• 249.00 KB
  • 98页

中国联通统一经营信息服务系统技术规范(讨论稿)

  • 98页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
'中国联通统一经营信息服务系统技术规范(讨论稿)中国联通统一经营信息服务系统技术规范(讨论稿)中国联通综合电信业务支撑系统统一经营信息服务子系统技术规范(讨论稿) 中国联通客服、结算与信息系统部2002.6.15目录81总则81.1系统建设提出的背景81.1.1电信行业背景81.1.2中国联通对统一经营信息的基本需求91.1.3现有经营信息提供方式的不足111.1.4统一经营信息服务子系统建设的必要性131.2规范适用范围131.3规范起草单位131.4规范解释权131.5术语解释151.6参考文献162系统建设目标及原则162.1系统建设目标及步骤162.1.1建设目标162.1.2建设方式172.1.3建设步骤182.2系统建设技术原则 182.2.1灵活性和扩展性182.2.2安全可靠性182.2.3可维护性182.2.4易用性192.2.5可理解性192.2.6响应及时性192.2.7互操作性192.3系统经营信息组织原则192.3.1经营信息与业务操作数据相分离的原则202.3.2按照本质特征组织经营信息结构的原则202.3.3信息沉淀原则202.3.4多粒度原则202.3.5统一经营信息集中服务原则202.3.6总部省分公司经营信息服务一体化原则212.3.7系统经营信息接口和源数据接口标准化、规范化原则213系统体系结构213.1系统环境体系结构223.2系统功能体系结构233.2.1纵向描述253.2.2横向描述253.2.2.1数据采集层253.2.2.2数据仓库生成层263.2.2.3应用逻辑层263.2.2.4元数据管理263.2.2.5系统管理 273.3系统信息体系结构284系统接口284.1接口设计原则284.2接口分类294.3外部接口设计要求294.3.1数据采集接口294.3.1.1数据采集接口概述304.3.1.2数据采集接口方式314.3.2经营信息提供接口要求314.4内部接口设计要求314.4.1与系统本地化应用的接口要求324.4.2总部与省分公司系统间接口要求325系统功能及处理流程325.1总体业务功能335.2总体处理流程355.3数据采集365.3.1数据源文件监视器375.3.2数据源文件预处理385.3.3数据源文件格式检查405.4数据仓库的数据加载415.4.1ETL功能425.4.2数据清洁7><435.5报表生成445.5.1立方体生成/更新445.5.2立方体部署 445.5.3报表生成455.5.4报表发布455.6报表查看465.7接口数据文件生成475.8OLTP数据查询485.9系统管理495.9.1数据抽取调度管理505.9.2元数据管理505.9.3用户权限管理505.9.4系统监控505.9.4.1系统服务监控505.9.4.2系统告警管理515.9.5系统日志管理515.9.6系统接口管理515.9.7报表管理515.9.8数据仓库归档管理515.9.9数据备份/恢复管理526系统信息模型设计526.1系统信息模型体系结构556.2DW信息模型的设计原则556.3DW信息模型设计要求556.3.1模型设计思路576.3.2DW数据的集成层次576.3.3DW分析主题分类586.3.3.1业务类信息分析 626.3.3.2客户类信息分析647系统网络组织架构647.1中国联通经营组织结构647.1.1各级组织职能657.1.2联通机构间经营信息流向657.2网络建设原则667.3总部与省分公司广域网组网方案677.4总部局域网组网方案697.5省分公司局域网组网方案707.6地市中心局域网718服务器性能要求728.1ODS/ETL服务器性能分析728.2DW/OLAP/WEB服务器性能分析739系统实施配置739.1系统软件要求739.1.1网络平台要求739.1.2操作系统平台和数据库管理系统要求739.1.3软件界面要求749.2数据库及数据仓库要求749.3主机要求749.3.1元数据信息服务器749.3.2ETL服务器759.3.3数据仓库及ODS服务器759.3.4统计报表服务器759.3.5OLAP服务器 759.3.6Web服务器759.3.7数据挖掘服务器769.4系统存储容量估算7610附录1:GSM、CDMA接口文档样本7710.1接口信息编号7710.2用户信息接口7710.2.1接口信息总体描述7810.2.2接口实现方式7810.2.3接口传递周期7810.2.4接口数据格式7810.2.4.1GSM用户信息接口数据格式7910.2.4.2CDMA用户信息接口数据格式8010.3用户押金信息接口8010.3.1接口信息总体描述8010.3.2接口实现方式8010.3.3接口传递周期8010.3.4用户押金信息接口数据格式8110.4用户服务信息接口8110.4.1接口信息总体描述8110.4.2接口实现方式8110.4.3接口传递周期8110.4.4用户服务信息接口数据格式8210.5付款信息接口8210.5.1接口信息总体描述8210.5.2接口实现方式 8210.5.3接口传递周期8210.5.4付款信息接口数据格式8310.6综合帐单接口8310.6.1接口信息总体描述8310.6.2接口实现方式8310.6.3接口传递周期8310.6.4接口数据格式8310.6.4.1综合帐单日传送数据格式8410.6.4.2综合帐单月传送数据格式8410.7欠费接口8410.7.1接口信息总体描述8410.7.2接口实现方式8410.7.3接口传递周期8510.7.4欠费传送数据格式8510.8预存款接口8510.8.1接口信息总体描述8510.8.2接口实现方式8510.8.3接口传递周期8610.8.4预存款接口数据格式8610.9资源销售记录接口8610.9.1接口信息总体描述8610.9.2接口实现方式8610.9.3接口传递周期8710.9.4资源销售接口数据格式8710.10资源状况接口 8710.10.1接口信息总体描述8810.10.2接口实现方式8810.10.3接口传递周期8810.10.4资源状况接口数据格式8810.11详单记录接口8810.11.1接口信息总体描述8810.11.2接口实现方式8910.11.3接口传递周期8910.11.4接口数据格式8910.11.4.1GSM详单记录接口数据格式9010.11.4.2CDMA详单记录接口数据格式9210.12用户套餐接口9210.12.1接口信息总体描述9210.12.2接口实现方式9210.12.3接口传递周期9210.12.4用户套餐接口数据格式9310.13用户营业业务记录接口9310.13.1接口信息总体描述9310.13.2接口实现方式9310.13.3接口传递周期9310.13.4营业业务记录接口数据格式9410.14增值业务使用接口9410.14.1接口信息总体描述9410.14.2接口实现方式9410.14.3接口传递周期 9410.14.4增值业务使用接口数据格式9510.15新业务使用接口9510.15.1接口信息总体描述9510.15.2接口实现方式9510.15.3接口传递周期9510.15.4新业务使用接口数据格式9610.16首张落地话单接口9610.16.1接口信息总体描述9610.16.2接口实现方式9610.16.3接口传递周期9610.16.4首张话单落地记录接口数据格式9610.17充值记录接口9610.17.1接口信息总体描述9710.17.2接口实现方式9710.17.3接口传递周期9710.17.4充值记录接口数据格式9710.18客户信息接口9710.18.1接口信息总体描述9710.18.2接口实现方式9710.18.3接口传递周期9810.18.4客户信息接口数据格式9910.19客户用户关系信息接口9910.19.1接口信息总体描述9910.19.2接口实现方式9910.19.3接口传递周期 9910.19.4客户用户关系接口数据格式9910.20资源状态变迁接口9910.20.1接口信息总体描述10010.20.2接口实现方式10010.20.3接口传递周期10010.20.4资源状态变迁接口数据格式10010.21销帐接口10010.21.1接口信息总体描述10010.21.2接口实现方式10110.21.3接口传递周期10110.21.4销帐接口数据格式总则系统建设提出的背景电信行业背景 在我国正式加入WTO以后,国外资本将逐步进入我国电信市场,国际化的市场环境要求国内的电信运营企业在经营管理上能够迅速赶上国外的先进水平,以迎接电信运营业的国际化竞争。同时随着国内电信行业改革和重组的不断深化,国内电信业务的市场环境将渐趋合理,竞争将日益加剧。国内、国际电信业的竞争态势,对电信运营企业的服务意识、服务内容、服务方式、服务质量、以及经营管理水平等均提出了严峻的挑战,要求国内的电信运营企业在经营理念、管理模式上能有一个较高层次的飞跃,以求在电信运营业日益残酷的国际化竞争中立于不败之地;同时,也要求国内电信运营企业传统的以产品为中心,以营业窗口为基础的运营模式,逐步向以客户为中心、以数据为中心、以信息为基础的模式转变。中国联通拥有全国范围内相当规模的公用电信网,经营多种基础电信业务和增值电信业务,形成移动(GSM、CDMA)、193长途、VoIP、165(互联网与电子商务)、寻呼、市话、增值业务等多种业务并存和共同发展的格局。如何发挥联通的综合优势,实现灵活多变的市场营销策略,为客户提供更具有针对性的满意服务;同时最大限度使自己的资源得到合理配置和优化,降低运营成本,以增强联通的核心竞争力,成为当前迫切需要解决的问题。在此过程中,市场策略的应对速度是保持竞争力的重要手段,而市场应对策略的制定需要丰富、真实、及时的经营信息提供支持。中国联通对统一经营信息的基本需求中国联通作为一家上市公司,为了适应竞争日益激烈的电信运营环境,对市场策略的制定与推出速度要求会越来越高,因此,各级经营决策者对经营信息的需求变化频度以及使用频度会不断加强。目前各级部门对经营信息提出了以下迫切需求:自2002年1月起,联通公司计划财务部、上市办需要每月公布一次经营信息,三月公布一次财务信息,这些信息的生成和传递需要良好的支持平台。联通公司总部计划、财务、上市办等部门进行日常经营管理时,需要业务发展、业务收入、业务使用等经营信息的服务支持,并可分阶段逐步扩展到客户经营信息的服务支持。 各个省分公司需要了解本省的业务情况、客户情况,为市场决策提供依据,并向总部传递业务经营信息。地市级分公司需要了解客户的静态信息、行为信息、使用信息、消费信息等,从而提交关于客户发展和保持的建议。现有经营信息提供方式的不足为了分析业务的发展、业务的收入和业务的使用情况,目前包括总部和省分公司在内的联通各级管理职能部门所需求的经营信息以提供统计报表方式为主,并直接建立在服务支撑系统上,如图1.1所示的三种主要的报表制作方式:利用业务支撑系统内置的业务查询功能收集业务数据,并手工完成报表制作;利用业务支撑系统内置的报表功能生成业务报表;利用第三方报表工具从业务支撑系统中采集数据,直接生成报表。迄今为止,这三种方式生成的报表在总部—省分公司—地市级分公司之间传递,作为制定市场营销策略的依据。这三种方式均存在有不同的问题,如下所述。手工制作报表的缺点是明显的: 报表制作人员的工作负担重,效率低下,而且会引入人为的错误;由于业务管理方式在灵活性远大于业务处理功能,因此,内置于业务支撑系统中的查询功能随着时间的推移会逐渐满足不了业务管理人员的查询要求,新的报表要求很难从业务支撑系统中获取数据;为了不影响业务支撑系统的效率,查询功能很难满足业务管理上复杂的连接查询请求;报表的分发都是通过人工完成的。通过业务支撑系统内置的报表功能实现业务管理的报表要求存在下列缺点:报表格式是预定义、静止的,当数据源发生变化、报表内容和结构要求发生变化时都会影响信息提供方式的变化,此时需重新设计报表格式、更新统计内容的灵活性和效率均会受到极大的限制;报表功能是简单的,很难满足业务管理上的复杂报表要求;由于内置于业务支撑系统,为了不影响生产系统的效率,报表在固定时间产生后以离线方式存放,新产生的业务数据无法动态反映到统计报表中,只能等到下一个报表生成周期进行更新;有些报表需要来自于非业务支撑系统的外部数据源,有些报表需要跨业务支撑系统的综合型数据,对于这报表要求该方式无法满足; 无法支持报表数据的动态探查功能。这种方式生成的报表基于平面展现,而市场营销人员除了需要平面展示的统计报表外,还需要立体展示的分析型报表,目的是能够对业务产生的信息进行总览和细剖地探查,做到即能宏观掌握全局,又能微观分析具体问题。利用第三方报表工具之生成报表在实现上存在以下问题:大部分利用第三方报表工具制作报表都是分专业进行的,无法支持跨业务支撑系统的综合型报表需求;没有从业务支撑系统中逐步沉淀出经营数据,当报表需要更新时,对业务支撑系统的压力比较大;无法适应业务支撑系统数据源的变化,也无法适应报表的可扩展性要求;由于分专业建设,无法获取统一的客户资料信息,因此,该类报表更多的是面向产品或业务,可以比较清晰地了解企业各业务的发展和使用情况,但对于企业的外部客户资源,包括客户的静态信息、客户与企业产品之间的互动关系都无法了解,进而无法了解市场的变化,也无法灵活地实施有针对性的市场营销策略;目前报表流转过程过于复杂,各专业生产系统均有一套独立的报表制作与流转机制,严重影响了经营信息上报的及时性、一致性与准确性,并增加了报表处理的复杂性。 因此,有必要对现有的报表系统进行改造,一方面要提高统计报表的灵活性和可扩展性,增加分析型报表,另一方面要在原来以产品为中心进行分析的基础上逐步扩展提供客户信息的统计和分析功能,使企业的市场营销人员既能了解自己的产品,又能了解使用企业产品的客户变化信息,从而为制定有针对性的营销策略提供必备的信息支持。统一经营信息服务子系统建设的必要性一方面,联通的经营信息来源于电信服务支撑系统(SSS)中各生产子系统,涵盖了计费、结算、营业、帐务、客服、大客户等信息,由于系统容量、运行效率等原因,服务支撑系统的各生产子系统不可能、也没有必要长期保存所有历史数据;然而,为了准确了解、分析电信企业的运营情况,运营过程中所积累的各时期历史操作数据通过汇总与沉淀之后,却构成了企业整体经营信息的生成基础。另一方面,由于联通业务量的迅速发展,支撑系统的各生产子系统处理负担日益加重,而统计日益复杂,仍以传统的方式,在生产系统中进行统计分析,向市场营销人员及时提供充足、准确的经营信息而又不影响生产系统的处理效率已不现实。 由上可见,有必要实现操作数据与经营数据的分离,形成统一的经营信息数据源,在服务支撑系统中为统计分析等经营信息服务建设专门的处理子系统:生产子系统视本身情况,周期地备份并清理历史数据;而经营信息服务子系统所需的大量历史数据不能直接依赖于生产子系统,必须周期性地从生产子系统中抽取,独立积累、独立存储、独立管理。另外,统一经营信息服务子系统存储了大量操作型历史数据,使得为生产子系统分担生产查询任务成为可能。联通规划的以数据为核心的服务支撑系统如下图所示:针对上述背景及规划,中国联通提出了各省分公司建设与生产系统相独立的统一经营信息服务子系统的要求。由统一经营信息服务子系统与各生产子系统共同构成联通电信服务支撑系统。统一经营信息服务子系统以经营信息为中心,各生产子系统以操作数据为中心。统一经营信息服务子系统实现沉淀、融合各个生产子系统的操作数据,形成经营信息,实现数据到信息的转换,向省分公司和地市级分公司相关部门提供面向业务产品与面向客户的营销报表与经营统计分析信息;并在统一传输平台上向联通总部提供标准的经营统计调查报表以及标准的报表数据。规范适用范围中国联通统一经营信息服务系统分为总部统一经营信息服务系统和各个省分统一经营信息服务系统两个级别,本规范主要针对省分统一经营信息服务系统制定。本规范是中国联通省分统一经营信息服务子系统规划与建设的基本业务指导依据,包括基线与应用集成两部分产品的业务功能,并为省分统一经营信息服务子系统技术规范的制定提供依据。中国联通各省分公司应依照本规范,结合本地实际情况进行规划和分阶段建设,为中、远期经营分析决策支持目标的实现提供基础。 本规范制定的原则、结构、接口和功能要求适用于中国联合通信有限公司运营的所有业务范围,包括GSM、CDMA、193、165、VoIP、市话、寻呼及各种业务的增值业务,也包括以后将出现的新业务。本规范所包含的信息范围仅为经营信息,即信息来源为服务支撑系统(SSS)中的各生产子系统信息:计费、结算、营业、帐务、客服、客户(包含大客户)、缴费、信用/防欺诈信息。规范起草单位本规范起草单位为中国联合通信有限公司总部客服、结算与信息系统部。本规范增补、修订权属中国联合通信有限公司总部客服、结算与信息系统部。规范解释权本规范的解释权属中国联合通信有限公司总部客服、结算与信息系统部。术语解释统一经营信息服务系统:为了实现企业分析型数据与企业操作型数据分离,按照经营信息本质特征组织数据,组建企业数据仓库,给企业经营支持系统提供企业级统一的经营信息服务的系统。它分为总部统一经营信息服务系统和省分统一经营信息服务系统两级。 统一经营信息服务系统基线产品:省分统一经营信息服务系统分两部分,分别是统一经营信息服务系统基线产品和本地化应用部分。基线产品部分是统一经营信息服务系统的核心,它所属的功能模块含盖了整个数据仓库组建的过程。本地化应用部分是在基线产品的基础上功能的扩展。详见正文。统一经营信息服务平台:即指统一经营信息服务系统基线产品。数据仓库(DataWarehouse):是一个面向主题的、集成的、时变的、非易失的数据集合,支持管理部门的决策过程。数据仓库信息模型:对数据仓库中数据组织方式进行描述的数据,包括各个主题的星型模型,维表,事实表。OLAP(On-lineAnalyticalProcess):,在线分析处理,或联机分析处理。OLAP是使分析人员、管理人员或管理执行人员能够从多种角度对从原始数据中转化出来、能够真正为用户所理解、并真实反映企业维特性的信息进行快速、一致、交互地存取、展现,从而获得对数据更深入了解的一类软件技术。ETL(ExtractionTransformationLoading):抽取、转换、装载的过程。本规范中指从中国联通各业务生产系统中提取经营信息,构建数据仓库的过程。ETL规则:进行抽取、清洁、集成、转换的所有规则。ETL任务:一次完整的ETL过程称为一个ETL任务,由一个或多个ETL规则组成。综合营帐子系统:是中国联通公司为了提高客户服务质量而提出的、隶属于服务支撑系统的子系统,目标是实现客户业务受理“一台清”、客户多业务缴费 “一单清”功能。CRM(CustomerRelationshipManagement):客户关系管理的简称。CRM是一种商业管理策略,它通过使企业组织结构、业务工作流程、技术支持和客户服务都以客户为中心来协调统一地与客户进行交互,达到保留有价值客户、挖掘潜在客户、赢得客户忠诚,并最终提高客户终身价值的目的。ODS(OperationalDataStore):操作数据存储的简称。用于支持企业日常、全局应用的数据集合,保存在ODS中的数据具有四个基本特点:面向主题的、集成的、可变的、数据是当前的或接近当前的.本规范中ODS数据存储支持文件和数据库表两种形式。ODS信息模型:对ODS中数据的组织方式进行描述的数据。元数据:是关于数据、操作数据的进程、应用程序结构与意义的描述信息,其主要目标是提供数据资源的全面指南。数据源元数据:描述数据源数据特性的数据。报表元数据:包括对报表各项指标的解释、报表名称定义、报表格式定义和报表更新周期等定义.商业元数据:系统在支持商业应用活动中产生了部分特定领域的数据,对这些数据的含义以及数据间的约束进行的定义称为商业元数据。 统计型数据:本规范中特指二维静态报表数据。分析型数据:本规范中特指多维立方体数据。.统计型报表:本规范中指二维统计型静态报表,可由统计型数据与分析型数据生成。分析型报表:本规范中指OLAP动态报表,支持旋转(pivote)、切片(slice)、切块(dice)、上钻(rollup)、下钻(drilldown)等操作,可由分析型数据生成。综合型报表:本规范中指基于统计型报表与分析型报表,以动态与静态相结合方式进行展现的报表。数据清洁:通过填写空缺的值、平滑噪声数据、识别、删除孤立点,并解决不一致而进行数据的”清洁”,去掉数据中的噪声并纠正不一致.数据集成:将多个数据源中的数据结合起来存放在一个一致的数据存储(如数据仓库)中.这些源可能包括多个数据库、数据立方体或一般文件.一类报表指标:为省分公司上报统计指标,由总部计划财务部向省分公司统计信息部门布置,必须以固定格式按照时间要求准时上报。二类报表指标:为总部各业务部门和各子公司上报的统计指标,由总部计划财务部向总部各业务部门布置,必须以固定格式按照时间要求准时上报。 三类报表指标:为总部各业务部门和各子公司需要备案的统计指标,是各业务部门和子公司向下属单位布置的统计报表,此类报表无需按固定格式上报计划财务部,但需于报表上报截止日后的10日内将统计结果提供计划财务部。专业报表指标:各业务部门专用的经营分析、市场营销策略的制定、业务考核和绩效考核等指标。参考文献《中国联通统一经营信息服务系统业务规范-讨论稿》《中国联通综合营帐子系统总体规范》《中国联通综合营帐子系统业务规范》《中国联通综合营帐子系统技术规范》《中国联通统一客户资料子系统信息模型》《中国联通统一客户资料子系统业务规范》《中国联通统一客户资料子系统技术规范》系统建设目标及原则系统建设目标及步骤建设目标 中国联通公司的市场经营模式正处于从以业务为中心向以客户为中心的逐步转变过程中,从原来的推销(selling)模式转变到营销(marketing)模式,即以客户的需求为出发点,以客户的满意为结束。信息系统的建设也遵循营销的商业模式,在业务处理流程上以客户关怀为起点、以满足客户的服务要求为终点进行重组,同时,分步骤逐步实现客户资料的统一,实现面向客户的综合业务支撑系统建设目标。本系统伴随着以客户为中心的综合营帐系统进行同步建设,总体建设目标就是要实现联通上下级组织机构(联通总部—省分公司—地市级分公司)间、各部门间、各系统间的面向客户和业务,并以客户为中心的经营管理信息传递,完成联通公司内部统一经营信息管理服务功能;以及为了减轻各生产系统日益繁重的生产压力,统一经营信息服务子系统应为生产型查询请求提供历史数据基础。信息的处理是一个闭环过程,完成从各生产系统中数据的抽取、信息的产生、信息的传递到信息的利用并施效于各生产系统多个步骤,以下为几个关键环节:经营信息数据源(生产数据)的统一和沉淀,为经营信息的生成提供基础数据来源;经营信息的产生和传递,实现信息的流通;经营信息的利用和施效于各生产系统,实现信息的价值体现。 为了协助联通公司的市场经营策略逐步从业务为中心转向客户为中心,并兼顾中国联通的总体策略以及各省分生产系统的复杂性,对本系统进行建设目标的总体规划,并分步实施:逐步将各生产子系统的业务数据、客户数据以及其他重要经营信息融入到统一经营信息服务子系统中,按照近期目标、中期目标、远期目标三个阶段进行设计和实现统计报表、分析报表甚至决策专题分析的全方位经营信息支持服务,完成统一经营信息服务子系统的整体功能。建设方式以“将基线产品和客户化/本地化功能相分离,基线产品信息模型逐步完善”为建设指导思想。基线产品以统一的信息模型为核心,完成数据的收集并存储于经营信息数据仓库的主要功能,同时对外提供统一的报表数据,包括生成和传输总部需要的标准报表数据文件、总部统一标准的省分公司经营报表等。客户化/本地化以满足本地经营分析需求为前提,在基线产品的基础上进行应用集成,提供经营信息的展现、生产型查询等客户化/本地化的具体应用。建设步骤 第一期的系统建设目标是在2002年年底要建立起以业务为核心的经营信息中心。实现业务经营信息数据源的统一、操作数据的沉淀积累、经营信息的产生和传递、经营信息展示、利用及施效接口的规范化。总之,本期目标就是构建系统的数据仓库,实现生产数据的信息沉淀,在统一的经营信息基础上生成并传递以面向业务为主的经营统计分析报表,支持上市公司信息发布,支持联通公司各经营层次上的对业务全面的了解和性能分析,以达到有依据、有针对性地进行运营业务的管理。本期建设原则为:以业务信息为主、以客户信息为辅;以统计报表为主、以分析为辅。(近期目标)第二期的系统建设目标是在2003年10月份左右建设增加以客户为核心的经营信息中心,包括客户经营信息、客户业务关联经营信息。在第一期目标实现的基础上,并在数据有足够的沉淀之后,完善系统的信息模型、实现面向客户以及客户业务关联的全面了解、健全与其他系统的接口功能;提供各类数据查询请求服务。本期建设原则:在数据有足够的沉淀之后进行建设。(中期目标)第三期的系统建设目标是在2004年年中,在第一、二期工程完成的验证型经营信息基础上提供以数据挖掘型知识为代表的发现型经营信息,提高经营信息的智能支持能力,并采用专题分析的方式实现系统的经营信息决策支持功能,以期达到对中国联通全方位的经营决策起到辅助支持作用,使中国联通在激烈的市场环境中提高自身竞争能力。(远期目标)系统建设技术原则灵活性和扩展性统一经营信息服务子系统的数据源于业务支撑系统,由于业务支撑系统的建设规划是分步进行的,不同时期系统的信息模型(包括逻辑模型和物理模型)可能存在差异,要求本系统能够灵活地适应数据源的变化。另外,本系统信息的使用者对于信息的格式及具体内容可能存在特殊的要求,本系统对外提供信息的方式要求灵活,譬如接口格式的灵活定义等。 系统使用者的需求和系统的规模会随着区域的不同、时间的推移而发生变化,统一经营信息服务子系统在建设过程中需要灵活组织与存储信息,增强系统扩展能力。安全可靠性确切地讲,统一经营信息服务子系统包含一个完整的经营信息管理流程,涉及中国联通各级公司的多层决策者和销售人员,跨越多个信息处理环节和职能部门,并涉及企业的机密。因此,需严格地限定各级使用者的访问权限和操作权限,并具备良好的抵抗外部各种冲击的能力,以保证系统的正常运行并确保信息的安全保密性。可维护性由于经营信息组织和利用具有灵活性、扩展性的特点,要求系统的维护能力必须增强。易用性在不影响决策者正常思维方式的前提下,统一经营信息服务子系统应提供灵活、易用、友好的操作界面,如:可根据实际需要建立综合性EIS(ExecutiveInformationSystem)界面。可理解性 分析结果的可理解性不仅指在形式上给出直观、可视化的信息展示,而且在内容上应该针对具体业务和服务给出各种方法的性能比较,给予决策者以充分选择的余地。响应及时性在对存储空间具有较高利用率的基础上,能及时响应使用者的各种应用,以达到使用者对系统所提供服务与支持的满意度。互操作性统一经营信息服务子系统是联接服务支撑系统中各生产子系统与管理信息系统的桥梁,接口繁多,为保证经营信息流动的通畅性,必须与其它系统具有良好的互操作性。系统经营信息组织原则经营信息与业务操作数据相分离的原则随着管理的科学化和规范化,中国联通对于经营信息的利用程度越来越高。一方面,传统的操作型数据环境主要面向企业的日常事务处理工作,存储的是当前的、细节的数据,不仅没有历史数据,而且数据的存储和组织是分散的、不一致的;而在面向决策分析的分析型数据环境中,数据是按照经营分析的要求,以面向主题的方式组织的。不仅包含一定粒度的细节数据,而且包含各种粒度的综合数据;不仅需要有近期的数据,而且必须有大量历史数据。因此,为了满足中国联通业务分析的需求,需要将经营分析数据从传统的操作型数据中分离出来。 另一方面,由于以分析处理为主的决策支持(DSS)应用和以业务处理为主的联机事务处理(OLTP)应用所要求的数据环境截然不同,如果将二者放在同一个数据环境中,会使两者的性能均受到严重影响。所以,为了保证Uni-UBISP系统不影响现有业务支撑系统的正常运行,也为了保证未来Uni-UBISP系统的性能,必须将用于分析处理的经营信息从业务操作数据中剥离出来,创建独立的、统一的业务经营信息数据源,即企业经营信息数据仓库,更好地支持企业经营决策。按照本质特征组织经营信息结构的原则市场环境变化的经常性导致市场应对策略的变化也是持续不断的,因此,对经营信息的要求也存在着变化。为了保证整个的数据仓库不仅可以支持计划财务部、市场部、上市办、省分企管部目前的统计报表需求,而且可以支持他们将来对分析型应用的需求和其他部门的经营信息需求,必须从整个企业应用的角度出发,按照联通各业务系统原始数据的本质特征组织数据仓库的信息模型,从而使数据仓库的信息模型具有良好的稳健性和可扩展性。信息沉淀原则由于系统容量、运行效率等原因,生产系统不可能长久保存所有历史数据;而为了准确统计分析、预测电信企业的运营情况,运营过程中所积累的历史数据却是经营信息产生的基础。所以,实现操作数据与经营数据的分离:生产系统视本身情况,周期地备份并清理历史数据;市场经营系统则必须将从生成系统中获得的基础数据进行重新组织、存储、管理、使用,沉淀、融合各个业务系统的操作型数据,形成面向统计分析应用的经营信息。多粒度原则 统计分析型应用所需的经营信息不是来自于生产系统的最低粒度的数据,而是面向各种不同应用的不同粒度的综合数据,所以,为了方便灵活地使用经营信息,需要对来自生产系统的操作型数据进行不同程度的综合,形成多粒度数据,多粒度原则是经营信息组织的一个重要原则。统一经营信息集中服务原则为了完成联通企业内部经营数据的整合,实现联通内部数据(信息)的真实性、一致性保密性、安全性,需要按照业务数据的本质特征组织数据的原则,对业务数据重新进行组织、存储,生成企业级经营信息数据仓库。同时,采用规范的经营信息访问接口,为联通总部和各省分公司的各种统计分析应用系统,提供统一、一致的经营信息数据源。不仅满足联通各级部门对于各自经营信息需求,而且保证了联通各级部门对外提供经营信息的一致性和准确性。总部省分公司经营信息服务一体化原则因为联通总部进行经营战略决策所需要的数据源,来自于各省分公司提供的战术性经营信息,所以,为了保持总部战略决策和省分公司战术决策的连贯性,在构建联通省级统一经营信息服务系统,满足省级各部门分析需求的基础上,要充分考虑总部的经营信息需求,实现总部和省分公司经营信息及时、有效的上传下达,实现联通总部和各省分公司经营信息服务的一体化。系统经营信息接口和源数据接口标准化、规范化原则 联通省分统一经营信息服务系统的构建,不仅需要从已有的各专业系统的中提取数据,而且需要为总部统一经营信息服务系统提供数据,所以,本系统与外部系统的接口不仅多,而且复杂。另外,由于系统本身的复杂性,使得本系统内部的接口也比较多。所以,为了保证系统扩充的灵活性和各系统间良好的互操作性(interoperability),必须保证各接口的实现方式、接口协议、接口内容的标准化和规范化,使得本系统内部的连接、本系统和外部系统的连接不仅清晰,而且易于理解。系统体系结构系统环境体系结构统一经营信息服务子系统以查询/统计型经营数据为核心,其数据源于服务支撑系统中各生产子系统中数据(包括电子与手工数据),通过信息展现(包括提供数据接口访问方式)为企业的其它系统提供业务和客户层面经营信息服务的统计及分析、决策支持,如为ERP系统中用于企业管理的经营统计信息提供数据来源,为将要建设的CRM系统提供数据。系统环境体系结构如下图所示:图3.1省分统一经营信息服务子系统环境结构图系统功能体系结构中国联通统一经营信息服务子系统由总部统一经营信息服务子系统和各省分统一经营信息服务子系统两级构成。其中省分系统功能结构如下所述(见图3.2): 统一经营信息服务子系统对经营信息的处理包括三部分内容,分别是收集、存储、展现。其中,经营信息的收集指按照统一经营信息基线产品规定的数据源接口标准,从服务支撑系统的生产子系统数据源(统一客户资料子系统、综合营业子系统、综合帐务子系统、客服子系统等)中进行抽取、转换、装载,形成本系统所需的信息。经营信息的存储指对本系统数据仓库中各级信息进行组织、存储与访问控制管理。经营信息的展现使得总部统一经营信息服务子系统、省分其他系统以及省分、地市用户可以通过上层提供的各种应用,利用WEB、GUI、API等方式对经营信息进行查看和访问。联通统一经营信息服务系统的体系结构参考客户机/应用逻辑服务器/数据库服务器三层结构,并采用“模块化”的软件设计策略进行规划,将软件在总体上分为五大模块:数据采集模块、数据仓库生成模块、应用逻辑模块、元数据管理模块和系统管理模块,从而形成模块化的分层体系结构。总体软件体系结构如下图所示。图3.2省分统一经营信息服务子系统功能结构图注:图3.2中‘数据挖掘’与‘商业管理’属于中、远期目标建设。纵向描述 从纵向看,系统是一个多层结构,主要分为数据采集层、数据仓库生成层、应用逻辑层三大层次。其中,数据采集层,主要是对从各专业系统传送来的数据文件进行预处理和格式检查,并将他们分类存放在临时存储区中;数据仓库生成层,主要包括第一次ETL过程层,ODS数据层、第二次ETL过程层、DW数据层和数据仓库接口层。应用逻辑层通过数据仓库接口层使用数据仓库中的数据,对外提供统计报表应用,OLAP分析型应用,数据访问应用,数据挖掘应用,商业管理应用等,从系统外部来看,应用逻辑层体现为一台虚拟主机,所有的应用全由该虚拟主机提供。该虚拟主机本身是一个分布式结构,可以由应用服务器(OLAP服务器、统计型报表服务器等)和WEB服务器构成。同时,应用逻辑层通过图形用户界面(GUI)、Web浏览器等多种方式为用户提供友好的界面访问。数据仓库接口层通过提供标准一致的接口,即方便了应用的提供,又保证了安全地使用数据仓库中的数据。从纵向看,联通统一经营信息服务系统采用的是管道-过滤器软件体系结构,具体如下图所示:UBISP系统纵向管道过虑器体系结构图图中桔黄色箭头表示管道,浅蓝色方框表示过滤器,各业务系统和外部数据源传送的数据为系统的输入。首先,这些数据经过数据源文件预处理、数据格式检查后,存储到源数据临时存储区; 然后,从临时存储区中抽取数据,并经过清洁、集成后,将数据装载到ODS中;再从ODS中抽取数据,经转换后装载到数据仓库中;最后,对数据仓库中数据的使用有两种方式,即数据仓库中的数据有两个方向的流向:从数据仓库中抽取数据:一方面,生成报表,供省分/地市各部门用户使用;另一方面,将抽取的数据转换成总部要求的格式,并生成数据文件,然后,将数据文件向传递给总部统一经营信息服务系统;对数据仓库中数据的访问。向其它应用系统提供本系统数据仓库中经营信息的元数据文档,以开放数据库连接并控制访问权限的方式对外提供数据接口,以供省分其他报表系统使用数据仓库中的数据;横向描述下面分别对系统功能体系结构部件进行描述。数据采集层数据采集层主要是完成将来自各经营数据源系统中的数据采集到本系统中的功能。 数据采集层都要包括数据源文件预处理层、数据源文件格式检查和数据源文件的临时存储层。数据源文件预处理层由于存在各专业系统每天产生的数据文件过大的情况,例如详单文件,各专业系统给本系统的文件可能进行分包处理,所以数据源文件预处理层主要功能是对分包的文件进行合包处理。数据源文件格式检查层数据源文件检查层主要对文件名字,文件头,文件尾和文件体进行检查,在一定程度上保证进入ODS的数据格式良好,类型正确。数据源文件的临时存储层经过检查格式正确的数据源文件分类存储在临时存储区中,等待ODS抽取、使用。数据仓库生成层数据仓库生成层包括:第一次ETL过程层、ODS数据层、第二次ETL过程层、DW数据层和数据仓库接口层。第一次ETL过程层 从数据源文件临时存储区中抽取数据,经过清洁、集成和轻度的综合后装载到ODS数据存储区中。ODS数据层存储清洁、集成和轻度综合的数据,屏蔽掉数据源对于数据仓库建立的复杂性,为数据仓库的建立做准备。第二次ETL过程层从ODS数据存储区抽取数据,以面向主题方式将数据重新组织、转换、综合后装载到DW数据存储区中。DW数据层以面向主题的方式存储着清洁、集成和转换后的数据,为面向分析的应用准备好数据。数据仓库接口层数据仓库接口层为建立在数据仓库数据基础上的各种应用提供标准一致的接口,保证方便、安全地使用数据仓库中的数据。应用逻辑层应用逻辑层包括应用逻辑生成层和应用逻辑使用层。 应用逻辑生成层应用逻辑生成层通过数据仓库接口层使用数据仓库中的数据生成不同的应用,包括固定报表应用、OLAP分析型应用(多维数据立方体)、数据访问应用、部门级数据集市、数据挖掘应用、商业管理应用等。应用逻辑使用层应用逻辑使用层通过图形用户界面(GUI)、Web浏览器等多种方式为用户提供友好的界面访问机制,使用户能方便地使用基于数据仓库的各种应用。元数据管理元数据管理对系统各层元数据进行管理,包括:数据源元数据管理、ETL规则管理、ODS元数据管理、数据仓库元数据管理、应用逻辑元数据管理和商业元数据管理。主要对各种元数据进行添加、删除、查询和修改操作。系统管理系统管理负责整个系统的管理工作,主要分为:用户权限管理、系统监视、接口管理。其中,用户权限管理负责对用户基本信息管理、权限管理、用户权限分配;系统监测负责日志管理、系统管理任务提示、系统服务进程监测和数据存储空间的监视;接口管理负责对数据仓库接口管理、数据文件接口管理(接口文件格式管理、网络通信参数管理)。 系统信息体系结构统一经营信息服务子系统的信息体系结构由收集层、存储层、展现层信息组成,如图3.3所示。每层信息均包括对本层进行管理用的元数据与本层业务数据。图3.3省分统一经营信息服务子系统信息体系结构图系统接口接口设计原则为了保证系统的稳定性和接口的规范化、标准化,系统的接口设计应该遵循如下原则:正确性:保证接口数据的有效性、无二义性扩展性:考虑系统的建设现状,不仅满足现有系统的需求,也需要考虑系统的演进对接口的要求 适应性:针对不同类型的接口,适应其特殊的需求健壮性:具有相应的错误处理机制安全性:保证系统的安全性,和企业经营数据的保密性接口分类各个省分统一经营信息服务系统分为两部分,分别是统一经营信息基线产品部分和统一经营信息本地化应用部分。同时,系统接口分为系统内部接口和系统外部接口。对于省分统一经营信息服务系统内部接口,它包括:省分基线产品与总部经营信息服务系统的接口省分基线产品与省分经营信息本地化应用的接口对于省分统一经营信息服务系统外部接口,它包括:系统与各专业生产系统的数据采集接口系统与ERP、OA、CRM等系统的经营数据提供接口外部接口设计要求 数据采集接口数据采集接口概述联通统一经营信息服务系统包括总部统一经营信息服务系统和各省分统一经营信息服务系统。省分统一经营信息服务系统的数据主要来自省分各业务支撑系统每天产生的生产数据和手工录入数据。省分各业务支撑系统包括:各省的营业系统、帐务系统、缴费系统、结算系统、计费系统、客服等系统。对于不便于直接从各业务系统中获取的数据,采用手工录入方式获得。所以省分公司该系统的数据采集接口主要指系统与各业务生产系统的接口。总部统一经营信息服务系统的数据主要来自于各省分统一经营信息服务系统定期传送来的经营数据、总部结算系统产生的结算数据和某些需要手工录入的经营数据。总部数据采集的接口主要是与各省分统一经营信息平台的数据提供接口和总部结算系统的接口。与省分公司业务支撑系统的接口要求 联通的业务运营支撑系统作为本系统的主要信息来源,需要提供其专业生产系统拥有的营业、帐务、缴费、客服等信息。具体要求营业、帐务、等其它运营支撑子系统传送的内容和传送数据的周期可以参看本系统业务规范(讨论稿)。各厂家在设计实现系统时,需要制定本系统与各个业务系统数据采集接口的格式和内容。手工数据录入接口要求对于目前某些无法直接从各业务支撑系统中得到的经营数据,例如卡销售数量等,采用手工录入的方式,向录入人员提供手工录入界面,同时保证录入数据相关的正确性和完整性。与总部结算系统的接口要求总部统一经营信息服务系统需要的经营信息中涉及到国际和省间的漫游结算数据等无法从各个省分公司上报的报表数据中取得,需要直接从总部的结算系统中取得。总部统一经营信息系统制定与结算生产系统产生的结算数据的具体传输格式、内容和传递周期等要求,总部结算系统根据要求向统一经营信息服务系统定期提供结算数据。数据采集接口方式本系统数据源主要有两类,一类是各专业生产系统产生的数据,另一类是需要某些部门手工输入的源数据。手工输入数据要求本系统以WEB页面方式或GUI方式提供手工数据录入界面,各部门定期填写所要求的手工录入数据,传送致本系统。 在采集各专业生产系统源数据时,根据各专业系统提供数据的方式可以分为主动数据采集和被动数据采集两种方式。主动数据采集要求本系统专门为各专业生产系统提供数据存放区,也要为各专业系统制定所要求的数据内容和格式,要求各专业系统将每天产生的数据定期传送到本系统源专业数据存放区中。本系统定期对系统源数据存放区中的数据进行处理。专业系统传送数据的周期为天,具体传送时间可以选择专业系统的空闲时间。与各专业系统的接口可参考本规范附录中与移动业务系统的接口文档进行制定。被动数据采集要求各专业系统为本系统开放数据库连接,同时要求专业系统为本系统提供专业系统元数据。本系统通过理解专业系统元数据,直接连接专业系统定期从数据库中取数据,然后在系统内在对专业系统源数据进行处理,例如进行格式、编码转换等。采集周期可以根据具体情况,自行设计。这种方式要求专业系统对所提供的元数据进行版本和发布管理。考虑到远程被动采集比主动本地数据采集对本系统性能要求高和对专业生产系统安全和性能影响大等问题,建议采用主动数据采集方式,要求各专业系统定期按要求传送数据到本系统。各专业系统在传送数据时,可以以文本数据文件的方式传送也可以以数据库表导出文件的方式传送。考虑数据库表导入、导出对系统效率的影响,建议采用规定格式的数据文本文件的方式传送。经营信息提供接口要求 经营信息提供接口概述统一经营信息服务系统作为企业各业务运行支撑系统(OSS)和企业经营支撑系统(BSS)的桥梁,主要是为将要建设的ERP、OA、CRM等经营信息应用系统提供有关整个企业的统一的经营信息。经营信息提供接口方式统一经营信息服务系统向ERP、OA、CRM等其它经营信息应用系统提供企业经营信息,可以采用以下两种方式:文件方式:按照其它外部系统的经营数据要求在本系统生成结果数据文件进行传送。开放数据库连接方式:以开放数据库链接的方式,供其它经营信息应用系统使用本系统中的经营数据。这要求本系统以文档或其它方式向其它应用系统提供关于本系统数据仓库的元数据,对数据仓库中的内容进行解释和说明,为其它系统使用本系统经营数据提供导航。并且还要求本系统保证数据库连接的安全性,防止非法访问非授权数据,即对数据仓库连接的用户进行认证、权限进行控制。同时本系统要对元数据的版本和发布进行管理。内部接口设计要求与系统本地化应用的接口要求 统一经营信息服务系统包括基线产品和本地化应用两部分。基线产品与系统本地化应用部分之间的接口可以采用文件方式或开放数据库连接方式提供,建议采用第二种。如果基线产品采用开放数据库连接的方式向本地化应用提供经营数据,则接口包括两部分内容:数据接口:本地化应用直接连接数据库,从库中取数据。元数据交换接口:基线产品需要向本地化应用提供关于DW的元数据,为本地化应用使用DW中经营数据提供导航。元数据目前可以采用文本文件的方式交换,待技术成熟后可以考虑采用基于CWM规范,遵循XMI标准的方式交换。系统需要对元数据的版本及发布进行管理。总部与省分公司系统间接口要求由于总部与省分公司之间的数据传递是通过广域网来进行传输,该部分接口采用文件方式传输,要求省分系统提供可靠的安全保证机制和错误纠正机制,同时也要保证接口数据传输的有效性。总部统一经营信息服务系统为省分公司统一经营信息服务系统制定数据传送的内容、格式、传送周期、传送方式和传送目的地的要求。总部统一经营信息服务系统与省分统一经营信息服务系统之间数据接口规范见附件。 系统功能及处理流程总体业务功能图4.1省分统一经营信息服务子系统业务功能及数据示意图省分统一经营信息服务子系统由统一经营信息服务平台与应用集成两部分组成。在上图中红框范围内的功能模块属于统一经营信息服务平台范围内的内容,蓝框范围内的功能模块属于中国联通统一经营信息服务系统的内容。统一经营信息服务平台的功能主要为数据仓库的生成以及对外提供数据访问。功能模块包括数据采集、数据仓库生成、数据仓库接口、标准报表数据文件/报表生成与传输、平台系统管理。平台数据包括元数据(数据仓库元数据、ETL规则、标准报表元数据)、数据采集后目标文件、ODS数据、DW数据、标准报表数据文件、标准报表。应用集成的功能主要为利用平台提供的数据提供上层应用服务。功能模块包括数据访问、本地化报表生成(统计型报表、分析型报表、综合型报表)、报表查看、OLTP查询、应用系统管理。应用集成数据包括本地化报表元数据、本地化报表数据、立方体、本地化报表。总体处理流程图4.2省分统一经营信息服务子系统业务流程示意图业务处理: 各业务系统和外部数据源传送的数据为平台系统输入,这些数据分别经过数据格式检查;源数据清洗抽取转换、装载数据到收集层;对收集层中数据抽取、转换、装载到数据仓库;数据仓库中数据进行抽取、转换并按照总部数据文件格式要求生成标准报表数据文件/标准报表;将标准报表数据文件/标准报表向总部传送,并最终到达总部统一经营信息服务子系统。同时通过数据仓库接口,可将数据提供给应用系统的本地化统计报表生成、OLAP报表生成、OLTP查询使用。系统管理:平台系统以及应用集成系统都要具有各自的系统管理功能,对系统中安全、日志、数据仓库数据生成的过程、系统元数据、等等内容进行管理。数据:平台系统以及应用集成系统均具有各自需要存储的数据,包括各层元数据与业务数据。在前面系统信息体系结构中已描述。下面分别对系统必备功能及功能的技术实现处理流程进行介绍。数据采集`图4.3数据采集模块图4.4数据采集模块数据流示意图图示:数据流;功能流。如前所述,系统数据采集可以分为主动采集和被动采集,主动采集要求各专业系统主动传送数据到本系统,被动采集是本系统去各专业系统数据库中采集数据。下面以主动采集为例阐述数据采集功能。被动采集与主动采集相区别,它不包括数据源文件监视器。数据源文件监视器功能说明:数据源文件监视器具有以下两个功能:文件迟传检查和文件到达监测。文件迟传检查是监测某类文件在给定的周期内是否按时上传,如果未能按时上传,则发出警告;文件到达监测是为了能及时发现新上传的文件。 处理流程:数据源文件预处理功能说明:由于存在文件过大的情况,对端系统需要对过大的文件进行分包处理后传输;数据预处理主要功能则是对该类文件进行合包处理。注:此模块可选处理流程:数据源文件格式检查功能说明:源数据文件检查主要进行文件名字,文件头,文件尾和文件体格式的检查,在一定程度上保证进入ODS的数据格式良好、类型正确,对文件体中出现的某些错误,依据纠错条件进行纠正,使之成为合法格式的数据.约束条件:纠错处理仅针对某文件体的部分非法格式进行纠错.注:文件头、文件尾、文件体的格式检查次序可调。处理流程:数据仓库的数据加载 图4.5数据仓库的数据加载模块图4.6数据仓库的数据加载模块数据流示意图数据仓库的数据加载模块依据一定的抽取规则,从数据采集后目标文件临时存储区中抽取数据,进行清洁、集成后可根据需要将数据按ODS信息模型进行转换,并装载到ODS数据存储区中,完成第一次ETL过程;之后,从ODS数据存储区中抽取所需数据,进行转换、计算、合并、汇总后将数据按数据仓库信息模型重新组织、装载到数据仓库数据存储区中,完成第二次ETL过程,生成数据仓库.数据加载分为两个步骤:初装、追加,由系统调度根据情况分别处理.追加是根据数据的追加策略,采用定时调度或触发方式,从数据采集后目标文件临时存储区抽取数据,经清洁、集成、转换后,加载到目标数据存储区中,实现对初装完成后相应数据的追加,进行数据积累。ETL功能功能说明:ETL的目标是将目标系统中所需的数据从源系统中抽取出来,并对数据按照一定的规则进行清洁、集成、转换、汇总等处理工作,最后将处理完的数据加载到目标系统中。处理流程: 数据清洁功能说明:数据清洁的目的是发现并解决源系统中抽取出的数据不一致,删除非法数据,并填写空缺值,使处理后的数据符合目标系统处理的前提条件。报表生成图4.7报表生成模块图4.8统计型报表生成模块数据流示意图4.9分析型报表生成模块数据流示意图报表生成模块的功能包括报表数据生成、报表生成、报表发布。将从数据仓库/ODS中抽取的数据,生成/更新统计型报表数据;生成/更新立方体并将立方体发布。报表生成时,一方面依据一定的统计型报表格式定义,提取统计型报表数据或发布后立方体直接生成统计型报表,另一方面依据立方体元数据定义,提取发布后的立方体,生成分析型报表。最后可将报表存放到指定的服务器上,以供使用。生成的统计型报表和分析型报表要反映出经营的最新信息,所以要对统计型报表数据和多维数据立方体进行定期的更新调度。立方体生成/更新功能说明:立方体的生成/更新是指将从数据仓库/ODS中抽取的数据组织成立方体要求的多维形式,并通过相应的聚合算法进行生成/更新操作。立方体部署 功能说明:立方体的部署是指将生成的立方体以用户需要的形式发布到服务器上,用户可以通过客户端在该立方体上进行相应经营分析。报表生成功能说明:报表的生成是指提取报表数据,根据设置的报表格式(如标题等),生成报表.报表发布功能说明:报表发布是指将所生成的报表存放到指定的位置并可指定用户访问的方式.报表查看图4.10报表查看模块图4.11表查看模块数据流示意图功能说明:允许授权用户通过WEB或客户端从远端查看需要的报表信息,并且允许进行在线的数据分析和综合;包括用户权限验证、报表展示等。处理流程:接口数据文件生成 ]图4.12接口数据文件生成模块数据流示意图功能说明:由系统定时调度机制触发、手动触发、或事件触发,按照总部数据接口格式规范或其它经营信息分析系统(ERP、OA、CRM等系统)制定的数据文件接口规范,生成符合总部要求的上传标准数据文件或其它经营信息服务系统要的经营信息数据文件。处理流程:按照接口规范从DW中生成数据;检查数据量,确定是否要分包处理;按照规范生成数据文件名字;按照接口规范生成文件头; 按照接口规范生成文件体;按照接口规范生成文件尾;将结果数据文件放入系统指定存储区,等待系统将文件传送致接口规范指定目的地。OLTP数据查询功能背景:为了提高客户服务质量,并且客户“明明白白消费”的要求也越来越强烈,所以要求电信运营支撑系统支持客户进行详单查询。在中国联通综合营帐系统中,详单查询由帐务系统承担,但随着用户量的增长,详单查询将给帐务系统带来巨大的压力。考虑到在建设统一经营信息服务系统时,系统中会在线存储3到5个月的专业系统的生产数据,其中包括详单数据,这样在统一经营信息服务系统建成后,就可以由它来承担客服等系统对详单等操作型数据的查询请求,在本系统中称为OLTP数据查询。本系统在支持OLTP数据查询时,需要注意以下事项:因在综合营帐系统中已制定好帐务系统与客服等系统的详单查询接口,所以在本系统中若要提供详单查询等OLTP数据查询接口,需要继承综合营帐规范中制定的接口内容及接口实现机制,按规范提供标准OLTP数据查询接口,尽量不影响其它系统。 在由本系统操作数据存储(ODS)中生成OLTP查询结果数据时,需要根据综合营帐系统中信息编码作相应转换。因本系统数据源系统(计费系统、帐务系统等)传送数据存在延迟,传送过来的源数据导入本系统ODS也存在延迟,而且如果传送数据错误,需要重传源数据,所以本系统提供的OLTP数据查询是准实时OLTP数据查询。各厂家在设计该功能时,应尽量缩小系统提供OLTP查询的时间延迟。功能说明:对客服等系统用户的请求进行身份验证,通过则根据该用户的权限及数据查询请求到ODS中取数据查询结果集并将结果返回;若身份验证失败,则给出登录失败信息。图4.13OLTP数据查询数据示意图系统管理图4.14系统管理数据流示意图数据抽取调度管理从各专业系统把源数据取到本系统,再装载到数据仓库中需要两次ETL过程,第一次是从各专业系统数据经清洁后存放的临时数据交换区到ODS,第二次是从ODS到DW,如何使它们在保证数据正确性的前提下保持并发性,尽可能的提高系统效率,系统必须提供有效、合理的调度机制进行控制。并且本系统中本地化应用部分由DW中产生报表的周期,也需要系统提供很好的调度机制。元数据管理 元数据管理包括元数据的查看和元数据的维护,主要的元数据包括数据源元数据,ETL规则,ODS信息模型,数据仓库信息模型,报表元数据,接口数据文件格式和商业元数据.其中,元数据的查看是为用户和系统管理员提供元数据的浏览功能;元数据的维护是为系统的维护人员提供元数据的增加、删除、修改、查看功能。功能说明:主要是为具有相应权限的人员提供元数据的增加、删除、修改、查看等维护功能。用户权限管理功能说明:对报表用户、管理员、维护人员、查询用户的权限信息进行管理;支持通过用户组、用户、角色等方式灵活地对一组用户进行权限管理。系统监控系统服务监控功能说明:对系统中的被监控服务对象以及监控指标进行设置,通过对各主要服务的当前运行状态进行查看,来了解系统当前的运行情况。系统出现故障时,管理员可以根据系统服务的状态采取相应的措施进行故障排除。系统告警管理功能说明:对数据采集过程中由于文件迟传、文件名错和文件格式错而产生的告警信息进行分类查看,并根据所提供的信息采取相应的措施进行处理。对两次ETL过程中由于源数据未到、抽取转换过程中产生错误等各种原因而出现的告警信息进行查看,并根据所提供的信息采取相应的措施进行处理。 对由于数据仓库、ODS、数据采集和数据上报中的各种存储空间的超容产生的告警进行处理,并根据所提供的信息采取相应的措施进行处理。系统日志管理功能说明:对日志产生条件、日志类别、日志处理等参数进行配置管理。对数据采集过程中由于文件迟传、文件名错和文件格式等错而产生的日志信息;对两次ETL过程中由于源数据未到,抽取转换过程中产生错误等各种原因而出现的日志信息进行查看或统计。系统接口管理功能说明:对系统的接口进行增加、删除、修改、查询等维护管理。对其它系统与本系统进行连接、本系统内部模块之间连接时(如:平台与应用集成系统之间的连接)所使用的用户名,以及所能访问的数据以及访问权限进行控制管理。报表管理功能说明:对报表进行增加、存储、删除等管理,并负责向总部统一经营信息服务子系统上传省分生成的各种标准报表。数据仓库归档管理功能说明:对数据仓库中低粒度的细节数据进行备份并清理,包括归档数据的选择、归档触发条件、归档方式等定义。数据备份/恢复管理功能说明: 针对系统中不同种类数据制定不同的备份/恢复策略,包括数据的分类、备份的时间间隔、备份的方式、恢复的方式等定义。系统信息模型设计系统信息模型体系结构考虑到统一经营信息服务系统的数据源主要是来自各个专业系统(GSM、CDMA、VOIP、寻呼、数据、市话、长途等)的生产数据,比较复杂,所以在设计统一经营信息服务系统信息模型时,可以在各专业系统源数据与系统数据仓库之间可以设计一个中间数据存储层即ODS——操作数据存储。ODS具有两方面的特点,一方面它存放的数据接近各专业系统中操作型详细数据,另一方面与数据仓库相似,ODS中存放的数据是面向主题的,不断累加的。这样,系统的信息模型从存储的内容方面可以分为,接口信息模型,ODS信息模型,DW信息模型,报表信息模型、转换规则信息模型、DW元数据信息模型、系统管理信息模型(日志信息模型、安全管理信息模型等)。在各个信息模型中存储的内容如下描述:接口信息模型:对于主动数据采集方式,以文件的方式描述系统与各个专业子系统之间数据接口的内容、格式等信息。与该模型对应的数据是各个专业系统按照该模型的定义传送来的数据文件。ODS信息模型:ODS的引入是为了避免DW与各个专业系统直接接口,减少了抽取的复杂性,同时ODS的信息模型组织主要遵循企业业务事务处理的形式,将各个专业数据进行集中。ODS中数据按客户、帐务、结算、缴费、计费详单、营业等主题组织,详见《中国联通统一经营信息服务系统业务规范(讨论稿)》。 DW信息模型:为企业进行经营数据的分析,系统将数据按分析的主题组织成多维库表的形式存放,DW信息模型描述了经营数据多维库表的结构信息。DW元数据信息模型:用来存储DW多维库表的逻辑结构信息,和DW商业元数据信息。报表信息模型:以文件或关系表的方式,描述系统产生报表的属性,如报表产生日期、产生周期、提交部门、报表指标、指标解释等。与该模型对应的数据是系统根据定义产生的各个报表。转换规则信息模型:本系统从采集源数据到提供经营数据给其它系统这个过程中涉及到三个数据转换过程,分别是从专业源数据到ODS、从ODS到DW、从DW到报表。系统以文件或库表的方式存储这几次数据转换的规则。与该模型对应的数据是三次数据转换实际的转换规则。系统管理信息模型:统一经营信息服务系统作为运营支撑系统中重要的子系统必须具有完善的系统管理功能。系统管理信息模型就是用库表的方式描述系统管理数据的结构信息。系统管理信息包括用于安全管理的信息、用于系统调度的信息,还有系统日志等信息。经营数据接口信息模型:以文件的方式对系统与总部、系统与其它经营信息分析系统的数据接口进行定义。各种模型中存储的数据之间的依赖关系如下图示: 系统ODS信息模型中的数据来源于各专业系统按照接口信息模型定义好的格式和内容传送来的数据,DW信息模型中的数据来源于ODS信息模型中的数据。系统产生的报表数据和总部要求的数据来源于DW。DW元数据信息模型中的数据是指DW信息模型的描述数据和本系统涉及的DW商业元数据。转换规则信息模型中存储依赖于接口信息模型、ODS信息模型、DW信息模型、报表信息模型制定的从接口源数据到ODS、从ODS到DW、从DW到报表的转换规则。系统各种信息模型主要的结构依赖关系如下图示:根据各个业务生产系统中的数据模型,在设计ODS信息模型时,既要能表现专业数据的特点,又要能表现综合业务的特点的操作数据存储信息模型。根据系统ODS中所要求的专业数据内容,制定系统和各个专业系统的接口,制定出接口信息模型。根据ODS中存储的经营数据,按照经营数据的本质设计DW信息模型,即分析主题和各分析角度(维)。在设计系统管理信息模型时,充分考虑系统的管理需求,可参考《中国联通统一经营信息服务系统业务规范(讨论稿)》。当信息模型需要修改时,例如生产系统增加了新的业务,ODS信息模型维护依赖于生产系统信息模型,接口信息模型、DW信息模型维护依赖于ODS信息模型。系统其它信息模型结构相对稳定。 由于各个专业系统的生产数据编码存在不一致的问题,所以在设计ODS信息模型时必须对各系统的涉及的编码进行统一。系统对各个专业系统提出的接口要求中,也要根据ODS的编码对各个专业系统提出编码要求,这样就要求各个专业系统的生产数据进行编码转换,具体编码转换是在专业系统完成还是在统一经营信息服务系统完成,在项目实施时由双方厂家协定,如果在本系统中编码转换,需要专业系统提供数据字典。考虑系统性能问题,建议由专业系统完成编码转换。数据仓库信息编码即各个维中的值的编码,一部分是根据ODS信息编码按照分析的角度重新分层组织得到的,还有一部分是在ODS编码的基础上设计的综合粒度的信息编码。关于《中国联通统一经营信息服务系统信息模型规范》,请参见附件。DW信息模型的设计原则统一经营信息服务系统的核心信息模型是经营信息的组织方式即DW信息模型。本小节和后继几小节就针对DW信息模型的设计进行描述。数据的集成性DW的信息模型应体现数据的集中性,将不同专业系统的数据按照主题组织在一起提供数据的统一展现,实现数据的综合,为企业提供企业级的视点。同时信息的组织又应考虑不同专业系统的差异,对数据进行适当的综合,同时又满足各专业系统特有的分析性需求。信息的有效性DW的信息模型应该支持联通现有报表,同时提供相应的分析。因此信息模型中的相应的数据信息应与联通的指标的定义一致。数据模型的独立性 系统将经营分析需要的数据从操作性环境中提取出来,实现数据的沉淀与集中,达到经营信息与事务处理系统的分离,为企业的经营分析提供支持。信息模型的独立性体现在DW数据与事务处理系统的无关性。模型的灵活性和可扩展性由于经营分析需求的多变性,DW的信息模型应体现按数据的本质特征组织数据,同时维的设计要体现一定的灵活性,以达到对需求的变更有一定的适应性。DW信息模型设计要求模型设计思路在设计DW信息模型时,采用面向对象的设计思路,先根据中国联通目前对企业经营信息的统计分析需求和企业经营信息数据的本质确定大的分析主题和小的子主题,及企业统计、分析经营信息时关心的维对象和维层次。例如DW中包括业务营业信息分析主题、业务帐务信息分析主题、业务计费信息分析主题、等等。业务营业信息分析主题下又包含业务开展、业务使用状态、业务使用状态异动等子主题。在设计子主题中具体应包含那些维和度量,及维的分层和各层取值时,本着尽量使各维的交叉取值都有意义的原则和尽量使维各层都可以向上汇总的原则设计。因为只有各维的交叉取值有意义,它们的度量才有意义;维各层可以向上汇总并且向上汇总的值有意义,才能支持OLAP分析型报表的上钻、下钻。 在确定主题和维后,以用户与业务支撑系统接触点为划分原则确定用户选择和使用电信业务的行为记录结构,即事实表。一个分析主题对应一个或多个事实表,一个子主题在本系统中与事实表一一对应。事实表中主要包括两部分字段信息,即维字段和度量字段。在每个事实表中描述了和每个子分析主题关联的维对象和度量,维对象主要是定性的描述子主题的观察角度,度量主要是定量的表示该子主题在各维约束条件下联通各部门关心的量值。在设计事实表和维各层的关联关系时,可以采用星型模型或雪花模型。星型模型即事实表中各个维字段通过存放维表的唯一主键值和各个维表关联,对于维表,该维所有层次的主键值互相组合,分配以唯一维值标识,组成一张维表。在雪花型模型中,事实表与维表关联,在组织维表时,将维的各个层次分为不同的层次表,要获得分析数据必须经过多次表的关联。考虑到星型模型效率高、可扩展性好,建议采用星型模型设计分析主题,如下图示。设计时要对维和维的层次进行合理划分,保证模型的可扩充性。提供数据的适当聚集,满足用户的一般查询。数据模型应支持联通现有的报表和分析型需求。图:星型模型 例如在业务营业信息分析主题下的业务开展子主题,该子主题与时间、地域、用户类型、用户级别、套餐类型、入网渠道、付费方式、业务类型、帐务类型等维对象关联,对该子主题,各部门关心的主要是在各维值下的新增用户数、离网用户数等度量值。比如2002年11月GSM北京普通个人用户选择资费套餐1通过营业厅入网后付费的标准资费用户数是多少。其中2002年11月是时间维取值,GSM是业务类型维取值,北京是地域维取值,普通是用户级别维取值,个人用户是用户类型维取值,资费套餐1是套餐类型维的取值,营业厅是入网渠道维的取值,后付费是付费方式维的取值,标准资费是帐务类型维的取值,用户数是本产品用户关心的在前面各维值约束下的量值。在DW中,根据用户关心粒度的不同,各维是有层次之分的,例如时间维分为年、月、日三个层次等。DW各维分层,便于本产品在作OLAP在线分析时,可以进行上钻、下钻进行不同粗细粒度的汇总统计分析。DW数据的集成层次DW信息模型应提供数据的不同粒度的集成,由于各个专业子系统的经营数据存在差别,很难用一个统一的模型将所有的专业系统需要的信息包容进来,同时还保证模型的合理性,因此对一个主题下不同的专业系统会有不同的子模型,该模型提供针对该专业系统的详细的信息,同时为了提供从企业级的数据视点,在一个主题下又有一个综合业务的模型,在某种程度上可以说各专业的分析主题是综合业务该分析主题的细化,如下图所示:DW分析主题分类 根据《中国联通统一经营信息服务系统业务规范(讨论稿)》统一经营信息服务系统中经营信息分析分为与业务相关的经营信息分析和与客户相关的经营信息分析。其中客户经营信息分析内容属于本系统中期目标,业务经营信息分析内容是统一经营信息服务系统的基础内容,属于系统目前要建设的目标,本系统含盖的业务经营信息必须能够支持联通总部要求的一类、二类报表,系统业务经营信息分析内容还可以根据各省具体情况增加。业务类分析主题有业务营业信息分析、业务帐务信息分析、业务缴费信息分析、业务计费信息分析、业务结算信息分析、客服业务信息分析、其它业务信息分析。其中业务营业信息分析体现了企业业务的发展情况,业务帐务信息分析、业务缴费信息分析、业务结算信息分析体现了企业业务收入方面的情况,业务计费信息分析、客服业务信息分析、其它业务信息分析体现了企业业务使用方面的信息。客户类分析主题有与客户发展相关的主题、与客户保持相关的主题、与客户价值相关的主题、与客户行为相关的主题、与客户满意相关的主题。业务类信息分析根据业务信息的内容本质特征分别从业务营业信息、业务帐务信息、业务缴费信息、业务结算信息、客服业务信息、其它业务信息这几个方面进行设计分析主题。中国联通拥有GSM、GSMIN、CDMA、CDMAIN、寻呼、长途、数据、市话、VOIP业务的经营权,可以把GSM、GSMIN、CDMA、CDMAIN归为移动业务进行分析,在下面各类分析内容中又包含好几个子分析内容,对每个业务都要针对各个子分析内容进行分析,而且对每个子分析内容除了从各个业务角度进行详细分析外,还要从综合业务角度进行分析。具体每个分析主题的观察角度和度量可参见《中国联通统一经营信息服务系统业务规范(讨论稿)》 数据仓库中的业务类分析主题主要根据客户与企业的接触点得到,客户与企业的接触点包括联通公司各业务系统的营业子系统、帐务子系统、计费子系统、缴费子系统、结算子系统、1001客户服务子系统,因此确定各类主要分析主题如下:业务营业信息分析提供业务开展分析、业务使用状态分析、业务使用状态异动分析、卡资源销售分析、子业务开展分析、子业务使用状态分析、预付费用户状态变迁分析。各个主题可以根据分析的要求设计不同粗细粒度的分析主题,例如业务开展主题即有对各个业务较粗粒度的综合业务业务开展分析,也有对各个业务的细粒度的业务开展分析。有些主题也可根据分析需要,只设计综合粒度的主题,例在卡资源销售分析中在一个分析主题中,综合对各种业务的卡的发展、销售情况进行分析。这点适于其它类分析主题。业务帐务信息分析业务帐务信息分析提供业务收入分析、业务优惠分析、费用分布分析、费用分档分析。业务计费信息分析 业务计费信息提供业务使用分析和信息业务使用分析。主要对话单进行分析,提供话音业务的话务量、数据业务的数据流量分布分析,不同话务类型上的通话次数、平均通话次数分布分析,不同话务类型上的来去话时长、次数分布分析,不同业务及其增值和附加业务的使用次数、平均使用次数分析,在话音业务上作为主叫或者被叫与竞争对手网内用户通话的次数和时长分布分析。业务缴费信息分析业务缴费信息分析包括业务缴费情况分析、业务欠费分析、预付费分析、预付费缴费分析。业务结算信息分析提供网内结算分析、网间结算分析、中继分析。客服业务信息分析客服业务信息分析提供客服服务分析、客服运行情况分析,客服投诉分析。其它业务信息分析其它业务信息分析提供通信能力分析、通信质量分析、业务覆盖分析、卡资源分析、业务资源分析、资源销售分析。 客户类信息分析本系统中、远期目标中要求对客户进行分析,要求系统中存放与业务紧密相关的客户信息。在中国联通统一经营信息系统中客户可以分为三类,一类是直接定购、使用联通业务的客户,一类是帮助联通推销业务的经销商、代理商,一类是其它运营商通过使用联通运营资源给联通带来结算收入的结算对象。在本系统中、远期目标实施时要能对这些客户与业务的定购、使用、和企业的收入贡献关系进行分析。本系统针对客户分析初步设计了客户发展类分析、客户价值类分析、客户保持类分析、客户满意类分析、客户行为类分析。客户发展类又包括客户发展构成分析、客户持久性分析、客户偏好分析、客户异动分析。客户保持类分析包括离网客户统计分析、客户离网原因分析、离网客户价值分析、客户离网前特征分析。客户价值类分析包括客户收益分析、客户成本分析、客服欠费分析、客户缴费分析、客户优惠敏感度分析。其中客户优惠敏感度分析又包括套装发展分析和套餐敏感度分析。客户满意类分析包括客户服务质量分析、客户服务种类分析、客户服务频度分析。 客户行为分析包括客户业务使用分析和客户购买方式分析。具体每个分析主题观察的角度和度量请参见《中国联通统一经营信息服务系统业务规范(讨论稿)》。系统网络组织架构中国联通经营组织结构各级组织职能联通公司的经营组织架构分为全国中心、省中心和地市中心三个层次,如图2.1所示:图2.1联通经营组织架构从市场经营角度,各中心的功能如下: 全国中心(联通总部)对内主要负责中国联通市场整体经营目标、市场营销策略和资费政策的制定,负责各省之间的收入结算,并对各省中心的市场经营活动进行宏观指导。全国中心对外负责处理同其它国际电信运营商的合作以及网络互联互通与国际结算等问题。省中心(省分公司)根据全国中心制定的总体市场方案,结合本省的实际情况制定具体的市场经营目标和市场营销策略。同时,由于中国联通综合电信业务支撑系统采取了以省为中心的集中处理模式,将计费、省内结算、营业、帐务、客服、缴费、客户资料和信用管理/防欺诈等信息的处理与存储集中在省中心,因此,省中心还负责为全国中心和地市中心提供市场经营数据,为其市场经营策略的制定提供依据。地市中心(地市分公司)在综合电信业务服务支撑系统建成后,不具有核心应用系统与生产数据,系统运行方面的职能将减弱,主要职责是客户发展和保持。地市中心作为中国联通以客户为中心总体经营战略的具体实施者,需要根据全国中心和省中心的指导,依据省中心所提供的市场经营数据,对本地区的电信市场进行深入细致的分析,提出相应的营销策略建议,以达到提高客户满意度和忠诚度,增加收入和利润的目的。联通机构间经营信息流向如上所述,综合电信业务服务支撑系统建成后,省中心将成为联通的系统运营中心和数据中心,存放着有关业务与客户的各种数据。因此,综合电信业务服务支撑系统建成后,全国中心、省中心和地市中心之间有关市场经营的信息流动如图2.2所示: 图2.2联通机构间经营信息流图全国和省中心之间:省中心需要向全国中心上传所要求的各种业务经营定报与总部报表需要的数据文件,全国中心需要向省中心发放各种定报格式/定报指标体系。省中心和地市中心之间:省中心需要向地市中心传递地市所需报表(包括常规报表和地市中心定制的报表)或者报表数据;地市中心向省中心上传各种目前没有实现省级业务集中的生产系统的业务数据(包括固网、寻呼等)以及地市经营管理数据。网络建设原则网络系统的设计遵循如下原则:网络系统应采用开放、标准的网络协议TCP/IP。网络系统要有足够的带宽和处理能力,不成为应用系统的“瓶颈”。网络系统要有足够的隔离与安全机制。网络系统要有足够的扩充能力。 网络系统要有一定的先进性,保证不会因技术的发展而立即被淘汰。在满足要求的情况下,尽可能采用简单的网络拓扑,尽可能利用原有设备和现有通信资源。总部与省分公司广域网组网方案中国联通综合信息系统数据传输网(DCN)的建设已经开始,目前正在进行骨干网的建设,可以提供全国中心到省中心的传输通道,各省也将进行信息系统传输网省内网的建设,可以提供省中心到各地市中心的传输通道,因此统一经营信息服务系统可以利用上述传输网作为数据传输通道。如果综合信息系统传输网的建设进度晚于本系统的建设,则可以暂时通过省内传输网连接省中心和各地市中心。由于地市中心所需的统计分析报表可以分为两部分:一部分是各地市通用的报表,由于此类报表采取统一的格式,并且是定期生成的,所以在传送时可以采取由省中心向地市中心“推”的方式,定期地通过文件的方式传送到地市,在联通OA平台建成后,这部分报表可以作为下传文件通过OA平台传递;另一部分报表是各地市根据自己的特点定制的,需要即时生成,因此只能采取地市中心从省中心“拉”的方式,即时地在信息系统传输网上传递。对于广域的数据通信量方面,由于所传递的信息主要由文字和矢量图构成,并且一个地市的数据量有限,所以任何一个地市中心与省中心之间点对点的通信量不会很大。 鉴于广域网内的点到点之间的通信量有限,因此使用基本的广域网技术,就可以满足需要。具体使用何种技术,由中国联通信息传输网的建设确定。如果信息传输网建设进度不能满足本系统的建设要求,建议各地市根据具体的通信方式和通信量选择相应的技术:如果地市中心只需要统一下发的报表,不需要定制报表和进行在线分析,则可以采用拨号/ISDN的方式实现;如果地市需要定制报表并进行在线分析,则可以考虑使用DDN/帧中继/ADSL等作为实现方式。待联通综合信息传输网(DCN)建成后再进行迁移,迁移后原有的连接可以作为备份链路。图:组网方案图总部局域网组网方案根据中国联通总部经营信息服务系统的业务需求,从系统功能上将系统分为数据采集服务器、数据仓库服务器、联机展示服务器。其中数据采集服务器和数据仓库服务器可以共用一个服务器。数据采集服务器和总部结算系统、省分的统一经营信息服务系统相连,联机展示服务器和联通总部的办公网相连。其框架模型如下图:图:总部局域网结构图 由于系统中需要支持在线的OLAP分析,需要从数据仓库中获取大量数据的操作,对局域网具有信息传输量大、转发速率快的要求,因此局域网宜采用快速交换以太网技术,各服务器以百兆的速率连接到核心交换机/路由器,局域网的核心交换机/路由器以百兆或者千兆的速度连接到省分的数据仓库系统。在网络的正常工作时间方面,作为企业经营决策的信息支持系统,统一经营信息服务系统不需要像生产系统那样具备7×24×52的正常运行时间,因此,局域网内不需要配置两台交换机,主机和工作站也不需要配置双网卡来消除单点故障。对于本系统来说,最为重要的是存储在数据仓库中的数据,以及生成的统计分析报表,所以系统的正常工作时间应该主要通过数据备份来保障。在网络安全方面,由于中国联通综合信息传输网属于专用网,自身有较高的安全性。主要应该解决的是与互联网连接时的安全性,建议使用防火墙进行隔离,以提高安全性。省分公司局域网组网方案统一经营信息服务系统省中心局域网结构如下图所示:图省中心局域网组网方案图 由于统一经营信息服务系统中需要支持在线的OLAP分析,需要从数据仓库中获取大量数据的操作,对局域网具有信息传输量大、转发速率快的要求,因此省中心局域网宜采用快速交换以太网技术,对于用户数多的省份可以采用千兆以太网交换技术。即以快速以太网或者千兆以太网交换机作为局域网的核心,各服务器以百兆的速率连接到核心交换机/路由器,局域网的核心交换机器/路由器以百兆或者千兆的速度连接到省中心的企业网骨干,通过骨干实现和各地市中心和全国中心,以及综合营帐系统、统一客户资料系统(UCIS)、1001客服系统、各专业计费系统、结算系统和其它系统的连接。在网络的扩展性方面,随着联通以客户为中心经营理念的不断深入,可以预见今后基于统一客户资料(UCIS)或者客户信息数据仓库的应用会越来越多,同时客户数据量也会不断增长,所以统一经营信息服务系统省中心局域网内的通信量以及和其它系统的通信量会不断地增加。但由于以太网技术自身良好地扩展性,因此即使目前选用快速以太网技术,今后要升级到千兆以太网也是十分容易的。同样,在网络的正常工作时间方面,作为企业经营决策的信息支持系统,省分统一经营信息服务系统不需要像生产系统那样具备7×24×52的正常运行时间,因此,局域网内不需要配置两台交换机,主机和工作站也不需要配置双网卡来消除单点故障。对于本系统来说,最为重要的是存储在统一客户资料(UCIS)和客户信息数据仓库中的数据,以及生成的统计分析报表,所以系统的正常工作时间应该主要通过数据备份来保障。在网络安全方面,由于中国联通综合信息传输网属于专用网,自身有较高的安全性。主要应该解决的是与互联网连接时的安全性,建议使用防火墙进行隔离,以提高安全性。地市中心局域网地市中心局域网的拓扑结构如下: 图表1:地市中心局域网由于地市中心在系统中只是作为客户端,因此需要的设备较少。组网方案可以采用交换式以太网,即以快速以太网交换机为中心,配置多个10/100M自适应端口。服务器性能要求联通统一经营服务系统是一项复杂的工程,其中所涉及的服务器种类也很多,主要的有完成从数据源到目标数据的ETL(抽取、转换、装载)服务器、ODS服务器、数据仓库服务器、OLAP服务器、WEB服务器等。各部分服务器在系统中完成不同的工作,不同的工作有不同的复杂性、不同的数据量,因此对服务器的性能要求也不一样。下面将就主要的服务器性能进行分析,以便为解决方案提供依据。以下是经常用到的几个衡量主机性能的指标。TPMC 对于OLTP应用,目前比较公认的衡量一个服务器处理能力的参数是TPMC值,TPMC值是测试一个服务器在配备某种操作系统,采用特定数据的情况下每秒钟处理事务的能力。TPMC值越高说明系统处理能力越强。用户的应用每秒钟会触发几个事务的范围基本是可以定量计算的,这样针对某个联机事务处理系统对系统主机的选择就可以参照主机的TPMC值来确定了。但是同时也应该看到,主机TPMC值是通过实验手段取得的,某主机系统的TPMC值是在其生产厂商所送检的特定配置的主机硬件、特定配置的操作系统、特定配置的数据库系统事物处理能力的衡量。其配置中任何一项的变化都可能会对TPMC值有很大的影响,例如在硬件和操作系统不变的情况下,改变数据库系统类型或者配置,就可能对系统的TPMC值影响很大,应用软件编制的好坏能在更大程度上影响系统的事物处理能力,所以对TPMC值的作用,仅可以用作参考,不可以生搬硬套,按照一般的原则,选择主机时一般对TPMC值要求要高一些。TPC-H针对决策支持系统中的即席查询,应当采用TPC-H(每小时处理的性能)作为衡量主机处理能力的指标。这种指标处理是面向大量的即席查询和并发的数据修改操作。这种处理用户往往不知道要查询什么数据,不能对预见的数据进行优化工作。TPC-R它也是以每小时处理能力为计量单位的。这种指标是在用户知道要查询什么数据,并可以对相应的数据表进行优化。ODS/ETL服务器性能分析ODS/ETL服务器主要完成的功能:从源数据到ODS地抽取、清洁、转换和装载从ODS到DW地抽取、清洁、转换和装载在ODS中保存接近当前业务的数据 从功能上分析,该服务器进行的工作是以OLTP处理为主。由于话单汇总、分析在经营分析中是数据量最大和最为复杂的,我们将以详细话单汇总和分析为例来分析主机的性能。根据TPC-9><#990099">C的标准,tpmC值是根据标准模型中New-Order事务的处理数目来计算的,一个New-Order事务由平均4-5个SQL语句处理完成,整个测试的执行过程中,New-Order处理占45%。估算条件:用户数按140万计算每天每用户按5个话单分析过程:每分钟处理:(用户数)140万*5/24/60=4861峰值处理:4861*2=9722需执行约8个SQL语句,则估算一个话单汇总处理业务相当的TPC-<#990099">C值为:8*0.45/4=0.9TPC-<#990099">C话单汇总和分析,的TPC-<#990099">C值要求满足: 9722*0.9=8750假设其他经营分析的TPC-<#990099">C总和与话单分析的TPC-<#990099">C相等。8750*2=17500考虑25%的冗余(系统其它开销):主机性能=17500*1.25=23333DW/OLAP/WEB服务器性能分析DW/OLAP/WEB服务器主要完成的功能:数据仓库的数据存储对数据进行OLAP分析提供用户的连接提供WEB展现功能 从功能上分析,该服务器既有OLAP处理,又有OLTP的处理。是两种应用的结合,因此,在性能的分析上,我们要进行了综合考虑。OLAP分析的时长是与数据量有一定的关系的,也就是数据量的增加,相应的分析时长也会增加。OLAP数据模型的生成要对数据库进行OLTP处理,所以该服务器的性能应大于或等于ODS/ETL服务器的TPMC值。系统实施配置系统软件要求要求采用开放、界面友好、具有较强的网络通信处理功能、完备的安全保密机制的系统软件。网络平台要求鉴于Internet已经成为网络的事实标准,本系统的网络平台要求架构在TCP/IP之上。无论底层网络接入采用什么协议、或操作系统采用什么平台,系统的网络平台采用TCP/IP协议。操作系统平台和数据库管理系统要求统一经营信息服务系统主要包括提供各类数据服务的后台服务器,和系统管理终端。建设统一经营信息平台时需要构建数据仓库服务器、ETL服务器等其它服务器,在保证系统性能和安全的前提下,它们可以跨平台建设,采用UNIX操作系统或WindowsNT/2000server等平台。 同样在保证系统性能和安全的前提下,在构建数据仓库时,可以选择商用大型关系型数据库,这些数据库必须具备数据仓库处理能力。系统管理终端采用Windows98/NT/2000操作系统平台。软件界面要求本系统为统计分析应用系统提供数据支持,因此,本系统对外的界面主要有供各部门手工录入数据的WEB页面、供各部门浏览的OLAP报表界面、及供系统管理员进行系统管理而设的图形界面。系统对外界面应该:启动界面中应该有用户权鉴功能。窗口和菜单的设计应该简单明了、方便操作、风格一致。设计的报表页面应该简捷、美观、大方、指标数据层次清晰。数据库及数据仓库要求本平台是供基于海量的业务操作数据作分析和统计的应用系统使用的。系统运行环境中包含有面向企业的ODS数据库和面向企业决策的多主题的数据仓库。数据库及数据仓库软件方面:具有在线备份、恢复机制;支持数据库开发工具;支持网络协议;支持数据安全等。 数据存储设备要求:支持足够大的数据存储容量;处理速度上满足系统的要求。主机要求支持数据库和数据仓库的服务器需采用具有大容量磁盘阵列的高性能企业级的服务器。由于ETL服务器处理的数据量比较大,所以要采用性能比较高的企业级服务器。系统逻辑上应包括以下几类服务器,服务器物理配置由各厂家根据具体实施情况设计。元数据信息服务器存放系统中的所有元信息,包括:源数据文件格式元信息、总部数据文件格式元信息、商业规则元信息、数据仓库元信息、ODS元信息、ETL规则等。将所有上述元信息放在一个服务器上便于管理,同时也便于访问。ETL服务器用于决策支持的数据仓库中的数据不是单单把业务系统的中的数据拿来就可用的。一般都需要做一定的预处理。这其中就要用到ETL即抽取、转换、装入工具。该部分对应于数据子系统中的数据处理,包括数据生成和数据刷新。数据仓库及ODS服务器 数据仓库是面向决策支持的,其特点是拥有各种不同粒度的数据,因而其数据量巨大,但是访问的频度则要低得多。另外数据仓库中数据的组织形式也与数据库有很大区别,数据仓库一般采用多维模型,尤其是星型模型,即数据仓库一般包括一个事实表和若干维表,不同维的层次即能表示不同粒度的数据信息。ODS(操作型数据存储)是用于支持企业日常的全局应用的数据集合,保存在ODS中的数据具有4个基本特点:面向主题的、集成的、可变的、数据是当前的或接近当前的。它架设了OLTP系统和OLAP系统的桥梁。为了提高从ODS到数据仓库导入数据的效率,将ODS和数据仓库放在一台服务器上,这样就要求数据仓库及ODS服务器具有海量存储能力,和高的主机性能。统计报表服务器提供基于传统的各式统计型报表,该部分对应于报表子系统中的报表处理部分,确切的说,对应于报表处理中的统计型报表处理。OLAP服务器OLAP服务器则是将数据仓库的数据按各种主题组织成多个多维立方体,它直接为前端各种展示工具提供快速响应服务。因此需要数据仓库的支持,使得在秒级获得各种查询或分析报表的响应。该部分对应于报表子系统中的报表处理部分,确切的说,对应于报表处理中的分析型报表处理。Web服务器 设置Web服务器,为用户提供通过Web访问OLAP/数据挖掘等服务器的接口。从而为决策者们从网络任何地点接入提供极大的灵活性。数据挖掘服务器在系统中、远期目标中,要包括数据挖掘服务器,利用数据挖掘技术,从大量客户信息、业务数据中找出人们未知的知识,用于企业的经营决策支持。存放各类算法、获得的各类知识、知识生成,知识刷新等。系统存储容量估算ODS数据库数据量估计:在GSM系统中,假设300万用户,每天的话单数据量为1.6G,假设其他的VOIP、193、165等系统的话单数量总共也为1.6G,存放3个月的话单数据,需要(1.6+1.6)×30×3=288G。同时,ODS数据库中需要客户、用户、帐户等静态数据及帐单数据,GSM的这部分数据为70G,假设其他业务的数据也近似共为70G,考虑到这些数据中会更改,每个月假设更改20%用户,考虑存放3个月的更改数据,所需的数量为:140+140×20%×3=224G。DW数据量估计:如果仅考虑业务类分析主题,每个事实表若平均为5个维,其中包含时间维,维的平均层次为3层,每个层次有3个分类值,度量的字节数:50Byte,考虑到维不同层次之间交叉取值含义的有效性,压缩比保守考虑为20%,若考虑DW中存放两年数据,则空间估算如下: 业务营业信息和业务计费信息时间维一般到日,所以估计基础数据量为:(2年*365天*(3值^3层次)^4维)*(4字节*5个维字段+度量占50字节)*(6个基础业务+1个综合业务)*8个事实表=1.416T其它业务分析主题时间维取值一般到月,所以估计基础数据量为:(2年*12月*(3值^3层次)^4维)*(4字节*5个维字段+度量占50)*(6个基础业务+1个综合业务)*8个事实表=47G系统用于临时存放专业源数据和报表及建索引等数据的容量粗略估算为以上容量的20%整个数据库的容量估计为:(288+224+1416+47)×120%=2.37T附录1:GSM、CDMA接口文档样本以下以本系统与移动业务系统的主动数据采集接口为例描述了接口的具体内容,系统与其它专业系统的数据采集接口及系统与其它系统经营数据文件接口可参考以下内容制定。接口信息编号接口名称接口编号 GSM用户信息接口、CDMA用户信息接口010用户押金信息接口020用户服务信息接口030付款信息接口040综合帐单信息日传送接口050综合帐单信息月传送接口051欠费接口060预存款接口070资源销售记录接口 080资源状况接口090详单记录接口100用户套餐接口110用户营业业务记录接口120增值业务使用接口130新业务使用接口140首张落地话单接口150充值记录接口160 客户信息接口170客户用户关系信息接口180资源状态变迁接口190销帐接口210用户信息接口接口信息总体描述在系统进行割接时传递某一个时点的全部用户信息,以后的接口中的信息是本接口在一个传递周期内发生变更的用户部分信息。不包括用户定购和变更的服务信息、用户套餐信息、用户押金信息,相应的信息在对应的接口中体现。用户标识和用户所拥有的资源类型以及资源编号是一对多的关系,因此需要用多条记录来反映用户所拥有的资源的变化。例如新建用户,就需要用2条记录来分别记录用户的号码和SIM卡号 接口实现方式使用文件传送方式。接口传递周期以天为单位传递数据。接口数据格式GSM用户信息接口数据格式字段英文名参数类型缺省值是否为空主键字段名称备注LogNumINTN 记录序号SubscrbIDCHAR(15)N用户标识SvcNumCHAR(20)业务标识号SvcIDCHAR(2) 业务类型SubscrbTypeCHAR(2)用户类型SvcStatCHAR(6)用户状态SubscrbAreaCHAR(8)用户所属地域 SubscrbChrtIDCHAR(2)用户消费性质InNetTypeCHAR(1)入网方式AcptSiteIDCHAR(30)受理点标识用户办理入网的受理点标识 AcptSiteTypeCHAR(2)入网受理渠道SubscbStatTimeDATE用户状态时间ContrCodeCHAR(20)合同号 UnicomMaxCnsmptINT消费高额值联通定义SubscrbMaxCnsmptINT用户高额值用户自己定的ResourceTypeIDCHAR(6)资源类型RsrcID CHAR(100)资源编号BeginTimeDATE资源占用时间EndTimeDATE资源释放时间ChangeReasonCHAR(255) 变更原因AcptSiteTypeIDCHAR(2)受理渠道类型用户办理业务变更的渠道AcptSiteIDCHAR(30)受理点标识ChangeTimeDATE 变更时间EnterCHAR(1)N回车符NewLineCHAR(1)N换行符CDMA用户信息接口数据格式 字段英文名参数类型缺省值是否为空主键字段名称备注LogNumINTN记录序号SubscrbIDCHAR(15)N用户标识SvcNum CHAR(20)业务标识号SvcIDCHAR(2)业务类型SubscrbTypeCHAR(2)用户类型SvcStatCHAR(6) 用户状态SubscrbAreaCHAR(8)用户所属地域SubscrbChrtIDCHAR(2)用户消费性质InNetTypeCHAR(1) 入网方式AcptSiteIDCHAR(30)受理点标识用户办理入网的'