- 4.87 MB
- 185页
- 1、本文档共5页,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 文档侵权举报电话:19940600175。
CTG-MBOSSCRM2.0业务交付流程监控系统功能技术规范CTG-MBOSSCRM2.0业务交付流程监控系统功能技术规范中国电信集团公司2010年3月
目录1文档说明....................................................................................................................................................11.1编制说明...........................................................................................................................................11.2适用范围...........................................................................................................................................21.3阅读指南...........................................................................................................................................21.4术语定义...........................................................................................................................................31.5起草单位...........................................................................................................................................41.6解释权..............................................................................................................................................41.7版权..................................................................................................................................................42总体说明....................................................................................................................................................52.1驱动力分析.......................................................................................................................................52.2建设目标...........................................................................................................................................62.3系统定位...........................................................................................................................................62.3.1在CRM2.0中的定位...................................................................................................................62.3.2在ITSM中的定位.......................................................................................................................72.3.3监控层次定位..............................................................................................................................82.3.4监控对象定位..............................................................................................................................83系统总体架构..........................................................................................................................................103.1功能架构.........................................................................................................................................103.2部署架构.........................................................................................................................................113.3技术架构.........................................................................................................................................133.3.1技术原则....................................................................................................................................133.3.2技术架构....................................................................................................................................143.4系统边界.........................................................................................................................................163.4.1集成接口边界............................................................................................................................163.4.2数据处理边界............................................................................................................................184系统功能..................................................................................................................................................224.1统一采集与控制.............................................................................................................................224.1.1采集策略管理............................................................................................................................23版权所有,注意保密i
4.1.2配置采集....................................................................................................................................234.1.3告警采集....................................................................................................................................244.1.4性能采集....................................................................................................................................264.1.5操作控制....................................................................................................................................274.2CRM应用监控模块...........................................................................................................................284.2.1应用拓扑管理............................................................................................................................304.2.2应用运行监测............................................................................................................................334.2.3应用交易跟踪(可选)............................................................................................................364.3业务交付流程监控模块.................................................................................................................404.3.1业务建模....................................................................................................................................404.3.2业务运营指标监测....................................................................................................................484.3.3业务运营质量分析....................................................................................................................514.3.4可用性探测................................................................................................................................534.3.5业务稽核....................................................................................................................................574.3.6订单监测....................................................................................................................................594.4告警处理.........................................................................................................................................644.4.1告警判断....................................................................................................................................644.4.2告警定位....................................................................................................................................654.4.3告警丰富....................................................................................................................................664.4.4告警过滤....................................................................................................................................664.4.5告警压缩....................................................................................................................................674.4.6告警操作....................................................................................................................................674.5控制管理.........................................................................................................................................704.6综合展现.........................................................................................................................................714.6.1告警展现....................................................................................................................................714.6.2综合视图....................................................................................................................................734.6.3统计报表....................................................................................................................................734.7系统管理.........................................................................................................................................744.7.1用户管理....................................................................................................................................744.7.2权限管理....................................................................................................................................764.7.3日志管理....................................................................................................................................764.7.4自身管理....................................................................................................................................78版权所有,注意保密ii
5集成架构..................................................................................................................................................805.1集成综述.........................................................................................................................................805.1.1集成接口视图............................................................................................................................805.1.2集成接口方式............................................................................................................................815.2集成接口.........................................................................................................................................895.2.1IT服务管理系统接口................................................................................................................895.2.2IT基础设施监控系统接口........................................................................................................975.2.3集团业务交付流程监控系统接口..........................................................................................1015.2.4被管对象系统接口..................................................................................................................1085.2.5其它系统接口..........................................................................................................................1146技术要求................................................................................................................................................1166.1总体要求.......................................................................................................................................1166.2性能要求.......................................................................................................................................1176.3可靠性要求...................................................................................................................................1176.4易用性要求...................................................................................................................................1186.5可维护性要求...............................................................................................................................1196.6接口要求.......................................................................................................................................1206.7数据生命周期要求.......................................................................................................................1217实施演进策略........................................................................................................................................1227.1实施原则.......................................................................................................................................1227.2实施演进.......................................................................................................................................1227.2.1第一阶段:基础平台搭建、实现主动管理..........................................................................1247.2.2第二阶段:增加监控范围、强化端到端的业务数据监控..................................................1257.2.3第三阶段:主动监控、优化服务..........................................................................................1277.3部署方案.......................................................................................................................................1278附录一监控指标体系...........................................................................................................................1298.1指标建设方法...............................................................................................................................1298.1.1指标建设范围..........................................................................................................................1298.1.2指标建设步骤..........................................................................................................................1338.1.3指标参数说明..........................................................................................................................136版权所有,注意保密iii
8.2业务监控指标...............................................................................................................................1388.2.1业务流程指标..........................................................................................................................1388.2.2业务功能指标..........................................................................................................................1578.2.3服务接口指标..........................................................................................................................1598.2.4业务稽核指标..........................................................................................................................1638.3应用监控指标...............................................................................................................................1668.3.1应用进程监测..........................................................................................................................1668.3.2应用服务器监测......................................................................................................................1678.3.3数据文件监测..........................................................................................................................1688.3.4业务服务监测..........................................................................................................................1689附录二监测指标编码规则...................................................................................................................17010附录三接口属性定义..........................................................................................................................17410.1信息项类型...................................................................................................................................17410.2配置项状态编码...........................................................................................................................17410.3事件来源.......................................................................................................................................17410.4告警类型.......................................................................................................................................17510.5告警级别.......................................................................................................................................17510.6所属系统类型...............................................................................................................................17510.7事件分类.......................................................................................................................................17610.8省份代码.......................................................................................................................................17711附录四规范编制人员名单...................................................................................................................17912附录五参考文档...................................................................................................................................180版权所有,注意保密iv
1文档说明1.1编制说明本规范规定了中国电信业务交付流程监控系统(简称SFM)的定位、建设目标和总体架构,从系统功能、系统接口、技术要求、系统演进、监控指标定义、测试规范等方面进行了规范性描述,供中国电信内部使用。本规范是CTG-MBOSSCRM2.0规范集中的一个分册,具体规定业务交付流程监控系统的功能要求、技术要求、指标要求、实施规划等。它在CTG-MBOSSCRM2.0规范集中的位置如下所示:图1.1业务交付流程监控系统规范定位本规范和中国电信IT服务管理规范集IT监控系统分册的关系:本规范定义的业务交付流程监控系统包括CRM应用监控模块和业务交付流程监控模块,分别对应IT服务管理规范集中IT监控系统分册中的应用软件监控系统和端到端的业务监控系统两个系统。本规范定义了对CRM域各系统的应用监控的功能要求,以及对跨系统端到端的业务交付流程的监控功能和监控指标要求。是对IT服务管理规范IT监控系统分册版权所有,注意保密1
在CRM域落地的细化描述。1.2适用范围本规范适用于中国电信各省(直辖市、自治区)业务交付流程监控系统的设计、开发、建设和入网测试,是中国电信各省(直辖市、自治区)公司电信业务交付流程监控系统建设的技术指导性文件。1.3阅读指南本规范包括以下章节:第一章,主要描述本规范的编制说明、适用范围、规范定位以及阅读指南等文档说明性内容。第二章,分析系统建设的驱动力,明确系统建设目标,阐述系统在CRM域中的定位以及与中国电信ITSM系统之间的关系,并对规范中用到的术语进行统一说明。第三章,从整体角度阐述系统功能范围、系统部署模式、系统技术架构要求,提出了基本的系统集成架构,并对数据处理相关功能的系统边界提出了建议。第四章,对系统业务功能进行了具体说明,详细阐述了各功能的定义,实现目标与功能要求。第五章,对系统集成架构进行了具体说明,明确了可选择的接口实现方式,并详细阐述了各系统接口的定义及数据内容要求。第六章,阐述系统技术要求,提出对系统的总体技术要求,并从性能、可靠性,易用性、可维护性等方面对业务交付流程监控系统提出具体的技术要求。第七章,阐述业务交付流程监控系统规划实施的演进策略,包括分阶段的功能实现演进路线和监控对象范围的演进路线。附录一,监控指标体系,对业务交付流程监控系统监控范围内的应用、业务类监控对象进行指标梳理,明确监控指标内容。附录二,监控指标编码规则,阐述了统一的指标编码规则。附录三,接口属性定义,明确了集成接口中选择字段的选择项如省份代码、告警级别版权所有,注意保密2
等。附录四,规范编制人员名单。附录五,参考文档。1.4术语定义术语解释SFM业务交付流程监控系统(ServiceFulfillmentMonitoringSystem)ITSP2.0中国电信企业信息化战略规划2.0版本CMDB配置管理数据库(ConfigurationManagementDatabase)配置项(ConfigurationItems),即CMDB中管理的企业IT资产。配置项包括应CI用软件、系统软件、基础架构、IT服务、文档等IT服务管理是一种以流程为导向、以客户和业务为中心的方法,它通过整合ITITSM服务与组织的业务,提高IT服务提供和服务支持能力和水平,包括事件管理、配置管理、问题管理、变更管理等流程。中国电信CTG-MBOSS规范集的重要组成部分,主要分为IT服务管理和IT监控ITSM规范两部分,其中IT服务管理主要包括CMDB的管理和流程管理,IT监控部分包括基础设施监控、应用监控和端到端的业务监控三部分。KPI关键性能指标(KeyPerformanceIndicators)KQI关键质量指标(KeyQuantityIndicators)SLA服务级别协议VSOP增值业务订购关系管理平台SOA面向服务架构(Service-OrientedArchitecture)J2EEJava2平台企业版(Java2PlatformEnterpriseEdition)WASWEB应用服务器(WebApplicationServer)CSB渠道服务总线版权所有,注意保密3
业务交付流程ServiceFulfillment,本规范定位为订单处理流程组件是实现特定功能,遵循某一个组件模型的约定并可独立部署与运行的软件组件/业务组件单元服务是组件实现并对外提供的功能与操作集合。业务服务有标准的接口,可以服务/业务服务被注册到服务总线上被其它业务服务调用。通过数据比对发现业务处理和业务办理中的数据差异,保证业务运行过程中业业务稽核务处理流程的完整性和正确性、业务数据完整性和一致性被管对象指IT监控系统所监视和控制的对象。又称作网元、元素、节点等。指基于企业业务目标对IT环境的整体容量进行规划设计,对支持当前IT服务容量管理的应用系统、IT基础架构的性能及负载情况、提供IT服务的组织能力进行监控与报告,并对IT资源的使用进行控制和优化。1.5起草单位本规范起草单位为中国电信集团公司。1.6解释权本规范的解释权属于中国电信集团公司。1.7版权本规范的版权属于中国电信集团公司。版权所有,注意保密4
2总体说明2.1驱动力分析在经济全球化的大背景下,信息化日益成为社会经济发展的重要推动力,信息化和工业化融合已成为国家的重要发展战略。因此,企业的信息化水平及IT运营能力必然成为现代企业未来制胜的关键。当前,我国电信行业已进入全业务运营阶段,随着3G牌照的发放,运营商间的竞争日趋激烈,为有效增强中国电信综合竞争能力,需要尽快提升中国电信企业信息化的整体能力,包括IT系统的建设能力和运营能力。为适应市场需求,建立“以客户为导向”的运营管理机制,有效落实精细化管理理念,需要不断深入发掘影响系统和业务运营的关键要素,加强业务内部及业务流程的运作和分析能力,为快速定位系统故障、提升业务应用程序运行效率,及时发现业务运营方面的漏洞提供有力支撑,并不断促进支撑能力的稳步提升和服务质量的持续改进。从以下几个方面驱动了业务交付流程监控系统的建设。战略规划要求:按照中国电信ITSP2.0要求,在2011年以前IT整体达到“主动服务、优化管理”的阶段目标。通过主动管理快速响应各类IT需求,不断提升IT管控的技术支撑水平。全业务运营带来的需求:在全业务运营的情况下,需要主动发现IT服务潜在问题,提前消除隐患;主动深入一线和前端,提高IT响应速度和响应能力;主动出击,引导、梳理、细化、完善IT能力;主动发现企业运营、管理中的问题,为业务发展、精确管理和运营提供决策支持。提升内外部客户感知的必要性:全业务融合的竞争更加要求中国电信提高以客户为中心的服务水平,要求IT为以客户为中心的客户服务感知提供更好的支撑及保障。内部管理水平提升的需求:oCRM域各系统作为电信公司和电信客户的接触点,基本上所有关于订单受理、订单开通等业务流程的故障投诉都会先由CRM运维人员来处理,但是版权所有,注意保密5
CRM运维人员对于订单端到端的业务流程没有监控手段,难以定位故障o运维人员对于面向客户的业务流程涉及到IT系统整体的运行情况缺乏了解,无法预先发现性能下降、系统故障等情况,并预先作出应对措施;o运维人员对业务运行过程中发生的问题,无法迅速判断原因并快速做出相应的动作o业务人员无法及时了解业务运行状态,无法及时了解业务运行过程中的问题和故障2.2建设目标针对面向客户的业务流程,实现对端到端业务交付流程运行状况的全面、准确、及时反映;通过对业务运行指标的分析及早发现业务和系统运行过程中的潜在问题;帮助运维人员快速定位应用程序漏洞或系统故障,控制业务差错,保障业务质量;进而为业务流程优化提供依据:关注面向客户的业务流程和功能,实现对业务运营的实时监控:从业务运营角度出发,针对业务可用性和性能指标进行实时监控,并通过对性能指标的分析及时发现业务运营过程中的渐进性异常,保证业务的可用性和连续性。建立纵向拓扑模型,支持根源分析和故障预警:构建业务、应用、基础设施之间的支撑关系模型,为业务、应用问题预警和故障的根源分析提供系统支撑。建立业务视图,实现业务运营状态可视化:以业务为主线,综合展现相关系统支撑、业务运营数据,为业务人员提供详细、完整、实时的业务运行全景视图。运用分析手段,支持IT综合运营管理:实现对IT支撑系统的综合运营分析,探索信息技术系统的关键点和改进方向,同时为容量管理、服务级别管理等IT服务内容提供基础数据。2.3系统定位2.3.1在CRM2.0中的定位业务交付流程监控系统在CRM2.0中的定位如下:版权所有,注意保密6
公众客户政企客户客户经理营业员客服代表代理商CP/SP面向客户面向内部员工客户面向合作伙伴10001自助终端门户掌厅门户号门户直销渠道门户10000接触门户SP/CP门户网厅门户门户营业厅门户代理商门户统一讣证平台(UAM)渠道服务总线(CSB)增值业务订购关产品与套餐管理系CRM系统系管理平台统(PPM)(VSOP)业务交付流程监控系统(SFM)图2.1业务交付流程监控系统在CRM域的定位2.3.2在ITSM中的定位业务交付流程监控系统在ITSM平台中的定位如下:业务交付流程监控模块实现对ServiceFulfillment端到端流程的监控CRM应用监控模块实现针对CRM域各系统的应用和业务监控图2.2业务交付流程监控系统在ITSM平台中的定位业务交付流程监控系统包括两个模块:版权所有,注意保密7
业务交付流程监控模块实现针对业务交付端到端流程的业务数据监控功能CRM应用监控模块实现针对CRM域各系统的应用软件监控功能。2.3.3监控层次定位业务交付流程监控系统的监控层次如下:监控层次监控对象监控内容监控信息采集源SFM业务流程业务流程KQIKQI和和KPIKPI指标:业务量、业务处指标:业务量、业务处业务交付业务交付CRMCRM、、1000010000号、网号、网业务交付涉及的端到业务交付涉及的端到理时间(平均理时间(平均//最大最大//最小)、异常量最小)、异常量//比率比率流程监控流程监控厅、厅、EAI/ESBEAI/ESB、服务开、服务开业务层业务层端业务流程、业务功端业务流程、业务功业务功能可用性和响应时间业务功能可用性和响应时间模块模块通、激活、计费等业通、激活、计费等业能、业务数据能、业务数据周边接口可用性、响应时间周边接口可用性、响应时间务交付流程相关系统务交付流程相关系统端到端流程实例告警和状态查看端到端流程实例告警和状态查看应用进程工作状态、性能信息应用进程工作状态、性能信息CRMCRM应用应用CRMCRM域各应用系统的域各应用系统的应用服务器工作状态、性能指标应用服务器工作状态、性能指标CRMCRM域各应用系统域各应用系统监控模块监控模块应用层应用层应用进程、应用服务应用进程、应用服务业务组件工作状态、性能指标业务组件工作状态、性能指标应用服务器应用服务器器、业务服务、交易器、业务服务、交易业务服务的运行状态业务服务的运行状态CSBCSB总线总线交易跟踪和问题分析交易跟踪和问题分析软件平台(操作系统、数据库)的可用性、响软件平台(操作系统、数据库)的可用性、响软件软件操作系统、数据库等操作系统、数据库等应时间、资源占用情况等;线程等资源使用情应时间、资源占用情况等;线程等资源使用情软件平台软件平台平台平台基础设施基础设施况;况;监控系统监控系统主机、存储、备份设主机、存储、备份设硬件硬件主机主机//存储的资源使用情况,运行状况等;存储的资源使用情况,运行状况等;硬件硬件备等备等网络网络网络设备网络设备网络连接,网络连接,QoSQoS等;等;网络网络图2.3业务交付流程监控系统监控层次图2.3.4监控对象定位业务交付流程监控系统在CTG-MBOSS2.0中的监控对象分布如下:版权所有,注意保密8
图2.4业务交付流程监控系统监控对象图其中,CRM应用监控模块的监控对象主要涉及CRM域各系统,业务交付流程监控模块的监控对象主要涉及CRM域系统、计费系统、服务开通系统等业务交付流程相关系统。版权所有,注意保密9
3系统总体架构3.1功能架构业务交付流程监控系统的主要功能包括:统一采集与控制、CRM应用监控模块、业务交付流程监控模块、告警处理、控制管理、系统管理、接口和综合展现。综合展现告警展现综合视图统计报表系统应用拓扑管理业务建模业务运营业务运营告警判断接口管理拓扑模型管理业务指标监测质量分析业务流程管理过程建模业务过程平衡性核查告警定位IT服务管理CRM应用支撑业指标监测业务运营告系统接口用户业务运营关系建模务业务支撑质量分析质量分析警告警丰富管理交关系建模业务支撑处应用参数管理关系监测应付业务理告警过滤IT基础设施权限用流参数管理监控系统应用运行监测订单监测管理监程业务稽核告警压缩应用运行控指标监测监可用性探测集团控业务数据订单流程告警操作两级接口日志模应用拓扑用例管理告警管理块模型监测模一致性核查应用支撑块关系监测探测处理订单状态控制管理与被管对象业务数据查询接口自身控制管理探测回退准确性稽核管理应用交易跟踪其它系统统一接口采集策略管理告警采集性能采集配置采集操作控制采集与控制被管对象图3.1业务交付流程监控系统功能架构图统一采集与控制统一采集作为业务交付流程监控系统后台支撑功能,负责根据用户制定的采集策略直接从各被管对象、或者间接从接口系统(基础设施监控系统以及CMDB)中获取告警、性能、配置等数据信息,用于指标数据的生成和处理。统一控制为实现对被管对象的控制管理功能提供命令传递和结果反馈通道,如通过远程登录主机、安装Agent代理等方式,完成对被管对象的控制。CRM应用监控模块CRM应用监控模块实现对CRM域各应用系统中的应用进程、应用服务器(J2EE容器)、业务服务等应用级对象的性能和可用性数据进行监测。版权所有,注意保密10
业务交付流程监控模块业务交付流程监控模块实现对反映业务交付流程运行状态的关键性能指标、关键质量指标、业务功能可用性、服务接口可用性、业务数据一致性及准确性进行统一监测与稽核。告警处理对来自被管对象的各类业务、应用、基础设施告警数据进行统一的定位、丰富、过滤、压缩处理,以提升告警的准确性,进而通过短信、邮件等方式通知维护人员处理,从而提升告警处理的及时性,缩短排障时间,为及时恢复应用、业务的正常运行打下良好基础。控制管理向操作人员提供集中的被管对象操控界面,以实现运维操作集中化、提升日常运维工作效率、并提高相关操作的规范性、安全性。综合展现提出操作人员与业务交付流程监控系统进行信息交互的界面要求,主要涉及告警展现、综合监控视图、综合报表等信息分析和展示功能。系统管理实现对业务交付流程监控系统操作用户的用户账号管理、用户权限管理、系统操作日志管理以及对业务交付流程监控系统自身的管理。接口管理实现业务交付流程监控系统与外部系统的接口,包括与IT服务管理系统接口、与基础设施监控系统接口、与集团业务交付流程监控系统接口、订单告警与状态查询接口、通知接口、统一认证接口等。3.2部署架构按照中国电信核心业务系统建设的体系结构,业务交付流程监控系统的体系结构分为两级,采用两级管理模式进行管理,如下图所示:版权所有,注意保密11
告警通知告警事件集团SFM集团ITSM服务管理系统集团SFM集团维护人员指标、告警信息控制请求基础设施性能数据、告警数据管控指标被管集团CRM集团服务…业务稽核对象域系统开通系统…订单查询集团基础设施监控系统集团省公司告警通知告警事件省SFM省ITSM服务管理系统省SFM省维护人员指标、告警、流控制请求基础设施性能数据、告警数据程实例信息被管省CRM域省级服务…省级EAI省基础设施监控系统对象系统开通系统…图3.2业务交付流程监控系统部署模式与接口关系示意图集团级:集团业务交付流程监控系统负责集团公司CRM域各应用系统的监控,集团业务交付流程的监控,以及全网业务运营过程中业务数据的稽核工作,为集团级全网业务运营提供支撑和保障。同时,集团业务交付流程监控系统接收省级业务监控交付系统的指标上报数据,由集团公司相应人员进行审阅。省级:省业务交付流程监控负责省内CRM域各应用系统,省内业务交付流程以及全网业务交付流程中涉及到省内处理的业务进行监控,负责省内业务运营过程中关键业务数据的稽核工作,为省级业务交付全流程提供充分的支撑和保障。同时,省级业务交付流程监控系统负责根据集团公司要求定期进行指标数据上报集成架构:集团公司系统与省公司系统通过广域网或专门的传输线路相联,以实现业务交付流程监控数据如管控指标上报、业务稽核数据上传、订单状态查询结果回传等。业务交付流程监控系统除了从被管对象系统采集被管对象的告警和性能数据之外,还需要从基础设施监控系统采集被管对象相关的基础设施的告警和部分性能数据;从IT服务管理平台中的CMDB中采集被管对象的配置数据;当确认被管对象发生故障时,通过接口在IT服务管理平台上启动事件管理流程。版权所有,注意保密12
详细接口方式与内容参见集成架构章节。3.3技术架构3.3.1技术原则业务交付流程监控系统实现中国电信CRM域应用系统与业务功能的实时监控,是端到端业务交付流程正常运营的保障,提供“以客户为导向”的运营管理机制,为改善客户感知和提升IT服务质量提供有利支撑。业务交付流程监控系统是中国电信的核心竞争力的体现,其技术架构主体上遵循CRM域技术架构规范要求,同时加入了监控系统统一的采集、控制、及告警处理等技术要求。系统在建设过程中应采用国际先进、成熟的科技成果,结合中国电信已有的经验和资产,保证系统在国内相应领域内具有领先的技术水平。系统实现过程中,应该遵循如下技术原则:1、先进性系统的实现应参考国际标杆并结合现状,采用先进可靠的设备和技术,确保系统的先进性和成熟性,保证投资的有效性和延续性。2、安全可靠性系统必须要达到电信级的安全标准,提供良好的安全可靠性策略,支持多种安全可靠性技术手段,制定严格的安全可靠性管理措施。3、开放性系统应基于国内外业界开放式标准,进行全国统一规划,为未来的业务发展奠定基础。4、可扩展性系统应具备灵活的可扩展性,具备方便地适应业务需求的变化、迅速地支持新业务的能力。5、可伸缩性系统应具备良好的可伸缩性,系统性能及并发处理能力对主机设备具备平滑的扩展能力,支持业务量快速发展的需要。版权所有,注意保密13
6、易使用性系统应易于使用与维护,具备良好的用户操作界面、人性化的管理工具和完备的帮助信息。3.3.2技术架构系统采用分层结构开发和设计,将采集、处理、存储、服务和界面层分离,实现系统内部的松耦合,以灵活、快速地响应业务变化对系统的需求。分层架构如下图所示:业务交付监控系统分层架构告警列表应用拓扑业务视图统计报表界面展现层界面组件(Jsp、Ajax、Flash、Portlet...)业务服务业务服务层业务组件业务组件数据存取数据转换数据封装数据存储层DB配置文件日志文件原始数据处理告警判断指标入库数据处理层数据数据预处理(格式转换、纠错)数据采集层接口协议(WebService、Socket、FTP、Agent...)监控对象(应用、功能、业务流程、基础设施接口、CMDB)图3.3业务交付流程监控系统技术架构各系统层次的职责和要求描述如下:数据采集层数据采集层从被管对象系统采集监控需要的配置信息、告警信息以及性能信息数据,并支持对数据的预处理:对采集来的原始数据进行格式转换、检错纠错、保证异构的原始数据能够按照监控系统内部的标准格式记录。版权所有,注意保密14
数据采集层主要负责为数据处理层提供原始数据,进行实时的数据处理和告警规则判断。同时也支持在数据预处理完毕后直接将原始采集数据入库,用于原始数据的二次加工和异步数据处理。如:原始数据为明细数据,而需要的指标数据为统计数据,就需要对数据进行周期性的汇总计算和处理。在系统设计时,数据采集层应尽量独立于数据处理层,可以单独部署和运行,减少系统内部耦合性,以避免当采集链路出现问题时对数据处理以及其它系统模块的影响。数据处理层数据处理层直接从数据采集层获取预处理完毕的标准格式原始数据,或者从数据存储层获取已保存的原始数据,进行数据加工处理、告警规则判断、并生成最终的指标数据。数据处理层主要负责指标数据、告警数据的生成。其直接调用数据存储层的数据存取、转换及封装功能,为业务服务层提供基础数据。随着被管对象数量的不断增加,数据采集、数据处理的压力也会越来越大。因此在系统设计时,应将数据处理层独立于其它层实现,并可以实现分布式地部署和运行,以保证整个系统架构的稳定性和扩展能力。数据存储层数据存储层的主要任务是实现对数据的封装,并把封装后的数据转换成有价值的业务与系统信息,向其上的业务服务层,其下的数据处理层以及其它相关外部系统提供一致的数据访问服务。数据存储层包括数据的物理存储以及数据的封装:在数据资源方面,支持对数据库、操作系统文件或其它形式存储的数据进行操作,保证数据的完整性、一致性和准确性。在数据封装方面,数据存储层要能完成业务对象的封装,以及业务对象到底层数据库结构之间的转换,并实现对物理数据的存取访问,从而帮助其它模块和系统对业务对象的处理,使得对数据的访问不受数据库物理设计、物理分布的影响。在设计上,可采用集群的构建方式,进行数据层的压力分担、负载均衡,以保证系统的高可用性。业务服务层版权所有,注意保密15
业务服务层实现人机界面无关的业务逻辑相关处理功能。业务服务层由业务服务和业务组件组成:业务服务业务服务以面向服务的方式对一个或者多个业务组件的功能进行封装,它具有明确的接口描述,可以被其它业务服务调用,也可以被界面展现层调用。业务服务的功能由业务组件来实现,某个服务也可调用其它服务来完成更复杂的业务功能。业务组件业务组件是提供业务服务的载体,负责实现具体的业务逻辑。业务组件使用数据存储层提供的功能,来实现对数据库、文件等的存取。业务组件的开发通常采用基于容器的技术,比如实现组件、负载均衡、高可用性和工作量管理的应用服务器。界面展现层界面展现层是业务交付流程监控系统与用户进行信息交互的平台,用户通过用户界面组件调用业务服务来实现业务功能:界面展现组件由一组基本并紧密相关的界面展现单元组成,并通过这些界面单元调用与之有较强内聚性的业务服务实现一个独立的、带有人机交互界面的业务功能。界面展现层设计时,建议采用业界成熟的技术标准体系来构建,通过Ajax、Flash、Portlet、Chart等多种技术手段,采用动画、图形、表格等多种展现方式,提供一套界面友好、操作灵活、运行高效的用户展示界面。3.4系统边界3.4.1集成接口边界业务交付流程监控系统与下列系统有接口交互:IT服务管理系统IT基础设施监控系统集团业务交付流程监控系统版权所有,注意保密16
被管对象系统其它系统主要的接口分类、接口功能概述如下:接口方向接口分类接口概述事件管理接口向IT服务管理系统上报告警事件并接收事件处理结果从IT服务管理系统接软件版本变更、进程启停、脚本执行等控制控制请求接口IT服务管理系请求,并反馈执行结果统IT服务管理系统中CMDB信息发生变更时,传递给业务交付流程监配置项同步接口控统进行同步(CMDB)从IT服务管理系统进行配置项和关联关系访问查询接收与应用软件和业务相关的基础设施如主机、网络、数据库的IT基础设施监告警与性能数据告警数据控系统同步接口接收与应用软件和业务相关的基础设施如主机、网络、数据库的性能数据管控指标上传接省级业务交付流程监控系统向集团级业务交付流程监控系统上报集团业务交付口性能、告警等指标数据流程监控系统全网订单查询接集团业务交付流程监控系统通过全网业务订单ID,调用省内接口口,查询全网业务订单在省内的实时状态、流转情况等信息实现系统对应用进程、接口、业务流程、业务功能的性能、告警数统一采集与控制据的采集接口实现对被管对象操作控制,如对被管应用进程的启停操作与ODS/EDW的接从ODS/EDW采集接收指标计算、业务稽核等结果数据被管对象系统口实时接收被管对象系统如CRM、服务开通等系统触发的告警信订单告警与状态息,转换后提供统一的告警列表展示查询接口从被管对象系统如CRM、服务开通、计费等系统查询订单状态及流转情况信息与短信平台的短信通知接口其它系统通知接口与邮件系统的邮件通知接口版权所有,注意保密17
以界面集成方式将业务交付流程监控系统界面集成到其它系统统一认证接口所有登入系统的用户都在统一权限控制中心进行认证详细接口内容、协议、接口方式定义参见集成架构章节。3.4.2数据处理边界对于业务交付流程监控系统中运算量较大,特别是需要对业务明细数据进行处理的功能进行分工说明:如业务类性能指标的计算、业务数据一致性稽核、业务数据准确性稽核。针对这些功能,要求监控系统提供统一的告警判断、结果展示功能。但运算过程,可以由生产系统本身处理、ODS系统处理或者业务交付流程监控系统来处理。本规范根据对业务交付流程监控范围内指标数据、业务稽核数据的分析,给出建议的处理方案,并提供分工方案选择说明。各省公司进行系统建设时可以根据自身情况择优选择。1)业务指标计算建议方案:指标生成功能部署在ODS系统中,ODS从生产系统中同步原始业务处理数据,按照业务交付流程监控系统的要求计算并生成指标数据,SFM通过统一采集功能将指标结果采集到系统中进行后续处理。如下图:SFM采集指标原始业务数据计算指标数据逻辑同ODSODS步生生产业务处理数据产系系统统业务处理版权所有,注意保密18
图2.6指标计算分工建议方案方案依据:指标计算是监控系统的重要组成部分,对于应用类指标或主动探测方式的业务类指标,通常由监控系统自行从被管对象获取。对于业务流程类的指标,往往需要根据指标要求和计算方法由原始生产数据汇总计算而来,因此涉及由哪个系统来计算的问题。考虑到对各系统的功能要求以及性能压力,如果业务指标计算方法较为复杂,或者ODS中已存有原始数据且ODS生成指标数据的及时性能够满足要求,建议由ODS进行指标计算处理;如果指标计算方法较为简单,或者生产系统数据中直接就可以取到指标数据,建议由生产系统生成后进行采集。其它情况下,也可以使用监控系统获取原始数据二次计算得到指标结果的方式。2)数据一致性稽核建议方案:业务数据一致性稽核功能部署在ODS系统中,ODS从生产系统中同步原始业务数据,按照业务交付流程监控系统的要求稽核业务数据的一致性,并将稽核结果、差异内容提供给业务交付流程监控系统统一告警与展示。如下图:SFM采ODS集数据业务数据一致性稽核结果稽核同步生产业务数据系统图2.7数据一致性稽核建议方案方案依据:数据一致性稽核主要分为数据量一致性稽核与数据内容一致性稽核两类:版权所有,注意保密19
数据量一致性稽核如订单数据平衡性、业务办理一致性等。主要关注各业务环节数据量的一致性,因此可采用简单的处理方法:业务交付流程监控系统直接从生产系统或ODS系统获取数据进行比对,对一致性比对结果进行告警与展示。数据内容一致性稽核如CRM与计费客户信息一致性的稽核,订单处理过程中各环节订单信息一致性的稽核等。除了关注数据量级的比对外,还关注数据内容的一致性,需要深入到字段级别的对比。这类稽核运算量巨大,数据涉及多个系统,但比对周期一般要求不高,分工方案的选择尤为重要。建议首选由ODS系统负责获取原始数据进行运算、其次选择由监控系统或者某个生产系统负责运算,将稽核结果传入监控系统进行统一跟踪告警与展现。3)数据准确性稽核建议方案:业务数据准确性稽核功能部署在生产系统中,将稽核结果、差异内容通过采集的方式提供给业务交付流程监控系统进行统一展示和告警。如下图:生产系统稽核结果采集SFM数据准确性稽核业务数据图2.8数据准确性稽核建议方案方案依据:数据准确性稽核是对数据稽核更高层面的要求,包括业务数据完整性、数据与系统配置符合情况、数据与业务规则符合情况等内容。准确性稽核除了需要获取大量的原始数据外,还与业务配置规则密切相关,因此首选由各生产系统自行处理,或者由专业的第三方数据核查工具来处理,如果涉及的数据和业版权所有,注意保密20
务规则较为明确也可由ODS系统处理,不建议由监控系统直接处理。业务交付流程监控系统可在稽核处理完成后采集处理结果进行统一展示。版权所有,注意保密21
4系统功能4.1统一采集与控制统一数据采集与控制是通过主动采集或被动接收等方式,从被管对象获取告警信息、性能信息、业务信息,并建立、维护及断开控制管理模块与被管设备之间的操作通道。为了实现业务、应用和基础设施三个层次支撑关系的建立与分析,还需要从IT服务管理系统的CMDB采集获取配置信息、从基础设施监控系统采集基础设施告警、性能数据。从被管对象采集数据包括原始数据采集、采集数据预处理等步骤。预处理是对采集来的原始数据进行格式转换、检错纠错,形成内部标准记录,可直接保存为原始数据。同时系统对原始数据进行计算、分析处理,并进行告警规则判断触发告警,并生成所需KPI指标。处理过程如下:从被管对象采集数据被管对象数据采集预处理数据处理告警判断监控DB图4.1采集处理流程示意图1从IT基础设施监控采集数据,是通过系统间集成接口,从IT基础设施监控系统获取处理完成的告警数据以及性能数据,通过接口的适配和转换直接保存为业务交付流程监控系统的告警指标及性能指标数据,处理过程如下:从IT基础设施监控系统采集数据基础设施数据采集数据适配监控DB监控系统图4.2采集处理流程示意图2从CMDB采集配置项数据,是通过与IT服务管理系统中CMDB的集成接口,获取被管对象的配置信息以及被管对象之间的关联关系信息,用于进行告警信息的内容丰富以及自动生成基础设施、应用之间的拓扑关系,处理过程如下:版权所有,注意保密22
从IT基础设施监控系统采集数据基础设施数据采集数据适配监控DB监控系统图4.3采集处理流程示意图34.1.1采集策略管理对统一采集功能所涉及的参数进行集中配置管理。如性能采集指标,告警采集指标,配置采集指标等采集点的参数配置进行集中管理。IT基础设施的告警、性能数据通过和基础设施监控系统的接口采集,应用、基础设施层被管对象的配置数据通过与CMDB的接口采集。【功能要求】4-1.系统支持通过统一的配置中心界面集中配置采集参数。4-2.支持按采集对象设定不同采集任务,支持采集任务参数的设定,比如采集任务名称、采集任务的类型(主动采集,被动采集等)、采集方式、指标采集周期、采集条件、数据文件存储目录、采集失败补采数据存储目录等参数设定。4.1.2配置采集4.1.2.1采集内容4-3.配置数据采集的内容包括但不限于:基础设施如主机、网络设备、数据库、中间件、存储、备份等设备的配置信息及配置项关联信息,详见ITSM规范中IT基础设施监控系统的配置信息采集要求;应用系统配置信息采集,主要指CRM域的应用软件、进程、进程池、接口、数据文件等逻辑单元的配置信息及配置项关联信息。版权所有,注意保密23
4.1.2.2采集方式4-4.配置数据采集的方式包括但不限于:从CMDB配置管理数据库提供的配置项(CI)同步接口采集4-5.应能够按照配置的采集周期和时间主动同步IT服务管理系统的配置项信息;4-6.当IT服务管理系统中的配置项发生变更时,应能够根据采集策略实时接收配置项变更信息;4.1.2.3采集要求<采集处理要求>4-7.应能够根据采集到的配置信息更新业务交付流程监控系统中的配置信息及配置项之间关联关系;<采集异常处理>4-8.支持对所需的资源配置数据采集失败后,能够产生配置数据采集失败告警,提示维护人员。告警内容要包括数据无法采集的对象标识和告警产生时间,告警级别等;4-9.如果由于网络或者其它原因,未能正确采集到资源配置数据,能够根据采集策略要求进行重新采集或补采;<采集日志要求>4-10.提供采集报告,采集情况写入系统日志,以便维护人员检查配置数据采集情况。4.1.3告警采集4.1.3.1采集内容4-11.告警采集的内容包括但不限于:来自基础设施监控系统的主机、数据库、中间件等基础设施的告警信息;来自应用系统的应用和业务告警信息。版权所有,注意保密24
4.1.3.2采集方式4-12.告警数据采集的方式包括但不限于日志方式:采集被管对象的日志文件,分析出日志文件中的告警信息,完成告警数据的采集任务;SNMPTrap方式:通过监听SNMPTrap端口,实时接收来自于应用、业务层面的Trap消息,经过消息预处理后,生成告警数据;Syslog方式:通过监听syslog端口,实时接收来自于应用、业务层面的syslog消息,经过消息预处理后,生成告警数据;SOCKET、文件(FTP)、API、数据库等方式:根据实际接口需要,通过SOCKET端口监听、文件传输、API传输、数据库访问等方式,被动接收或主动采集告警数据;安装代理方式:通过在被管服务器上安装Agent,实现被管设备的告警数据采集。4-13.对于实时采集接口,如:从被管对象发送的Socket、SNMPTrap告警信息以及基础设施监控系统接口传来的告警信息,统一采集应能够实时接收并处理;4-14.对于非实时的采集接口,如文件(FTP)、数据库等方式,统一采集应能够定制采集时间规则,并根据该规则进行告警采集;4.1.3.3采集要求<采集处理要求>4-15.应能通过对采集到的告警数据进行预处理,完成告警格式一致性处理;4-16.应能根据告警分类规则,实现告警的分类,如:应用告警、业务告警等;4-17.应能根据告警严重程度,实现告警级别的定义和判断;<采集异常处理>4-18.当采集系统自身出现故障时可以产生系统告警信息;版权所有,注意保密25
4-19.当采集系统恢复正常后,数据采集应能迅速自动恢复,能够根据采集策略要求进行重新采集或补采。<采集日志要求>4-20.提供采集报告,采集情况写入系统日志,以便维护人员检查告警数据采集情况。4.1.4性能采集4.1.4.1采集内容4-21.性能数据采集的内容包括但不限于:来自基础设施监控系统的主机系统、数据库、中间件等基础设施性能指标;来自应用系统的进程、进程池、接口、数据文件等性能信息;相关业务系统的监测指标数据,包括业务数据总量、比率性能指标等;相关业务系统的关键质量指标、管控指标数据,包括业务系统的服务质量评价指标等。4.1.4.2采集方式4-22.性能数据采集的方式包括但不限于:FTP/TFTP方式:针对业务系统的日志数据或者业务系统其它以文件方式保存的业务统计数据,数据采集层以FTP/TFT的方式从业务系统主机上进行采集;Syslog方式:业务系统主动通过Syslog方式上报的业务数据;数据库方式:从业务系统数据库表中,提取相应的业务统计数据;业务系统厂家提供的其它方式:如业务系统已经按照相关技术规范要求,定义了该业务系统MIB,其中定义了各种业务性能指标的Count值,要求能够通过SNMP轮询方式,从业务系统采集相应的业务性能数据;针对ODS系统已有的业务数据,系统应能支持通过接口直接从ODS系统采集。4-23.应能够周期性地自动采集性能数据,采集周期和采集时间可配置。应能根据不同的被管对象设置不同的采集周期和采集时间;版权所有,注意保密26
4.1.4.3采集要求<采集处理要求>4-24.应能够对采集来的原始数据进行检错纠错,形成内部标准记录,应支持比较灵活的检错纠错配置。应能够完成性能数据格式一致性处理;<采集异常处理>4-25.当采集系统自身出现故障时可以产生系统告警信息;4-26.基于被管对象支持的基础上,应提供补采机制,当性能数据采集出现问题时进行补采;<采集日志要求>4-27.提供采集报告,采集情况写入系统日志,以便维护人员检查性能数据采集情况。4.1.5操作控制操作控制数据传递主要在控制管理模块操作被管对象时提供命令传递和结果反馈通道,以便完成对被管对象的自动化控制。【功能要求】4-28.对被管对象的操作内容包括但不限于:对应用进程、应用服务器进程的启停操作;对应用接口的启停操作;对数据文件的增、删、改等处理操作;对业务系统的操作控制:比如对业务功能访问权限的控制、对系统的经常发生问题的数据进行变更控制,使得系统可以完成后续处理,保证系统连续性;基础设施如主机、数据库、中间件的启停等控制操作。4-29.操作方式包括但不限于:SNMP方式:支持SNMP接口的系统,可以此方式操作;telnet方式:通过telnet等方式对被管对象进行操作;版权所有,注意保密27
Agent方式:通过在服务器上安装Agent控制服务器的操作;ssh方式:大量操作控制采用安全的ssh执行;FTP/TFTP方式:FTP等文件方式传输配置文件;rlogin方式:远程登录后执行;Rsh、rexec方式:直接远程执行相应的操作;HTTPS方式:通过HTTPS对相应的被管对象执行操作;Webservice方式:对于支持webservice的应用系统采用本方式。4.2CRM应用监控模块CRM应用监控模块的主要目的是从CRM域各系统应用架构的视角,监控组成应用系统的应用软件运行情况,根据各部分的性能数据和异常数据生成各种告警,通过告警列表、应用拓扑图等方式展现给运维人员,及时发现应用系统存在的诸如服务不可用、性能下降等问题或隐患,帮助维护人员快速缩小、界定问题存在的最小范围,定位并解决问题,在最短时间内恢复系统的正常运行,为由被动服务向主动服务的转变提供有力的保障和支撑。【应用监控范围】目前的应用系统普遍采用分层结构开发和设计,特别是基于J2EE和SOA的系统架构,将界面、业务流程、服务、数据分离,实现了系统内部松耦合,以灵活、快速地响应业务变化对系统的需求。这样的分层架构对应用监控提出了更高的要求,相应的监控范围也扩充到应用系统各个层级,如下图所示:版权所有,注意保密28
外围展现层AJAX、Portlets、WEB2.0、Other系统BIL4L业务流程层ING3MS业务服务层EAISO2CSBSS业务组件层ED1A基础应用层应用服务器应用进程数据文件图4.4SOA架构下CRM域应用监控的范围(带有数字标识的内容为应用监控对象)应用层次结构划分为基础应用层、业务组件层、业务服务层、业务流程层、展现层,各层次间通过直接调用或者通过CSB进行调用,实现系统功能。其中CRM域的应用监控主要涉及基础应用层、业务组件层、业务服务层、CSB四部分:基础应用层:监控为上层组件和服务提供基础支撑的软件进程、应用服务器、数据文件等,在J2EE平台下,主要体现为运行在JVM容器中的WebApplicationServer。这里主要关注应用服务器的性能、故障、配置等信息的监控;业务组件层:业务组件是提供业务服务的载体,负责实现具体的业务逻辑,并且保证其对外提供的服务的质量要求。通常业务组件的开发采用基于容器的技术,比如实现组件、负载均衡、高可用性和工作量管理的应用服务器。对业务组件的监控主要基于对应用服务器的监控实现,提出了对J2EE架构下交易的跟踪功能(可选);业务服务层:业务服务以面向服务的方式对一个或者多个业务组件的功能进行封装,它具有明确的接口描述,可以被其它业务服务调用,也可以被业务流程或展现层调用。对业务服务的监控主要体现为业务服务的可用性监控;版权所有,注意保密29
CSB:是CRM域内部的服务总线,CRM内部公用服务都需要在CSB上注册管理,可以提供给各个系统进行调用。提供给集团CRM或其它域相关系统的服务也需要通过CSB提供。对于CSB的监控主要指的是对注册在CSB上的服务的监控。4.2.1应用拓扑管理应用拓扑是以应用系统作为索引来组织应用软件所包含被管对象的拓扑结构,与普通告警列表相比,应用拓扑关注关键的应用监控对象及其关键指标信息,并能通过对支撑关系的分析协助运维人员进行问题预警和告警根源定位。应用拓扑图由节点、节点上的指标、节点间的关系、指标间的关系等元素构成。为体现应用软件与支撑应用软件的基础设施之间关联关系,拓扑图还要能展示与应用软件节点相关的基础设施节点以及告警、性能等指标数据内容。图4.5应用拓扑建模示意图应用拓扑建模步骤如下:1.确定应用拓扑监测范围:对需要监测的关键应用系统进行分类,如CRM域的,将相同类型应用系统监控对象配置在同一个应用拓扑模型中。系统要支持对应用拓扑模型的分类目录式展现;版权所有,注意保密30
2.确定应用关键节点:在明确了监测的应用系统范围后,对需要监测的应用程序、应用服务器、接口、数据文件以及支撑应用的基础设施如主机、存储、数据库等节点进行调研分析;3.建立关键节点,节点与监控对象、监控指标的关联关系,能通过指标库查询选择相应指标,可实现一次性的选中多个指标建立关联关系;4.建立节点间的关联支撑关系:应用拓扑管理具体包括拓扑模型模型管理、应用支撑关系管理和应用参数管理等,详述如下。4.2.1.1应用基本参数管理应用参数管理是指对应用拓扑管理中用到的各类基本参数进行管理,包括应用、基础设施类被管对象管理、指标管理、指标关联关系管理等。【功能要求】4-30.系统支持通过统一的配置中心界面,可视化方式集中配置应用建模相关参数。4-31.支持应用软件与支撑应用软件的基础设施监控对象管理、监控对象关联关系管理、指标管理、指标关联关系的统一配置管理;4-32.对于应用及基础设施的配置信息以及关联关系信息,获取方式除了手工录入,还支持从IT服务管理系统的CMDB接口导入;4-33.应用建模应支持自动发现功能,系统可根据自动发现规则配置自动发现被管对象、被管对象关联关系等信息;4.2.1.2拓扑模型管理能够提供图形化的方式,根据监控人员的要求配置一个或多个应用拓扑模型,以网络拓扑图的方式展示应用软件、基础设施监控对象以及他们的支撑关系。【功能要求】版权所有,注意保密31
4-34.应能支持拓扑模型中节点基本信息的维护,包括节点名称、节点与应用、基础设施类被管对象之间的对应关系等。系统应能够提供图形界面,灵活的定义业务监控视图,在定义过程中,应可以选择视图呈现的元素、背景颜色、父节点显示层次、子节点显示层次等;4-35.支持节点与节点之间的拓扑关系管理,如关键应用模块之间及关键应用模块内部的逻辑关系;4-36.应能够在拓扑模型中设置节点与被管对象的指标过滤规则,以便将与应用有关的指标信息在模型中呈现出来;4-37.应能够在拓扑模型中设置节点与被管对象的告警过滤规则,以便将影响应用状态的告警信息加载到拓扑模型中;4-38.应支持根据需要切换到不同的应用拓扑,支持多个拓扑模型管理;4.2.1.3应用支撑关系建模应用支撑关系建模主要指对应用软件与支撑应用的基础设施之间关系管理、应用软件自身之间的关系管理、告警影响规则管理、告警关联规则管理。应用软件、基础设施被管对象之间的关联关系包括但不限于:关联关系、依赖关系、从属关系等。通过关联关系可以对应用进行钻取,找到与告警的应用相关的其它应用以及支撑应用运行的基础设施,进而查看相关被管对象的告警数据和性能数据,进行告警问题的根源分析。告警影响规则管理指设置应用支撑关系模型中监控对象的影响规则,如设置某个应用出现告警,引起其父元素状态变化的规则。在应用拓扑图中体现为父节点状态的变化、颜色、文字的提示,以实现应用软件的及时预警。告警关联规则管理指设置不同应用之间、应用与基础设施之间告警关联关系,当多个告警同时出现时,系统会根据告警关联规则进行处理,自动定位出根源告警并突出显示。【功能要求】<应用支撑关系管理>版权所有,注意保密32
4-39.当具备了与IT服务管理系统的集成环境后,当在CMDB(配置管理数据库)中完成配置项关系建立或变更时,应能够将关联关系模型传递到应用支撑关系模型中,实现模型的自动生成;4-40.应能够提供可视化界面新建、编辑、删除构成应用支撑关系模型的各类监控对象,如应用进程、接口、主机、中间件、数据库等监控对象;4-41.应能够实现应用支撑关系模型的增加、删除、修改等基本管理功能,支撑关系包括但不限于关联关系、依赖关系、从属关系等;<告警影响规则管理>4-42.应支持根据监控对象的告警类型、告警程度、告警持续时长等信息对监控对象告警传递规则的配置功能;4-43.应支持根据告警影响规则,将被管对象的告警信息自下往上逐级传递的功能;4-44.告警影响规则方式包括但不限于:最大化:源节点发生任何级别的告警,目标节点将产生严重预警;升级:源节点发生告警,目标节点将产生更高一级的预警;标准:源节点发生告警,目标节点将产生相同的预警;减小:源节点发生告警,目标节点将产生更低一级的预警;最小化:源节点发生告警,目标节点将不产生预警;<告警关联规则管理>4-45.应能够提供可视化界面新建、编辑、删除构成应用支撑关系模型的各类监控对象的告警信息关联关系,告警关联关系包括但不限于:关联关系、从属关系等,以支持告警数据的关联过滤与分析。4.2.2应用运行监测应用运行监测是指根据应用参数管理功能中配置的应用、基础设施监控对象以及各监控对象的指标要求,实时采集、处理指标数据,进行数据预处理、纠错、转换并进行告警判断,通过告警列表、应用拓扑视图等方式予以展示,并通过短信、声音、邮件等方式将告警信息传递给运维人员,来实现对应用运行状态的实时监测。版权所有,注意保密33
应用运行指标监测按照功能可以划分为:应用运行指标检测、应用拓扑模型监测、应用支撑关系监测。4.2.2.1应用运行指标监测应用运行指标监测是指对系统中配置的应用、基础设施监控对象的性能、质量指标数据进行实时监控,如进程CPU利用率、进程内存占用率、接口可用性状态等,对这些数据进行预警分析并生成告警信息,将告警状态呈现在告警列表中,并可以根据配置执行告警前传,以短信、邮件等方式及时通知运维人员处理。【功能要求】4-46.应支持对应用进程的监测管理,如进程状态、进程CPU使用率、进程内存使用率等运行信息;4-47.应支持通过以模拟接口协议进行接口(业务服务)可用性测试,从而实现接口可用性状态、响应时间及其它指标进行实时监测;4-48.应支持数据文件监测,指对系统运行时重要的配置文件、系统文件等进行监测,这些文件的异常可能会导致应用软件的异常,能够针对配置数据文件的变化而产生告警,如数据文件内容的修改、数据文件的删除等;4-49.支持J2EE架构应用服务器的运行指标监测,如客户端请求数、Session数、数据库连接池使用率、Servlet情况、EJB情况等(可选项);4-50.详细的应用监控内容要求见附录一:监控指标体系相关内容;4-51.基线分析:系统初上线时,因版本的不够稳定,通常告警阀值设定较高,系统进入稳定期后,相应告警阀值需要根据实际情况进行调整。系统应支持根据某个监控对象和指标一段时期内的指标运行情况进行汇总,作为阀值调整的基线,用户可参考汇总基线值方便地调整性能告警阀值。版权所有,注意保密34
4.2.2.2应用拓扑模型监测应用拓扑模型监测是根据拓扑模型,对在模型上定义的关键应用节点,节点关键性能、质量指标数据进行实时监控,将应用运行中出现的告警、预警信息直观呈现在应用拓扑模型中,来实现对应用系统运行状态的专题式监控,及时发现用户关注的异常。【功能要求】4-52.应用拓扑模型监测功能应以应用拓扑视图的方式展现;4-53.支持根据不同的应用系统构建不同的拓扑视图,并可以在监控时灵活切换进行监控;4-54.性能指标应具备预警机制,当某个指标的当前值超出了预警阀值,系统应能够自动生成应用告警信息,通过短信、声音、告警列表等方式主动通知业务人员或者相关维护人员及时解决问题。反映应用拓扑模型上,则该指标对应的节点应能够以不同的颜色展示不同级别的告警,当该告警事件被清除后,系统应能自动将该关键点恢复成正常颜色;4-55.支持通过应用拓扑图关联到应用节点详细信息页面,可根据时间段来查询该节点的告警信息列表,进而进行相关告警处理如告警确认、告警级别调整、告警清除等操作;4-56.支持通过应用拓扑图关联到应用节点详细信息页面,可根据时间段来查询该节点的历史指标数据,以表格或走势图的方式展现,应支持业务指标数据导出功能,导出格式包括但不限于文本、EXCEL等文件格式;4-57.应用拓扑视图应支持定时无闪烁刷新功能,刷新频率不宜过高,以不影响系统性能和展现效果为基准,也不宜过低,否则无法达到业务过程监测的实时性要求。4.2.2.3应用支撑关系监测应用支撑关系监测是指根据应用支撑关系模型对应用系统以及支撑应用的底层基础设施系统进行监测。对符合应用支撑关系、告警影响规则、告警关联规则的信息进行处理和展现,借此实现告警的根源分析、节点预警以及告警关联过滤,帮助运维人员提前发现应版权所有,注意保密35
用系统潜在问题、快速定位告警根源,以最短的时间解决系统问题,保证业务的正常运行。【功能要求】4-58.应支持根据应用模块之间的支撑关系以及应用与底层IT基础设施间支撑关系,以拓扑图的方式展示被管对象关联关系。在应用拓扑模型或者告警列表中,当某应用被管对象出现告警时,可以根据支撑关系钻取并展示相关被管对象,帮助维护人员进行告警问题根源分析。由上至下迅速定位影响应用系统正常运行的故障根源;4-59.应能够根据告警影响规则实现告警信息的传递。在应用拓扑模型中,当某节点发生告警时,系统可根据告警影响规则将告警信息传递到相关的其它节点中,并用特殊的颜色或信息予以展示。由下至上迅速了解节点故障对应用系统的影响;4-60.应能够根据告警关联规则实现告警的关联过滤。在应用拓扑模型或告警列表中,当多个被管对象均触发告警时,系统可根据告警关联规则,找到多个告警信息中的根源告警并突出显示,并能展示各告警信息之间的衍生关系;4.2.3应用交易跟踪(可选)【背景分析】随着J2EE框架及相关技术的迅速发展,J2EE已经成为大型企业创建以Web为中心的关键业务应用的首选平台,基于J2EE的应用服务器已经成为企业Web应用基础架构的核心。在J2EE应用管理过程中,迅速诊断和解决故障、性能问题是最关键,也最具挑战性的工作,特别是在生产环境下,问题将会更加复杂。常见的J2EE应用系统架构如下:版权所有,注意保密36
DBServletssnoiLtInternetWEB服务器EJBsQScaDBsna外部用户rT负载均衡防火墙中间件DBIntranetWEB服务器应用服务器内部用户图4.6J2EE应用架构示意图J2EE应用架构是一个复杂的、多层次的结构,其中包括客户机、防火墙、负载均衡器、Web服务器、应用服务器、交易服务器、数据库服务器以及这些组件之间的网络链接。同时,由于J2EE应用是建立在组件基础上的多层次结构,所以其本身也具有内部复杂性:应用服务器通过某个Web服务器接收到客户发出的HTTP要求,然后采用各种J2EE组件(Servlets、EJBs、helperclasses等)和各种外部实体(例如:数据库和交易服务器等)处理这些要求,再返回处理结果。可能造成J2EE应用服务器出现性能和可用性问题的因素有:不良的代码、设计和系统结构,造成例如内存泄漏、过多的远程调用、数据库SQL语句耗时、JDBC连接未释放等;错误的参数设定,例如数据库连接数不足、不合理的缓冲池大小、不正确的执行线程数、过小或过大的JVM内存量等;不合理的容量规划,低估了并发用户的数量造成资源紧缺,或者高估了所需容量导致资源浪费;不合适的集群,它将导致不正确的负载平衡,同样会造成节点的性能过载,削弱应用可用性;网络、硬件等其它问题。传统的分析策略,如基于服务器日志和参数的分析,在大型分布式、多层次的复杂J2EE应用中,往往不能提供足够的信息。J2EE诊断需要能够对运行中的生产系统,从版权所有,注意保密37
URL访问至数据库调用整个交易过程进行跟踪与分析,并能在定位到具体交易环节后深入应用系统组件和代码以定位问题的根源,以实现真实环境与负荷下的性能分析和诊断。由此提出了对应用交易跟踪功能的要求。【功能定义】交易实例跟踪:系统可以通过跟踪全程事务的方法,来获取每个应用交易实例各环节及整体性能数据,跟踪信息要能跨越Web应用架构的各个层面,如浏览器客户端到http服务器,再到应用服务器的网络时间;应用服务器内部各组件,如Servlet时间、SessionEJB时间、数据库时间等。系统可以通过设定性能阀值如交易时长来实现对整体交易或者某交易环节的监控,当应用交易出现超时等异常情况时,系统可以自动产生告警,并将交易实例详细流转情况记录入库,以支持问题现场的重现,方便运维人员先于系统用户发现问题并进行后续的交易深入分析,准确定位系统性能瓶颈所在。交易跟踪过程如下图:交易流转路径URL1JSP3ServletEJB3SQL21客户端HTTP服务器应用服务器数据库服务器URL1JSP1Servlet1EJB1SQL1URL2JSP2Servlet2EJB2SQL2URL3JSP3Servlet3EJB3SQL3图4.7交易跟踪流程示意图版权所有,注意保密38
交易深入分析:通过监控级别的进一步增强,当交易跟踪过程中监控到应用出现性能瓶颈后,可以自动开启应用交易的深入分析功能,实现事务处理中函数级别的时间捕捉,并将函数栈调用全过程,包括方法名、方法耗时信息等记录入库。可以通过被跟踪的交易实例关联到函数调用列表,支持运维人员与系统设计、开发人员协同工作,找出性能根源并及时解决。【功能要求】4-61.系统应能够根据应用交易实例流转情况自动生成交易拓扑,以图形化的方式展示交易实例流转过程,包括每个环节关联的组件对象,每个环节耗费的时间等;4-62.系统应支持针对不同的URL路径、Servlet对象名称等维度对交易的性能数据进行查询和统计分析,以期在生产过程中对系统性能进行评估,提前发现系统性能瓶颈;4-63.应支持交易跟踪的监控级别调整,分为两级基本的交易跟踪与监控。开启后,系统可以通过实时采集每个应用交易实例各环节流转的性能数据,进行性能数据的汇总,将均值信息记录入库,当设定了交易时长阀值后,如果交易超出阀值则会记录交易调用的详细信息,以备现场重现所用;深入的交易跟踪与分析,开启后,系统会在出现交易超时情况时,深入代码级别的数据采集,记录函数调用顺序以及函数执行时长等信息,以实现交易的深层次跟踪;4-64.应支持集群环境下的系统架构的交易跟踪功能,能够定位低性能应用服务器;4-65.要求系统实现时不修改生产系统源代码,不会对原有交易性能产生影响。同时,在开启了应用交易跟踪的两级监控功能时,分别对生产系统主机的额外压力应不大于10%和20%;4-66.要能支持主流J2EE应用服务器的交易跟踪功能,包括但不限于:WebLogic、WebSphere、Tomcat等。【说明】应用交易跟踪功能专业化程度较高,实现的技术难度较大,同时对生产系统也会带来较大的性能压力,作为可选功能项,各省可根据自身需求情况酌情参考。版权所有,注意保密39
4.3业务交付流程监控模块业务交易和信息处理通常在运行过程中是以业务流程的方式进行的,业务交付流程监控模块是将业务流程作为监测视角,对关键业务流程的处理过程进行深层次的信息整理和展现,深入业务过程内部,解析业务细节信息,通过监测业务过程中关键环节的指标数据以及整个业务过程的关键质量指标数据,来了解业务的运行状态和质量,找出业务流程瓶颈,发现业务存在或潜在的问题。这里监测对象主要指业务交付端到端流程涉及的各业务系统运行环节以及相应的业务指标数据。业务监测过程包括业务建模、运营监测、业务质量分析、可用性探测及业务稽核。4.3.1业务建模业务建模是以数据模型的方式在系统中建立起业务过程或者业务支撑关系的描述。主要包括:业务过程建模、业务支撑关系建模和业务参数管理。业务过程建模主要指业务活动过程中的模型建立;业务支撑关系建模是描述业务与模块、业务与底层IT基础设施以及应用之间的关系;业务参数管理指业务基本配置数据管理。4.3.1.1业务基本参数管理业务参数管理是指对业务建模过程中所包括的参数进行集中配置管理。【功能要求】4-67.系统支持通过统一的配置中心界面,集中配置业务建模参数。4-68.支持图形化界面灵活的配置业务建模参数。4-69.支持业务过程配置、关键点配置、指标管理、指标关联关系配置、指标分析方法配置、指标关联关系分析方法配置等功能。4.3.1.2业务过程建模业务过程建模首先通过对关键业务的流程梳理,确定业务处理过程中的监测关键点,版权所有,注意保密40
以业务处理过程的视角描述关键点之间的关系,形成业务处理过程模型。然后根据监测需要建立相应的监测指标体系,指标通过对业务基础数据的抽取和计算,来体现业务关键点的业务状态。业务过程建模的方法:图4.8业务建模方法示意图1.确定业务流程监测范围,选择重点需要监控的业务流程;2.确定流程的关键点,即业务过程中的关键处理环节。主要从监控需求出发,选择流程中容易出问题或者需要重点关注效率的环节作为关键点;3.梳理关键点的指标。抽取的关键业务指标能够对关键点的业务处理状态进行直观准确反映。指标的类型一般包括业务可用性、业务及时性、业务准确性、业务处理量、积压量等;4.通过关键点间的关联关系梳理指标之间的关联关系。关键点间的关联关系包含某几个关键点间的关联关系、具体的关键点与整个业务过程的关联关系;5.确定指标的分析方法,包括针对单个指标、以及多个指标之间关系的分析方法。例如新装机流程监控:版权所有,注意保密41
图4.9新装机流程示意图4.3.1.2.1业务过程模型管理过程模型管理是对所梳理的业务过程在系统中以模型化语言的方式进行存储,包括过程关键点梳理、业务关键点变迁流转路径梳理,并将整个业务过程以模型的方式存储,一个业务过程主要实体包括业务过程、环节、关键点、环节关联。【功能要求】业务过程关键点关键点关键点关键点图4.10业务过程建模示意图4-70.应能够根据对业务过程进行分类,支持对业务类型的增加、删除、修改的功能;4-71.应能够支持对业务过程基本信息进行增加、删除、修改的功能;4-72.应能够提供图形化界面新建、编辑、删除构成业务过程模型的各类监控对象,如业务关键点、指标等信息。版权所有,注意保密42
4.3.1.2.2关键点与指标的关系管理关键点与指标的关系管理,是对指标库中的指标与业务过程的关键环节的关系进行维护,通过这种关系的建立,将指标与业务过程关联起来,指标的量值能反应出监测对象的实际状态。关键点与指标的关系模型管理指的是将这种关系在系统中以模型的方式进行存储。【功能要求】建立关键点与指标的关系包含以下内容:4-73.应支持图形化的配置界面,配置关键点与指标的关联关系。包括关系的建立、修改与删除。如下图所示:图4.11关键点与指标关系示意图4-74.应支持从业务指标库中搜索需监测的指标,搜索条件包括指标类型、指标编码、指标名称等;4-75.应支持直接创建指标并与关键点关联的功能。指标需要明确定义采集周期、采集方式、起始采集时间等;4-76.应支持对指标进行归类整理的功能,如业务量类指标、业务处理效率类指标、业务积压类指标等;版权所有,注意保密43
4-77.应支持设置关键点上所对应的指标的告警过滤规则,以便将这些影响业务的告警信息加载到模型中,过滤规则应能够灵活的基于告警事件的不同字段进行设置,并能够基于多个字段组合设置过滤规则。4.3.1.2.3关键点间的关联关系模型管理业务关键点间的关联关系指确定业务过程中的关键点相互之间存在的关系,其关系通过关键点关联的指标的关系来具体体现。业务关键点间的关联关系管理指的是将这种关系在系统中以模型的方式进行存储。通过对不同关键点的多个同类业务指标的归并可以形成反映整个业务过程的关键质量指标。如下图所示的过程质量指标1是由业务指标1和业务指标10归并而成,归并算法根据具体业务应至少支持加、减、乘、除、定制等基本算法。图4.12业务关键点关联关系示意图关键点间的关联关系包含两种:某几个关键点间的关联关系;某一关键点与整个业务版权所有,注意保密44
过程的关联关系。某几个关键点间的关联关系,具体体现为多个不同关键点同类指标间的关系,通过对关键点指标进行分类及规整,形成相关指标类型,根据过程模型,并结合业务经验积累定义相关关键点同类指标的关联关系,进而建立关键点间的关联关系。关键点间的关联关系是业务监测的分析要点,如上图中关键点1的业务指标1和关键点3的业务指标12存在固定比值范围的关系,即业务指标1与业务指标12的比值在某一固定取值区间。关键点与业务过程的关联关系,具体体现为某一关键点业务指标与业务过程关键质量指标之间的关系。如上图所示:关键点3的业务指标10和反映该业务过程关键质量指标的过程质量指标1存在关联关系。【功能要求】建立关键点间的关系模型具备如下功能:4-78.应支持图形化的配置界面,配置关键点间的关联关系。包括关系的建立、修改与删除;4-79.应支持对关键业务指标进行归类整理,如业务处理效率类指标、业务积压类指标等;4-80.应支持对关键点相关业务指标进行归并,形成反映整个业务过程的关键质量指标的功能;4-81.应支持对不同关键点同类指标间建立关联关系,形成整个业务过程的监测分析要素,例如:构成关系、比值关系等;4-82.应支持对某个关键点与业务过程关键质量指标间建立关联关系,形成整个业务过程的监测分析要素,例如:占比关系等;4-83.应支持对关键点的单个指标或单个业务过程关键质量指标设置异动分析、趋势分析等多种分析方法;4-84.应支持对关键点间的关联关系设置多种分析方法,具体体现为对不同关键点间具有关联关系的同类指标设置对比分析、构成分析等多种分析方法,或者对多个关键版权所有,注意保密45
点间的同类指标以及某个业务过程关键质量指标之间设置对比分析、构成分析等多种分析方法。4.3.1.3业务支撑关系建模业务支撑关系建模主要是指对业务与模块、业务与底层的IT基础设施以及应用之间的关系进行梳理,建立业务的支撑关系模型,描述不同层次之间的物理和逻辑支撑关系,从而把业务的可用性和业务状态,与支撑业务的模块以及底层IT基础设施和应用的状态关联起来,构成业务与模块的支撑关系模型以及业务与应用、IT基础设施支撑关系的模型。业务支撑关系建模主要包括支撑关系模型管理、指标聚合规则管理、告警影响规则管理、告警关联规则管理等。4.3.1.3.1支撑关系模型管理关系模型管理是以数据模型的方式在系统中建立业务与应用及IT基础设施的关系模型,并在系统中以模型的方式进行存储。【功能要求】关系模型管理要能支持如下功能:4-85.当具备了与IT服务管理系统集成环境后,在配置数据库(CMDB)中完成配置项关系建立时,应能够将关联关系模型自动传递到业务支撑关系模型中,以便实现模型自动生成功能。4-86.应能够实现业务支撑关系模型的增加、删除、修改等基本管理功能。4-87.应能够提供图形化界面新建、编辑、删除构成业务支撑关系模型的各类监控对象,如服务器、中间件等监控对象。4-88.应能够在业务支撑关系模型中设置监控对象的指标过滤规则,以便将与业务有关的指标信息在模型中呈现出来。4-89.应能够在业务支撑关系模型中设置监控对象的指标告警过滤规则,以便将这些影版权所有,注意保密46
响业务状态的告警信息加载到模型中,过滤规则应能够灵活的基于告警事件的不同字段进行设置,并能够基于多个字段组合设置过滤规则。4.3.1.3.2指标聚合规则管理指标聚合规则管理指在业务与模块的业务支撑关系模型中设置基本监测指标向父元素聚合的规则管理功能。父元素根据聚合生成的新指标的数据取值以及该新指标设置的告警规则得到影响该元素可用性状态的告警数据,呈现在业务支撑关系模型展现视图中,直观的反映父元素的业务状态以及底层元素状态之间的支撑关系。【功能要求】4-90.系统应支持提供常用的指标聚合计算规则,主要包括如下:平均算法;最大算法;最小算法;合计算法;定制算法等;4-91.应支持指标逐级向上聚合的功能;4-92.系统应支持聚合指标值自动计算功能。4.3.1.3.3告警影响规则管理告警影响规则管理指设置业务支撑关系模型中监控对象的告警状态变化,引起其父元素状态发生变化的影响规则。如支撑业务的服务器或者应用出现影响业务的严重告警时,可直接或间接的影响到该业务的出现预警,在业务监控视图中体现出父关键点的状态变化,以颜色、文字等方式给以提示。【功能要求】版权所有,注意保密47
4-93.应支持根据监控对象的告警程度、告警持续时长等信息对监控对象告警影响规则的配置功能。4-94.应支持告警影响规则自下往上逐级传递的功能。4-95.直接传递规则应包括如下算法:最大化:源节点发生任何级别的告警,目标节点将产生严重预警;升级:源节点发生告警,目标节点将产生更高一级的预警;标准:源节点发生告警,目标节点将产生相同的预警;减小:源节点发生告警,目标节点将产生更低一级的预警;最小化:源节点发生告警,目标节点将不产生预警。4-96.系统应支持根据影响规则自动计算父元素状态的功能,父节点的告警信息能体现原节点的告警信息。4.3.1.3.4告警关联关系管理告警关联规则管理指设置不同业务之间、业务与应用以及底层基础设施被管对象之间的告警关联关系,当不同层面的多个告警同时出现时,系统会根据告警关联规则进行处理,自动定位出根源告警并突出显示。【功能要求】4-97.应支能够提供可视化界面新建、编辑、删除构成业务支撑关系模型的各类监控对象的告警信息关联关系,告警关联关系包括但不限于:关联关系、从属关系等,以支持告警数据的关联过滤与分析。4.3.2业务运营指标监测业务运营指标监测是通过业务监控视图将业务运行中的各个关键点的业务指标数据以及支撑业务的底层IT基础设施和应用的性能指标数据加载到业务模型上,并对这些指标数据进行预警分析生成告警数据,将告警状态呈现在业务模型中,来实现对业务运行状态的实时监测。版权所有,注意保密48
业务运营指标监测按照功能可以划分为:业务过程指标监测、业务支撑关系监测。4.3.2.1业务过程指标监测业务过程指标监测是指根据业务过程模型对各关键点上定义的关键业务指标以及整个业务过程的关键质量指标数据进行监控,如订单处理失败率、平均处理时长等数据,并对这些业务数据进行预警分析生成告警信息,将告警状态呈现在业务过程模型中,来实现对业务流程运行状态的实时监控,及时发现业务流程中出现的异常。【功能要求】4-98.业务过程指标监测功能应以业务监控视图的方式展现。4-99.业务监控视图应可以针对不同的业务构建出不同的视图。4-100.业务监控视图应能够提供拓扑图的方式来呈现具体的业务流程图,包括业务流程、关键点以及关键点间的关系等信息。4-101.业务关键点上应可以实时展现该关键点所关联指标的即时数据,包括基本监测指标数据以及根据基本监测指标运算出来的聚合指标数据。如:指标A为新装开户工单开机成功数,指标B为新装开户工单开机失败数,则聚合指标C新装开户开机工单失败比例=B/(A+B)。4-102.应能够实时展现反映该业务流程整个过程的关键业务质量指标数据。该指标数据一般由各个业务关键点同类指标聚合得到。比如整个业务过程的业务处理时长为各个关键点业务处理时长的加和。4-103.指标应具备预警机制,当某个指标的当前值超出了预警阀值,系统应能够自动生成业务告警信息,通过短信、声音、邮件、网站列表等方式主动通知业务人员或者相关维护人员及时解决问题。反映到业务过程模型上,则该指标所属的关键点应能够以不同的颜色展示不同级别的告警,当该告警事件被清除后,系统应能自动将该关键点恢复成正常颜色。4-104.业务过程指标监测应具备单实例监测以及总量监测的功能,单实例监测主要是指监测的业务指标对象为单个实体,如监测订单处理时长指标,则需要监控具体每一版权所有,注意保密49
个订单的处理时长;而总量监测是指监测的业务指标对象为多个实体的总量数据,并不需要细分到单个实体,如订单平均处理时长指标、订单受理失败量等。单实例监测和总量监测是通过监测指标采集数据的属性来区分的。4-105.业务关键点详细页面可根据时间段来查询该关键点的告警信息列表,系统应支持自动和手工进行告警确认、告警级别调整、告警清除等操作。4-106.业务关键点详细页面应支持根据时间段来查询各关键点业务指标在该段时间内的数据,以表格或走势图的方式展现,应支持业务指标数据导出功能,导出格式包括文本、EXCEL等文件格式。4-107.业务监控视图应支持定时无闪烁刷新功能,刷新频率不宜过高,否则影响系统性能和展现效果,也不宜过低,否则无法达到业务过程监测的实时性要求。4.3.2.2业务支撑关系监测业务支撑关系监测是指根据业务支撑关系模型对业务以及支撑该业务的业务模块、底层IT基础设施和应用的状态进行监控,并对这些业务数据进行预警分析生成告警信息,将告警状态呈现在业务支撑关系模型中,根据定义的业务影响规则来实现对业务的影响性分析。【功能要求】4-108.应支持以拓扑图的方式分别呈现业务与业务模块之间的支撑关系模型和业务与底层IT基础设施以及应用的支撑关系模型。4-109.业务支撑关系监测是通过业务监控视图来呈现的,系统应能够提供图形界面,灵活的定义业务监控视图,在定义过程中,应可以选择视图呈现的元素、背景颜色、父节点显示层次、子节点显示层次等。4-110.应能够将影响业务的性能指标信息加载到对应的监控对象中。4-111.应能够灵活的设置告警引起的监控对象可用性状态规则,可用性状态应至少包括可用、劣化、不可用等状态,并能针对不同的可用性状态设置不同的展现颜色。4-112.应能够将可用性状态加载到对应的监控对象中。版权所有,注意保密50
4-113.应能够根据告警关联规则实现告警的关联过滤。在业务监控视图或告警列表中,当多个被管对象均触发告警时,系统可根据告警关联规则,找到多个告警信息中的根源告警并突出显示,并能展示各告警信息之间的衍生关系以实现告警的根源发现。4-114.应能根据业务影响规则来判断当底层IT基础设施以及应用出现故障时将会对哪些业务产生什么级别的影响。4-115.监控对象详细页面可根据时间段来查询该元素的告警信息列表,系统应支持自动和手工进行告警确认、告警级别调整、告警清除等操作。4-116.业务监控视图应支持定时无闪烁刷新功能,刷新频率不宜过高,否则影响系统性能和展现效果,也不宜过低,否则无法达到业务监测的实时性要求。4.3.3业务运营质量分析业务运营质量分析是在业务建模和业务运营指标监测的基础上对业务过程的状态变化情况进行跟踪,对各关键点指标数据以及业务过程关键质量指标数据通过异动、趋势、对比、构成等分析方法来实时或准实时地发现业务异常,及时掌握业务运营质量,并对业务未来变化趋势进行预测,提前发现业务可能出现的问题并及早做出预防措施,找出影响业务的主要因素,解决问题。可以考虑的分析方法包括:异动分析:通过对当前业务指标数据与历史指标数据或业务指标预测数据的对比,发现业务活动的异常,作为业务问题进一步分析的出发点图4.13异动分析示意图版权所有,注意保密51
趋势分析:对关键业务指标的历史数据进行特定周期的趋势分析,反映关键业务环节业务活动质量的变化趋势8.00%7.00%6.00%5.00%4.00%3.00%2.00%1.00%0.00%1357911131517192123252729时间比例处理环节1失败处理比率处理环节2失败处理比率图4.14趋势分析示意图对比分析:业务流程中,有些关键点的指标之间有相似的变动趋势,可以通过比对指标之间的变化趋势,发现某个指标的异常变化业务量时间图4.15对比分析示意图构成分析:业务流程中,有些指标之间有构成关系,可以根据业务经验发现基本一致的构成比例,如构成比例曲线发生异常,则应及时展开分析100%60%50%80%40%60%30%比例比例40%20%10%20%0%0%9:0010:0011:0012:00时间9:0010:0011:0012:00时间业务环节1业务环节2业务环节3处理环节1占比处理环节2占比处理环节3占比图4.16构成分析示意图【功能要求】4-117.应能针对单个指标提供异动分析、趋势分析等图形分析方法,针对关键点间的关联关系(即不同关键点同类指标之间的关联关系、某一关键点与业务过程关键质量版权所有,注意保密52
指标之间的关联关系)则可以提供对比分析、构成分析等图形分析方法,这在业务建模时需要进行分析方法的配置。4-118.针对某些业务指标已确定的分析方法应可随着业务的变化而进行适当调整;4-119.应支持历史数据的对比功能,对于同一指标不同时期(如小时、天、月等)的对比(趋势分析),不同指标相同时期的对比(对比分析)。4.3.4可用性探测可用性探测是通过模拟客户端运行业务的过程以及模拟外部系统调用服务的过程,以界面、短信、服务调用等方式针对业务进行探测,从而对业务可用性状态、响应时间及其它指标进行实时监视。通过分析探测结果,发现关键业务流程潜在的性能及可用性问题,建立预警机制,生成业务活动监测告警事件通过模拟端到端的请求,替代传统的人工检查,弥补系统监控管理的缺陷,先于系统使用者找出业务流程的隐患。【主要探测方式】HTTP方式:通过模拟HTTP方式请求,探测网上营业厅请求、前台B/S结构的受理终端等系统;短信方式:通过模拟短信方式请求,探测短信营业厅系统;程序方式:通过模拟程序方式请求,探测自助受理设备、前台C/S结构的受理终端等系统;Socket接口方式:通过模拟Socket接口方式请求,探测CRM系统与外部系统之间的接口;WebService通过模拟WebService接口方式请求,探测诸如CRM系统与外部系统之间的查询,受理等功能。版权所有,注意保密53
4.3.4.1用例管理探测用例管理提供对探测用例和探测动作的定制、修改、删除。探测用例包含若干探测动作,每一个探测动作代表探测时执行的一次请求,系统针对每一探测动作记录其探测结果。探测用例管理需要提供探测用例与探测动作的关联关系、探测动作之间的关联关系的管理。例如缴费开机、客户订购产品、充值、停机等业务活动过程都可以作为探测用例。【功能要求】4-120.探测用例管理功能支持对用例属性(主要包括用例名称、探测对象、业务类型、部署位置等)的增删改查的管理。4-121.探测动作管理功能包括对动作属性(主要包括动作名称、所属用例、动作频率、探测方法等)管理。4.3.4.2探测处理探测处理功能包括业务活动模拟功能、手动探测与定时探测、探测点部署、探测告警、探测结果展现(通过综合展现层展示)。【主要业务分类】可用性探测可分为用户接触点探测、服务接口探测。用户接触点探测:通过模拟最终用户、营业员等系统最终用户的实际业务操作,采用仿真方式直接对被探测系统特定业务发起探测,通过对被探测业务办理结果及办理时延等探测结果的分析,发现被探测系统中存在问题的业务功能模块。服务接口探测:版权所有,注意保密54
主动模拟OSS订单接口、计费接口、欠费停机接口等CRM外部系统的实时业务过程,采用仿真socket、http数据交易等方式直接对CRM相关的业务接口发起模拟探测,模拟产生业务交易并分析交易最终结果,从而发现接口潜在的性能及可用性问题,建立预警机制,生成服务接口监测告警事件。在用户接触点探测和服务接口探测的基础上,可以使用业务建模中已经设置好的业务流程顺序,采用仿真交易的方式直接对业务过程发起模拟探测,模拟产生业务交易并分析交易最终结果,从而发现关键业务流程潜在的性能和可用性问题,建立预警机制,并通过系统监测生成告警事件。具体的业务功能和服务接口探测内容见附录一:监控指标体系章节。【功能要求】4-122.业务活动模拟功能业务活动模拟应能根据被探测业务系统的类型提供多种模拟功能。需要能够模拟用户打开业务系统页面,判断是否可以正常打开页面;再使用特定的测试帐号登录业务系统,判断是否可以正常登录;并模拟用户执行一个查询操作或功能操作(该操作需要通过相应中间件连接至数据库,然后返回操作结果),根据操作的返回结果判断操作是否成功,同时获取时延信息。4-123.手动探测与定时探测定时调度按照配置的探测频度和时间要求,发起探测交易;手动调度根据某类业务探测任务需要发起即时探测交易。增加手动调度功能可以补充定时调度探测的一些盲区,在某个时点可以进行业务运行状况抽查或者验证业务运行状况,并能按照现实情况增加某些时间点地探测密度。4-124.探测点部署模拟探测需要具备从不同地理位置(区域)发起业务探测的能力。这些业务探测发起地点通常部署在用户体验较差、性能问题多发地点,或者业务量较大的地点。所有探测点版权所有,注意保密55
采集的信息都需要发送到业务活动探测平台,按照小时、天、月和年等时间维度进行聚合。为查询分析和实时监测提供能够定位到地理位置(区域)的信息。4-125.探测告警探测告警是指在探测过程中由于探测模块本身出现故障或者探测结果数据出现异常导致系统生成警示信息的功能。探测告警包括两个方面的含义:一方面是指探测过程本身发生故障;另一方面是指探测到的业务活动信息有异常。4-126.按照主题的方式展示探测数据探测展示功能能够实时的按照用户类型和业务类型等维度来展示探测的数据。探测展示功能能够以业务为中心,按照模拟业务体验发起时间、发起地点、业务响应时间和业务体验结果等维度进行数据分析,找出体验较差的业务。本功能也可以以用户类型作为分类,展示不同类型用户的探测结果。探测的实时数据需要提供参考数据对比功能。参考值可以基于系统自行测算出来,也可以基于维护人员的历史经验输入。4-127.探测信息查询与分析探测信息查询与分析功能,需要根据探测信息的用户接触点、业务类型、探测指标等多种属性提供查询和分析的功能,属性范围如下:探测用例信息需要包括:探测时间、探测结果、探测时间总长、平均时长、探测失败率。探测动作信息需要包括:探测时间、反馈结果、时间长度。4.3.4.3探测回退探测回退是指在整个探测活动结束后,系统自动回退探测过程中对于生产环境造成的改动,确保生产环境恢复到探测之前的状态。【功能要求】版权所有,注意保密56
4-128.若自动回退失败,系统将发起回退失败告警,提示维护人员手动回退。4.3.5业务稽核为了保证系统处理全过程的顺畅,提前发现潜在的问题,应考虑对各系统的业务数据质量进行主动性监控及维护。业务数据稽核是指通过数据比对或配置审查的方式来发现业务处理过程以及各系统档案的数据问题,保证业务运行过程中业务处理流程数据及业务档案数据的一致性和准确性。业务数据的异常原因多种多样,主要可分为动态数据异常,如前后环节的订单流转数据;和基于档案的静态数据异常,如客户资料数据。动态数据异常一般是由于在业务办理过程中,由于接口通讯中断、数据配置错误、业务逻辑不完善等原因而导致。而静态数据异常一般是由于系统间同步不及时、数据存储异常、人为操作等原因而导致系统数据异常。从稽核方式上看,业务稽核可分为数据一致性稽核和数据准确性稽核两类,分别对应对比方式的数据稽核和数据审查方式的数据稽核。详细的业务稽核内容与指标要求见附录一:监控指标体系章节。4.3.5.1数据一致性稽核数据一致性稽核从稽核粒度上可分为基于数据统计值的平衡性稽核,如客户接触单派发总数等于接收处理各环节的单量总数,和基于数据明细的内容一致性稽核,如CRM系统中的客户信息应该与计费系统保持一致。根据本规范中系统处理边界的定义,数据平衡性稽核通常由业务交付流程监控系统实现,而内容一致性稽核由ODS或者生产系统实现,业务交付流程监控系统负责采集稽核结果、进行展示和告警判断。【功能要求】<数据平衡性稽核>版权所有,注意保密57
4-129.系统应支持业务数据平衡性稽核规则的配置化管理,要求配置灵活、简单;内容包括:核查所需KPI指标的选取,运算公式的配置,运算周期、运算开始时间的设定等。4-130.系统能根据配置好的采集策略自动获取稽核所需的KPI指标,并按设定的运算周期自动进行业务稽核。4-131.对于不满足规则的核查结果,支持产生告警并展现不满足规则的具体原因,包括告警内容、稽核时间等。4-132.提供按照核查时间、稽核类型、稽核规则名称等条件进行查询和统计。<内容一致性稽核>4-133.系统应支持设定内容一致性稽核结果的展示方式和告警判断规则。4-134.系统可接收来自ODS系统或者其它业务系统的内容稽核结果,根据设定的规则进行展示。提供图形化的展示方式,对于不满足稽核规则的记录可以用特别的颜色标明,并提供差异明细数据的关联展现。可对符合告警规则的稽核结果进行告警提示。4-135.可对历史稽核信息进行查询,可按稽核时间、稽核类型等条件进行查询与统计。4.3.5.2数据准确性稽核业务数据准确性稽核包括系统配置符合度稽核、业务逻辑符合度稽核两类。系统配置符合度稽核指系统档案中的数据与系统配置限定的要求是否匹配,是否存在不符合配置条件的数据:例如:系统配置数据限制了USIM卡号必须固定长度且为数字、客户档案的身份证信息不能为空等情况。业务逻辑符合度稽核指系统档案中的数据与业务规则的符合情况,是否有不符合业务场景的数据。例如:E家套餐下的产品的付费方式必须为后付费、办理的在途订单进行反向撤销前必须进行相关退款操作等。版权所有,注意保密58
根据本规范中系统处理边界的定义,数据准确性稽核一般由业务系统实现,业务交付流程监控系统负责采集稽核结果、进行展示和告警判断。【功能要求】4-136.系统应支持设定数据准确性稽核结果的展示方式和告警判断规则。4-137.系统可接收来自业务生产系统或者其它业务系统的准确性稽核结果,根据设定的规则进行展示。提供图形化的展示方式,对于不满足稽核规则的记录可以用特别的颜色标明,并提供差异明细数据的关联展现。可对符合告警规则的稽核结果进行告警提示。4-138.可对历史稽核信息进行查询,可按稽核时间、稽核类型等条件进行查询与统计。4.3.6订单监测订单监测是指对端到端的业务交付订单流程实例进行实时监测,与业务运营指标检测中监控流程性能指标不同,订单监测的对象的是订单实例。通过从CRM、服务开通、计费等系统中同步订单告警信息,及时发现订单流转过程中的异常,并通过主动的查询与分析帮助运维人员准确定位订单问题。4.3.6.1订单流程告警端到端的业务交付订单流转经过CRM、EAI、服务开通、计费等系统,在任何一个系统流转的过程中,如果流程环节执行异常、或者流程环节执行超时,业务系统在本系统生成告警的同时,也可以通过订单同步接口将订单告警同步到业务交付流程监控系统中,业务交付流程监控系统实时采集到这些告警信息,并统一以告警列表的方式展现给维护人员。【功能要求】4-139.应支持从业务生产系统实时接收订单告警数据,根据接口内容和格式要求将数据转换为格式化的内部数据,统一在告警列表进行展示;版权所有,注意保密59
4-140.为了生成业务交付流程监控系统的统一告警信息,各个被监控系统都必须按照业务交付流程监控系统的统一要求生成相应告警接口数据,告警信息内容包含但不限于:客户订单ID:出错的订单在各个系统中的的唯一标识,由CRM系统产生产品定单项ID:出错的定单项标识,由CRM系统产生告警标题:此次告警的标题告警描述:此次告警的详细描述告警生成时间:此次告警发生的时间告警环节:被监控系统中产生告警的具体节点告警类型:超时告警、异常告警产品信息(*可选):产品名称、产品属性等告警级别(*可选):产生告警的重要程度。各生产系统根据所产生告警的严重程度对告警进行分级。详细的接口内容与格式要求见集成架构章节相关内容。4.3.6.2订单状态查询订单状态查询是通过订单标识或用户关键号码等唯一查询条件对业务订单的运行情况进行实时查询和可视化视图展现,帮助运维人员了解该订单流程的实时的运行状态。因为端到端的订单流转过程涉及到多个系统的多个流程环节,因此系统应支持在输入统一的查询条件后顺序调用各系统订单查询接口,进行统一的展现。以欠费停开机和订单处理流程为例进行说明:欠费停开机处理根据唯一的事件ID,分别去查询CRM中的客户资料同步情况、服务开通中的开通情况,查询欠费停开机查询流程如图:版权所有,注意保密60
SFM计费系统服务开通系统CRM系统1.发送用户关键号码查询停开机事件ID返回查询结果2.发送停开机事件ID查询停开机是否成功返回查询结果3.发送停开机事件ID查询客户资料同步是否成功返回查询结果图4.17欠费停开机流程示意图系统支持以图形化方式展示订单实例在各系统的流转情况,流程从事件发起到结束过程中,在CRM、服务开通、计费等系统的实时状态。运维人员可以通过视图的颜色定义,区分查询用户的停开机流程是否正常:图4.18欠费停开机流程状态示意图点击图形中的流程节点,可以展现欠费停开机流程在该系统中处理情况的详细信息。如:流程进入时间、处理完成时间、故障详细信息等。订单处理流程版权所有,注意保密61
根据订单标识,分别去查询CRM中的订单流转情况、服务开通中的工单处理情况,以及计费中的资料同步情况等流程,如图:SFMCRM/计费/服开等发送订单编号查询流程在自身系统中是否完成流程完成:返回流程开始时间、结束时间;流程未完成:返回流程停留节点、实时状态;如果发生异常反馈详细故障信息返回查询结果图4.19订单处理流程示意图接收到各系统的反馈信息后,业务交付流程监控系统组合出一张客户订单在各个业务系统中的运行状态图。每个业务系统用一个节点表示,节点的不同颜色表现客户订单在该系统中的运行状态。例如:红色表示有订单行在该系统中发生异常或超时故障;蓝色表示有订单行正在该系统流转,且未发生异常或超时;绿色表示所有订单行在该系统中正常执行完毕;灰色表示订单尚未流转到该系统。如下图:版权所有,注意保密62
图4.20订单处理流程状态示意图点击图形中的流程节点,可以展现订单处理流程在该系统中处理情况的详细信息。【功能要求】4-141.应支持根据订单运行流程,顺序调用相关系统订单状态查询接口,接收反馈的订单流转详细信息,进行统一的展现;4-142.应支持以图形化的方式展示订单实例在各系统的流转情况,展示订单从发起到结束过程流经的节点。运维人员可以通过视图的颜色、文字等定义,区分各节点是否正常;4-143.应支持通过订单流转节点状态关联查询到订单状态详细信息,包括订单状态、系统内部环节列表、各内部环节流程进入时间、处理完成时间、故障详细信息等;4-144.订单状态查询对象应包括但不限于:欠费停开机流程订单处理流程全网订单处理流程:订单状态查询功能支持间接向集团业务交付流程监控系统提供查询接口,处理过程如下:版权所有,注意保密63
SFMCRM系统其他业务支撑系统1.集团订单编号查询省订单编号反馈查询结果2.省订单编号查询订单流转情况反馈查询结果2.集团订单编号查询订单流转情况反馈查询结果图4.21全网订单状态查询过程示意图4.4告警处理告警处理是针对来自应用及业务的性能、告警信息进行统一处理,以便快速确认故障,缩短排障时间,为及时恢复业务运行打下良好基础。主要包括告警判断、告警定位、告警信息丰富、告警过滤、重复告警压缩、告警操作(告警前转、告警确认、告警清除、告警级别调整)、告警流程定义等。【处理原则】实时性:保证关键告警信息及时得到处理。准确性:保证告警信息根据告警级别得到准确处理。参数化管理:提供灵活的参数配置功能,保证告警处理具有很强的适应性。4.4.1告警判断告警判断是对统一采集功能获取到的性能、告警数据进行处理、分析,根据设定的告警规则判断是否需要触发告警。如采集数据满足告警条件,则系统产生告警记录,在告警版权所有,注意保密64
列表及监控视图中进行呈现,并可以通过短信、邮件等方式及时通知运维人员。对于告警类原始数据,主要使用对告警发生频度、告警发生级别等属性进行分析的方式来实现告警的判断;对于性能类原始数据,主要使用阀值策略设定的方式实现告警的判断。【功能要求】4-145.系统应支持灵活的告警判断规则设定,可以根据告警规则准确触发系统告警;4-146.针对告警类数据,支持根据原始告警属性设置告警判断策略,包括告警发生次数、告警发生频度、告警级别等;4-147.针对性能类数据,应支持根据数据阀值设置告警判断策略,应支持静态阀值和动态阀值两种告警策略的设置功能:静态阀值:针对指标值相对固定的数据,特别是应用类性能数据,如进程CPU利用率,使用固定的阀值,将实际发生值与阀值对比生成告警。可以设定多个阀值对应于不同的告警级别;动态阀值:针对指标值不断变化的数据,特别是业务类性能数据,如订单受理量,一天中不同的时刻差异很大,可以使用动态阀值来实现数据比对:1)历史动态阀值:根据业务活动周期,动态选取一定周期内的历史指标数据,如过去一周的数据,通过不同的算法(如均值、加权均值等)计算得出历史动态阀值,通过将当前指标发生值与动态阀值进行对比,实现告警的判断;2)预测动态阀值(可选):根据业务活动周期,动态选取一定周期内的历史指标数据,如过去一周的数据,选用不同的数据预测及拟和算法(如:回归模型、移动平均模型、混合模型等),计算得出预测动态阀值,通过将当前指标发生值域动态阀值进行对比,实现告警的判断。4.4.2告警定位告警定位是通过对告警信息的查看确定故障可能发生的位置。【功能要求】版权所有,注意保密65
4-148.告警故障定位应与被管对象和被管对象关联关系相结合,应能建立告警列表展示信息中相关元素和被管对象之间的关系。对于一个告警,可根据这个关系自动确认发生告警的被管对象,进而查看与被管对象关联的其它对象情况。4-149.可以对被管对象的最小粒度进行定位,如应用资源和关键业务点。4.4.3告警丰富告警丰富功能主要是对告警信息增加描述,使得告警信息更加详细和直白,方便系统维护人员更快的了解告警信息。【功能要求】4-150.应能够实现告警信息与告警对象的配置数据的关联,对告警信息进行丰富,增加对告警信息的描述,如对于主机告警,丰富相应的厂家,型号,设备描述信息等;对于数据库告警,丰富相应的数据库版本,字符集等信息;对于应用及业务关键点对象,应能够将其支撑的应用业务信息进行丰富,以便维护人员及时了解发生告警设备的全方位信息,针对不同情况分别处理。4.4.4告警过滤告警过滤是指对大量重复的告警信息和次要、无意义的告警信息进行过滤,以避免告警风暴和无效告警或非关心告警的干扰,以提高监控与处理的效率。【功能要求】4-151.按维护要求和管理部门的要求及实际管理情况,针对单位时间内发生大量告警或者已知告警,设置过滤规则,过滤从底层产生的告警信息中不重要的信息,减少轻微告警的干扰,以提高监控与处理的效率。4-152.告警过滤需要提供灵活的过滤规则,可按告警对象、告警级别、告警类别、告警标题、告警时间等设置过滤规则。4-153.被过滤的告警信息可以选择是否入告警数据库。4-154.对已设定的过滤规则需要提供保存和修改功能,便于维护人员灵活选择。版权所有,注意保密66
4-155.告警过滤应实现对以下告警的过滤:用户确认一段时间内可以忽略的告警周期产生的维护类告警已进入服务管理流程进行处理,一定时间内重复发送的告警特殊情况下,只需要记录不需要展现的特殊资源的相关告警4.4.5告警压缩告警压缩是对不同时间产生的相同告警,将其合并成一条告警信息,同时累计该告警的次数,更新最后发生时间等。【功能要求】4-156.在进行告警压缩时,应只在活动告警库中保留一条压缩后的告警信息。4-157.在进行告警压缩时,应更新告警记录的发生次数、最后发生时间等信息。4-158.在对告警进行压缩时,应能够灵活的定义压缩规则,应提供可视化的压缩规则编辑功能。4.4.6告警操作4.4.6.1告警操作内容4.4.6.1.1告警前转系统提供告警前转功能,将告警信息以各种方式(短信、声音、邮件等)转至指定的维护人员。【功能要求】4-159.告警前转的设置条件:告警级别、告警发生时间、告警标题、告警类型、告警地区、告警内容关键字模糊匹配、需要通知的相关系统和人员等。版权所有,注意保密67
4-160.一旦本系统接收到被管对象的告警信息,自动的根据告警前转过滤条件进行过滤匹配,并根据设置的前转方式,自动通过短信等形式发送给相应的管理人员或维护人员。4-161.可以根据告警数据的内容自由定义短信内容,在手动前传时,可以手工编辑短信内容,短信内容应该简单明了。4.4.6.1.2转事件单系统提供告警转事件单的功能,通过与IT服务管理系统的事件管理接口,可以手动或者自动将告警信息转换为告警事件单,进入IT服务管理流程。并可以接收IT服务管理系统返回的事件单处理状态,适时关闭告警。【功能要求】4-162.应支持根据告警对象、告警级别、告警类别、告警时间等属性设置自动转事件单的规则。应能提供可视化的转事件单规则编辑功能;4-163.应支持通过告警列表界面手动触发转事件单的功能,能够手动修改事件单信息,包括事件类型、事件标题、事件描述等;4-164.应支持接收IT服务管理系统反馈的事件单处理结果,自动关闭处理完成的告警记录。4.4.6.1.3告警确认告警确认主要是对告警承载的信息予以认可,以形成有效的告警,便于维护人员快速的优先处理告警信息。收到告警提示后,提供友好的界面供维护人员进行告警确认,系统产生确认时间等确认信息,且具备批量确认的功能。【功能要求】4-165.应能提供根据告警的属性字段设置自动确认规则的功能,并能根据自动确认规则对符合条件的告警进行自动确认,告警确认需要提供灵活的过滤规则,应能够通过组合不同的告警信息字段设置告警过滤规则。版权所有,注意保密68
4-166.可按告警对象、告警级别、告警类别、告警时间等设置过滤规则,应能提供图形化的自动确认规则编辑功能。4.4.6.1.4告警清除告警清除是对于系统中已经处理完毕,或者根据一定的条件判断,无需再提示的告警信息,能够设置清除的标识,标志告警处理完毕。例如:系统提供IT服务管理系统的接口,将告警事件传送给IT服务管理系统,在其实现事件管理流程,事件处理完成后返回本系统,将告警信息清除。【功能要求】4-167.应能提供根据告警的属性字段设置自动清除规则的功能,并能根据自动清除规则对符合条件的告警进行自动清除;应能提供可视化的自动清除规则编辑功能,并且能够对清除的告警设置告警清除标志。4-168.已清除的告警信息,在活动告警库中保留的时间应能设置,以便方便排障。清除后的告警信息,应能够自动转存到告警信息历史库中。4.4.6.1.5告警级别调整根据系统告警已发生时长、告警发生次数方面发生的变化,重新调整告警级别,保证根据正确的告警系统处理的正确性。【功能要求】4-169.应能提供根据告警的属性字段或属性字段的组合字段(如告警时长、告警发生次数)设置告警自动升降级的功能,并能根据告警级别自动调整规则对符合条件的告警进行级别升降级。应能提供可视化的自动升降级规则编辑功能。4.4.6.1.6控制操作为排除告警故障,借助监控系统的统一控制功能实现对被管对象进行的如执行命令、版权所有,注意保密69
主机重启、应用重启等控制操作。【功能要求】4-170.应能提供根据告警的属性信息(如告警对象、告警级别、告警类别、告警时间)设置自动控制操作规则的功能,并能根据规则实现被关对象的自动控制。应能提供可视化的控制操作规则编辑功能。4.4.6.2告警操作方式告警处理操作在默认情况下可以根据配置的规则自动执行,如果需要,可以人工干预手动执行。【功能要求】4-171.自动执行应支持根据配置的前传、转事件单、确认、清除、级别调整以及控制操作判断规则,自动执行告警操作的功能。4-172.手动执行应支持手动进行告警的前传、转事件单、确认、清除、级别调整以及控制操作功能,其中确认、清除操作应支持单条或者多条操作的功能。4.5控制管理控制管理功能向操作人员提供统一的被管对象控制界面,利用采集与控制接口将对被管对象的指令进行解析适配,发送至被管对象执行。管理员不需要直接登录到被管设备,可以通过控制管理远程登录到被管设备上执行操作命令。所有的操作过程、操作执行结果应当被记录下来提供查询。【功能要求】版权所有,注意保密70
4-173.管理员可以将常用的日常操作命令定义为控制管理中的标准操作,支持标准操作的增、删、修改,操作范围包括但不限于:添加、删除系统用户启动、停止应用进程部署升级软件包更新、备份配置文件关键数据备份4-174.支持操作过程的记录,对于执行的任意控制操作,都具有日志记录的功能,保证运维人员对历史操作记录的查询;4-175.支持操作结果的检查,对于执行的任意控制操作,可在执行异常或者成功后获取执行结果,并提供操作结果检查能力,能够明确查阅操作控制执行状态。4.6综合展现综合展现层是业务监控系统的统一展示和操作界面,各级管理人员和维护人员通过综合展现界面对业务交付流程监控系统进行运行状态监测。4.6.1告警展现告警展现是通过告警列表、告警监视视图的方式,对处理后的告警条目进行展现。在监控中,可以将告警分配给属于不同岗位(角色)的人员,当维护人员查看告警列表时,只是显示分配给他的告警消息。对管理人员显示对业务影响较为严重的告警和告警处理记录。4.6.1.1告警列表告警列表是以电子表格的方式对活动告警信息进行滚动呈现,是最简单也最实用的告警监视方式。在告警事件列表中,告警信息是以不同的颜色来代表不同的告警级别,运维人员可以根据其所关心内容的不同,灵活过滤其需要查看的字段,并可根据字段内容进行相应告警的排序。版权所有,注意保密71
【功能要求】4-176.告警列表的字段需支持用户自定义,系统默认的为告警级别、告警重复次数、发生时间、告警标题、告警内容、告警源。用户可以自定义告警列表显示字段,操作完成后可以立即生效;4-177.通过告警事件列表所提供的功能菜单,运维人员需能对某条具体的告警信息进行告警处理,如手工告警确认、告警清除、告警级别改变等操作,且所有上述工作均需通过日志的形式进行记录,保证运维人员对告警信息安全可靠的操作。4.6.1.2告警查询与统计告警查询与统计是对特定时间和范围的告警发生次数进行查询与汇总,以数据表和图形化方式进行多维度的展示,直观地反映运维人员关注的业务和应用的告警发生情况。【功能要求】4-178.告警查询与统计可以对不同监视对象、告警指标、告警类型、告警级别等条件进行查询和统计。展示结果可以根据运维人员关注的对象不同,进行个性化定制,满足不同运维人员的需要;4-179.支持以数据表和图形化方式如饼图、直方图、对比图等方式进行直观显示。4.6.1.3告警历史指标查询系统能够记录告警发生时被管对象的运行期指标信息,可以通过告警信息关联查询到被管对象发生告警时一定周期内的指标信息,以及与被管对象相关联的其它被管对象的当时的指标信息。同时提供查询、分析功能,尽可能展示故障发生时的情景,方便管理人员查找分析故障的原因。【功能要求】4-180.系统能够记录告警发生时被管对象指标信息、以及被管对象相关联的其它被管对象运行期信息;版权所有,注意保密72
4-181.系统应能够通过告警列表关联查询到告警对象当时的历史指标信息,并支持查询时间范围的修改。4.6.2综合视图综合视图即业务监测视图。提供一个以业务为中心,实时展现业务状态的视图。一方面,根据业务过程模型展现业务流程各关键点的可用性、性能、处理及时率等指标以及告警信息;另一方面,通过业务支撑关系模型及影响度规则配置,展现业务系统内部关系、业务与应用、业务与IT基础设施之间的关联关系,展示业务影响度和影响路径。可以通过不同的颜色来展现业务运行状态。应提供可视化的工具,以便管理业务监测视图。【功能要求】4-182.支持WEB展现方式,界面美观、信息清楚、操作简便,使用人员可以很快上手,查看自己关心的业务信息;4-183.可以在被授权访问的不同业务视图之间进行灵活切换;4-184.能够展现业务的内部关系和业务与IT系统构架之间的关联关系;4-185.通过业务节点可以查看相关的指标和业务数据;4-186.具备自上而下快速定位问题的能力;4-187.具备自下而上分析IT对业务的影响路径和影响程度的能力;4-188.具备展示各类告警情况的能力,如业务告警、应用告警和IT基础架构告警;4.6.3统计报表报表是业务交付流程监控系统重要的信息呈现方式,报表功能应具有报表生成的灵活性和呈现的多样性,以适应用户不断变化的需求。主要包括报表模板定义,报表生成等功能,报表是IT业务监控系统向使用者提供的主要信息。提供报表引擎,用户可以根据系统中的各个数据表,自由定义自己的报表,并存储成报表模板。支持报表自动生成,用户可以定义报表生成的计划,在计划的时间自动按照模板的定义生成报表。版权所有,注意保密73
【功能要求】4-189.用户可自定义模板报表,报表可以按照模板格式生成。报表模板包含数据的内容列表,格式的描述等信息。报表的内容列表可以由用户通过数据库中的数据生成,也可以由报表模板中已有的字段通过函数计算生成。报表模板支持分类管理。4-190.支持手动生成报表和自动根据模板生成报表,系统应支持报表自动生成任务的管理。任务的执行时间可以有周期性和非周期性方式,周期性的执行方式支持周、月、固定天数等,非周期性为一个确定的时间。4-191.可以方便查询、浏览、打印已经生成的历史报表。提供图形化展现界面,用户可以设置默认的显示格式、排序条目等信息,报表形式包括表格、图形,其中图形应当支持饼图、柱图、线条图等多种格式。4-192.报表导出支持HTML、PDF、EXCEL等格式。4-193.对于定义的报表,可以设置权限,只有通过授权的人员才能查看,其它人员无法看到报表内容。4.7系统管理4.7.1用户管理用户管理仅是对用户基本属性信息和权限信息的管理维护,不涉及用户认证信息的增删改等操作管理,用户认证信息由MSS集中进行管理维护。【功能要求】4-194.用户登录平台时,平台系统将用户认证要素转发给MSS集中进行身份认证,认证通过的为合法用户,平台根据事先配置的用户权限对合法用户进行授权管理。4.7.1.1用户管理用户管理功能指对业务交付流程监控系统中的用户信息、用户与角色等关联的管理。用户可以登录系统,由权限控制能够使用的系统功能。用户管理功能只能由授权的用户实版权所有,注意保密74
施,无此权限的用户,可以查询自身的用户属性,修改自身的用户密码、真实姓名和描述信息。【功能要求】4-195.增加用户:应能够增加系统用户。增加用户时应提供以下信息:用户名、用户密码、真实姓名、用户的描述信息(如用户的通信地址、用户单位、联系方法等)、用户角色。4-196.修改用户属性:应能够根据用户名称修改用户属性。可以修改的用户属性包括:用户密码、真实姓名、用户的描述信息(如用户的通信地址、用户单位、联系方法等)、用户角色。4-197.查询用户属性:应能够根据用户名称查询用户属性。应能查询到的用户属性包括:真实姓名、用户的描述信息(如用户的通信地址、用户单位、联系方法等)、用户角色、用户的操作权限。4-198.删除用户:应能够删除系统已存在的用户。4-199.用户密码管理。4.7.1.2角色管理角色是用来封装用户的权限的,一个角色就是一组权限的集合。可以按照在流程中的岗位设定角色,一个用户可以拥有一个或多个角色。角色管理功能只能由授权的用户实施。【功能要求】4-200.增加角色:应能够增加用户组。增加角色应提供以下信息:角色名、操作权限列表。4-201.删除角色:应能够删除系统已存在的用户组。4-202.查询角色属性:应能够根据用户组的名称查询用户组的权限信息。4-203.修改角色属性:应能够根据用户组的名称修改用户组的权限。版权所有,注意保密75
4.7.2权限管理系统能够对用户和角色进行权限分配,用户所具有的权限为用户所拥有的角色的权限或者角色权限的子集。用户、角色、权限的关系如下图:图4.22用户、角色、权限的关系4.7.3日志管理日志管理是对各个关键处理部位采用日志管理的方法,保证业务交付流程监控系统的安全、可靠和稳定运行,及时发现、及时预防故障隐患,避免系统运行事故的发生。【功能要求】4-204.用户操作日志:系统可记录每个操作员进入、退出系统的时间以及在系统中的一些重要操作的操作内容;4-205.故障日志:对人为和软、硬件故障及其解决过程进行详细的记录备案4-206.日志备份:对数据完整性要求较高的数据建立双副本日志,以保证意外发生时的数据恢复;版权所有,注意保密76
4-207.日志统计:系统支持对日志数据进行统计分析,帮助检查系统使用情况,对于系统的非正常使用和非正常状态及时发现、及时预防,避免系统运行事故4-208.日志查询:系统支持对用户操作日志的浏览、查询、删除和统计功能。当用户进入日志管理功能后,可以看到日志记录的列表显示;用户可以输入一定条件(比如时间段)查询统计相关的日志记录;用户还可以删除不需要的一条或者多条日志记录。4.7.3.1系统登录日志管理【功能要求】4-209.系统登录日志记录系统应能将用户的登录信息(包括成功与不成功的登录)记录下来,以供查询。用户登录信息包括用户名称、登录终端名称与IP地址、登录时间和退出时间等。4-210.系统登录日志查询系统应能够查询系统登录日志。查询条件包括用户名称、IP地址、登录日期时间、登录结果(成功或失败)等。查询内容包括用户名称、登录终端名称与IP地址、登录时间和退出时间。4-211.系统登录日志删除系统应能够删除过时的系统登录日志。系统应提供以下两种删除方式,一是按时间进行删除;二是按保留的记录条数进行删除。4-212.系统登录日志备份系统应具有手动保存系统登录日志到Excel文件的功能。系统应具有打印系统登录日志功能。4.7.3.2系统操作日志管理【功能要求】版权所有,注意保密77
4-213.系统操作日志记录系统应能将用户的操作信息记录下来,以供查询。操作信息包括实施操作的用户、操作时间、IP地址、操作名称、操作对象、操作结果。4-214.系统操作日志查询系统应能够查询系统操作日志。查询条件包括用户名称、IP地址、操作日期时间、操作结果(成功或失败)等。查询内容包括实施操作的用户、操作时间、IP地址、操作名称、操作对象、操作结果。系统应具备模糊查询方式。4-215.系统操作日志删除系统应能够删除过时的系统操作日志。系统应提供以下两种删除方式,一是按时间进行删除;二是按保留的记录条数进行删除。4-216.系统操作日志备份手动保存系统操作日志到Excel文件的功能。系统应具有打印系统操作日志功能。4.7.4自身管理对系统自身的各应用程序或服务进程进行监视和管理的功能,使管理员能够控制各类应用程序和服务进程的合法性和有效性。进程监控系统:当发现某个应用程序或服务进程出现问题或运行异常时,系统能自动重起或中止有问题的服务进程,或重新加载配置信息和功能模块告警:同时以系统自身告警的方式呈现到告警监视列表中,以确保系统始终处在正常运行状态【功能要求】4-217.能够查看被管进程的运行状态;4-218.对系统内各软件模块的进程进行统一管理,可对被管进程进行统一启动与关闭;4-219.自动维护被管进程的运行,当被管进程失效时,进程控制模块会自动的尝试重新启动该进程,并向系统报告进程的失效与启动信息;版权所有,注意保密78
4-220.提供与被采集系统网络链路的监视功能,当相关计算机网络链路出现问题时可以产生系统告警信息等;当采集链路恢复后,数据采集应能迅速自动恢复;(可以通过基础设施监控系统实现)4-221.应提供系统服务器运行状况监视功能(如主机CPU利用率、内存和磁盘运行状况等)。(可以通过基础设施监控系统实现)4-222.当用户非法登陆,日志异常等类似情况发生时,可以产生系统告警信息。版权所有,注意保密79
5集成架构5.1集成综述5.1.1集成接口视图短信、邮集团SFMMSS件平台指标订单统一消息上传查询认证通知被管对象系统订单CSB订单流程查询接口数据应用软件采集、省SFM控制业务事件控制配置告警、性能数据管理请求同步IT服务IT基础设施监控采集、基础设施管理系统系统控制图5.1系统集成架构业务交付流程监控系统的集成关系主要包括反映两级部署关系中的集团业务交付流程监控系统、为系统提供支撑的MSS(统一认证)和短信邮件平台、与业务交付流程监控系统同属ITSM范畴的IT服务管理系统和IT基础设施监控系统,以及各被管对象生产系统系统如CRM、计费、服务开通、ODS等。版权所有,注意保密80
根据CRM2.0集成接口规范的要求,与集团业务交付流程监控系统、MSS、短信邮件平台以及被管对象订单查询接口统一从CSB间接调用,或者封装为服务形式部署到CSB上提供第三方调用。与其它系统的接口,各省实现时视情况进行选择,可采用直连的方式。5.1.2集成接口方式从接口实现上看,一些接口是由第三方系统提供标准接口,业务交付流程监控系统根据接口调用方法和接口数据要求发起调用即可,如MSS认证接口、门户系统界面集成接口、短信邮件平台通知接口、被管对象提供的被动采集接口如Syslog、Socket侦听等。另外一些接口是新增接口,接口双方需要根据接口要求共同制定接口标准与要求,接口双方共同开发并实现接口。从接口类型上看,一些接口对及时性要求比较高、数据量中等或者较小,如数据实时采集接口、事件接口、控制请求接口等,适合采用WebService、Socket等实时性的接口方式;另有一些接口对及时性要求不高,数据传输量较大,如省级监控指标上传、大数据量采集、配置项同步等,适合采用FTP文件接口、临时数据库表等接口方式。同步和异步从接口数据格式上看,建议采用主流的XML格式统一进行接口数据的表示,这也利于基于XML技术的WebService协议实现。对于一些数据格式比较复杂,对数据解析效率要求较高的接口场合,也可以使用JSON等轻量级的数据格式。在本文档中以表格的形式表示XML等格式数据项。5.1.2.1消息类接口5.1.2.1.1数据协议业务交付流程监控系统采用主流的WebService接口协议或者自定义通讯包方式的Socket接口协议,各省在进行接口建设时可根据接口双方系统实际情况进行选择,优先选择WebService接口方式。下面就这两种协议分别进行说明。【WebService协议】WebService采用可扩展的标记语言(XML)来表示数据的基本格式,利用基于HTTP传输的SOAP访问协议实现接口方法的调用,并通过WebService描述语言(WSDL)将提版权所有,注意保密81
供的接口公布出去,让第三方系统了解接口提供哪些Webservice及其对应的函数、参数和返回值。WebService每个接口方法的请求和应答参数包括两个部分:MessageHeader(消息头)与MessageBody(消息体)。其中,MessageHeader用于存储交易请求以及应答的公共部分和消息的控制数据,MessageBody包含交易请求和应答的业务数据,以XML格式表示,例如:消息头元素一 消息头元素二 消息头元素三 消息体元素一 消息体元素二 消息体元素三 WebService方式的通用消息头信息包含但不限于:字段名约束类型说明version必选xsd:string消息的版本号,初始版本号为“1.0.0”TID必选xsd:string操作交易序列号sendAddress必选AddressInfo发送方平台编码timeStamp必选xsd:string消息打包时间,北京时间YYYYMMDDHH24MISS【Socket协议】Socket接口基于TCP或UDP传输协议,实现应用程序之间相互通信,传输的数据可以是文本或者是自定义的报文格式。本规范采用自定义报文的数据传输方式。版权所有,注意保密82
通讯包格式由三部分组成,通讯包包头、数据区、包尾。包头包含接口类型、版本等公共信息,数据区包含请求和应答的业务数据信息,以XML或者其它标准格式定义,包尾包含校验信息和结束标志等。如下图:包头(32个字节)消消息息记(录数(据数区据长区度长)度)包尾(5个字节)子包序号客户端节压缩加密包标志版本号包类型包序号子包序号数据区长度保留字段校验区结束标志最大值点编号标志标志图5.2Socket报文格式如选用Socket协议定义接口,包头、包尾信息的详细要求,参见ITSM服务管理规范中系统接口分册相关内容。5.1.2.1.2数据内容数据请求和数据返回消息均包括消息头与业务内容两部分,其中消息头用于存储交易请求以及应答的公共部分和消息的控制数据,WebService和Socket接口有所不同,业务内容作为根元素下的最后一个元素(Element),名称定义为body,包含请求和应答的业务数据。业务数据格式如下表所示,前六个字段属于公共字段,详细的接口内容作为子元素体现:元素说长约序号元素名称父元素名称类型备注明度束1serialIDbody序列号Integer18M接口传递序列号2infoTypebody信息项Integer3M具体取值参考附件信息项类类型型。该处必须填写值为4告警信息3systembody监测目String40取值参考附件所属系统类型标系统4regionIDbody本地网Integer9本地网标识标识5sendTimebody时间戳String20M6infoContentbody6.1业务内容„在本文档中以表格的形式表示XML格式。版权所有,注意保密83
5.1.2.2文件类接口这里主要对与集团业务交付流程监控系统的指标上传文件接口进行说明,其它文件类接口规则可参考后自行设置。5.1.2.2.1交互流程定义文件传输接口数据发送方与接收方的交互情况如下。数据传送方数据接收方1.生成数据文件2.请求建立连接3.连接建立成功4.传送数据文件5.文件级检查,生成报告6.返回文件级报告7.记录级检查,生成报告8.返回记录级检查报告9.处理文件图5.3系统集成架构流程说明:1.数据发送方生成数据文件;2.数据发送方向数据接收方服务器发出连接请求;3.连接成功后,数据接收方服务器返回连接成功消息;4.数据发送方传输数据文件到数据接收方服务器的指定路径;5.数据接收方进行文件级检查,并生成文件级检查报告;6.数据接收方返回文件级报告;版权所有,注意保密84
7.数据接收方进行记录级检查,并生成记录级检查报告;8.数据接收方返回记录级报告;9.数据接收方对上传文件进行处理。5.1.2.2.2发送文件定义5.1.2.2.2.1发送文件命名文件名定义如下:TYPE_PROV_YYYYMMDD_XXX_FFF.YYY。说明:元素描述取值说明TYPE文件类型前缀这里表示的前缀为五位字符,可能的取值如下:告警数据文件为:..FAULT;性能数据文件为:..PERFM;其它类文件............OTHERPROV省份代码参看附件的省代码定义YYYYMMDD时间填写文件的所在日(月),示例:15分钟发送文件格式(如告警文件):20060101每日发送文件(如日性能文件)格式:20060101月发送文件(如月报表、日期填写‘00’)格式:20060100XXX序列号1、对于15分钟发一次的文件,步长为1,序号依次递增,序号范围:000-095;时间与序号对应2、对于按日、月发的每次只有一个文件,序号取值为:0003、ALLCI文件序号为000-999FFF重传标志位填写是否重传的标志,000非重传文件;如果重传,按重传次数依次递增1。YYYY文件后缀名xml5.1.2.2.2.2发送文件目录上传目录要求如下:/itsm/upload/<省份代码>/<文件类型前缀>/<年份>/<月>。版权所有,注意保密85
上传目录示例:1)北京上发的告警文件,文件所在日为2009年6月8日,则上传的目录为:“/itsm/upload/bj/fault/2009/06/”2)福建上发的性能文件,文件所在日为2009年9月16日,则上传的目录为:“/itsm/upload/fj/perfm/2009/09”上传文件名示例:1)北京上发的告警文件,文件所在日为2009年6月8日,生成时间为上午10点,状态为正常上传的文件,则文件名称为FAULT_BJ_20090608_040_000.xml2)北京上发的性能文件,文件所在日为2009年6月8日,状态为正常上传的文件,则文件名称为PERFM_BJ_20090608_000_000.xml3)北京上发的性能文件,文件所在日为2009年6月8日,状态为重传的文件,则文件名称为PERFM_BJ_20090608_000_001.xml5.1.2.2.2.3发送文件内容文件接口数据格式均采用XML格式或者其它轻量级数据表达方式如JSON,所有文件都统一采用同样的文件头,而数据内容则放在文件头的最后一个元素Body中;以下是文件头各元素的具体定义:父元素名称元素名称类型描述file主标签文件类型;filetypeString其取值范围与发送文件定义中的TYPE一致。发送省代码;filesendprovinceString其取值范围参看附件中的省份码接收省代码;filerecprovinceString其取值范围参看附件中的省份码filecreatetimeTime文件创建时间版权所有,注意保密86
filesumInteger记录数filebegintimeTime统计起始时间fileendtimeTime统计截止时间filebody数据记录内容body„„详见集成接口一节中各文件接口内容定义5.1.2.2.3返回文件定义5.1.2.2.3.1返回文件命名文件名说明注释前缀(F_)+原文件名文件级检查结果文件名只有在出现文件级错误的上发文件才有前缀(E_)+原文件名记录级检查结果文件名每个无文件级错误的上发文件都有对应的记录级检查结果文件反馈5.1.2.2.3.2文件级检查结果定义【文件级检查错误类型定义】错误编码错误编码注释备注F001文件名重复F002文件名称错误F003文件格式错误F999其它【文件级检查格式定义】父元素名称元素名称约束类型描述VerifyError1StringErrorErrorCode1StringErrorErrorMessage1String版权所有,注意保密87
结果示例:F001 错误示例 5.1.2.2.3.3记录级检查结果定义【记录级检查错误类型定义】错误编码错误编码注释备注R001字段取值范围错误取值是否合适R002字段类型错误字段类型是否匹配R999其它【记录级检查验错字段定义】文件类型字段检错方式检错标准告警数据文件ProvinceID类型/值域类型string/取值参见附件1BeginTime类型DateEndTime类型DateFirstTime类型DateLastTime类型DateEventLevel值域1,CRITICAL;2,MAJOR;3,MINORValue值域0:告警清除;1:告警未清除性能数据文件ProvinceID类型/值域类型string/取值参见附件1BeginTime类型DateEndTime类型DateValue值域大于等于0,小于100000【记录级检查格式定义】父元素名称元素名称约束类型描述版权所有,注意保密88
VerifyErrors1ErrorsSum1int错误记录条数ErrorsError*ErrorErrorCode1String错误编码ErrorSeqNum1Int错误记录的序列号ErrorErrorMessage1String出错原因记录级检查结果文件示例:R002 1 错误记录信息示例 1 --如果没有记录错误,此处为0 5.2集成接口5.2.1IT服务管理系统接口5.2.1.1事件管理接口5.2.1.1.1接口功能业务交付流程监控系统发现故障或异常告警后,通过事件管理的接口将故障传递到IT服务管理系统,由服务管理系统去执行服务管理的相关处理流程,并实时将事件处理结果反馈给监控管理系统,以保障业务服务第一时间恢复正常以及告警的正常关闭。【接口要求】版权所有,注意保密89
5-1.支持根据告警处理规则的定义自动触发,或者在告警列表查看过程中手动触发,将特定的告警形成告警事件单,通过告警事件接口将告警事件发送给IT服务管理系统;5-2.支持与业务交付流程监控系统的双向同步。即当IT服务管理系统中事件处理完毕后,可通过事件管理接口将告警关闭消息传递给业务交付流程监控系统,同步告警的状态为关闭;5-3.支持告警信息的过滤,对于后续相同告警不会重新触发生成事件单。5.2.1.1.2接口数据5.2.1.1.2.1接口概述接口名称事件管理接口接口说明业务交付流程监控系统将告警信息形成事件单发送给IT服务管理系统,同时接收IT服务管理系统的处理结果,更新告警状态发送方业务交付流程监控系统接收方IT服务管理系统接口类型异步实时小数据量接口协议WebService、Socket等数据格式XML、JSON等5.2.1.1.2.2发送数据序元素名称父元素名称元素说明类型长度约束备注号1serialIDbody序列号Integer18M接口传递序列号2infoTypebody信息项类Integer3M具体取值参考附件型信息项类型。3Systembody监测目标String40IT服务管理系统标系统识,取值参考附件4regionIDbody本地网标Integer9本地网标识识5sendTimebody时间戳String20M6infoContentbody-----7eventIdinfoContent事件IDString8M8ciIDinfoContent配置项String8M版权所有,注意保密90
9ciNameinfoContent配置项名String6010TitleinfoContent事件标题String20M11DescribeinfoContent事件描述String200012OrigininfoContent事件来源Integer3M取值参考附件中的事件来源13occurTimeinfoContent发生时间String2014PriorityinfoContent优先级Integer315FinishLimitinfoContent解决时限String2016cancelFlginfoContent清除标志Integer3取值为1已清除5.2.1.1.2.3返回数据序元素名称父元素名称元素说明类型长度约束备注号1serialIDbody序列号Integer18M接口传递序列号2infoTypebody信息项类Integer3M具体取值参考附件型信息项类型。3Systembody监测目标String40IT服务管理系统标系统识,取值参考附件4regionIDbody本地网标Integer9本地网标识识5sendTimebody时间戳String20M6infoContentbody-----7eventIdinfoContent事件IDString8M8returnCodeinfoContent返回码Integer3M接收失败/成功,处理完成/异常9returnMsgInfoContent返回消息String60返回的消息5.2.1.2控制请求接口5.2.1.2.1接口功能IT服务管理系统中,日常运维周期性作业计划产生的的控制请求,发布管理时发起的软件分发和补丁管理的控制请求,变更管理发起的对应用和业务服务的启停控制请求单等,可以通过控制请求接口发送给业务交付流程监控系统,并接收返回的控制操作结果。【接口要求】版权所有,注意保密91
5-4.支持根据接口数据要求,接收IT服务管理系统发起的控制请求,对被管对象进行操作控制;5-5.当被管对象操作过程执行完毕、或者执行异常时,支持将操作控制结果异步地发送给IT服务管理系统,实现控制请求单状态的更新。5.2.1.2.2接口数据5.2.1.2.2.1接口概述接口名称控制请求接口接口说明IT服务管理系统向业务交付流程监控系统发起对被管对象如应用、基础设施的控制请求接口如进程启停、服务器重启等,同时接收业务交付流程监控系统返回的控制结果发送方IT服务管理系统接收方业务交付流程监控系统接口类型异步实时小数据量接口协议WebService、Socket等数据格式XML、JSON等5.2.1.2.2.2发送数据序元素名称父元素名称元素说明类型长度约束备注号1serialIDbody序列号Integer18M接口传递序列号2infoTypebody信息项类Integer3M具体取值参考附件型信息项类型。3Systembody监测目标String40IT服务管理系统标系统识,取值参考附件4regionIDbody本地网标Integer9本地网标识识5sendTimebody时间戳String20M6infoContentbody-----6.1ctrlIdinfoContent控制请求String8MID6.2CtrlTypeinfoContent控制种类String8M6.3ciIDinfoContent配置项String8M6.4ciNameinfoContent配置项名String606.5TitleinfoContent控制标题String20M版权所有,注意保密92
6.6DescribeinfoContent控制描述String20006.7userIDinfoContent发起人String8M5.2.1.2.2.3返回数据序号序号元素名称父元素名称元素说明类型长约束备注度1serialIDbody序列号Integer18M接口传递序列号2infoTypebody信息项类Integer3M具体取值参考附件型信息项类型。3Systembody监测目标String40IT服务管理系统系统标识,取值参考附件4regionIDbody本地网标Integer9本地网标识识5sendTimebody时间戳String20M6infoContentbody-----6.1ctrlIDinfoContent控制请求String8MID6.2returnCodeinfoContent返回码Integer3M接收失败/成功,控制完成/异常6.3returnMsgInfoContent返回消息String60返回的消息5.2.1.3配置项同步接口5.2.1.3.1接口功能业务交付流程监控系统通过配置项同步接口从IT服务管理系统中的CMDB配置管理数据库中查询或者接收变更的配置项信息、配置项之间关联关系信息,用于业务交付流程监控系统配置项信息的展示,以及应用、业务支撑关系的建立。配置项同步接口传输的数据内容包括但不限于:一级分类二级分类三级分类PC服务器服务器小型机硬件大型机网络设备交换机版权所有,注意保密93
路由器防火墙磁带库存储设备磁盘阵列硬盘CPU硬件模块内存网卡端口Windows操作系统LinuxUnixMacOS集群软件集群软件ORACLE数据库INFORMIXSYSBASEMSS软件OSS应用系统BSSEDAITSM卷交换空间文件系统操作系统逻辑单元系统服务系统进程系统日志版权所有,注意保密94
数据库参数数据库服务数据库内存数据库逻辑单元日志文件存储区间存储文件应用域应用集群中间件逻辑单元应用服务器线程池数据库连接池应用软件程序进程应用系统逻辑单元进程池接口应用数据文件【接口要求】5-6.支持根据功能需要主动发起对CMDB配置数据的查询,通过配置项同步接口发送要查询的配置项,接收配置项信息以及配置项关联信息;5-7.支持当CMDB中的配置信息发生变更时,IT服务管理系统可以实时将发生变更的配置项以及配置项关联关系发送给业务交付流程监控系统,及时更新业务交付流程监控系统中相关数据;5-8.其它配置项同步接口要求见业务功能章节统一采集与控制中的配置数据同步接口要求。5.2.1.3.2接口数据5.2.1.3.2.1接口概述版权所有,注意保密95
接口名称配置项同步接口接口说明IT服务管理系统在配置项发生变更时向业务交付流程监控系统发起配置项信息同步数据,业务交付流程监控系统也可以根据需要主动发起配置项信息的查询。后面的发送和返回接口内容主要针对同步方式。发送方IT服务管理系统接收方业务交付流程监控系统接口类型同步实时小数据量接口协议WebService、Socket等数据格式XML、JSON等5.2.1.3.2.2发送数据序号元素名称父元素名称元素说明类型长约束备注度1serialIDbody序列号Integer18M接口传递序列号2infoTypebody信息项类Integer3M具体取值参考附型件信息项类型。3Systembody监测目标String40IT服务管理系统系统标识,取值参考附件4regionIDbody本地网标Integer9本地网标识识5sendTimebody时间戳String20M6ciContentbody配置项信----息6.1ciIDciContent配置项String8MID6.2ciCodeciCOntent配置项编String60M码6.3ciNameciContent配置项名String606.4ciStatusciContent配置项状String8取值参考附录态6.5DescribeciContent配置项描String2000述6.6ciAttrciContent配置项属----性集6.6.1attrIDciAttr属性IDInteger3M取值参考附件中的事件来源6.6.2attrCodeciAttr属性编码String8M6.6.3AttrNameciAttr属性名称String60M6.6.4attrValueciAttr属性值String20007ciRelContentbody配置项关-----版权所有,注意保密96
系信息7.1fromCiIDciRelContent主配置项Integer3MID7.2toCiIDciRelContent从配置项Integer3MID7.3ciRelTypeciRelContent配置项关String8M关联、依赖、从联关系属等关系5.2.1.3.2.3返回数据序号序号元素名称父元素名称元素说明类型长约束备注度1serialIDbody序列号Integer18M接口传递序列号2infoTypebody信息项类Integer3M具体取值参考附件型信息项类型。3Systembody监测目标String40IT服务管理系统系统标识,取值参考附件4regionIDbody本地网标Integer9本地网标识识5sendTimebody时间戳String20M6infoContentbody-----6.1returnCodeinfoContent返回码Integer3M接收失败/成功6.2returnMsgInfoContent返回消息String60返回的消息5.2.2IT基础设施监控系统接口5.2.2.1告警数据接口5.2.2.1.1接口功能业务交付流程监控系统不直接采集基础设施层,如主机、网络、数据库的告警信息,但在应用监测和业务监测过程中,进行告警影响性分析和关联分析需要用到这些数据。因此采用接口的方式间接从基础设施监控系统获取基础设施层的告警信息。【接口要求】5-9.支持实时地从基础设施监控系统接收告警数据,通过解析、转换后形成业务交付流程监控系统中的告警指标数据信息并展现在告警列表以及应用、业务监控视图中;版权所有,注意保密97
5-10.告警数据接收完成后,支持将数据接收成功状态反馈给IT基础设施监控系统,以便进行失败后的重传。5.2.2.1.2接口数据5.2.2.1.2.1接口概述接口名称告警数据接口接口说明业务交付流程监控系统从IT基础设施监控系统获取基础设施的告警数据发送方基础设施监控系统接收方业务交付流程监控系统接口类型同步实时小数据量接口协议WebService、Socket等数据格式XML、JSON等5.2.2.1.2.2发送数据元素说长约序号元素名称父元素名称类型备注明度束1serialIDbody序列号Integer18M接口传递序列号2infoTypebody信息项Integer3M具体取值参考附件信息项类类型型。该处必须填写值为4告警信息3systembody监测目String40取值参考附件所属系统类型标系统4regionIDbody本地网Integer9本地网标识标识5sendTimebody时间戳String20M6infoContentbody6.1ciidinfoContent配置项Integer8配置项标识标识6.2ciNameinfoContent配置项String64配置项名称名称6.3alarmIdinfoContent告警的String18M告警的序列号,在省范围内唯序列号一标识一个告警。6.4occurTimeinfoContent告警发String20M告警发生时间生时间6.5confirmTimeinfoContent告警确String20告警确认时间,若告警已确认时间认,该项必填。版权所有,注意保密98
6.6clearTimeinfoContent告警清String20告警清除时间,若告警已清除时间除,该项必填。6.7alarmTypeinfoContent告警类Integer3M告警类型,参考附录型6.8alarmLevelinfoContent告警级Integer3M告警级别,参考附录别6.9orgTypeinfoContent告警原String20M告警类型始类型6.10orgLevelinfoContent告警原String20M告警级别始级别6.11activeStatusinfoContent活动状Integer3M活动状态态0:不活动1:活动6.12confirmStaffinfoContent确认操String60确认操作员用户名,若告警已作员确认,该项必填。6.13clearStaffinfoContent清除操String60清除操作员用户名,若告警已作员清除,该项必填。6.14alarmTitileinfoContent告警标String60M告警标题题6.15alarmtTextinfoContent告警内String512M告警内容容6.16causeinfoContent告警可String512M告警可能产生原因能原因5.2.2.1.2.3返回数据序号序号元素名称父元素名称元素说明类型长约束备注度1serialIDbody序列号Integer18M接口传递序列号2infoTypebody信息项类Integer3M具体取值参考附件型信息项类型。3Systembody监测目标String40IT服务管理系统系统标识,取值参考附件4regionIDbody本地网标Integer9本地网标识识5sendTimebody时间戳String20M6infoContentbody-----6.1alarmIdinfoContent告警的序String18M告警的序列号列号6.2returnCodeinfoContent返回码Integer3M处理失败/成功,6.3returnMsgInfoContent返回消息String60返回的消息版权所有,注意保密99
5.2.2.2性能数据接口5.2.2.2.1接口功能业务交付流程监控系统不直接采集基础设施层,如主机、网络、数据库的性能信息,但在应用监测和业务监测过程中,进行问题根源分析,如某个应用出现告警,查看支撑该应用的基础设施性能信息时,需要用到这些数据。因此采用接口的方式间接从基础设施监控系统获取基础设施层的性能信息如CPU利用率、内存占用率等。【接口要求】5-11.支持实时地从IT基础设施监控系统接收运行期性能数据,通过解析、转换后形成业务交付流程监控系统中的性能指标数据信息,供业务交付流程监控系统查询和分析;5-12.性能数据接收完成后,支持将数据接收成功状态反馈给IT基础设施监控系统,以便进行失败后的重传。5.2.2.2.2接口数据5.2.2.2.2.1接口概述接口名称性能数据接口接口说明业务交付流程监控系统从IT基础设施监控系统获取基础设施的性能数据发送方基础设施监控系统接收方业务交付流程监控系统接口类型同步实时大数据量接口协议WebService、Socket等数据格式XML、JSON等5.2.2.2.2.2发送数据序元素名称父元素名称元素说明类型长度约束备注号1serialIDbody序列号Integer18M接口传递序列号版权所有,注意保密100
2infoTypebody信息项类型Integer3M具体取值参考附件信息项类型。该处必须填写值为1实时运行信息3Systembody监测目标系String40取值参考附件统4regionIDbody本地网标识Integer9本地网标识5sendTimebody时间戳String20M6infoContentbody6.1ciidinfoContent配置项标识Integer86.2ciNameinfoContent配置项名称String646.3kpiidinfoContent指标标识String8指标标识6.4kpiNameinfoContent指标名称String64指标名称6.5valueinfoContent采集值Integer12采集数据值6.6valueTypeinfoContent数据类型String30采集数据类型6.7actionCycleinfoContent采集周期Dat205.2.2.2.2.3返回数据序号序号元素名称父元素名称元素说明类型长约束备注度1serialIDbody序列号Integer18M接口传递序列号2infoTypebody信息项类Integer3M具体取值参考附件型信息项类型。3Systembody监测目标String40IT服务管理系统系统标识,取值参考附件4regionIDbody本地网标Integer9本地网标识识5sendTimebody时间戳String20M6infoContentbody-----6.1kpiIDinfoContent指标IDString8M指标ID6.2returnCodeinfoContent返回码Integer3M接收失败/成功,控制完成/异常6.3returnMsgInfoContent返回消息String60返回的消息5.2.3集团业务交付流程监控系统接口5.2.3.1告警数据上传接口5.2.3.1.1接口功能版权所有,注意保密101
告警信息上报是指省业务交付流程监控系统监测到的告警级别为严重与重要告警的信息通过XML文件格式自动上报集团业务交付流程监控系统。【接口要求】5-13.告警数据上传流程要求:将全天从00:00:00开始分成96个上传时间点,到了时间点,省端程序检查在这个时间段内是否有需要上传的告警或告警清除记录,如果有则在一个文件中上传,其它时间点不做上传。如果在这个时间段内发生了告警,并且在该时间段内已经清除,省端同时上传该告警的告警和告警清除记录。如果没有需要上传的记录,省端上传空文件;如果告警仍存在,在每个上传时间点监测到都再次上传该告警的记录。记录内容与最近一次该告警的记录基本相同,将BeginTime,EndTime,LastTime等字段改写,并将Count值加1,如果告警已经升级,EventLevel这个字段也需要改写为相应的告警级别,详情参见下面的例子;如果在某个上传时间点监测到该告警已经清除,则上传一次告警清除记录。内容与最近一次告警记录基本相同,Value置为0,Count置为1;5-14.由于传输原因导致的文件漏传,要求当连接恢复后将所有在中断开始时间到本地恢复时间段内的文件全部上发;5-15.非传输原因导致的文件漏传,将中断开始时间到本地恢复时间段内的上发信息合成一个文件,该文件的序号为当前时间段对应的序号;5-16.对于退回的错误文件,需要保证重传文件中只能包含对应的改正记录。5.2.3.1.2接口数据5.2.3.1.2.1接口概述接口名称告警事件上传接口接口说明省级业务交付流程监控系统定时向集团业务交付流程监控系统批量上传告警数据发送方省业务交付流程监控系统接收方集团业务交付流程监控系统版权所有,注意保密102
接口类型异步非实时大数据量接口协议FTP、中间件等数据格式XML、JSON等5.2.3.1.2.2发送数据序元素名称父元素名称元素说明类型长约备注号度束1serialIDBody序列号Integer18M接口传递序列号2infoTypeBody信息项类型Integer3M具体取值参考附件信息项类型。该处必须填写值为4告警信息。3SystemBody监测目标系String20M参考附件中的所属系统类型统4CompanyIDBody省公司编码String4M参考附件中的省份代码5infoContentBody--------告警信息5.1alarmTitileinfoContent告警标题String60M告警标题5.2alarmtTextinfoContent告警内容String512M告警内容5.3CiidinfoContent配置项标识Integer8M5.4ciNameinfoContent配置项名称String64M5.5alarmedinfoContent告警的序列Integer18M告警的序列号,在省范围内号唯一标识一个告警。5.6firsttimeinfoContent告警初次发date14M告警初次发生时间,生时间yyyymmddhh24:mi:ss5.7LasttimeinfoContent告警最近发date14告警重复发生需要填写生时间yyyymmddhh24:mi:ss5.8clearTimeinfoContent告警清除时date14告警清除时间,若告警已清间除,该项必填。yyyymmddhh24:mi:ss5.9eventTypeinfoContent告警类型Integer6M取值参考附件中的告警类型。5.10alarmLevelinfoContent告警级别Integer1M取值参考附件中的告警级别。5.11orgTypeinfoContent告警原始类Integer1取值参考附件中的告警类型型。版权所有,注意保密103
5.12orgLevelinfoContent告警原始级Integer1取值参考附件中的告警级别别。5.136M告警计数,填写本告警已上count告警计数Integer传的次数,如果是告警清除infoContent记录,则填15.14valueinfoContent告警是否清BooleanM告警是否清除除true:告警发生false:告警清除5.15CauseinfoContent告警可能原String512告警可能产生原因因5.2.3.1.2.3返回数据文件级检查结果和记录级检查结果文件(见集成接口方式一节中的文件类接口相关说明)。5.2.3.2管控指标上传接口5.2.3.2.1接口功能本接口负责由省级业务交付流程监控系统向集团级业务交付流程监控系统发送管控指标数据,包括告警指标数据、性能指标数据等。省级业务交付流程监控系统向集团业务交付流程监控系统上报管控指标包括:全网订单业务的性能、告警指标数据;省级关键业务运行性能、告警指标数据;省级关键应用运行性能、告警指标数据;省级关键业务稽核指标;具体的管控指标要求见电信ITSM规范中管控指标分册相关内容,以及集团发布的最新管控指标要求。【接口要求】5-17.性能数据上传流程要求:对于1小时统计一次的指标,在下一个小时之内,生成1小时指标上传文件;版权所有,注意保密104
对于每日统计一次的指标,在第二天的早晨6点之前,生成日指标上传文件;对于每月统计一次的指标,在下个月1日的早晨10点之前,生成月指标上传文件;对于每季度统计一次的指标,在下个季度首月2日的早晨10点之前,生成季度指标上传文件;5-18.由于传输原因导致的文件漏传,要求当连接恢复后将所有在中断开始时间到本地恢复时间段内的文件全部上发;5-19.非传输原因导致的文件漏传,将中断开始时间到本地恢复时间段内的上发信息合成一个文件,该文件的序号为当前时间段对应的序号;5-20.对于退回的错误文件,需要保证重传文件中只能包含对应的改正记录。5.2.3.2.2接口数据5.2.3.2.2.1接口概述接口名称管控指标上传接口接口说明省级业务交付流程监控系统定期向集团业务交付流程监控系统批量上传管控指标数据发送方省业务交付流程监控系统接收方集团业务交付流程监控系统接口类型异步非实时大数据量接口协议FTP、中间件等数据格式XML、JSON等5.2.3.2.2.2发送数据序列元素名称父元素名称数据类型长度备注1rcdbody指标信息记录1.1seqrcdInteger18序列号,集团按照seq从小到大的顺序来处理记录1.2kpiidrcdString8KPI标号,参考监控管控指标分册的指标值版权所有,注意保密105
1.3kpinamercdString60KPI名称1.4valuercdDecimal18指标值(对于带小数的保留4位,例如0.9998)1.5descrcdString255描述5.2.3.2.2.3返回数据文件级检查结果和记录级检查结果文件(见集成接口方式一节中的文件类接口相关说明)。5.2.3.3全网订单查询接口5.2.3.3.1接口功能集团业务交付流程监控系统通过全网业务订单ID,调用本全网订单查询接口,查询全网业务订单在省内的实时状态、流转环节等信息。【接口要求】5-21.支持接收集团业务交付流程监控系统传入的查询条件,如全网业务订单ID,转换为省内业务订单ID,查询并反馈业务订单在省内的状态和流转信息;5-22.当查询过程出现异常,如数据不存在、系统忙等,支持将相应的错误信息反馈给集团业务交付流程监控系统。5.2.3.3.2接口数据5.2.3.3.2.1接口概述接口名称全网订单查询接口接口说明集团业务交付流程监控系统通过本接口从省级业务交付流程监控系统查询全网订单状态,返回全网订单流转状态信息发送方集团业务交付流程监控系统接收方业务交付流程监控系统接口类型同步实时小数据量版权所有,注意保密106
接口协议WebService等数据格式XML、JSON等5.2.3.3.2.2发送数据序元素名称父元素名称元素说明类型长度约束备注号1serialIDbody序列号Integer18M接口传递序列号2infoTypebody信息项类Integer3M具体取值参考附件型信息项类型。该处必须填写值为1实时运行信息3Systembody监测目标String40取值参考附件系统4regionIDbody本地网标Integer9本地网标识识5sendTimebody时间戳String20M6infoContentbody6.1orderIdinfoContent全网业务String18M查询条件订单流水号6.2regionCdinfoContent区域编码String8本地网的取值为本地网代码;省集中或集团的取值见附件省份代码5.2.3.3.2.3返回数据序元素名称父元素名称元素说明类型长度约束备注号1serialIDbody序列号Integer18M接口传递序列号2infoTypebody信息项类Integer3M具体取值参考附件型信息项类型。该处必须填写值为1实时运行信息3Systembody监测目标String40取值参考附件系统4regionIDbody本地网标Integer9本地网标识识5sendTimebody时间戳String20M6infoContentbody版权所有,注意保密107
6.1orderStatusinfoContent全网业务String查询结果订单状态6.2regionCdbody区域编码String本地网的取值为本地网代码;省集中或集团的取值见附件省份代码6.3orderIdinfoContent客户订单integer12ID6.4orderLineIdinfoContent产品订单integer9项6.5processNodeinfoContent流程环节String50当前流程环节,若订单行已经执行完成,则此字段为空6.6alarmEventinfoContent流程故障String3000信息6.7startDateinfoContent开始执行String14开始执行时间时间YYYYMMDDHHMISS6.8endDateinfoContent结束执行String14结束执行时间时间YYYYMMDDHHMISS5.2.4被管对象系统接口5.2.4.1统一采集与控制接口5.2.4.1.1接口功能业务交付流程监控系统使用WebService、Socket、Syslog、数据库、文件、部署Agent等方式从应用、业务系统被管对象中主动采集或者被动接收运行期性能信息、告警信息。并通过与被管对象建立操作传递和结果反馈通道,直接或间接实现对被管对象的操作控制。详细接口方式与功能要求见系统功能中的统一采集与控制相关章节。5.2.4.1.2接口数据接口数据交互与内容如下表所示:数据类型数据说明数据发送接口类方型版权所有,注意保密108
性能信息业务交付流程监控系统从被管对象系统中获得当前性能信息,包被管对象定时同括性能数据发生时间、性能数据值、数据类型等步告警信息业务交付流程监控系统从被管对象系统获取告警信息,包括告警被管对象定时同标题、告警类型、告警内容、告警级别、发生时间等步操作控制信业务交付流程监控系统建立与被管对象的操控通道,传递操作信业务交付实时同息息,包括操作类型、操作指令等;接收反馈的操作结果流程监控步系统接口数据内容视被管对象不同而有所不同,在具体实现时可根据被管对象实际的数据提供情况进行定制。5.2.4.2订单告警同步接口5.2.4.2.1接口功能在端到端的订单处理流程中,当订单出现异常、超时等情况时,通过此接口将告警信息同步到业务交付流程监控系统中来,实现各业务系统订单流程的统一告警与展现。【接口要求】5-23.支持实时地从各生产系统收告警数据,通过解析、转换后形成业务交付流程监控系统中的订单告警数据并展现在统一的告警列表中;5-24.告警数据接收完成后,支持将数据接收成功状态反馈给生产系统,以便生产系统进行失败后的重传。5.2.4.2.2接口数据5.2.4.2.2.1接口概述接口名称订单告警同步接口接口说明业务交付流程监控系统从生产系统中获取订单告警数据发送方各生产系统接收方业务交付流程监控系统接口类型同步实时小数据量接口协议WebService、Socket等数据格式XML、JSON等5.2.4.2.2.2发送数据版权所有,注意保密109
序元素名称父元素名称元类型长约备注号素度束说明1serialIDbody序Integer18M接口传递序列号列号2infoTypebody信Integer3M具体取值参考附件信息项类息型。该处必须填写值为1实时项运行信息类型3Systembody监String40取值参考附件测目标系统4regionIDbody本Integer9本地网标识地网标识5sendTimebody时String20M间戳6infoContentbody-----6.1CustOrder_idinfoContent客Integer12M由CRM系统产生,在订单流程户涉及的各个系统中作为客户订订单的唯一标识单ID6.2CustOrder_line_idinfoContent订Integer9M由CRM系统产生,在订单流程单涉及的各个系统中,和行CustOrder_id一起构成客户ID订单行的唯一标识6.3alarm_titleinfoContent告String60警标题6.4alarm_eventinfoContent告String3000M详细告警信息警事件版权所有,注意保密110
6.5alarm_typeinfoContent告String20M例如:超时、异常故障等警类型6.6alarm_levelinfoContent告String10警级别6.7alarm_lineinfoContent告String20M发生告警的的流程节点名称警环节6.8alarm_timeinfoContent告date14M时间YYYYMMDDHHMISS警时间5.2.4.2.2.3返回数据序号序号元素名称父元素名称元素说明类型长约束备注度1serialIDbody序列号Integer18M接口传递序列号2infoTypebody信息项类Integer3M具体取值参考附件型信息项类型。3Systembody监测目标String40IT服务管理系统系统标识,取值参考附件4regionIDbody本地网标Integer9本地网标识识5sendTimebody时间戳String20M6infoContentbody-----6.1returnCodeinfoContent返回码Integer3M接收失败/成功6.2returnMsgInfoContent返回消息String60返回的消息5.2.4.3订单状态查询接口5.2.4.3.1接口功能版权所有,注意保密111
通过订单状态查询接口,业务交付流程监控系统可以根据订单号、用户关键号码等查询条件发起对CRM、计费、服务开通等端到端订单流程涉及的系统的订单查询,各生产系统返回订单实时状态信息或者历史流转情况信息。【接口要求】5-25.支持根据接口数据格式发起对生产系统的订单状态查询,生产系统根据查询条件查询订单状态信息,反馈给业务交付流程监控系统,如果订单查不到或者出现其它异常也需要将错误信息予以反馈;5-26.支持对生产系统返回的订单状态信息进行解析、处理,对正确或错误的反馈信息予以展示。5.2.4.3.2接口数据5.2.4.3.2.1接口概述接口名称订单状态查询接口接口说明业务交付流程监控系统通过本接口从各生产系统查询订单流转状态信息发送方业务交付流程监控接收方各业务生产系统系统接口类型同步实时小数据量接口协议WebService、Socket等数据格式XML、JSON等5.2.4.3.2.2发送数据序元素名称父元素名称元素说明类型长度约束备注号1serialIDbody序列号Integer18M接口传递序列号2infoTypebody信息项类Integer3M具体取值参考附件型信息项类型。该处必须填写值为1实时运行信息3Systembody监测目标String40取值参考附件系统4regionIDbody本地网标Integer9本地网标识版权所有,注意保密112
识5sendTimebody时间戳String20M6infoContentbody6.1orderIdinfoContent订单流水String18查询条件号6.2KeyIDinfoContent关键标识String18查询条件,可以是业务号码、事件标识等5.2.4.3.2.3返回数据序元素名称父元素名称元素说明类型长度约束备注号1serialIDbody序列号Integer18M接口传递序列号2infoTypebody信息项类Integer3M具体取值参考附件型信息项类型。该处必须填写值为1实时运行信息3Systembody监测目标String40取值参考附件系统4regionIDbody本地网标Integer9本地网标识识5sendTimebody时间戳String20M6infoContentbody6.1orderStatusinfoContent业务订单String查询结果状态6.3orderIdinfoContent客户订单integer12ID6.4orderLineIdinfoContent产品订单integer9项6.5processNodeinfoContent流程环节String50当前流程环节,若订单行已经执行完成,则此字段为空6.6alarmEventinfoContent流程故障String3000信息6.7startDateinfoContent开始执行String14开始执行时间时间YYYYMMDDHHMISS6.8endDateinfoContent结束执行String14结束执行时间时间YYYYMMDDHHMISS版权所有,注意保密113
5.2.5其它系统接口5.2.5.1短信/邮件通知接口当业务交付流程监控系统产生告警时,可以利用通知接口将告警信息以短信、邮件等方式及时通知维护人员,加快告警信息的处理过程。【接口要求】5-27.要求业务交付流程监控系统应能与短信网关SP接口API进行集成,实现与中国电信短信网关衔接;5-28.要求业务交付流程监控系统提供内置标准的邮件接口,使用标准SMTP协议,实现与现有OA系统中的邮件服务衔接;5-29.要求支持通知发送结果的接收:当短信或者邮件发送失败后,可以根据设定自动重发。5.2.5.1.1接口数据5.2.5.1.1.1接口概述接口名称短信/邮件通知接口接口说明业务交付流程监控系统通过短信网关提供的API接口以及邮件服务器提供的地址进行短信、邮件的自动发送发送方业务交付流程监控接收方短信网关/邮件服务器系统接口类型同步实时小数据量接口协议API/SMTP等数据格式文本5.2.5.1.1.2发送数据告警内容短信/邮件系统要求的其它发送内容(视具体的接口要求而定)版权所有,注意保密114
5.2.5.1.1.3返回数据短信/邮件发送成功标志发送时间等版权所有,注意保密115
6技术要求6.1总体要求6-1.系统应基于开放的技术标准和体系架构,所有的软硬件必须符合行业内标准的技术规范硬件平台更换时应能做到不修改软件代码实现无缝迁移,以便未来的扩展和集成的要求。6-2.系统应支持多应用服务器的集群结构,可以根据规模的变化灵活调整计算能力节点数量,提供处理性能的横向扩展能力,配合负载均衡设备实现高可用性。6-3.系统应用软件的设计应符合规范中技术体系架构的要求,数据存储层、业务逻辑层、接口展现层等相互独立,不同层之间采用符合国际标准的中间件或接口,使系统具有良好的灵活性、可操作性和可扩展性。6-4.应该支持常用的硬件架构(X86、Power、SPARC);应该支持常用的操作系统(Unix、Linux、Windows);应该支持常用的中间件(Websphere、Weblogic、Jboss);应该支持常用的数据库(Oracle、DB2、PostgreSQL、MySql);6-5.应支持多种接口方式,如Socket、WebService等多种标准接口协议;支持API接口;支持接口的可扩展性;接口遵从松耦合原则。6-6.应灵活支持集团公司和省公司两级管理架构,支持两级管理的数据交互。6-7.系统应支持对被管对象进行统一的、跨平台的操作,以简化管理操作。6-8.系统应同时支持安装监控代理和直接连接两种方式获取监控数据。监控代理程序应支持包括UNIX、LINUX、WINDOWS等在内的多种主机平台。监控代理程序应支持采集周期和采集脚本可以灵活配置。6-9.系统应支持对监控代理软件版本的管理、监控代理的程序的自动分发、以减少监控代理程序的复杂度和日常维护工作量,并确保以后扩充监控对象时,无须在被监控端对象上进行额外的工作。版权所有,注意保密116
6.2性能要求6-10.系统界面的操作反应时间应不高于6秒,统计报表类操作反应时间应不高于60秒,如存在其它特殊耗时操作,需详细说明原因。6-11.高峰时支持并发用户数:总系统用户数*10%。6-12.应支持1天内所能处理的最大当前告警、性能数据量:本期不得低于60万个,终期不得低于200万个。6-13.网络设备运行正常且系统压力正常情况下,告警、性能数据的响应时间(指被监控对象发生告警事件和性能事件,到监控系统完成采集、纠错、转换并入库的时间间隔)应不得大于5分钟。在系统满负荷情况下,响应时间应不大于以上指标的150%。6-14.当系统某个用户界面程序异常停止后,不应该影响服务器端和其它用户界面的正常运行。6-15.系统进行数据采集不能影响业务生产系统的稳定性,也不能明显影响业务生产系统的性能。6-16.在被管对象设备上安装的全部监控代理程序占用被监控系统资源累计的限制要求为:占用CPU使用率在5%以下,占用服务器物理内存为30MB以下。6-17.当系统网络资源或者被管对象系统主机资源紧张时,支持动态停止或恢复某些监控对象的数据采集功能,以减少对网络及对被管对象系统主机的压力,无需重启业务交付流程监控系统整个应用程序。6.3可靠性要求6-18.排除人为误操作因素,由应用系统自身原因导致的系统崩溃故障,平均无故障时间(MTBF)应大于365天,平均修复时间(MTTR)应小于4小时。6-19.排除人为误操作因素,由应用系统自身原因导致的系统错误故障,平均无故障时间(MTBF)应大于100天,平均修复时间(MTTR)应小于30分钟。6-20.应用系统必须支持连续7×24小时不间断地工作,应用软件中的任一构件更新、加载时,在不更新与上下构件的接口的前提下,不影响业务运转和服务。版权所有,注意保密117
6-21.系统在业务处理高峰时,各主机设备的内存利用率应该不大于70%,CPU平均空闲率不低于30%。6-22.系统应具有安全的管理体系结构,可通过管理员安全定义,权限划分和管理信息传输加密、网络隔离等措施保证管理系统的安全。6-23.应用系统应该充分利用防火墙、安全证书、SSL等数据加密技术保证系统与数据的安全。6-24.应用系统必须支持操作失效时间的配置。当操作员在所配置的时间内没有对界面进行任何操作则该应用自动失效。6-25.应用系统必须提供完善的日志记录功能,对系统关键数据的每一次增加、修改和删除都能记录相应的修改时间、操作人和修改前的数据记录。6-26.系统与监控对象连接中断时,应在一定时间内自动尝试重建连接,如连接失败应以告警形式提示用户。6-27.告警处理核心软件建议实现应用级主备配置,以便在没有系统级热备软件的情况下,实现告警处理的可靠性和稳定性。6-28.系统具有自检功能,能监视系统各功能模块的运行情况,随时发现系统自身的问题。6-29.为了保证系统的高可靠运行,本系统必须提供容错机制,避免单点故障的发生,如采用集群、负载均衡等技术;同时,系统应提供完整的备份和恢复手段。6-30.业务交付流程监控系统设计不能影响业务生产系统的可靠运行,业务交付监测系统与业务支撑系统之间采取严格的权限控制或设置防火墙等措施,保证业务生产系统的安全性。6-31.监控代理程序应提供本地数据保存功能,当网络发生故障导致数据传输发生中断后,监控代理程序应能保存所采集的数据。6.4易用性要求6-32.系统应易于安装和使用,用户界面应保持风格一致。6-33.应用系统对普通用户的操作界面应该以B/S方式实现。版权所有,注意保密118
6-34.系统所有界面应简洁、友好、操作简单,提示信息通俗易懂。6-35.系统应提供完善的联机帮助信息。6-36.常用操作应支持设置“快捷键”,以方便功能间的快速切换。6-37.对于查询界面,应支持跳页和滚动显示功能。6-38.对于查询/统计结果、业务单等,应支持打印功能,并提供电子文档的存储功能。6-39.数据展现的Web化:应采用Web技术实现相关报表及监控视图的展示。对于一些要求交互性、客户体验特别高的客户端的展现功能,可采用AJAX、Flash/Flex等技术来实现。6-40.灵活的配置界面:应能够采用Web的配置界面实现综合统计分析报表模板以及业务监控视图界面进行个性化配置。6.5可维护性要求6-41.系统应具有对自身的集中维护配置功能,包括集中的系统参数设置、集中的系统日志管理等。6-42.系统应该按照可维护性原则进行设置,对于重要操作要求记录日志,关键操作的每一步处理应该是可追踪的,如告警确认人员、时间等信息。6-43.当提交完整的产品时,必须提交易于安装的标准安装程序(如:主要软件包可放置于光盘)。提供必要的操作维护手册及技术手册、必要的培训。当进行版本升级时,提供版本差异的详细说明。6-44.系统必须具有良好的可扩展性,支持平滑扩容,以满足未来各省公司管理应用和业务系统规模的增加而不断扩展。6-45.当被管对象迅速增加时,数据采集、告警处理和性能处理模块应能够采用分布部署的方式,分模块、分主机部署地对告警数据和性能数据进行处理,以保证整个软件架构的稳定性和扩展能力。6-46.系统支持采用增量备份和全量备份相结合的方式定期备份重要的系统数据。版权所有,注意保密119
6-47.应能支持系统的横向可扩展能力,当系统处理压力过高时,可通过增加硬件/应用服务器的方式,实现系统的分压处理能力6-48.系统应该采用构件化设计思想,系统框架与业务逻辑分离,以满足大型电信企业用户的需求。6-49.应用系统必须支持各构件的单独升级,并应该尽可能实现在线升级功能。6.6接口要求6-50.接口方式与信息模型的松耦合。即无论采取何种接口方式或技术,其交互的信息都应遵循统一的信息模型,建议统一采用XML格式描述信息模型。6-51.系统与外部信息源的松耦合。即通过接口的信息交互,业务交付流程监控系统与监控对象系统以及其它接口对端系统之间不应存在强依赖的关系,接口的运行不应对接口对端系统的可靠性、稳定性、安全性等方面造成影响。6-52.接口实现要具备可靠性:当接口出现异常时,可及时产生自身的告警或者将异常信息体现在业务功能界面中,以便维护人员迅速察觉解决问题。当接口连接恢复正常时,接口应具有自恢复能力,可以继续正常运行,不应造成数据的丢失。6-53.接口实现方式的适度冗余可以作为系统接口的建设参考,以在某种接口方式失效时保证信息的正常交互。6-54.系统与外部系统的接口交互信息内容有着不同的安全保密要求,如配置信息通常比性能信息保密性要高,根据信息的安全级别可采取不同的接口传输方式,或采用信息加密的方式提高接口安全性。6-55.接口实现要具备高效性:业务交付流程监控系统的运行效率与接口效率密切相关,要求采用的接口方式与实现技术必须保证接口的畅通、高效,尽量减少待交互信息的积压或延迟。6-56.接口实现要具备可扩展性:接口的定义不应限制业务交付流程监控系统的功能实现,在将来业务交付流程监控系统管理功能发生改变时(增加或调整),接口方式应能继续对功能提供支持。版权所有,注意保密120
6-57.接口信息数据模型的可扩展性:随着电信通信网络的发展,软件技术的变革以及及业务的不断更新,管理对象的种类和具体指标都会发生改变。无论采取何种接口方式,都应能很好地支持信息模型的改变。6-58.接口方式与实现应当尽可能采用成熟的先进技术,与国际主流技术保持一致,从而使系统得到较好的投资保护。系统间的接口实现技术应该优先选用WebService技术和支持JMS标准的消息队列技术。6.7数据生命周期要求6-59.原始告警、性能等采集数据至少保留1个月。6-60.处理后的告警数据、性能指标数据至少保留3个月。6-61.备份数据、报表数据至少保留2年。版权所有,注意保密121
7实施演进策略7.1实施原则统一认识,遵循规范。业务交付流程监控系统对中国电信IT能力提升至关重要,各省应统一认识,并在集团的统一规范下进行平台的建设。对集团规范暂时没有发布的内容,有条件的省公司可以先行探索和实践,适当超前。分步实施,持续推进。业务交付流程监控系统体系的完善是一个持续的过程,业务交付流程监控系统的建设也不可能一蹴而就,各省应建立持续推进的工作机制,分步实施,优先解决客户感知改善明显、工作效率提升显著等方面的问题。7.2实施演进根据《中国电信IT服务管理实施指导意见》(中国电信2008(546号)的三阶段安排,相应的业务交付流程监控系统分三阶段实施:第一阶段基础平台搭建,实现主动管理(2009年-2010年):建立基础的业务交付流程监控管理平台,实现CRM域统一的应用软件监控,初步实现端到端的业务交付流程的业务数据监控;第二阶段增加监控范围、实现端到端的业务数据监控(2011年):完善技术手段,增强CRM域应用软件监测的分析能力;实现跨系统的端到端的业务数据监控能力;实现业务可用性探测功能。第三阶段主动监控、优化服务:(2012年):完善业务影响规则,优化根源分析及业务影响性分析功能。增强日常维护操作自动化,建立有效的告警处理自动化流程。分阶段功能演进列表如下(★为新建功能,●为功能增强):编号一级功能二级功能一阶段二阶段三阶段1采集策略管理★2配置采集★统一采集与控制3告警采集★4性能采集★版权所有,注意保密122
5操作控制★6应用拓扑管理★7应用运行监测★CRM应用监控模块8应用交易监测★●9应用分析★10业务建模★●●11业务运营指标监测★●●12业务运营质量分析★●●业务交付流程监控模块13可用性探测★●14业务稽核★●15订单监测★16告警定位★17告警丰富★18告警过滤★告警处理19告警压缩★20告警操作★21告警处理流程定义★●22控制管理控制管理★23告警展现★●24综合展现综合视图★●25统计报表★●26用户管理★27权限管理★系统管理28日志管理★29自身管理★30通知接口★31事件接口★32接口管理两级接口★33CMDB接口★34统一认证接口★版权所有,注意保密123
35基础设施监控系统接口★36订单状态查询接口★具体分阶段的演进计划如下节所示。7.2.1第一阶段:基础平台搭建、实现主动管理实现CRM域系统的统一应用软件监控;建立业务交付流程的客户感知明显的业务数据监控功能,主动发现问题并解决问题;对基本的IT系统应用软件操作进行管控,对部分例行操作实现自动化操作处理,提高维护效率。1.监控管理范围实现业务交付流程中客户感知明显的业务流程监测。通过对业务流程、流程关键环节、关键环节关联关系的梳理,找出反映业务环节的可用性、完成情况、处理能力、异常情况等指标的监控,实现基本的业务过程监控。本阶段至少要实现本规范中要求的级别为“高”的业务数据指标监控。实现CRM域应用软件关键进程、业务组件、业务服务的运行情况监测,及时发现应用软件在运行状态和资源开销等方面的问题,实现应用层异常主动告警。本阶段至少要实现本规范中要求的级别为“高”的应用软件指标监控。要保证业务过程建模及业务支撑关系建模中涉及到的应用层监测对象及相关指标的实现,以满足业务支撑关系监测的需要。2.监控管理功能实现统一的采集与应用软件集中控制功能:通过主动采集或被动接收等方式,从被管对象获取采集信息,并打通系统与被管对象之间的操作通道。其中,主机、网络、数据库等基础设施的指标、告警及运行信息取自基础设施监控系统。实现统一的告警处理功能:通过告警的准确定位、告警信息丰富、告警过滤、告警压缩、告警前传等操作处理,快速确认应用及业务故障,缩短排障过程,为及时恢复业务运行打下基础。版权所有,注意保密124
实现CRM应用监控模块的应用拓扑管理、应用拓扑生成、应用软件运行监测功能:跟踪业务系统的应用软件的运行情况,以直观拓扑的方式监测应用软件出现的异常情况,准确定位故障,及时纠正问题,保证CRM域应用软件正常运行。实现业务交付流程监控模块的业务过程建模、业务支撑关系建模、业务运营指标监测功能:以业务流程作为监测视角,对关键业务流程的处理过程进行展现,通过业务过程中关键指标的运行监测以及纵向的业务支撑关系监测,了解业务的运行状态和质量,发现业务存在或潜在的问题,定位问题根源。实现业务运营质量分析功能:对各关键点指标数据以及业务过程关键质量指标数据通过异动、趋势、对比、构成等分析方法来实时或准实时地发现业务异常、潜在业务问题,及时掌握业务过程的运营质量并采取对应措施。实现订单监测功能:通过对各系统订单告警数据的实时采集与接收,实现统一的跨系统端到端订单告警展现功能,协助运维人员及时、全面掌握订单运行情况。通过对订单状态的主动查询,以流程化方式展示订单流转视图,帮助运维人员快速定位流程异常点,及时采取预防或处理措施。实现基本的告警列表及监视视图功能:可以根据一阶段的实际情况,为不同角色人员定制不同的告警列表及监视视图的展示方式,满足不同运维及其它人员的需要。7.2.2第二阶段:增加监控范围、强化端到端的业务数据监控增大监控范围;加强业务建模能力;强化跨系统的端到端的业务流程监控;实现业务可用性探测功能。1.监控管理范围:强化对业务交付流程的业务监测。本阶段实现本规范中要求的其它级别的业务数据指标的监控。实现CRM域全IT系统应用软件进程、接口、服务运行情况的监测,全面了解IT系统资源开销及运行状况,及时告警并提前发现系统运行过程中可能出现的版权所有,注意保密125
潜在问题。本阶段实现本规范中要求的其它级别的应用软件指标的监控。同时要保证应用软件监测对象及指标对新增业务数据监测内容的支持。在细化和扩充监控管理范围的同时,持续优化业务过程建模、业务支撑关系建模的准确性。使得业务过程中各关键点及指标充分体现业务过程的运行情况,有效支持运维人员进行问题的提早发现和准确定位。使得业务、模块、应用及基础设施的支撑关系更加明晰,有效支持自动的关联业务预警并帮助运维人员进行根源分析。2.监控管理功能:实现业务数据可用性探测功能:通过模拟客户端运行业务的过程以及模拟外部服务接口调用的过程,以界面、短信、服务调用等方式针对业务进行探测,从而对业务可用性状态、响应时间及其它指标进行实时监视。通过分析探测结果,发现关键业务流程中潜在的性能及可用性问题。全面实现跨系统的业务数据稽核告警能力:在各业务系统提供数据的基础上,实现全业务流程数据的平衡性、完整性和一致性稽核监控,如话单平衡关系校验、CRM与计费接口资料一致性等,对业务数据不平衡或不一致的情况产生告警。实现应用交易监测功能:在应用系统性能、可用性指标监控的基础之上,深入应用内部,追踪某个请求在整个业务应用中的交易(调用)路线,各个环节如WEB访问、中间件调用、数据库读写的执行情况,并将汇总信息以交易视图方式展示。实现告警流程定义功能:在实现基本的告警操作功能的基础上,增加告警处理过程的流程化定义,支持针对不同的告警定制不同的处理流程,协助运维人员便捷、有效地验证告警、定位告警并解决问题。实现可定制的告警列表及告警监视视图功能:可以根据运维人员关注告警列表字段、告警对象不同,进行个性化定制,满足不同运维人员的需要。版权所有,注意保密126
7.2.3第三阶段:主动监控、优化服务全面提升监控能力,增强系统日常维护操作自动化,实现主动监控、优化服务的目标。增强业务与底层IT基础设施以及应用之间的影响性分析功能,完善业务影响规则。优化告警根源分析功能,根据配置的根源告警对应规则,对产生的多个关联告警进行分析,找到产生这些批次告警的根源告警信息。增强日常维护操作自动化执行功能,针对日常维护过程中复杂的操作任务,可将多种标准操作组合成操作流程任务,定义各种标准操作之间的连接关系以及输入输出参数,完成自动化执行的功能,提高维护人员的工作效率。持续优化监控工作相关岗位、人员配比。根据运维工作有效性、及时性要求进一步明晰岗位职责定义,如告警处理流程、日常巡检流程等,达到IT服务管理流程与业务交付流程监控系统使用上的有机结合。7.3部署方案各省公司在建设业务交付流程监控系统时,可以选择在已有监控系统基础上升级改造以满足本规范的要求,也可以独立建设业务交付流程监控系统。系统改造如省内已经建设了基础设施监控系统,或者已经建设了其它业务域的应用和业务监控系统(如计费业务监控系统),并且已有系统功能通过一定的改造可以满足本规范的监控要求,为了节省投资,可在原有系统基础上,根据本规范的要求,通过改造和实施实现对CRM应用和业务业务交付流程的监控。独立部署如省内没有建设监控系统,或者已建监控系统但不具备相对完善的应用和业务监控能力,对已有系统改造难度较大,可以考虑独立建设业务交付流程监控系统。版权所有,注意保密127
从系统规模来看,对于较大用户规模的省份,业务交付流程监控涉及的基础设施、应用、业务类监控对象较多,使用人员分步较广,考虑到系统的性能、可用性压力,应优先考虑独立建设业务交付流程监控系统。版权所有,注意保密128
8附录一监控指标体系8.1指标建设方法根据业务交付流程监控系统监控范围定位,指标体系围绕业务交付端到端流程的业务数据监控,以及针对CRM域各系统的应用软件监控来建设。本规范对CRM域实时性要求比较高、较为影响客户感知的的业务流程、业务功能及服务接口以及支撑它们的应用指标进行梳理,整理出应用指标、业务关键流程及关键点,提出CRM业务交付流程的基本指标要求,并对指标采集原则、计算方法、指标关联关系以及指标的分析方法提出了参考建议。在本规范业务指标体系基础之上,按照业务交付流程监控系统实施演进策略要求,省公司可以根据自身情况进行指标的细化、扩充,以适应各省公司业务交付流程监控要求。8.1.1指标建设范围指标建设的目的主要是为了保障端到端的业务交付流程、CRM域应用系统的正常运行。通过监控指标实时了解CRM域业务系统的运行状态和运行质量,发现业务存在或潜在的问题,及时预警与处理。通过加强对业务运营过程的管理,保证业务的连续性和可用性。通过业务交付流程监控系统两级接口,各省公司可以上报集团CRM关注的省内管控指标数据。具体要求参见ITSM规范中的平台管控指标分册相关要求。业务交付流程监控指标体系范围整理如下:版权所有,注意保密129
图8.1指标范围具体指标要求和指标内容见下节。8.1.1.1业务监控指标范围8.1.1.1.1业务流程指标订单处理流程对CRM订单受理中装、拆、移、改、复等订单类流程提出统一的监测指标要求,详见指标内容定义。欠费停开机流程由计费发起,采取特殊的短流程的方式直接调用服务开通,进行CRM数据同步的过程,详见指标内容定义。增值业务订购流程版权所有,注意保密130
各渠道发起的增值业务订购,转发到VSOP进行受理、鉴权、生成激活工单、激活并竣工处理的过程。全网订单处理流程集团CRM系统通过集团CRM枢纽的订单下发接口将订单下发给省CRM,省CRM自动完成订单受理,进入省内开通流程,进而获取服务开通处理完成结果报竣并反馈给集团CRM的过程。通过业务交付流程监控系统两级接口,各省公司可以上报集团CRM关注的全网管控指标数据。特别提示:全网业务指标中(详见后续章节),有部分属于集团CRM枢纽考核指标,要能够按照集团CRM的要求进行上传。如各省业务交付流程监控系统及两级接口届时未能建设完成,可以考虑先行从CRM系统获取后,通过其它接口方式(如集团CRM枢纽)先行上传。8.1.1.1.2业务功能指标重点关注门户类自助渠道业务功能的监控,如网上营业厅、掌上营业厅、短信等。业务功能监控主要依靠业务可用性探测功能来实现,通过模拟最终用户的实际业务操作,采用仿真socket、webservice等数据交易方式直接对被探测系统特定业务发起探测,通过对被探测业务办理结果及办理时延等探测结果的分析,发现被探测系统中存在问题的业务功能模块。业务功能指标选取原则如下:1)、选取最能体现最终客户的感知,使用频率较高的业务功能进行监控,如余额查询、账单查询、积分查询等功能。2)、监控对象要有可探测性,要能通过探测用例的设定,同步返回响应时长、可用性状态等探测结果数据,并支持探测过程的回退。8.1.1.1.3服务接口指标版权所有,注意保密131
服务接口指标包括CRM域各独立系统之间的接口可用性指标,如CRM系统与网厅、CRM系统与10000号系统;CRM域系统与其它域系统如计费、服务开通等系统之间的接口可用性指标等。服务接口探测利用业务接口可用性探测功能,主动模拟各接口实时业务过程,采用仿真socket、http等数据交易方式直接对特定业务接口发起模拟探测,模拟产生接口交易并分析最终结果,从而发现关键接口潜在的性能及可用性问题,建立预警机制,生成服务接口监测告警事件。服务接口指标选取原则:1)、选取使用频率较大、重要性级别较高的服务接口进行监控,反映系统重点业务的运行状态。2)、要求监控对象要有可探测性,要能通过探测用例的设定,同步返回响应时长、可用性状态等探测结果数据,并支持探测过程的回退。8.1.1.1.4业务稽核指标为了保证系统处理全过程的顺畅,提前发现潜在的问题,应考虑对各系统的业务数据质量进行主动性监控及维护。业务数据稽核是通过数据比对或配置审查的方式来发现业务处理过程以及各系统档案的数据问题,保证业务运行过程中业务处理流程数据及业务档案数据的一致性、准确性和一致性。8.1.1.2应用监控指标范围8.1.1.2.1应用进程指标应用进程监测是指对CRM域应用系统的关键进程进行探测,包括进程状态、系统资源占用情况、按用户的进程数统计等指标,目的是在进程出现异常时可以及时通知相关人员进行处理。8.1.1.2.2应用服务器指标版权所有,注意保密132
应用服务器主要指的是J2EE架构下的应用系统容器,通过定时采集或者接收应用服务器提供的指标数据,如应用服务器状态、客户端连接数、数据库连接池使用率等指标,对应用服务器的运行情况进行实时监控,保证应用的正常运行。8.1.1.2.3数据文件监控指标应用软件数据文件是指系统运行时重要的配置文件、系统文件等,这些文件的异常可能会导致应用软件的异常。对数据文件的监测指标包括文件变动情况、文件生成是否超时等。8.1.1.2.4业务服务指标业务服务是由业务组件实现并对外提供的功能与操作集合,其支撑了CRM域各应用软件与外部系统的接口,以及应用软件内部模块之间的重要接口。对于业务服务通常采用接口可用性探测的方法进行监测,需要定义探测性的监控指标如每个业务服务的探测次数、失败比率、响应时长等等。8.1.2指标建设步骤这里着重说明业务流程指标的建设方法,业务功能、服务接口和应用类指标的设置,可参考指标建设范围中的描述。业务流程指标建设通过业务建模方式实现,功能描述详见业务监控功能中的业务建模章节。在具体实施过程中,主要体现为业务过程建模、业务监测指标设置与业务运行运行监测,如下图所示:图8.1业务流程指标建设示意图版权所有,注意保密133
1.业务过程建模指在系统中建立起从业务起始关键点到结束关键点的业务流程模型。2.业务监测指标设置指在业务过程模型上设置关键点与监视指标的关联。3.业务监测运行基于业务监测模型设置运行参数并运行。8.1.2.1业务过程建模业务过程建模采用从业务流程监控需求出发、至上而下的方法。通过对业务流程监测的需求进行分析,明确监控的业务范围和要点,从关键业务流程展开,确定业务处理过程中的监测关键点,描述关键点之间的关系,必要时绘制出业务流程图,并在系统中存储为业务过程模型。图8.2业务过程建模具体的业务过程建模可形成业务专题,如CDMA新装开机业务流程,其中关键点包括CRM订单受理创建、订单派单、服务开通、竣工、资料同步与归档等。详见指标内容定义。8.1.2.2业务指标设置在完成了业务过程建模后,系统中已有了完整的业务过程模型,可以在该模型的关键点上设置监测指标,通过监测指标与业务关键点的关联,明确每个业务关键点需要监测的指标内容,从而形成完整的业务监测模型。下面就各种业务过程可能的业务监测指标进行分析与抽象,提取出大部分业务过程通用的业务监测指标。在指标体系的建设过程中,各省公司应在通用指标项的基础上明确、细化和扩充适合自身业务要求的监控指标。版权所有,注意保密134
通用指标项是适用于各类业务全流程监控的指标项,通过对各类业务流程关键点所需指标项的总结及收敛,我们从处理能力、完成情况、可用性、异常率、预测性五个方面对业务处理流程监控必需的指标项进行整理,详细如下:(1)处理能力指标:处理能力指的是系统在某个关键点处理单效率的高低,通常用单位时间的完成单量、监测时间点的待处理单量等指标作为衡量标准。(2)完成情况指标:完成情况指标包括处理平均时长和指定时间的完成率指标。处理平均时长指的是固定的单量下处理系统完成平均需要的时间,以时间为单位。指定时间的完成率指的是以系统某段时间的完成单的百分比,是系统某段时间的完成单量和该段时间系统待处理单量的比值,来考查系统的完成情况。(3)可用性指标:可用性指标是通过主动探测指定时间内关键点是否有产生新的数据,以判断系统是否正常运行。(4)异常率指标:包括当前关键点的异常单量和超时单量。异常单是指某个订单由于资料不匹配、系统数据配置不完整等方面原因而导致该订单不能被系统的某个业务环节正常处理的单量。超时单量指系统处理能力有限或某类异常导致待处理的单无法按系统关键点要求的工单处理时间阀值内完成,导致超时的数量。即可监控人工环节也可监控非人工环节。(5)预测性指标:通过指标项实现对业务活动的监控预警,并通过指标的量值和预测算法分析预测未来的发展,建议至少包括待处理量、预计完成量、预计超时量和预计完成时间四个指标。待处理量指某业务流程的关键点当前等待处理的数量。预计完成量指依照系统目前的处理能力预估一定时间段后可完成的数据量。预计超时量指由于等待处理的工单流入量超出系统的处理能力,预计单位时间后的超时量。预计超时量=当前待处理量+待处理预估增量-预计完成量版权所有,注意保密135
预计完成时间指的是系统处理完成当前的处理单所需要消耗的单位时间,其数值可被系统处理能力、当时待处理量、预计新增待处理量等因素影响。8.1.2.3业务监测运行对业务模型中的指标实例化,设置运行实例的运行周期、告警阀值、告警规则、告警清楚规则等日志输出,并通过后台的统一调度运行业务监测。业务监测实例首先根据监测指标的采集脚本从采集对象通道,根据指标算法提取采集对象数据并计算得出指标结果。实时记录运行指标结构值,实时比对数据阀值,到超过阀值的指标,进入告警状态。告警是根据设置好的告警规则,来产生告警。并根据告警清除规则来消除告警。业务监测运行的实时结果可以集合成为实时的界面趋势图、柱状图等。业务监测运行结构还可以为事后的报表统一分析展现提供数据。8.1.3指标参数说明为保证各省公司对指标理解的一致性、明确性,有必要对指标主要参数进行统一说明,如下:指标ID:系统中指标唯一编码,参看附件1指标编码方式。鉴于各省公司的指标实现方式、数量可能不同,二级、三级分类编号码由省公司自行设定。例如,PM-02-06-MMMM-NN指的是:PM:性能数据;02:BSS应用类;01:CRM系统;MMMM:二级分类编号(省公司自行编制);NN:三级分类编号(省公司自行编制)。指标维度:对于一些通用的业务流程和关键点,可以建立统一的指标。如:单位时间内服务开通系统接收到CRM系统派发的订单量,不同的业务操作、受理渠道、套餐类型均会用到此指标,可以以业务操作、渠道、套餐为维度只建立一个统一的指标。系统可以支持对不同的维度设置不同的性能告警阀值、采集间隔等。维度实现时也可以使用另外一种方式:针对关注的维度信息,建立多个监控指标,版权所有,注意保密136
比如营业厅受理的新装订单量、网厅受理的新装订单量分别建立两个不同的指标。规范涉及的指标中用到的维度主要有:业务操作:订单、销售品、产品有不同区分,针对订单有新建、修改等;针对销售品有订购、退订、注销、变更等;针对产品装、拆、移、改、停复机等区域:各省有所不同,一般指地市信息渠道:如实体营业厅、网上营业厅、短信营业厅、掌上营业厅、10000号等套餐类别:如e8、e9等产品类别:如固话、C网、ADSL等客户类型:如大客户、普通客户等业务功能(全网业务):全网业务支持的业务功能大类,如总计服务、协同通信、综合办公等业务对象(全网业务):全网业务支持的业务功能中具体的服务,如订单通知、订单状态查询、订单反馈等建议采集间隔:指标数据统一采集的间隔,时长不能大于本规范要求的时间。根据指标维度的不同,同类指标的采集间隔可能不同,如ADSL积压量的采集一般比C网积压量的采集时间长。各省请根据自己的业务要求定义合理的采集间隔,达到指标数据的及时性、有效性。指标级别:指标的重要性级别,实施演进一阶段至少需要实现级别为“高”的指标监控,二阶段要求实现其它级别的指标监控。建议分析方法:规范建议的指标分析方法,分为异动分析、趋势分析、对比分析、构成分析几种。分析方法的详细说明可参考业务监控部分的业务运营质量分析功能。指标关联:指标关联关系说明,主要用于对比分析、构成分析这样需要多个指标关联分析的情况。版权所有,注意保密137
8.2业务监控指标8.2.1业务流程指标8.2.1.1订单处理流程订单处理流程包含从订单受理、服务开通到订单竣工等环节的端到端处理,实现了全业务、全区域、全渠道的订单管理。本规范将订单流程作为业务交付流程监控中的重点监控对象,利用业务过程建模、业务监测指标设定方法,整理出了统一的订单流程监控关键点与统一的指标-关键点关联关系。在统一的监控指标体系要求下,针对不同业务、区域、渠道等维度的订单流程,可以选取关注不同的关键点,如普通的变更订单不需要服务开通关键点;可以为指标设定不同的采集间隔、告警阀值等,如CDMA开通订单的时限要求高于固话或ADSL的开通时限要求。各省公司在建立业务指标体系时,要根据自身业务需要以及集团管控指标要求进行合理的指标维度选取与设置。8.2.1.1.1业务流程版权所有,注意保密138
订单处理流程示意CRM服务开通网厅CRM订单受理CRM派单服务开通处理自动激活营业厅施工调度计费接收同步CRM竣工处理服务开通报俊VSOP激活数据接口计费系统ODS系统其他系统网元系统网络运维业务平台图8.3订单处理流程示意图流程关键点说明:CRM订单受理接收用户受理请求,根据用户的申请信息在系统内生成相关产品服务的生产订单,并收取用户费用,打印发票回执的全过程,包括申请信息录入、订单生成、算费、缴费、回执打印等环节。CRM订单派单派单是用户受理完成后,由CRM系统通过后端订单分解、派发往服务开通系统请求施工的过程,并根据服务开通返回的结果更新环节状态。主要环节状态包括待派单、已派单、已回单、派单异常等。服务开通处理服务开通处理环节是服务开通系统接收到CRM发送的订单后,根据客户订单中产品及其对应产品服务完成对客户订单的分解,并启动对应的服务定单处理流程过程,包括资源配置、服务配置、自动激活派单、施工调度派单等。自动激活版权所有,注意保密139
如需通过自动激活平台进行自动施工,则服务开通根据工单模板以及工单拆分原则生成自动工单派发到自动激活平台,自动激活平台负责进行指令的翻译,将指令发送到相应的网元/网管完成工单施工,并反馈施工结果给服务开通。VSOP激活服务开通系统判断是否有增值业务的开通项,如果有,则向VSOP发送激活工单进行开通,VSOP接收到服务开通工单后,生成销售品实例,再通过内部服务激活工单的形式向业务平台下发工单,竣工完成后反馈结果给服务开通。施工调度如需通过施工调度进行人工施工,则服务开通根据工单模板以及工单派发规则生成施工调度单并派发到相应的工位,由施工调度进行人员以及工具的调度完成施工,并反馈施工结果给服务开通。服务开通报俊服务开通系统在服务定单对应的各类(服务配置)工单回笼后,向测试管理系统发起产品测试请求,向资源管理系统发出资源归档的请求,以订单+产品实例为基本单位向CRM系统进行产品开通完成的报竣。报竣过程中支持按照先完成先报竣原则分别对客户订单中的产品进行报竣。CRM竣工处理CRM系统接收到服务开通的产品实例竣工消息后完成竣工归档处理、根据需要调用资源管理系统的号码占用接口,完成新号码的占用。根据需要调用资源管理系统的号码释放接口,释放在用的老号码,临时占用的过程号码。把订单的最新信息同步给计费系统、集团CRM。当一个订单的所有定单都竣工后,CRM需要进行订单竣工归档处理,主要完成套餐销售品的竣工归档处理,并把套餐销售品信息同步给计费系统、集团CRM。计费接收同步数据计费系统通过资料同步接口接收CRM系统发送的客户资料及套餐销售品信息,进行数据入库处理。如计费系统接收同步数据出现,需将错误消息反馈给CRM系统。版权所有,注意保密140
8.2.1.1.2指标内容1、CRM订单受理编建议采指标建议分指标关指标ID指标名称指标描述建议维度号集间隔级别析方法联关系PM-02-06-订单受理采集间隔内各类渠业务操作、区异动分11小时高MMMM-NN量道受理的订单量域、渠道、套餐析PM-02-06-订单受理采集间隔内各类渠业务操作、区异动分21小时高MMMM-NN失败量道订单受理失败量域、渠道、套餐析订单受理采集间隔内各类渠PM-02-06-业务操作、区趋势分3失败率道订单受理失败比1小时高MMMM-NN域、渠道、套餐析率一次性费采集间隔内收取一PM-02-06-业务操作、区异动分4用收取数次性费用的订单数1小时中MMMM-NN域、渠道、套餐析量PM-02-06-一次性费采集间隔内收取一业务操作、区异动分51小时中MMMM-NN用收取额次性费用的数额域、渠道、套餐析2、CRM订单派单编建议指标指标名建议采指标号指标ID指标描述建议维度分析关联称集间隔级别方法关系派单平采集间隔内处理派单平均时业务操作、区其它PM-02-06-构成1均处理长(受理完成到发给服务开域、渠道、套1小时高环节MMMM-NN分析时长通时长)餐、全网标志时长派单处采集间隔内派单处理量业务操作、区PM-02-06-异动2理量域、渠道、套1小时高MMMM-NN分析餐派单处采集间隔内派单处理失败量业务操作、区PM-02-06-异动3理失败域、渠道、套1小时高MMMM-NN分析量餐派单处采集间隔内派单处理失败率业务操作、区PM-02-06-趋势4理失败域、渠道、套1小时高MMMM-NN分析率餐派单处采集间隔内派单处理超时量业务操作、区PM-02-06-异动5理超时域、渠道、套1小时高MMMM-NN分析量餐派单处业务操作、区PM-02-06-趋势6理超时采集间隔内派单处理超时率域、渠道、套1小时高MMMM-NN分析率餐PM-02-06-流入订采集间隔内接受到受理完成业务操作、区对比订单71小时中MMMM-NN单量的订单量域、渠道、套分析受理版权所有,注意保密141
餐成功量待处理业务操作、区PM-02-06-异动8单量截至当前未完成派单量域、渠道、套1小时中MMMM-NN分析餐待处理业务操作、区PM-02-06-异动9单超时截至当前未完成派单超时量域、渠道、套1小时高MMMM-NN分析量餐待处理业务操作、区PM-02-06-趋势10单超时截至当前未完成派单超时率域、渠道、套1小时高MMMM-NN分析率餐3、服务开通处理编建议指标名建议采指标指标关号指标ID指标描述建议维度分析称集间隔级别联关系方法订单平采集间隔内处理订单平均PM-02-06-业务操作、区构成其它环1均处理时长(订单接收到派单完1天高MMMM-NN域分析节时长时长成)PM-02-06-订单处采集间隔内处理订单量业务操作、区异动21天高MMMM-NN理量域分析订单处采集间隔内处理订单失败PM-02-06-业务操作、区异动3理失败量1天高MMMM-NN域分析量订单处采集间隔内处理订单失败PM-02-06-业务操作、区趋势4理失败率1天高MMMM-NN域分析率订单处采集间隔内处理订单超时PM-02-06-业务操作、区异动5理超时量1天高MMMM-NN域分析量订单处PM-02-06-采集间隔内处理订单超时业务操作、区趋势6理超时1天高MMMM-NN率域分析率订单流订单派PM-02-06-采集间隔内服务开通接受业务操作、区对比7入量1天中单成功MMMM-NN到的订单量域分析量PM-02-06-待处理业务操作、区异动8截至当前未完成订单量1天中MMMM-NN订单量域分析待处理PM-02-06-截至当前未完成订单超时业务操作、区异动9订单超1天高MMMM-NN量域分析时量待处理PM-02-06-截至当前未完成订单超时业务操作、区趋势10订单超1天高MMMM-NN率域、产品分析时率版权所有,注意保密142
---------施工工PM-02-06-采集间隔内派发到施工调业务操作、区异动11单派发1天中MMMM-NN度环节的工单数域、产品分析数自动激PM-02-06-采集间隔内派发到自动激业务操作、区异动12活工单1小时中MMMM-NN活环节的工单数域、产品分析派发数VSOP激PM-02-06-采集间隔内派发到VSOP业务操作、区异动13活工单1小时中MMMM-NN平台处理环节的工单数域、产品分析派发数4、自动激活编建议指标名建议采指标指标关号指标ID指标描述建议维度分析称集间隔级别联关系方法激活工PM-02-06-单平均采集间隔内处理自动激活业务操作、区构成其它环11小时高MMMM-NN处理时工单平均时长域、产品分析节时长长激活工采集间隔内处理工单总量PM-02-06-业务操作、区异动2单处理1小时高MMMM-NN域、产品分析量激活工采集间隔内处理工单失败PM-02-06-业务操作、区异动3单处理量1小时高MMMM-NN域、产品分析失败量激活工采集间隔内处理工单失败PM-02-06-业务操作、区趋势4单处理率1小时高MMMM-NN域、产品分析失败率激活工采集间隔内处理工单超时PM-02-06-业务操作、区异动5单处理量1小时高MMMM-NN域、产品分析超时量激活工PM-02-06-采集间隔内处理工单超时业务操作、区趋势6单处理1小时高MMMM-NN率域、产品分析超时率服务开PM-02-06-接收工采集间隔内从服务开通接业务操作、区对比71小时中通派工MMMM-NN单量受到的工单量域、产品分析单量PM-02-06-待处理业务操作、区异动8截至当前未完成工单量1小时中MMMM-NN工单量域、产品分析待处理PM-02-06-截至当前未完成工单超时业务操作、区异动9工单超1小时高MMMM-NN量域、产品分析时量10PM-02-06-待处理截至当前未完成工单超时业务操作、区1小时高趋势版权所有,注意保密143
MMMM-NN工单超率域、产品分析时率5、施工调度编建议指标名建议采指标指标关号指标ID指标描述建议维度分析称集间隔级别联关系方法施工工PM-02-06-单平均采集间隔内处理施工工单业务操作、区构成其它环11天高MMMM-NN处理时平均时长域、产品分析节时长长施工工采集间隔内处理工单总量1天PM-02-06-业务操作、区异动2单处理高MMMM-NN域、产品分析量施工工采集间隔内处理工单失败1天PM-02-06-业务操作、区异动3单处理量高MMMM-NN域、产品分析失败量施工工采集间隔内处理工单失败1天PM-02-06-业务操作、区趋势4单处理率高MMMM-NN域、产品分析失败率施工工采集间隔内处理工单超时PM-02-06-业务操作、区异动5单处理量1天高MMMM-NN域、产品分析超时量施工工PM-02-06-采集间隔内处理工单超时业务操作、区趋势6单处理1天高MMMM-NN率域、产品分析超时率服务开PM-02-06-接收工采集间隔内从服务开通接业务操作、区对比71天中通派工MMMM-NN单量受到的工单量域、产品分析单量PM-02-06-待处理业务操作、区异动8截至当前未完成工单量1天中MMMM-NN工单量域、产品分析待处理PM-02-06-截至当前未完成工单超时业务操作、区异动9工单超1天高MMMM-NN量域、产品分析时量待处理PM-02-06-截至当前未完成工单超时业务操作、区趋势10工单超1天高MMMM-NN率域、产品分析时率6、VSOP激活编建议指标名建议采指标指标关号指标ID指标描述建议维度分析称集间隔级别联关系方法版权所有,注意保密144
VSOP工PM-02-06-单平均采集间隔内VSOP处理工业务操作、区构成其它环11天高MMMM-NN处理时单平均时长域、产品分析节时长长VSOP工采集间隔内VSOP处理工1天PM-02-06-业务操作、区异动2单处理单总量高MMMM-NN域、产品分析量VSOP工采集间隔内VSOP处理工1天PM-02-06-业务操作、区异动3单处理单失败量高MMMM-NN域、产品分析失败量VSOP工采集间隔内VSOP处理工1天PM-02-06-业务操作、区趋势4单处理单失败率高MMMM-NN域、产品分析失败率VSOP工采集间隔内VSOP处理工PM-02-06-业务操作、区异动5单处理单超时量1天高MMMM-NN域、产品分析超时量VSOP工PM-02-06-采集间隔内VSOP处理工业务操作、区趋势6单处理1天高MMMM-NN单超时率域、产品分析超时率服务开PM-02-06-接收工采集间隔内VSOP从服务业务操作、区对比71天中通派工MMMM-NN单量开通接受到的工单量域、产品分析单量PM-02-06-待处理截至当前VSOP未完成工业务操作、区异动81天中MMMM-NN工单量单量域、产品分析待处理PM-02-06-截至当前VSOP未完成工业务操作、区异动9工单超1天高MMMM-NN单超时量域、产品分析时量待处理PM-02-06-截至当前VSOP未完成工业务操作、区趋势10工单超1天高MMMM-NN单超时率域、产品分析时率7、服务开通报俊编建议采指标建议分指标关联指标ID指标名称指标描述建议维度号集间隔级别析方法关系产品定单项PM-02-06-采集间隔内竣工订单业务操作、构成分其它环节1竣工平均时1小时高MMMM-NN行的平均处理时长区域、产品析时长长PM-02-06-订单行竣工采集间隔内订单行竣业务操作、异动分21小时中MMMM-NN总量工总量区域、产品析PM-02-06-订单行竣工采集间隔内订单行竣业务操作、异动分31小时高MMMM-NN失败量工失败量区域、产品析PM-02-06-订单行竣工采集间隔内订单行竣业务操作、趋势分41小时高MMMM-NN失败率工失败率区域、产品析版权所有,注意保密145
接收工单反采集间隔内接收自动业务操作、PM-02-06-对比分激活和施5馈数激活和施工调度完工区域、产品1小时中MMMM-NN析工返单数工单数订单行待报截止当前时间服务开PM-02-06-业务操作、异动分6俊量通环节等待报竣的订1小时中MMMM-NN区域、产品析单行数8、CRM竣工处理编建议采指标建议分指标关指标ID指标名称指标描述建议维度号集间隔级别析方法联关系订单行竣业务操作、区PM-02-06-采集间隔内竣工订单行构成分其它环1工平均时域、渠道、产1小时高MMMM-NN的平均处理时长析节时长长品业务操作、区PM-02-06-订单行竣采集间隔内订单行竣工异动分2域、渠道、产1小时中MMMM-NN工量总量析品业务操作、区PM-02-06-订单行竣采集间隔内订单行俊工异动分3域、渠道、产1小时高MMMM-NN工失败量失败量析品业务操作、区PM-02-06-订单行竣采集时间内订单行竣工趋势分4域、渠道、产1小时高MMMM-NN工失败率失败率析品业务操作、区服务开PM-02-06-接收订单采集间隔内服务开通往对比分5域、渠道、产1小时中通报俊MMMM-NN行量CRM报竣订单行量析品量截止当前时间服务开通业务操作、区PM-02-06-待竣工订异动分6报竣,但CRM未完成竣域、渠道、产1小时中MMMM-NN单行量析工量品---------业务操作、区PM-02-06-资料同步采集间隔内资料同步的构成分其它环7域、渠道、产1小时高MMMM-NN平均时长平均处理时长析节时长品业务操作、区PM-02-06-资料同步采集间隔内资料同步总异动分8域、渠道、产1小时中MMMM-NN总量次数析品业务操作、区PM-02-06-资料同步采集间隔内资料同步失异动分9域、渠道、产1小时高MMMM-NN失败量败次数析品业务操作、区PM-02-06-资料同步采集间隔内资料同步失趋势分10域、渠道、产1小时高MMMM-NN失败率败率析品版权所有,注意保密146
9、计费接收同步数据编建议采指标建议分指标关指标ID指标名称指标描述建议维度号集间隔级别析方法联关系PM-02-06-完成同步采集间隔内完成数业务操作、区异动分11小时高MMMM-NN数据量据同步量域、产品析PM-02-06-同步数据采集间隔内同步数业务操作、区异动分21小时高MMMM-NN失败量据失败数域、产品析PM-02-06-同步数据采集间隔内同步数业务操作、区趋势分31小时高MMMM-NN失败率据失败率域、产品析PM-02-06-接收同步采集间隔从CRM接业务操作、区异动分41小时中MMMM-NN数据量收的待同步数据量域、产品析PM-02-06-待处理数截至当前时间待同业务操作、区异动分51小时高MMMM-NN据量步处理的数据量域、产品析10、流程整体指标编建议指标名建议采集间指标指标关号指标ID指标描述建议维度分析称隔级别联关系方法PM-02-订单平采集间隔内处理订业务操作、区域、1天/1小时构成各环节106-MMMM-均处理单平均时长(订单渠道、套餐、产(非外线施高分析时长NN时长受理到竣工)品、客户类型工订单)PM-02-订单处采集间隔内处理订业务操作、区域、1天/1小时异动206-MMMM-理量单量渠道、套餐、产(非外线施高分析NN品、客户类型工订单)PM-02-订单处采集间隔内处理订业务操作、区域、1天/1小时异动306-MMMM-理失败单失败量渠道、套餐、产(非外线施高分析NN量品、客户类型工订单)PM-02-订单处采集间隔内处理订业务操作、区域、1天/1小时趋势406-MMMM-理失败单失败率渠道、套餐、产(非外线施高分析NN率品、客户类型工订单)PM-02-订单处采集间隔内处理订业务操作、区域、1天/1小时异动506-MMMM-理超时单超时量渠道、套餐、产(非外线施高分析NN量品、客户类型工订单)PM-02-订单处业务操作、区域、1天/1小时采集间隔内处理订趋势606-MMMM-理超时渠道、套餐、产(非外线施高单超时率分析NN率品、客户类型工订单)PM-02-订单流业务操作、区域、1天/1小时订单受采集间隔内接受各对比706-MMMM-入量渠道、套餐、产(非外线施中理成功种渠道的订单量分析NN品、客户类型工订单)量PM-02-待处理业务操作、区域、1天/1小时截至当前未完成订异动806-MMMM-订单量渠道、套餐、产(非外线施中单量分析NN品、客户类型工订单)版权所有,注意保密147
PM-02-待处理业务操作、区域、1天/1小时截至当前未完成订异动906-MMMM-订单超渠道、套餐、产(非外线施高单超时量分析NN时量品、客户类型工订单)PM-02-待处理业务操作、区域、1天/1小时截至当前未完成订趋势1006-MMMM-订单超渠道、套餐、产(非外线施高单超时率分析NN时率品、客户类型工订单)8.2.1.2欠费停开机流程欠费停开机流程是计费系统根据用户余额和信用控制要求,实时发起对产品实例停开机的过程。欠费停开机的流程采取特殊的短流程的方式同步到CRM、服务开通系统,尽量减少系统间的处理依赖,从而保证欠费停开机的实时性。这里主要关注欠费停开机过程中服务开通接收处理环节、CRM与VSOP欠费停开机数据同步环节的正确性、准确性指标。8.2.1.2.1业务流程欠费停开机处理流程示意计费开通服务开通进行VSOP同步停停开机处理开机信息欠费/缴费停开机判断CRM同步停开机信息图8.4欠费停开机处理流程示意图流程关键点说明:服务开通处理版权所有,注意保密148
计费通过欠费停开机请求接口把欠费停开机处理要求给服务开通,由服务开通进行具体的欠费停开机处理。数据同步到CRM计费通过欠费停开机同步接口欠费停开机处理信息同步给CRM,由CRM进行相应的用户状态数据更新。数据同步到VSOP服务开通向VSOP同步欠费停开机同步。8.2.1.2.2指标内容1、服务开通处理编建议采指标建议分指标关指标ID指标名称指标描述建议维度号集间隔级别析方法联关系停开机平业务操作(停/PM-02-06-采集间隔内停开机构成分各环节1均处理时开)、区域、产1小时高MMMM-NN处理过程平均时长析时长长品业务操作(停/PM-02-06-停开机处采集间隔内处理的异动分2开)、区域、产1小时高MMMM-NN理量停开机量析品采集间隔内处理失业务操作(停/PM-02-06-停开机处异动分3败的停开机量开)、区域、产1小时高MMMM-NN理失败量析品采集间隔内处理失业务操作(停/PM-02-06-停开机处趋势分4败的停开机比率开)、区域、产1小时高MMMM-NN理失败率析品采集间隔内处理超业务操作(停/PM-02-06-停开机处异动分5时的停开机量开)、区域、产1小时中MMMM-NN理超时量析品采集间隔内处理超业务操作(停/PM-02-06-停开机处异动分6时的停开机比率开)、区域、产1小时中MMMM-NN理超时率析品采集间隔内接受计业务操作(停/订单受PM-02-06-接收请求对比分7费发出的停开机请开)、区域、产1小时中理成功MMMM-NN量析求量品量业务操作(停/PM-02-06-待处理请截至当前未完成的异动分8开)、区域、产1小时中MMMM-NN求量停开机请求量析品9PM-02-06-待处理请截至当前未完成请业务操作(停/1小时高异动分版权所有,注意保密149
MMMM-NN求超时量求超时量开)、区域、产析品业务操作(停/PM-02-06-待处理请截至当前未完成请趋势分10开)、区域、产1小时高MMMM-NN求超时率求超时率析品2、数据同步到CRM编建议采指标建议分指标关指标ID指标名称指标描述建议维度号集间隔级别析方法联关系业务操作(停/PM-02-06-数据同步采集间隔内完成停异动分1开)、区域、产1小时高MMMM-NN量开机同步数量析品业务操作(停/PM-02-06-数据同步采集间隔内完成停异动分2开)、区域、产1小时高MMMM-NN失败量开机同步失败数析品业务操作(停/PM-02-06-数据同步采集间隔内完成停趋势分3开)、区域、产1小时高MMMM-NN失败率开机同步失败率析品业务操作(停/PM-02-06-接收数据采集间隔从计费接异动分4开)、区域、产1小时中MMMM-NN量收的待同步数据量析品业务操作(停/PM-02-06-待处理数截至当前时间待同异动分5开)、区域、产1小时高MMMM-NN据量步处理的数据量析品3、数据同步到VSOP编建议采指标建议分指标关指标ID指标名称指标描述建议维度号集间隔级别析方法联关系业务操作(停/PM-02-06-数据同步采集间隔内完成停异动分1开)、区域、产1小时高MMMM-NN量开机同步数量析品业务操作(停/PM-02-06-数据同步采集间隔内完成停异动分2开)、区域、产1小时高MMMM-NN失败量开机同步失败数析品业务操作(停/PM-02-06-数据同步采集间隔内完成停趋势分3开)、区域、产1小时高MMMM-NN失败率开机同步失败率析品业务操作(停/PM-02-06-接收数据采集间隔从计费接异动分4开)、区域、产1小时中MMMM-NN量收的待同步数据量析品PM-02-06-待处理数截至当前时间待同业务操作(停/异动分51小时高MMMM-NN据量步处理的数据量开)、区域、产析版权所有,注意保密150
品8.2.1.3增值业务订购流程订购管理主要实现与CRM、门户配合,完成客户自营业厅、10000号、网厅、WAP/SMS营业厅等渠道发起的增值业务产品的订购、开通、退定等处理。对于个人/家庭客户单增值产品订购,由各渠道将订购请求发送到VSOP,由VSOP负责受理,对受理订单进行鉴权、二次确认,并通过服务激活工单向业务平台进行服务激活的过程。对于捆绑类套餐(含增值业务)的订购以及政企客户的增值业务产品订购是由CRM负责受理、鉴权、发服务开通,向VSOP发送服务开通工单进行处理。8.2.1.3.1业务流程增值业务订购流程VSOP网厅营业厅订单接收工单处理竣工处理10000号其它渠道业务平台图8.5VSOP流程示意图流程关键点说明:订单接收从营业厅、10000号、网厅等渠道接收增值业务订单受理请求,对订购请求进行鉴权,确认是否可以定购,包括SP/CP状态鉴权、产品状态鉴权、用户鉴权、依赖互斥关系鉴权和订购关系处理,生成激活工单发送到工单处理模块。版权所有,注意保密151
工单处理通过工单的调度接收服务激活工单,向业务平台、ISMP、集团VSOP发送服务激活指令,并接收服务激活结果。竣工处理接收回笼业务平台激活结果,对完成激活的工单进行合并,对工单对应的订单进行结果标识,同时在系统内完成工单的竣工归档。对已激活成功的订购关系向计费系统进行同步。8.2.1.3.2指标内容1、订单接收编建议指标指标名指标建议分号指标ID指标描述建议维度采集关联称级别析方法间隔关系PM-02-订单受业务操其它采集间隔内受理完成的平均时构成分106-MMMM-理平均作、区1小时高环节长析NN时长域、渠道时长PM-02-订单受业务操采集间隔内各类渠道受理的订异动分206-MMMM-理量作、区1小时中单量析NN域、渠道PM-02-订单受采集间隔内各类渠道订单受理业务操异动分306-MMMM-理失败失败量(包括接收失败、鉴权失作、区1小时中析NN量败、二次确认失败等)域、渠道PM-02-订单受采集间隔内各类渠道订单受理业务操趋势分406-MMMM-理失败失败比率作、区1小时中析NN率域、渠道2、工单处理编建议指标指标名建议采指标号指标ID指标描述建议维度分析关联称集间隔级别方法关系激活请采集间隔内激活平均用时业务操作、区其它PM-02-06-构成1求处理(激活请求发出到接收到反1小时中环节MMMM-NN域、渠道分析时长馈的时长)时长PM-02-06-激活请采集间隔内激活请求量业务操作、区异动21小时中MMMM-NN求次数分析版权所有,注意保密152
域、渠道激活成采集间隔内激活反馈成功数业务操作、区PM-02-06-异动3功数1小时中MMMM-NN域、渠道分析激活失采集间隔内激活反馈失败数业务操作、区PM-02-06-异动4败数1小时中MMMM-NN域、渠道分析激活超采集间隔内激活反馈超时数业务操作、区PM-02-06-异动5时数1小时中MMMM-NN域、渠道分析3、竣工处理编建议采指标建议分指标关指标ID指标名称指标描述建议维度号集间隔级别析方法联关系PM-02-06-资料同步采集间隔内资料同业务操作、区构成分其它环11小时高MMMM-NN平均时长步的平均处理时长域、渠道析节时长PM-02-06-资料同步采集间隔内资料同业务操作、区异动分21小时中MMMM-NN总量步总次数域、渠道析PM-02-06-资料同步采集间隔内资料同业务操作、区异动分31小时高MMMM-NN失败量步失败次数域、渠道析PM-02-06-资料同步采集间隔内资料同业务操作、区趋势分41小时高MMMM-NN失败率步失败率域、渠道析8.2.1.4全网订单处理流程本流程主要描述非ISMP管理的跨省移动融合业务(如总机服务、综合办公等)的全网开通流程。集团CRM统一受理跨省业务订单,由集团服务开通完成集团层面(包括集团业务平台的激活等)的开通;集团CRM将订单发送省CRM,并由省CRM发送省服务开通,省层面的开通工作由省服务开通完成,并将开通状态反馈给省CRM。8.2.1.4.1业务流程版权所有,注意保密153
全网订单处理流程示意集团CRM全网订单处理环节省内处理流程集团订单受理下发订单转省内订服务开通CRM派单自动激活接收单处理施工调度集团订单处理订单行CRM竣工处服务开通VSOP激活报俊理报俊集团订单下发图8.6全网业务订单处理流程示意图省内流程关键点说明:下发订单接收省CRM从集团CRM枢纽接收集团CRM下发的业务订单,关注订单行接收完成情况和异常情况,验证省CRM枢纽接收接口是否正常。转省内订单省CRM从接收到集团下发的订单,到转成省内订单所需的过程,主要关注集团订单转省内订单过程的处理成功、失败情况。省内订单处理集团CRM下发的订单,在省内的处理、开通流程,指标参考省级业务指标中CRM派单、服务开通处理、自动激活、施工调度、服务开通报俊等环节,在此不做特殊说明。订单报俊省CRM在订单竣工或者出现异常时将结果通过集团CRM枢纽反馈给集团CRM,关注订单行反馈的完成情况和异常情况,验证省CRM枢纽反馈接口是否正常。同时定义省CRM一段时间内的订单行竣工详细情况,包括竣工量、超时情况、竣工时长等。订单异常将省内处理时出现异常,但还没有通过枢纽接口反馈给集团CRM的订单进行统一跟踪和监测。版权所有,注意保密154
8.2.1.4.2指标内容1、下发订单接收编建议采指标建议分指标关指标ID指标名称指标描述建议维度号集间隔级别析方法联关系PM-02-06-订单行接采集间隔内省CRM收到枢业务操异动分11天高MMMM-NN收量纽发送的订单行数作,产品析PM-02-06-订单行接采集间隔内省CRM接收成业务操异动分21天高MMMM-NN收成功量功枢纽发送的订单行数作、产品析PM-02-06-订单行接采集间隔内省CRM接收失业务操异动分31天高MMMM-NN收失败量败枢纽发送的订单行数作、产品析2、转省内订单编建议采指标建议分指标关指标ID指标名称指标描述建议维度号集间隔级别析方法联关系PM-02-06-转省内订采集间隔内省CRM转省业务操异动分11天高MMMM-NN单行总数内订单行处理总数作,产品析转省内订采集间隔内省CRM转省PM-02-06-业务操异动分2单行成功内订单行成功处理数1天高MMMM-NN作、产品析数转省内订采集间隔内省CRM转省PM-02-06-业务操异动分3单行失败内订单行失败处理总数1天高MMMM-NN作、产品析数3、省内订单处理参考省级业务中订单处理相关指标4、订单报竣编指标名建议采指标建议分指标关指标ID指标描述建议维度号称集间隔级别析方法联关系反馈订业务操作、产品、PM-02-06-省CRM在采集间隔内异动分1单行量反馈状态(竣工、1天高MMMM-NN向枢纽反馈订单行数析异常等)反馈订省CRM在采集间隔内业务操作、产品、PM-02-06-异动分2单行成向枢纽反馈订单行成反馈状态(竣工、1天高MMMM-NN析功量功数异常等)PM-02-06-反馈订省CRM在采集间隔内业务操作、产品、异动分31天高MMMM-NN单行失向枢纽反馈订单行失反馈状态(竣工、析版权所有,注意保密155
败量败数异常等)订单行省CRM在采集间隔内PM-02-06-异动分4竣工量完成省内竣工的订单业务操作、产品1天高MMMM-NN析行数订单行省CRM在采集间隔内PM-02-06-异动分5超时竣超时竣工的订单行数业务操作、产品1天高MMMM-NN析工量订单行省CRM在采集间隔内PM-02-06-异动分6竣工最竣工的订单行的最大业务操作、产品1天中MMMM-NN析大时长时长订单行省CRM在采集间隔内PM-02-06-异动分7竣工最竣工的订单行的最小业务操作、产品1天中MMMM-NN析小时长时长订单行省CRM在采集间隔内PM-02-06-异动分8竣工平竣工的订单行的平均业务操作、产品1天高MMMM-NN析均时长时长订单行截至当前时间省CRMPM-02-06-异动分9超时未超时且未竣工的订单业务操作、产品1天高MMMM-NN析竣工量行数采集间隔内新增的超新增超时未竣工订单行量,PM-02-06-异动分10时未竣如1号应竣工,但未业务操作、产品1天高MMMM-NN析工量能按时在1号竣工的量5、订单异常指建议建议指标编指标名标指标ID指标描述建议维度采集分析关联号称级间隔方法关系别PM-02-省内流业务操作、异动106-MMMM-程异常截至采集点流程有异常的订单行数产品、异常1天中分析NN单量状态省内流截至采集点流程有异常的订单行数PM-02-业务操作、程异常中已经通过人工等渠道解决的订单异动206-MMMM-产品、异常1天中单解决行(含撤单、退单成功等解决方分析NN状态量法)版权所有,注意保密156
8.2.2业务功能指标8.2.2.1业务范围本节重点关注门户类自助渠道业务功能的监控,业务功能监控范围要求如下表:编号功能类型业务功能优先级别网厅短信掌厅1客户资料查询高★2基础功能用户登录中★★3密码修改、重置高★4帐单查询高★★★5详单查询中★★6余额查询高★★★7实时话费查询高★★★业务查询8套餐使用情况查询中★9月初扣费查询低★10历史欠费查询低★11未付帐单查询高★★★12产品目录展现中★13基础业务受理中14业务受理增值业务受理中15预受理中16终端销售低17业务咨询中18投诉建议中客户服务19故障申告中20进度查询中★21积分规则查询中★22积分查询高★★★积分服务23积分生成明细查询中★★24积分兑换高★★★版权所有,注意保密157
25积分捐赠低26积分兑换记录查询高★★27号码归属地查询中★★28区号查询中★★29综合查询营业厅导航中★30终端售后点查询低★★31常见问题中★32充值高★33交费高★充值缴费34充值记录查询中★★35交费记录查询中★★8.2.2.2指标内容业务功能监控依靠业务可用性探测功能实现,通过探测用例的建立,定时探测被监控业务功能,生成并保存业务功能的性能、可用性等探测结果。通过统一采集功能,定期自动采集探测结果数据,经过必要的预处理、计算、汇总形成业务功能监控指标。业务功能监控指标的统一要求如下表所示:编建议建议采指标建议分指标关指标ID指标名称指标描述号维度集间隔级别析方法联关系PM-02-ZZ-采集间隔内模拟探测业业务异动分1探测请求数5分钟中MMMM-NN务功能请求总个数功能析PM-02-ZZ-采集间隔内执行成功的业务异动分2探测成功数5分钟中MMMM-NN模拟业务应答个数功能析PM-02-ZZ-采集间隔内失败的模拟业务异动分3探测失败数5分钟中MMMM-NN业务应答个数功能析PM-02-ZZ-探测未完成采集间隔内执行未完成业务异动分45分钟中MMMM-NN数的模拟业务应答个数功能析PM-02-ZZ-采集间隔内处理成功的业务趋势分5探测成功率5分钟中MMMM-NN模拟业务的成功比率功能析PM-02-ZZ-探测请求应采集间隔内处理成功的业务异动分65分钟中MMMM-NN答平均时长模拟业务的平均时长功能析PM-02-ZZ-探测请求应采集间隔内处理成功的业务异动分75分钟中MMMM-NN答最大时长模拟业务的最大时长功能析版权所有,注意保密158
PM-02-ZZ-探测请求应采集间隔内处理成功的业务异动分85分钟中MMMM-NN答最小时长模拟业务的最小时长功能析PM-02-ZZ-探测请求应采集间隔内处理成功的业务异动分95分钟中MMMM-NN答超时数模拟业务的超时数量功能析PM-02-ZZ-探测请求应采集间隔内处理成功的业务趋势分105分钟中MMMM-NN答超时率模拟业务的超时比率功能析8.2.3服务接口指标8.2.3.1接口范围本规范重点关注CRM域各独立系统之间的接口可用性指标以及CRM域系统与其它域系统接口可用性指标。根据CRM2.0技术规范要求,省CRM域内各系统间、集团DEP、省内跨域系统之间接口统一通过服务总线(CSB)完成。因此对于服务接口的应用可用性的监控,通过应用监控里对服务总线的监控来间接实现。这里采用可用性探测方式获取业务可用性数据,对业务交付过程中的重要接口进行主动监测,详细的接口内容信息详见《集成接口规范》相关文档。省内接口范围如下表:编优先接口类型接口接口描述号级别1VSOP_订购鉴权CRM发送鉴权请求到VSOP进行产品订购的鉴权高CRM与VSOP接口CRM_用户订购2客户订购增值业务后,向客户发起提示,请求客户确认高信息确认CRM_用户激活计费通知CRM用户激活信息,后续可以正常的办理业务;3中通知并修改用户的起租时间CRM_欠费处理计费通过欠费停开机同步接口欠费停开机处理信息同步给4中请求CRM,由CRM进行相应的用户状态数据更新CRM_预后切换计费实时发起预后互转请求,通知CRM系统发起相应受理5中CRM与计费账处理请求处理务接口计费_欠费信息6查询客户、用户是否欠费高查询计费_订单计费7CRM系统向其它系统同步套餐销售品实例最新信息高资料归档请求计费_客户资料客户资料在CRM系统管理;CRM系统进行客户资料更新之高8更新请求后,通过该接口将更新同步给计费系统版权所有,注意保密159
CRM_产品实例9服务开通系统向CRM系统报竣高竣工通知CRM_订单撤单服务开通系统在撤单完成之后向CRM系统发送撤单结果反中10处理反馈馈(对撤单请求进行异步反馈)CRM_订单待装由于资源问题或其它局方问题需要待装,服务开通系统要中11处理请求向CRM系统发送服务定单待装请求信息CRM_订单开装服务开通系统在开装条件满足的情况下向CRM发送待装开中12处理请求装请求服务开通系统能够接收CRM系统发来的客户定单,并完成服务开通_订单高13客户订单的分解,按预定规则启动服务定单处理流程(由处理请求服务开通系统完成订单信息转换)服务开通_订单14以订单中的产品实例为粒度查询产品施工信息和当前状态中处理查询服务开通_预约15服务开通提供,接收前端的预约能力查询请求高能力查询服务开通_预约16CRM与服务开CRM通过该接口实现预约服务能力的预占高能力预占请求通接口CRM通过该接口实现预约服务能力的修改,由服务开通释服务开通_预约高17放原来的老预约信息;在受理单到服务开通之前,CRM可能力修改请求以多次修改预约信息服务开通系统能够接收CRM系统发来的修改后客户定单,服务开通_订单高18并完成客户订单的分解,按预定规则启动服务定单处理流修改请求程(由服务开通完整订单信息转换)CRM在前台需要撤销订单的情况下,需要先向服务开通系服务开通_订单中19统发送请求,申请服务定单的撤销,服务开通系统返回撤撤单许可请求单许可结果服务开通_订单20CRM在允许撤单的条件下,向服务开通系统发送撤单请求中撤单请求服务开通_订单21CRM向服务开通反馈客户同意待装中待装处理反馈CRM进行客户确认后,把客户同意待装开装的信息反馈给服务开通_订单中22服务开通系统。注意,如果客户要求撤单,那么系统按照开装处理反馈原来的撤单流程处理资源管理_号码23对号码进行预占高预占请求资源管理_号码24释放号码资源高释放请求CRM与资源管资源管理_资源25判断是否有相应的资源满足客户的需求高理接口提供能力查询资源管理_资源26通知资源系统完成对资源系统中卡号资源的预占高预占请求资源管理_资源27通知资源系统完成对资源系统中卡号资源的释放高预占释放请求CRM与积分商CRM_积分归集客户积分帐户在CRM系统管理;积分商城系统通过该接口中28城接口请求按周期将生成的客户非电信积分提交给CRM系统进行积分版权所有,注意保密160
归集客户积分帐户在CRM系统管理;积分商城系统在客户积分29CRM_积分查询查询请求处理时,通过该接口从CRM系统查询获取客户积中分情况客户积分帐户在CRM系统管理;积分商城系统在进行积分CRM_积分扣减中30兑换处理时,通过该接口向CRM系统提交请求完成客户积请求分扣减客户积分帐户在CRM系统管理;积分商城系统在进行积分CRM_积分返销中31兑换撤消处理时,通过该接口向CRM系统提交请求完成客请求户积分扣减的回退操作计费_欠费信息32查询客户、用户是否欠费高VSOP与计费查询账务接口计费_订单计费33CRM系统向其它系统同步套餐销售品实例最新信息高资料归档请求VSOP_增值业务34用户新装、停复拆等业务信息由服务开通向VSOP同步高开通处理请求VSOP与服务服务开通_增值开通接口35业务开通处理VSOP向服务开通回单高反馈VSOP_激活处理36接收工单回单并记录日志高VSOP与ISMP/反馈业务平台接口ISMP_激活处理37向业务平台进行增值业务订购激活高请求CRM_客户资料38集团CRM向省CRM查询指定客户的资料高查询CRM_客户资料集团CRM通过该接口向涉及省CRM提交集团级政企客户资高39更新请求料更新同步请求CRM_订单处理40集团CRM下发客户订单给省CRM高请求41CRM与集团CRM_撤单通知集团CRM将撤单通知发送省CRM高CRM接口CRM_退单审批42集团CRM将退单申请的审批结果反馈给省CRM高反馈43CRM_竣工通知集团CRM将竣工信息同步给省CRM高CRM_产品实例44集团CRM向省CRM查询号码状态中信息查询CRM_订单处理45集团CRM向省CRM查询订单开通状态中查询VSOP_集团订单46发送订单到省VSOP进行处理高VSOP与集团下发VSOP接口集团VSOP_集团47省VSOP向集团VSOP回复订单受理结果高订单回单版权所有,注意保密161
8.2.3.2指标内容对于通过服务总线管理的接口指标,指标要求参见应用监控中对服务总线业务接口监控的指标要求。对于采用可用性探测功能实现的指标。建立接口探测用例,定时探测被监控服务接口,生成并保存接口的性能、可用性等探测结果,进而通过统一采集功能,定期采集探测结果数据,形成业务接口监控指标。指标要求与业务功能指标类似,如下表所示:编建议建议采指标建议分指标关指标ID指标名称指标描述号维度集间隔级别析方法联关系PM-02-16-采集间隔内模拟探测服服务异动分1探测接口数5分钟中MMMM-NN务接口请求总个数接口析PM-02-16-探测接口成采集间隔内探测接口成服务5分钟异动分2中MMMM-NN功数功返回个数接口析PM-02-16-探测接口失采集间隔内探测接口失服务5分钟异动分3中MMMM-NN败数败返回个数接口析PM-02-16-探测接口未采集间隔内探测接口未服务5分钟异动分4中MMMM-NN完成数完成的个数接口析PM-02-16-探测接口成采集间隔内探测接口成服务5分钟趋势分5中MMMM-NN功率功的比率接口析PM-02-16-探测接口应采集间隔内探测接口成服务5分钟异动分6中MMMM-NN答平均时长功的平均时长接口析PM-02-16-探测接口应采集间隔内探测接口成服务5分钟异动分7中MMMM-NN答最大时长功的最大时长接口析PM-02-16-探测接口应采集间隔内探测接口成服务5分钟异动分8中MMMM-NN答最小时长功的最小时长接口析PM-02-16-探测接口应采集间隔内探测接口成服务5分钟异动分9中MMMM-NN答超时数功的超时数量接口析PM-02-16-探测接口应采集间隔内探测接口成服务5分钟趋势分10中MMMM-NN答超时率功的超时比率接口析对于全网接口,可以利用已发生的接口交易来监测接口整体的处理能力、完成情况及异常情况。针对省CRM需要定期上传给集团CRM的业务数据,建立数据文件上传监测。接口性能指标:编指建议建议指标号指标标指标ID指标描述建议维度采集分析关联名称级间隔方法关系别版权所有,注意保密162
PM-02-接口省CRM在采集间隔内接业务功能、业务对象、接异动1ZZ-MMMM-交易收枢纽的和向枢纽发送1天高口方向(发送/接收)分析NN量的接口交易量接口省CRM在采集间隔内接PM-02-交易收枢纽的和向枢纽发送业务功能、业务对象、接异动2ZZ-MMMM-1天高成功的接口交易成功量口方向(发送/接收)分析NN量接口PM-02-省CRM在采集间隔内接业务功能、业务对象、失交易异动3ZZ-MMMM-收枢纽的和向枢纽发送败类型(超时、异常等)、1天高失败分析NN的接口交易失败量接口方向(发送/接收)量PM-02-平均省CRM在采集间隔内接业务功能、业务对象、接异动4ZZ-MMMM-处理收枢纽的和向枢纽发送1天高口方向(发送/接收)分析NN时长的接口交易平均时长文件上传监控指标:编指标ID指标名称指标描述建议维度建议采指标建议分指标关号集间隔级别析方法联关系1PM-02-ZZ-文件上传采集间隔内接口文件类型1天中异动分MMMM-NN个数模拟探测次数析2PM-02-ZZ-文件上传采集间隔内接口文件类型、失败原1天中异动分MMMM-NN失败个数模拟探测失败次因(文件级/记录级)析数3PM-02-ZZ-文件上传失败次数/总探文件类型1天中异动分MMMM-NN超时个数测次数析维度中的文件类型指的是文件的不同用途,比如用于业务稽核的,用于指标上传的等。8.2.4业务稽核指标8.2.4.1稽核范围业务稽核范围包含但不限于:稽核序号稽核内容计算方法稽核间隔类型业务订单平衡稽核:稽核流程中各个环总订单量=竣工订单量+各个环节未完1数据1天节的订单数的一致性成订单量平衡版权所有,注意保密163
性核订单失败数稽核:一段时间内发起总订单失败量=入库失败量+一次性费查2的订单中失败总数等于各个环节的用收取失败量+服务开通失败量+竣工1天失败数之和失败量+送计费失败量集团下发订单数=省CRM接收集团下发订单数=集团下发订单处理成功订单数3集团下发订单数稽核1天+集团下发订单处理失败/异常订单数+集团下发订单未处理订单数营收帐款(指营收一次性费用,不含4营收资金稽核帐务费用)=实收费用(现金+银行卡1天+转帐费用)5CRM与外部接口数据处理的平衡性与计费接口期末用户数=期初用户数+开户数-预销6用户数稽核(到某个时间为止)户数-销户数+销户重开数(核对总旬、周量)本期实际净增积分=积分结算-积分7稽核客户积分正确性1月兑换+积分赠送+积分转赠业务数据内容针对一点收费用户数据,CRM和计需要稽核客户ID、账户ID、主业务标81月一致费系统间客户数据一致性稽核识、电话号码四个字段的一致性性稽核8.2.4.2稽核指标编建议建议采指标指标ID指标类型指标名称指标描述号维度集间隔级别AM-02-01-一段时间内产生的总订单1总订单量时间天中MMMM-NN数量AM-02-01-订单平衡性核一段时间内竣工的订单量2竣工订单量时间天中MMMM-NN查数量AM-02-01-各个环节未完一段时间内各个环节未完3时间天中MMMM-NN成订单量成订单数量AM-02-01-一段时间内发起的订单中4总订单失败量时间天中MMMM-NN失败总数AM-02-01-订单失败稽核一段时间内入库失败的订5入库失败量时间天中MMMM-NN单数量6AM-02-01-一次性费用收一段时间内一次性费用收时间天中版权所有,注意保密164
MMMM-NN取失败量取失败的订单数量AM-02-01-服务开通失败一段时间内服务开通失败7时间天中MMMM-NN量的订单数量AM-02-01-一段时间内竣工失败的订8竣工失败量时间天中MMMM-NN单数量AM-02-01-一段时间内送计费失败的9送计费失败量时间天中MMMM-NN订单数量AM-02-01-集团下发订单一段时间内集团下发到本10时间天中MMMM-NN数省的订单数量一段时间内省CRM接收AM-02-01-省CRM接收集11到集团下发到本省的订单时间天中MMMM-NN团下发订单数数量集团下发订单AM-02-01-一段时间内省CRM处理12全网订单稽核处理成功订单时间天中MMMM-NN集团下发订单成功的数量数集团下发订单一段时间内省CRM处理AM-02-01-13处理失败/异集团下发订单失败/异常时间天中MMMM-NN常订单数的数量AM-02-01-集团下发订单一段时间内省CRM未处理14时间天中MMMM-NN未处理订单数的集团下发订单数量AM-02-01-指营收一次性费用,不含15应收帐款时间天高MMMM-NN帐务费用营收资金稽核AM-02-01-实收费用(现金+银行卡+16实收费用时间天高MMMM-NN转帐费用)AM-02-01-17期末用户数统计时间末的用户数时间旬、周中MMMM-NNAM-02-01-18期初用户数统计时间开始时的用户数时间旬、周中MMMM-NNAM-02-01-19开户数统计时间内的开户数时间旬、周中MMMM-NN用户数稽核AM-02-01-20预销户数统计时间内的预销户数时间旬、周中MMMM-NNAM-02-01-21销户数统计时间内的销户数时间旬、周中MMMM-NNAM-02-01-22销户重开数统计时间内的销户重开数时间旬、周中MMMM-NNAM-02-01-本期实际净增统计时间内实际净增加的23时间月低MMMM-NN积分积分AM-02-01-统计时间内结算产生的积24积分结算时间月低MMMM-NN分AM-02-01-积分稽核25积分兑换统计时间内兑换了的积分时间月低MMMM-NNAM-02-01-26积分赠送统计时间内赠送的积分时间月低MMMM-NN27AM-02-01-积分转赠统计时间内转赠的积分时间月低版权所有,注意保密165
MMMM-NNAM-02-01-28客户ID客户标识时间旬、周低MMMM-NNAM-02-01-29账户ID帐户标识时间旬、周低MMMM-NN一点收费客户AM-02-01-资料稽核30主业务标识主业务标识时间旬、周低MMMM-NNAM-02-01-31电话号码电话号码时间旬、周低MMMM-NN8.3应用监控指标8.3.1应用进程监测8.3.1.1性能指标最大编监视指监视实现监视指标描述采集号标ID指标名称要求间隔进程CPU使用15分1/采集间隔内进程CPU的使用率必选率钟15分2/进程内存占用采集点进程占用内存空间大小必选钟15分3/进程开始时间进程启动的时间,可作为应用运行稳定程度依据必选钟15分4/线程数采集点进程启动的线程数量可选钟进程I/O吞吐15分5采集间隔内进程I/O读写量(单位:MB)可选量钟15分6/进程指令行进程的指令行、启动路径可选钟版权所有,注意保密166
8.3.1.2告警指标最大编监视告警级实现要监视指标ID监视指标描述采样号指标名称别求间隔进程状态告进程状态异常产生告警,状态包括运行/15分1/严重必选警等待/阻塞/挂起/停止钟CPU利用率15分2/进程CPU利用率超过预设的阀值产生告警重要必选阀值告警钟内存占用阀15分3/进程内存占用量超过预设的阀值产生告警重要必选值告警钟8.3.2应用服务器监测8.3.2.1性能指标编监视最大采样实现要监视指标ID监视指标描述号指标名称间隔求1/客户端连接数当前应用服务器客户端连接数15分钟必选2/JVM内存堆使用比率当前应用服务器JVM内存堆使用15分钟可选比率3/数据库连接池使用比当前应用服务器数据库连接池使用15分钟可选率比率4/线程池使用比率当前应用服务器活动线程数占线程15分钟可选池容量比率5/HTTPSessions数当前应用服务器活动会话数15分钟可选6/Servlet调用数采集间隔内Servlet调用次数15分钟可选8.3.2.2告警指标编监视最大告警级实现要监视指标ID监视指标描述号指标名称采样别求版权所有,注意保密167
间隔应用服务器15分1/应用服务器状态异常产生告警严重必选状态告警钟客户端连接应用服务器连接数超出设定的阀值产生告15分2/重要必选数阀值告警警钟8.3.3数据文件监测8.3.3.1性能指标监视指标监视最大采样实现要编号监视指标描述ID指标名称间隔求配置文件配置文件在采集周期内有变化,产生配置文件1/15分钟可选变动被修改的事件配置表变配置表的数据在采集周期内有变化,产生配置2/15分钟可选动表被修改的事件8.3.4业务服务监测根据CRM2.0技术规范要求,省CRM域内各系统间、系统与其它域系统之间的业务服务统一通过服务总线(CSB)完成。如果CSB平台建设完成,则可以间接通过对CSB平台的监控实现对各业务服务可用性的监控,否则需要采用可用性探测的方式由监控系统发起探测,采集业务服务监控指标数据。8.3.4.1性能指标最大采监视指标监视实现要编号监视指标描述样ID指标名称求间隔版权所有,注意保密168
1/调用次数采集间隔内业务服务被调用的次数15分钟必选调用失败2/采集间隔内业务服务调用失败的次数15分钟必选次数调用平均3/采集间隔内业务服务被调用的平均时长15分钟必选响应时长8.3.4.2告警指标最大编监视告警级实现要监视指标ID监视指标描述采样号指标名称别求间隔业务服务状业务服务是否正常,实时从CSB接收告警5分1/严重可选态信息钟调用失败率业务服务调用失败比率超出预设的阀值产15分2/重要可选阀值告警生告警钟调用时长阀业务服务调用平均时长超出预设的阀值产15分3/重要可选值告警生告警钟版权所有,注意保密169
9附录二监测指标编码规则监视指标编码由几个部分组成:xx-yy-zz-mmmm-nn(1)xx代表被管理的信息种类:名称/描述编码性能管理PM告警管理FM配置管理CM稽核管理AM(2)yy代表被管理的系统种类:名称/描述编码平台类00MSS应用类01BSS应用类02OSS应用类03EDA应用类04应用类,保留给各省公司扩展使用80----99(3)zz可划分为:平台类名称/描述编码主机01网络02数据库03中间件04存储05备份06排队机20版权所有,注意保密170
IVR21CTI22保留给各省公司扩展使用80----99MSS应用类名称/描述编码财务管理01工程管理02人力资源管理03统计(决策分析)04企业信息门户05保留给各省公司扩展使用80----99BSS应用类名称/描述编码营销管理01渠道管理02客户服务03产品管理04客户管理05订单管理06服务开通07资源管理08综合采集09融合计费10综合帐务11综合结算12合作伙伴管理13系统管理14版权所有,注意保密171
统计报表15接口16客服管理17保留给各省公司扩展使用80----99OSS应用类名称/描述编码服务开通01网络资源管理02综合网络服务03专业网络管理04组织人员和权限管理05接口管理06系统管理07统计报表08保留给各省公司扩展使用80----99EDA应用类名称/描述编码任务调度01源数据处理02源数据加载03CUBE文件生成04接口表生成05接口数据过滤06接口数据文件生成07地市数据集市数据生成08地市数据集市数据文件生成09保留给各省公司扩展使用80----99版权所有,注意保密172
(4)mmmm:二级分类编号,范围为0001-9999;8000----9999:保留给各省公司扩展使用(5)nn:三级分类编号,范围为01-99;80----99:保留给各省公司扩展使用举例说明:系统稳定性指标中主机系统的CPU时间(空闲百分比)监视指标编码如下:PM-00-01-0001-01xx:信息种类nn:三级分类编号---性能管理yy:系统种类zz:平台类mmmm:二级分类编号---平台类---主机版权所有,注意保密173
10附录三接口属性定义10.1信息项类型编码名称说明1实时运行信息2性能信息3配置信息4告警信息10.2配置项状态编码编码状态说明1空闲表示该资源状态正常并且无用户使用。2预占表示该资源已经被分配给某个用户但还未使用的状态。3占用表示该资源已经被用户使用。4预释放表示资源处于准备拆除状态,但还未进行实拆处理。10.3事件来源编号代码描述用户或地市维护人员通过电话/邮件/Web/传真报告的事1用户事件件,服务台人员手工创建事件单2客服转单通过10000号系统自动转发的事件3内部开单省公司业务支撑部门内部提交的事件4监控告警监控工具自动转发过来的事件5内部转发OSS电子运维等转发的事件6集团下发集团转发的事件版权所有,注意保密174
10.4告警类型编码名称说明1网络2主机3操作系统4数据库5中间件10.5告警级别编名称说明码严重告告警信息的严重程度高、对系统业务影响范围广、与业务支撑系统相应考核指标的1警关系紧密重要告告警信息的严重程度较高、对系统业务有一定范围的影响、与业务支撑系统相应考2警核指标有一定关系一般告告警信息的严重程度低、对系统业务影响范围小、与业务支撑系统相应考核指标没3警有紧密的联系10.6所属系统类型业务系统子类编码CRM系统1001融合计费系统1002结算系统1003综合采集预处理系统1004BSS系统统一充值平台100510000语音平台1006网上客户服务中心1007外部客户认证平台1008其它1009版权所有,注意保密175
综合服务开通系统2001综合服务保障系统2002综合资源管理系统2003网络运维管理系统2004OSS系统施工调度系统2005综合网络管理系统2006自动激活系统2007专业网络管理系统2008其它2009OA系统3001财务管理专业系统3002供应链管理专业系统3003MSS系统项目管理专业系统3004人力资源管理专业系统3005知识管理3006企业内部门户3007ODS4001EDA企业数据应用门户4002EDW400310.7事件分类类别子类编码小型机1001PC服务器1002路由器1003网络交换机1004系统硬件磁盘阵列1005存储光纤交换机1006磁带库1007安全设备1008版权所有,注意保密176
类别子类编码操作系统2001数据库2002中间件2003系统软件集群软件2004备份软件2005系统管理软件2006安全软件2007进程3001数据3002应用软件参数3003代码3004接口300510.8省份代码省份名称省份编码省份名称省份编码北京BJ广东GD天津TJ海南HI河北HE广西GX山西SX四川SC内蒙古NM重庆CQ辽宁LN贵州GZ吉林JL云南YN黑龙江HL西藏XZ湖北HB陕西SN湖南HN甘肃GS河南HA青海QH江苏JS宁夏NX山东SD新疆XJ版权所有,注意保密177
安徽AH上海SH浙江ZJ福建FJ江西JX集团JT版权所有,注意保密178
11附录四规范编制人员名单葛静(IBM)、张邱溪(亚信),徐晓静(联创),周开祥(神码思特奇),余辉(天源迪科)版权所有,注意保密179
12附录五参考文档本文档在编写过程中参考了以下文档:《中国电信IT服务管理规范-IT监控系统分册》,2009年《中国电信IT服务管理规范-IT服务管理系统分册》,2009年《附件2:中国电信IT服务管理规范-系统接口》,2009年《附件3:中国电信IT服务管理规范-平台监视指标》,2009年《附件4:中国电信IT服务管理规范-平台管控指标》,2009年版权所有,注意保密180