• 625.74 KB
  • 8页

教育管理信息化建设信息系统试运行阶段故障管控办法

  • 8页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
教育管理信息化建设信息系统试运行阶段故障管控办法一、试运行的重要性项目监理对各阶段的把控都是十分重要的,通过以往的经验表明,很多项目当完成项目初验进入试运行阶段,对于系统质量的把控就会松懈,但此阶段恰恰是项目成败的检验过程,对于软件项目十分重要,为保证应用系统正常运行,各级用户正常使用,确保系统在出现紧急情况时能切实有效的解决问题,并认真分析、研究、发现问题,监理在其中需要发挥主导作用,根据项目特点制定相应的试运行故障管理办法,对试运行期间的各承建单位进行约束与制定性工作,本章将阐述监理将从几个方面对故障进行处理。二、试运行阶段故障控制内容主要涉及以下几个方面的内容:1)故障级别及解决时间规定了故障级别及对于故障的解决时间。2)故障处置流程根据两种不同的故障发现形式,对于处理流程进行约定。3)事后分析流程对于故障处理完成后的事后分析流程进行了严格控制。4)相关处罚条例通过四个不同维度将故障划分为四种情况,根据不同情况制定了相应的处罚条例。5)相关组织机构针对项目试运行情况,制定组织机构,确定责任人和联系人。三、故障级别及解决时间1.故障级别为提供故障快速应急响应。根据故障所给系统造成的影响程度来划分故障级别,本项目故障级别主要被分为四级。表1:故障级别说明 序列级别描述影响度紧急度优先级解决时间1全国范围第一级出现以下问题时:软件:应用系统中主要功能不能使用;或硬件:主干网络、服务器、存储、安全等设备故障导致全国性系统中断。高高12小时2第二级出现以下问题时:软件:应用系统部分功能出现故障;或硬件:部分硬件设备出现故障。高高23小时3省级数据中心用户范围第三级出现以下问题时:软件:应用系统功能造成部分用户无法使用或不能正常使用;或硬件:某省数据中心网络系统中断、教育部信息中心网中断等故障问题;故障影响个别省级数据中心使用的情况。中高34小时4第四级出现以下问题时:软件:应用系统功能出现故障只影响到某个人或某个不重要功能;或硬件:硬件设备非主要部件出现问题,但并不影响整体系统运行的正常应用;故障在不会对系统造成明显影响的情况下。低低48小时2.故障定级故障具体定级由总集成负责初步定位和定级,最终由业主及监理单位认定级别,并由承建单位进行确认后生效,如有争议聘请第三方专业测评机构进行定级,产生后果由责任方承担,如总集成定级不准确与责任方共同承担后果,如总集成无法定级、定位故障原因,由总集成承担相应责任,具体流程见下图图2故障定级流程 四、故障处置流程1)主动发现故障处理流程主动发现故障是指承建单位通过巡检、测试等方式检测出系统问题,主动提出问题。主动发现问题后,由发现问题的承建单位通过书面方式向总集成提交工作联系单,首先相关技术人员详细记录故障现象,为后期分析故障原因保留真实依据,由总集成派遣相关专业具有一定技术能力的人员对故障进行详细记录,为故障分析与定级提供充分证据,组织相关人员进行问题排查,同时提交业主方与监理方,由业主方进行最终定级,总集成组织相关承建单位利用技术会议等形式进行排查,相关承建单位记录排查过程并向总集成提交工作联系单,总集成根据排查结果对问题进行客观的实事求是的分析判断,定位故障原因,根据故障原因制定解决方案,由总集成出具工作联系单要求相关承建单位根据解决方案解决问题,如果问题解决由总集成通知业主及监理单位,并完成此流程,如果没有解决则继续进行排查,直至解决为止。 具体见流程图:图12:主动发现故障处理流程2)被动发现故障处理流程被动发现故障是指由用户提出系统故障问题,告知总集成,由总集成组织解决。总集成接到用户提出系统故障问题时,首先相关技术人员详细记录故障现象,为后期分析故障原因保留真实依据,并派遣相关专业并具有一定技术能力人员对问题进行初步定位、定级,提交业主及监理单位,由业主确定故障级别后,总集成组织相关承建单位利用技术会议等形式进行排查;相关承建单位记录排查过程并向总集成提交工作联系单,总集成根据排查结果对问题进行客观的实事求是的分析判断,定位故障原因,根据故障原因制定解决方案,由总集成出具工作联系单要求相关承建单位根据解决方案解决问题,如果问题解决由总集成通知业主及监理单位,并完成此流程,如果没有解决则继续进行排查,直至解决为止。 具体见流程图:图2:被动发现故障处理流程五、事后分析流程系统恢复正常后要求总集成组织各承建单位以会议形式对问题原因进行分析总结,要求各相关承建单位提交故障报告(故障中应包括故障定级和故障责任单位),由总集成对故障进行技术审核后,出具故障报告,加盖单位公章(事后五个工作日内)提交监理审核,监理审核通过后提交业主,业主确认后按照相关处罚条例进行定责处罚。具体见流程图:图3:事后分析流程 六、相关处罚条例1)根据故障级别处罚依据故障定级结果,对主要责任方进行以下处罚:一级故障:出现问题后承建单位在规定时间内排除故障,系统恢复正常,由于此故障影响范围较广,因此认为责任单位造成了系统质量问题,形成了事实上的违约,按照合同相关条款应承担违约责任,如果此故障为重复故障,则按照第6.4节处罚条例追加处罚;二级故障:出现问题后承建单位在规定时间内排除故障,系统恢复正常,由于此故障影响系统正常使用,因此认为责任单位应受到相应处罚,但影响范围较小,由业主视情况酌情进行处罚,如果此故障为重复故障,则按照第6.4节处罚条例追加处罚;三级故障:出现问题后承建单位在规定时间内排除故障,系统恢复正常,由责任单位提交故障报告,并以公司名义向用户单位提交致歉信,同时归入项目备忘,进行档案管理,如果此故障为重复故障,则按照第6.4节处罚条例追加处罚; 四级故障:出现问题后承建单位在规定时间内排除故障,系统恢复正常,由责任单位提交故障报告,归入项目单位备忘,如果此故障为重复故障,则按照第七、节处罚条例追加处罚。1)根据故障解决时间处罚出现故障后总集成确认故障原因,要求相关单位排除故障后,相关单位未在规定时间内解决问题,则认为责任单位造成了系统质量问题(如总集成无法确定问题原因,所造成的时间拖延,由总集成承担责任),形成了事实上的违约,按照合同相关条款应承担违约责任。2)对于故障瞒报或不报处罚对于系统出现故障后,如主动发现故障承建单位有义务执行第4.1节流程,但在发现故障后瞒报或不报者,如事后发现有类似情况出现,则认为责任单位已形成了事实上的违约,按照合同相关条款应承担违约责任。3)重复故障处罚出现故障后总集成确认故障原因,业主认为此故障是由于相关人员未执行相关规定或手续造成的重复故障,由相关单位确认后,则认为责任单位造成了系统质量问题,形成了事实上的违约,按照合同相关条款应承担违约责任。八、组织机构及职责应急保障工作组织将在教育部信息中心的统一管理下,成立本项目技术保障机构,设置管理组和技术组:Ø管理组由项目核心工作组和项目监理组成;Ø技术组由总集成、软件组、硬件组组成。1)管理组负责本项目监督、管理,对系统故障进行最终定级,对系统故障流程执行情况进行全过程监控,并负责对故障责任单位依照本办法进行相关处罚。2)技术组Ø总集成负责项目的整体实施工作,提出项目建设整体技术方案和建设要求,并对其他承建商提出技术指导和建设约束要求;在具体实施过程中按照国家相关标准提交规范化的各阶段工程文档,保障整个工程建设有序、稳步推进,实现整个系统 建设目标。对于故障的发现与处理,总集成应完善技术规范,保障工程质量,杜绝故障发生,同时及时监测发现问题,出现应急情况,组织相应人员详细记录故障现象,分析故障原因,对问题初步定级,提交业主、监理单位,故障处理完成后,开展故障分析并提交故障分析报告。Ø软件组n教育部本部现场技术保障;n协调系统集成商完成网络系统保障;n协调其他承建单位完成相关系统的保障工作;n数据库系统技术保障;n中间件等相关支撑软件;n接收各省级数据中心反馈的问题,进行汇总、整理和分析。Ø硬件组硬件系统支撑基础平台保障组负责本项目机房、网络、安全、服务器存储等硬件基础支撑环境的应急保障工作。与项目现场保障组相互合作,共同负责系统运维工作。总之,在试运行阶段故障控制办法对于项目整体而言十分重要,通过惩罚机制可以大大减少了试运行期间系统问题的发生,使承建单位积极主动预防问题发生,同时当出现系统问题时,解决问题的效率也有所提高,为项目顺利验收提供了保障。