试运行方案模板

  • 230.50 KB
  • 18页

试运行方案模板

  • 18页
  • 当前文档由用户上传发布,收益归属用户
  1. 1、本文档共5页,可阅读全部内容。
  2. 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
  3. 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
  4. 文档侵权举报电话:19940600175。
.WORD完美格式编辑.……试运行方案……有限公司2012年8月技术资料.专业整理 .WORD完美格式编辑.目录一、概述11.1编写目的11.2项目背景11.3参考资料3二、试运行环境5三、试运行内容63.1网络环境试运行63.2安全环境试运行73.3服务器设备/存储设备及支撑软件试运行73.4软件系统试运行73.5试运行记录8四、试运行人员安排10五、日常运行维护105.1运行维护原则105.2硬件运行维护115.2.1机房环境维护115.2.2计算机硬件平台维护115.2.3网络系统维护115.3软件运行维护125.3.1维护的要求125.3.2运行维护目标与原则125.3.3运行维护范围与人员135.3.4系统维护工作流程145.3.5运行维护内容155.3.6运行维护相关制度建设185.4运行维护组织保障18技术资料.专业整理 .WORD完美格式编辑.5.4.1组织机构保障185.4.2技术支撑体系保障195.4.3信息安全保障体系保障195.4.4运行维护管理机制保障19六、试运行期间故障响应20技术资料.专业整理 .WORD完美格式编辑.一、概述1.1项目实施情况二、试运行环境(1)汛期、高温、低温及雷雨风暴等恶劣天气等条件下,系统工作的稳定性、可靠性和功能、指标的正确性;(2)在各种工况条件下,特别是在局部故障或个别设备故障时,系统整体功能的正确性;(3)各种环境、工况条件下,对设备的安全保护性能和系统的工作性能;(4)各种环境、工况条件下,远程控制功能在实际操作中的安全性能。三、试运行内容试运行期间,主要工作有:安排人员培训,并进行实际操作;对系统进行日常操作,并予以记录;对系统发生的问题,分重点分层次地予以解决,并由此提出针对性的措施。发现并总结系统运行中的管理和维护问题,总结经验,以便系统正常运行时参考。(1)建立专责管理队伍;(2)建立健全运行操作规程;(3)建立健全系统日常维护规范;(4)建立设备运行档案。根据子系统验收大纲和初步验收会议的规定,系统试运行时间跨度定为一个月。试运行具体从2012年8月15日开始,到2012年9月15日结束。2012年9月16日开始进入正式运行。试运行具体内容包括:系统软件的试运行及记录、系统硬件的试运行及记录、系统操作运行及记录、巡检及记录等。其中需要试运行的具体内容如下:技术资料.专业整理 .WORD完美格式编辑.3.1网络环境试运行1)硬件设备试运行对核心交换机、千兆交换机、链路负载均衡等网络设备进行试运行,验证设备是否完好。对核心交换机的负载均衡模块进行试运行,验证核心交换机是否能够平衡负载及热备。2)综合布线试运行对机房等位置的综合布线进行试运行,试运行网络连通性及链路质量。3)整体网络试运行对网络进行整体试运行,包括QoS试运行,QoE试运行等。3.2安全环境试运行1)硬件设备试运行对防火墙、上网行为管理等硬件设备进行加电试运行,验证设备是否完好。验证设备各端口是否可用。验证设备授权是否有效。2)网络安全试运行按照系统设计的网络拓扑接口进行安装部署后,对网络进行安全性试运行,确定安全设备是否工作正常,对网络攻击及病毒木马等是否有足够的防范作用。3.3服务器设备/存储设备及支撑软件试运行1)服务器设备、存储设备硬件试运行包括服务器、存储设备的配置检查(CPU、内存、磁盘配置等),设备的加电试运行。确保设备到货的完整性以及设备运行的稳定性。2)支撑软件试运行在安装操作系统后,对服务器设备、存储设备进行功能试运行和性能试运行,包括CPU计算性能、内存读写性能、磁盘读写性能等,以验证设备是否符合采购标准。技术资料.专业整理 .WORD完美格式编辑.3.4试运行记录试运行过程中对系统允许状况要进行详细记录,主要包括以下内容:1)试运行日常记录包括:软件的日常运行记录、硬件的日常运行记录、安全环境的日常运行记录、服务器/存储设备的日常运行记录。2)试运行期间服务器等硬件设备操作手动记录在对服务器等硬件设备进行操作时,手动记录对服务器操作的内容,并记录非法操作的原因及结果、报警内容、报警处理情况。由操作人员或值班人员按实际操作记录。每天都要求有记录。3)巡检记录试运行期间,对系统硬件设备和使用环境进行定期巡检,每周巡检一次,巡检完成后填写巡检记录。4)试运行期间软件操作手动记录在对软件进行操作或者更改时,手动记录对软件进行操作或者更改的内容,并记录更改的原因及结果。由操作人员或值班人员按实际操作记录。每天都要求有记录。5)恶劣环境操作记录在恶劣环境下设备和系统的运行情况。根据实际环境随机选取记录。6)特殊工况操作记录在系统发生局部故障或个别设备故障时,系统的运行情况。7)问题记录汇总(1)半月问题汇总记录(含处理记录)问题部分由操作人员汇总,主要汇总日常试运行中发现的问题;处理记录单由承建方据实填写。(2)重大问题记录(含处理记录)问题部分由操作人员汇总,主要汇总日常试运行中发现的问题;处理记录单由承建方据实填写。(3)试运行总结报告:甲方的试运行管理报告、监理单位的试运行报告、承建方试运行总结。技术资料.专业整理 .WORD完美格式编辑.项目名称:……项目单位:试运行开始时间试运行软件设备开始状态设备调整记录试运行异常记录异常记录解决办法试运行结果(运行是否正常或其它运行状态描述)记录人技术资料.专业整理 .WORD完美格式编辑.一、试运行人员安排我公司针对本项目成立试运行工作组,。组织职责负责人职位二、日常运行维护运维管理是平台的核心环节之一,它为平台的安全、稳定运行提供保障,对平台的服务、安全运行等各环节进行实时监控,对系统运行的关键信息进行记录,对突发事件进行报警处理。应包括用户管理、权限管理、日志管理、平台监控、运行统计等模块。5.1运行维护原则日常管理的机构设置遵守以下原则:q节约成本原则,尽量利用现有的人力资源、减少浪费。q提高效率原则,岗位明确、协同合作。q责任明确的原则,无论是技术岗还是管理岗都应责、权、利统一,责任明确、落实到人。5.2硬件运行维护本次项目硬件运行维护主要包括机房环境维护、计算机硬件平台维护和网络系统维护三部分内容。技术资料.专业整理 .WORD完美格式编辑.5.2.1机房环境维护机房环境是指保证计算机系统正常稳定运行的基础设施,包含机房建筑、电力供应、空气调节、灰尘过滤、静电防护、消防设施、安防设施、网络布线等子系统。机房环境维护首先需要制定机房管理规章制度,该规章制度对机房环境各子系统指标进行详细说明,对管理人员职责和工作内容进行详细定义,通过管理人员定期巡检,发现问题或并及时处理,重大故障需及时通知维护单位现场排除。本次项目我们将组织每月对机房环境进行一次巡检,并提交机房环境巡检报告,记录巡检情况,对机房故障和隐患提出分析判断意见并提出解决方案。5.2.2计算机硬件平台维护计算机硬件平台是指服务器以及存储、备份等设备。硬件平台维护主要分为两个方面,一个方面是硬件设备的运行状态巡查及故障处理,另外一个方面是硬件操作系统软件和硬件配置文件的检查、备份与更新等。本次项目我们将每月对硬件平台设备进行巡查,检查设备运行状态,跟踪硬件产品信息,制定产品升级计划,备份产品配置文件。对硬件产品故障及时排除。每月提交硬件平台维护报告,提出硬件平台维护建议。5.2.3网络系统维护计算机网络系统是指保证信息系统相互通讯和业务系统正常运行的网络组织,包括交换机、路由器、防火墙等网络设备以及联网的综合布线系统等。网络系统维护的核心是保障业务系统的正常运行。本次项目我们每月对所有网络交换设备和网络安全设备运行状态进行巡检,对核心交换设备、网络安全设备等配置文件进行备份,提交网络系统维护报告。5.3软件运行维护5.3.1维护的要求1.根据平台应用需要及甲方要求,完成信息共享服务平台和3个示范应用。技术资料.专业整理 .WORD完美格式编辑.1.自各项目交付验收通过之日起2年内提供免费的保修和维护服务。在此期间如发生系统运作故障,或出现瑕疵,我方保证响应时间不超过30分钟,技术人员到达现场服务时间小于4小时。2.在保修期内如由于我方的责任而需要对系统予以更换或升级,则相应延长该系统的保修期。3.系统维护期内,我方根据系统运行情况进行不定期的检测与调优,每半年对系统进行一次总体检测,系统维护期满后为业主方提供一套完整的运行记录。5.3.2运行维护目标与原则系统运行维护的目标:1)通过采取主动的系统运行维护方案,确保系统的安全、稳定运行,尽量减少运行故障;2)在系统故障无法避免及突发故障的情况下,也可保证系统能够得到最快的响应和最及时的恢复;系统运行维护的原则:1)节约成本原则:尽量利用现有的人力资源、减少浪费。2)提高效率原则:岗位明确、协同合作。3)责任明确的原则:无论是技术岗还是管理岗都应责、权、利统一,责任明确、落实到人。5.3.3运行维护范围与人员系的运行维护工作将由业主方、我方售后服务机构,共同协调配合承担。我方在项目验收前由项目建设小组对系统进行维护,验收后有售后服务小组负责对系统进行维护。我方软件部分的运行维护范围主要包括项目所采购的基础软件、信息共享服务平台、古建保护与修缮管理信息系统、公园绿化网格管理信息系统和文物管理展示信息系统三个典型业务应用系统。技术资料.专业整理 .WORD完美格式编辑.图Error!Notextofspecifiedstyleindocument.1运行维护范围5.3.4系统维护工作流程在项目正式验收前,我方建设小组将在现状进行维护。当系统遇到故障时,用户可以直接当面或通过电话向建设小组提交维护请求。在项目正式验收后。当系统遇到故障时,用户可以直接当面或通过电话向售后服务小组提交维护请求。在电话提交问题时,售后维护工作人员根据问题描述给出解决方案指导业主方系统维护人员排除故障;如果问题不能通过电话解决,我方派出技术人员在4小时内赶到现场协助业主方解决问题。到达现场后,技术人员大致判定故障等级、故障类型与解决故障的时间,如果判断24小时内不能够解决问题,我方提供备用系统,以保证业主方的正常使用,问题得到解决后,记录问题原因以及解决问题的方法,并收集业主方对于维护工作的评价,以便我方进一步晚上维护工作。系统运行情况记录对于系统的管理维护与评价具有重要意义。系统管理维护人员在系统投入试运行的一开始就应注意积累系统运行情况记录材料。在本平台的运行过程中,需要收集和积累的资料包括以下四个方面:1)有关工作数量的信息如:每天(周、月)录入数据的数量、平台中积累的数据量、数据使用的频率等反映系统的工作负担、所提供的信息服务的规模以及计算机应用系统功能的最基本的数据。2)工作的效率即系统为了完成所规定的工作,占用了多少人力、物力及时间。如,用户提出一个临时的查询要求,系统花费了多长时间才给出所要的数据。此外,系统在日常运行中,例行的操作所花费的人力是多少等。技术资料.专业整理 .WORD完美格式编辑.1)系统的维护修改情况系统中的数据、软件都有一定的更新、维护和检修的工作规程。这些工作都要有详细的及时的记载,包括维护工作的内容、情况、时间、执行人员等。这不仅是为了保证系统的安全和正常运行,而且有利于系统的评价及进一步扩充。2)系统的故障情况无论大小故障。都应该及时地记录以下这些情况:故障的发生时间、故障的现象、故障发生时的工作环境、处理的方法、处理的结果、处理人员、善后措施、原因分析。要注意的是,所说的故障不只是指计算机本身的故障,而是对整个系统来说的。上述四个方面中,通常在正常情况下的运行数据是比较容易被忽视的。因为发生故障时,人们往往比较重视对有关的情况加以及时的记载,而在系统正常运行时,则不那么注意。事实上,要全面地掌握系统的情况,必须十分重视正常运行时的情况记录。如果缺乏平时的工作记录,就无从了解瞬时情况。如果没有日常的工作记录,表示可靠性程度的平均无故障时间指标就无从计算。5.3.5运行维护内容智慧颐和园综合信息平台的维护主要包括服务器和系统的运营维护,系统管理员主要工作内容包括:q系统能否提供服务,保证用户能够正常使用。q系统的日志,确认系统的工作状态。q数据的备份/恢复,保证数据的安全性。q系统的更新,保证系统的安全性和可靠性。具体内容如下:q网络:服务器网络的连接状态。q服务器:服务器本身的运行状态。q操作系统:操作系统的各设备、服务的运行状态以及版本更新情况。q数据库服务器:数据库的运行情况以及数据的备份和恢复。qWeb服务器:Web服务器的运行状态以及站点、虚拟目录的安全设置。q应用系统:系统能够正常向用户提供服务。l操作系统的运行维护技术资料.专业整理 .WORD完美格式编辑.任何操作系统都有漏洞,网络系统管理员每周定期对系统服务器及客户端及时打上“补丁”(Patch)。使系统采用的操作系统时刻保持最新的版本,从而排除操作系统Bug可能带来的安全隐患。l数据库运行维护1.用户管理利用数据库的安全机制:对各个数据库设置不同的口令(8位以上的密码)、权限等;设置不同的角色权限管理。2.警告日志文件监控数据库在运行过程中,会在警告日志文件(alert_SID.log)中记录数据库的一些运行情况:数据库的启动、关闭,启动时的非缺省参数。数据库的重做日志切换情况,记录每次切换的时间,及如果因为检查点(checkpoint)操作没有执行完成造成不能切换,会记录不能切换的原因。对数据库进行的某些操作,如创建或删除表空间、增加数据文件。数据库发生的错误,如表空间不够、出现坏块、数据库内部错误(ORA-600)DBA应该定期检查日志文件,根据日志中发现的问题及时进行处理。3.监控数据库表空间数据库运行了一段时间后,由于不断的在表空间上创建和删除对象,会在表空间上产生大量的碎片,DBA应该及时了解表空间的碎片和可用空间情况,以决定是否要对碎片进行整理或为表空间增加数据文件。监控数据库的连接情况:DBA要定时对数据库的连接情况进行检查,看与数据库建立的会话数目是不是正常,如果建立了过多的连接,会消耗数据库的资源。同时,对一些“挂死”的连接,可能会需要DBA手工进行清理。4.备份控制文件在数据库结构发生变化时,如增加了表空间,增加了数据文件或重做日志文件这些操作,都会造成数据库控制文件的变化,DBA应及进行控制文件的备份,备份方法是:5.检查数据库文件的状态DBA技术资料.专业整理 .WORD完美格式编辑.要及时查看数据库中数据文件的状态(如被误删除),根据实际情况决定如何进行处理,检查数据文件的状态的SQL如下:selectfile_name,statusfromdba_data_files;如果数据文件的STATUS列不是AVAILABLE,那么就要采取相应的措施,如对该数据文件进行恢复操作,或重建该数据文件所在的表空间。6.数据库备份与恢复当我们使用一个数据库时,总希望数据库的内容是可靠的、正确的,但由于计算机系统的故障(包括机器故障、介质故障、误操作等),数据库有时也可能遭到破坏,这时如何尽快恢复数据就成为当务之急。如果平时对数据库做了备份,那么此时恢复数据就显得很容易。l服务器备份为防止不能预料的系统故障或用户不小心的非法操作,必须对系统进行安全备份。服务器备份内容:对全系统进行每月一次的备份外;对修改过的数据进行每周一次备份;同时,对修改过的重要系统文件存放在不同的服务器上,在出现系统崩溃时(通常是硬盘出错),可以及时地将系统恢复到正常状态。在条件允许的情况下,可实现异地备份,采多种备份模式,可以全方位保证系统的安全性。l系统维护q为客户整体系统提供一体化、有效的问题解决方案;q为客户提供每周七天,每天二十四小时,即7*24实时支持;q接到问题30分钟内响应,24小时内解决故障;q提供大量服务项目,包括提供信息技术咨询、教育和培训。q长期免费提供硬件平台相关设备理论培训,为甲方培养专业人才。q必要时提供设备原厂工程师的现场指导与服务。5.3.6运行维护相关制度建设想要建立切实可行的运行维护体系,制度建设是必不可少的要求。我方将协助业主方建立和落实系统运行维护的一系列相关制度。l机房管理条例服务器系统的管理按照IDC机房的管理制度执行。对于机房环境的管理,有必要制定规范的《机房管理条例》,进行规范、有序的管理,以保障系统安全、稳定运行。l保密与信息安全制度技术资料.专业整理 .WORD完美格式编辑.系统内的部分数据将涉及保密数据,有必要进行安全防护。而数据安全的防护需要从计算机网络、系统内部、人为因素等多方面去考虑,为了杜绝由于人为疏忽导致的数据泄密,需要制定和执行《信息安全条例》。业主方内部管理保密管理,负责数据管理和系统维护(涉及数据库)的人员要求签订保密协议。另外,为保证部门之间地理数据共享交换时的数据安全,需制定数据版权保护和数据保密的合同制度。l系统维护责任制度为了使系统能够长期稳定运行,需要对计算机硬件设备和软件系统进行定期和不定期的维护。不定期的维护主要由相关的使用人员负责。因此,有必要建立系统维护责任制度,将责任以制度的形式加以明确。5.4运行维护组织保障5.4.1组织机构保障为进一步加强智慧颐和园的建设工作,构建智慧景区,需要成立专门的智慧颐和园综合信息平台建设工作领导小组。我方将为此项目成立专门的项目组,以保证项目的顺利实施。5.4.2技术支撑体系保障……综合工程,需要建设和整合的系统很多,涉及到很多关键技术,如集成技术、安全技术、空间数据库技术等,这些技术的成熟度直接影响着系统的建设效果。开展技术支撑体系建设,不仅对关键技术进行预研,还要抓好实施,降低技术的实施成本。既要重视科学原创,又要重视技术的创新和发明,加强系统集成。5.4.3信息安全保障体系保障技术资料.专业整理 .WORD完美格式编辑.智慧颐和园综合信息平台建设的一个重要的内容就是要保证各系统中的信息安全,只有在安全的基础上,才能考虑信息的共享。完善的安全保障体系是信息化顺利运行的“守护神”。安全保障体系包括软硬件的安全保障与管理制度的安全保障。网络安全体系是通过软硬件设备,保证系统在运行中安全稳定运行,不会被突发状况或恶意程序破环。信息安全保障体系是保证信息系统能够遵循安全稳定的制度运行,在制度与操作上保证信息的安全与稳定。包括:l信息备份机制l信息系统人员管理机制l历史信息追溯机制l安全评估机制5.4.4运行维护管理机制保障良好的运行机制是智慧颐和园综合信息平台维护管理规范化的保证。在运行机制的设计上,应着重于制度的健全和办事程序的规范,让信息化管理工作在信息化建设中发挥积极的作用。根据颐和园目前的信息化管理现状,建议在建设过程中设计好项目管理机制、业务协同机制和监督评价机制等。一、试运行期间故障响应由于本项目涉及产品多、覆盖范围广,因此在系统试运行过程中技术故障的出现将是不可避免的,针对这种情况,我公司设计了完善的技术故障应急策略。当客户服务中心收到系统出现技术故障的运行维护与支持服务需求时,我们将立即做出实质性响应,联系项目单位技术人员核实故障情况,收集故障信息,并且立即派出试运行工作组技术支持人员到达项目单位故障现场,以最快的速度分析故障原因,确定故障点,在根据故障类型和项目单位的需求,进行故障排除。针对本项目,我公司承诺提供维护、维修技术服务。我公司保证业主可以得到每周7天×24小时的实时技术支持响应,按照承诺的时间提供响应,并根据情况提供必要的现场服务。根据我公司多年的项目实施和售后服务经验,我们总结出大型信息系统中出现的几种典型技术故障情况,同时针对不同情况提出了相应的预防措施和应急策略。技术资料.专业整理 .WORD完美格式编辑.具体内容如下表所示:紧急情况预防措施应急策略线路故障我们有着详细的竣工图纸,并有着熟练得施工队伍。立即联系线路施工协调,解决故障,尽快恢复主线路正常运行。软件故障我们提供的全部软件产品均经过严格的测试,在安装时也会安装好相应的补丁程序,很大程度上减少了软件故障发生的可能。了解问题的详细情况,根据具体问题,提出相应的应急策略,同时负责将问题通知相关的设备、软件厂商,督促厂商及时地提供软件补丁或者软件修正方案,在得出相应的解决方法和软件补丁后,及时与项目单位技术人员一起解决故障问题。操作失误我们在技术培训中会把设备、软件的操作作为重点内容讲授给项目单位的技术人员,减少操作错误的可能,并且强调系统备份的重要性,讲授系统备份的方法。同时,协助项目单位制订系统运行管理制度及规范,尽量减少误操作的发生。项目单位技术人员可以独立或者在客户服务中心技术人员的指导下,按照正确的操作步骤,利用事前的系统配置备份完成系统恢复工作。配置丢失对项目单位各级技术人员强调系统备份工作的重要性,同时提供系统备份与恢复工作的培训内容,使得项目单位技术人员掌握对于网络设备配置、各类关键数据文件等多种类型的系统备份与恢复步骤项目单位技术人员可以独立或者在客户服务中心技术人员的指导下利用事前的配置备份完成系统恢复工作。病毒破坏我们在进行方案设计时,已经充分考虑到整个系统对病毒的抵抗能力,采用了成熟的防病毒产品,大大降低了病毒破坏的可能性。为项目单位提供实用的病毒专杀工具或病毒代码库,并协助项目单位完成病毒的清除工作,同时帮助项目单位使用备份数据进行系统恢复工作,将病毒造成的损失减到最小。非法入侵我们在进行方案设计时,已经充分考虑到系统的安全性,采用了多种成熟的安全技术和产品,大大降低了非法入侵的可能性。客户服务中心的技术人员利用专门的工具,对线路进行监控,及时地查找到入侵根源和系统的安全隐患,并且提供相应的解决方案。技术故障应急策略服务流程图如下:技术资料.专业整理 .WORD完美格式编辑.故障服务登记表任务书编号承担人执行日期用户信息客户名称地址联系人电话/传真电子邮件服务编号(产品序列号)问题内容工作记录主要过程及结果(可另附纸张):实施方式:现场□远程□咨询□其他客户意见(远程维护与服务时,无客户直接签署的意见及签名,但要填写客户对本次工作情况的评价):客户代表签字:日期:经理审核意见:签字:日期:技术资料.专业整理