- 3.35 MB
- 15页
- 1、本文档共5页,可阅读全部内容。
- 2、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。
- 3、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 文档侵权举报电话:19940600175。
系统试运行报告BTSO运维管理系统项目试运行报告建设单位:黑龙江科技发展有限公司2017年3月1日14
系统试运行报告BTSO智能运维系统作为2017年管理部信息化建设的重要组成部分,为信息化设备的科学管理提供了可靠的技术保障。公司服务器工作年限大多超过五年,运行已出现老化现象。网络设备分散在公司各个位置,人为监控运行状态难度较大。数据库出现故障无法提前预警,查找故障点难度较大。智能运维系统上线主要目的,就是为了减少故障处理时间,加强软硬件系统监管,提高工作效率。1.系统试运行的平台及网络环境1.1系统硬件平台系统部署的服务器型号:IBMx3650-m3,配置:3颗至强4核CPU,内存为32G,配备2网卡,RAID5+1热备,硬盘300G*71.2系统软件平台Ø管理平台服务器、WEB发布服务器、数据库都整合在一台实体服务器中。实体服务器端操作系统为VMware5.5.0,BTSO运维管理平台运行在操作系统VMware下的MicrosoftWindowsServer2008虚拟机中,数据库采用北塔PgSQL。Ø客户端采用GoogleChrome54.0浏览器以上版本,建议设置为1920*1080分辨率。14
系统试运行报告1.3系统网络环境Ø服务器主板集成2个10/100/1000M以太网卡,使用其中1个以太网卡,IP地址设置为:10.1.7.104/21Ø系统采用了B/S架构,通过虚拟机网址(http://10.1.7.100)进行登录。客户端登陆需要输入用户名密码,帐号和密码由系统平台管理员分配。Ø系统登录页面如下图:14
系统试运行报告2系统概要说明2.1系统主要模块BTSO北塔智慧运维平台包含9大模块类型:系统平台、告警时间管理、运维数据输出、报表管理、机房管理、拓扑管理、系统类管理、网络类管理、存储设备管理等,每个模块类型下辖若干模块,共计20个模块。14
系统试运行报告2.2系统权限系统权限灵活分配,不同的岗位按照需求可以设置不同的操作权限,现已发放操作员账号8个。3.系统试运行的工作时间安排3.1培训阶段2017年1月13日,北塔工程师主持,进行了BTSO智能运维系统相关操作人员的培训。3.2基本数据输入2017年1月9日——2017年1月12日搭建BTSO智能运维系统运行平台,进行数据库挂接,创建网络结构框架,服务器拓扑,分配各操作员账号。1月13日进入试运行阶段,试运行期为3个月。14
系统试运行报告4系统试运行的规模目前系统监测对象83个。分别为:交换机46台、服务器21台、虚拟服务器1台、光纤交换机2台、防火墙1台、上网行为1台、存储服务器1台、SQL数据库实例3个、Oracle数据库实例7个。另有UPS逆变器2台、温湿度传感器1台,需要停机检修期间进行安装,ghS防火墙由于不在局域网网段内暂时无法监控。5系统试运行对提高工作效率的作用分析通过对目前的系统试运行结果来看,此系统能很好的监控局域网中的各种主要信息化设备、数据库的运行状况和健康信息。在加强公司信息化设备管理的同时,也大大提高了对信息化设备、数据库故障判断的速度。另一方面,系统智能巡检比之前的手工巡检即缩短了时间,又提高了数据的准确性。智能巡检功能24小时不停的进行巡检,如被监控设备、数据库出现异常,系统可以及时提醒,并指明发现异常的指标名称,便于维护人员排除异常,缩短问题的处理时间,提高解决问题的工作效率。6系统试运行的影响分析由于此系统设计为B/S架构,所有局域网计算机都可以登陆系统平台进行查看,所以不会限制维护人员所在位置。系统内置运行率报表、故障分析报表、性能分析报表等,针对网络设备健康状态14
系统试运行报告进行统计,便于维护人员判断网络设备是否良性运转。网络设备拓扑功能,能够生成办公网络拓扑图,并将介入层以上的设备以及链路以列表、图形等表现形式展现。图形中链路的颜色代表线路的性能变化,并通过其线路信息查看线路总流量、线路帧流量以及带宽利用率等信息。如发现异常数值,通过查询上下级交换机的链路信息表,可以找到产生异常数值的交换机端口,通过线号端口表最终找到产生异常终端的准确位置,便于查找异常原因。此项功能可快速查找广播风暴产生的源头,有利于网络的稳定运行。对于服务器、网络存储、光纤交换机等设备的监控则深入硬件底层:CPU、内存、硬盘、磁盘IO性能、光纤接口、网卡、RAID卡、LUN、RG使用率、风扇转速、供电模块等信息都进行了监控。在日常的维护中服务器、网络存储等设备如出现告警信息,其告警指标可与历史指标进行对比,判断其告警信息是否准确。对于性能指标产生异常数值的设备也会有告警信息,通过这种告警信息,完全可以提醒操作人员及时维护相应设备,降低运行风险,起到预警的作用。对于数据库的监控,主要监控指标:数据库服务运行状态、表空间使用情况监测、数据库用户使用情况、SGA大小及使用率、SQL语句性能消耗查阅、数据库ALTER日志报错、数据库是否有锁(行级锁数、表级锁数、死锁数、锁等待数、阻塞锁数)、相关进程持续时间、归档模式、数据缓存命中率、共享池缓存命中率、内存占用比率、重做日志缓存命中率、用户表空间昨日增长量等,监控指标数值一旦超出阈值设置范围,系统可及时告警,提醒操作人员进行维护,14
系统试运行报告防止数据库产生异常。通过BTSO运维系统的监控预警功能,可以快速查找故障源,减少解决故障的时间。信息化系统故障解决时间越少,对公司整体生产运营的影响就会越小,事实上是间接提高了整个公司的运转效率。7系统试运行过程7.1试运行过程该系统自1月13日开始试运行。自运行之初,我们按照设计要求,逐项进行演示,并把实际看到的功能与《技术协议书》进行对比。在试运行阶段我们着重在以下几个方面进行了检查:.1、网络的运行率,检查方式为查看《网络设备运行率报表》、《网络线路连通率报表》。14
系统试运行报告1、网络线路和设备的负载情况,检查方式为查看《网络线路负载分析报表》、《网络设备负载分析报表》。14
系统试运行报告1、网络告警信息统计,检查方式为查看《网络告警统计分析》。2、服务器、网络存储设备的运行率,检查方式为查看《主机运行率报表》。14
系统试运行报告1、服务器、网络存储设备的告警信息统计,检查方式为查看《告警统计分析报表》。2、服务器、网络存储设备的性能统计,检查方式为查看《主机性能分析报表》。14
系统试运行报告1、网络设备实时运行情况,通过网络拓扑图进行查看。2、服务器、数据库实时运行状况,通过系统拓扑图进行查看。3、智能巡检功能,通过“巡检指标状态”查看异常出现的次数和比例。14
系统试运行报告1、各种实时告警信息,通过故障管理查看。2、BTSO智能运维软件的操作手册。14
系统试运行报告1、BTSO智能运维软件自身的稳定性,试运行期间没有出现过系统崩溃、死机等现象。7.2待解决问题北塔前期参与了测试,且测试结果较为满意。此次实施项目的北塔工程师也已多次来厂参与前期测试工作,对于我们的各项需求比较清晰,所以系统在安装和调试阶段都比较顺利。系统在安装试运行阶段,发现了一个问题。ØBI数据库服务器连接过程中,运维系统可正常连接,但是连接时间较长,系统显示无法连接,办公电脑可正常连接数据库。此问题已反馈北塔售后,要求尽快查找原因并解决。7.3系统安全问题系统基于B/S架构进行部署,所有数据保存在第二办公楼机房BTSO运维服务器中,不存在分散管理数据的问题。14
系统试运行报告由于此信息系统运行在公司局域网上,而且有专业维护人员进行服务器维护及网络安全方面的管理,且操作人员的每一步修改操作都有详实记录,完全可以做到追根溯源。对于被监控的设备安全性:此系统属于监控软件,对于服务器、交换机、数据库等设备,并无任何修改权限。7.4日常维护工作在系统正式运行前,系统管理室人员仍然按照以往的巡检流程进行人工巡检。由于UPS逆变器和机房的温湿度传感器,需停机检修期间进行安装,所以UPS逆变器运行状态、机房温湿度还需人工检查记录。8总结从系统试运行的情况看来,系统运行状况良好,功能总体上满足管理要求,符合《技术协议书》的内容。相关操作人员的培训已经结束,操作手册已发放到每个操作人员手中。经过2个月的试运行,操作人员对系统中功能的使用越来越熟悉,已达到独立使用的水平,目前系统运行稳定。14