系统运维方案.pdf
《系统运维方案.pdf》由会员分享,可在线阅读,更多相关《系统运维方案.pdf(39页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、运维技术方案运维技术方案陕西思宇信息技术有限公司1 1运维服务目标及服务范围运维服务目标及服务范围通过购买专业运维服务 , 进一步加强未央区城市管理监督指挥系统运行维护,对指挥系统维护流程提供先进的管理理念与流程,并通过专业的技术支持为数据中心运行维 护工作提供专业的技术平台,满足未央区城市管理监督指挥系统大数据量安全存储的要求,可以满足多种 应用运行环境稳定的要求,可以满足系统及数据高效、可靠和安全运行的要求, 可以满足运行设备统一管理、及时的故障恢复的要求,可以保证在应用系统和硬件设备平台正常运行,满足省本级数据库和应用系统的建设需要,达到高效、稳定、安全和高扩展性的要求,为实现信息化建设
2、的可持续发展奠定集中统一的设施基础。设备及软件清单:一、系统软硬件维护序号12345678内容工程投影机(SONY)高级投影金属硬屏幕(三星)液晶监视器、MYWAY双基色 LED 屏会议室用投影仪(SONY)会议室用电动伸缩幕布核心汇聚网络交换机/博达接入网络交换机-指挥中心/博达制造商上海 SONY 中国有限公司江苏张家港市电教器材厂西安英特安防设备有限公司西安上海 SONY 中国有限公司江苏张家港市电教器材厂上海博达数据通信有限公司上海博达数据通信有限公司数量单位说明维护设备正常运行维护设备正常运行维护设备正常运行维护设备正常运行维护设备正常运行维护设备正常运行维护设备正常运行维护设备正常
3、运行1台1台6台1台1台1台2台1台91011121314151617181920212223242526272829303132333435363738394041424344接入网络交换机-执法中队端/博达配套光模块/博达高端服务器中端服务器上海博达数据通信有限公司上海博达数据通信有限公司11台22个4台5台1台1台160232台块台台台维护设备正常运行维护设备正常运行维护设备正常运行维护设备正常运行维护设备正常运行维护设备正常运行维护设备正常运行维护设备正常运行维护设备正常运行维护设备正常运行维护设备正常运行维护设备正常运行维护设备正常运行维护设备正常运行维护设备正常运行维护设备正常运行
4、除尘保养除尘保养维护设备正常运行维护设备正常运行维护设备正常运行维护设备正常运行维护设备正常运行维护设备正常运行维护设备正常运行维护设备正常运行保养维修维护设备正常运行维护设备正常运行维护设备正常运行维护设备正常运行维护设备正常运行维护设备正常运行维护设备正常运行保养维修除尘保养IBMIBM北京邦诺存储科IPSAN 存储设备技有限公司上海博达数据通防火墙/博达信有限公司UPS艾默生蓄电池冠军电池柜艾默森配电柜国产专业型笔记本电脑THINKPAD执法票据打印专用笔THINKPAD记本电脑指挥中心办公工作站联想各执法中队/督查室监联想控指挥工作站针式票据打印机爱普生KVMRaritan机柜42U华
5、为机柜-6U国产矩阵输入输出箱美国/派尔高带线缆输入后面板扩美国/派尔高展板视频输入卡美国/派尔高视频输出卡美国/派尔高带 BNC 接头后面板输美国/派尔高出板串口通讯卡美国/派尔高128*32 矩阵美国/派尔高控制键盘美国/派尔高工作台、椅国产彩色多功能激光一体惠普机路由器华为光模块H3C交换机H3C防火墙H3C空调 5P格力空调 2P格力防静电地板 100 平米电源柜国产3台10161523111台台台台台台台6块6块2块2块11110块台台套1台12221314台个台台台台组台45464748495051风机、新风卡巴斯基杀毒软件赛门铁克备份软件Windows Server 2008操作
6、系统数据库中间件150192112台套套保养维修更新、升级更新、升级北京卡巴斯基科技有限公司赛门铁克软件北京有限公司微软OracleOracle套补丁升级,系统检测套补丁升级,备份,渗透测试套硬件及系统软件的运月维,驻场工程师一名单位说明维护设备正常运行维护设备正常运行工程师日常巡检维修二、外设硬件维护序号1234内容前端摄像机、视频信号线路、摄像机云台控制线路、接电的故障排除、设备维修监控主机的设备检测、系统维护、扩容、故障排除立杆、设备箱、防雷设施维护设备清洁(每半年一次)数量100点100点5固定摄像机拆除6固定摄像机安装7移动监控车运行及维护三、移动摄像头迁移序号内容100点维护设备正
7、常运行台200摄像机除尘次10点预估拆除监控点10点预估安装监控点3辆保证车辆正常运行数量1616数量1单位点点单位批单位说明预估拆除监控点预估安装监控点说明预估监控点设备意外损坏更换说明100 个摄像头,每个摄像头功率 100W预估变更取电监控点10 个1移动摄像机拆除2移动摄像机安装四、设备意外损坏更换序号1内容设备意外损坏更换五、外设设备运行序号12内容摄像头电费交纳监控点取电位置意外变更数量100点10点2 2服务内容服务内容2.12.1运维类别运维类别乙方为甲方提供的运行维护服务,主要包括以下以下四个方面内容:网络设备(交换机、防火墙等)主机设备(服务器)基础软件(数据库、中间件)其
8、他硬件(视频监控设备)桌面设备(打印机、笔记本、台式机、投影仪)2.22.2 运维内容运维内容2.2.12.2.1 交换机交换机服务描述服务描述1.检查设备的运行状态是否正常,接口状态是否正常,有无报警。2.设备系统版本: 查看设备的软件版本是否是最新版本,是否存在已知的可能导致运行不正常的问题。3.检查设备电源状态信息:查看系统电源工作情况是否正常,要求电源都工作正常。4.检查设备风扇状态信息: 查看系统风扇工作情况是否正常,要求风扇都工作正常。5.检查设备板卡运行状态信息:查看系统板卡工作情况是否正常,要求板卡都工作正常。6.检查设备的温度状态:查看设备的温度是否正常,要求设备工作温度在
9、5-70 度之间。7.检查设备 flash 信息:查看系统flash 空间使用情况是否正常,要求 Flash 空间利用率低于 80%。8.检查内存信息: 查看系统内存使用情况是否正常,要求“Mem”占用率要低于 80%。9.检查 CPU 信息:查看系统内存使用情况是否正常,要求“CPU”占用率要低于 70%。10.检查设备运行时间:查看设备的运行时长,要求连续运行时间应服务内容例行巡检在 1 个月以上(4 周)。11.检查设备系统时钟信息:查看设备进时钟信息,要求设备的系统时钟偏差在 5 分钟以内。12.检查光模块输入功率信息:要求设备可插拔模块的输入光功率不超过正常范围。13.检查光模块工作
10、温度信息:要求设备可插拔模块的温度保持在温度上下限之间。14.登录用户口令安全性:为保证设备的安全性,要求设备登录用户的口令采用加密方式显示。15.VRRP 状态: 运行 VRRP 协议的接口在稳定时组状态为 Master、 Slave或是 Backup。16.OSPF 邻居状态:基于 OSPF 协议正常运行的考虑,要求 OSPF 协议的邻居必须稳定处于 FULL 状态。17.事件日志告警信息:是否有错误或告警日志,观察设备运行参数。18.对设备系统配置及系统更改信息进行归档。20.每季度到现场对维保设备进行巡检,对硬件设备运行状态进行检查和分析,及时发现故障隐患,并排除系统故障或调整系统性能
11、,必要时更换故障部件,完成巡检和故障处理报告。远程:1、网络架构标准化、可扩展性、可用性、可靠性、高性能性、安全性及可管理性等检查;2、系统日志分析;3、网络系统通讯状态检查;4、检查网络流量、通讯流量控制、网络访问安全、通讯数据类型的转发、VLAN 划分等;现场:1.查看设备运行参数;2.提供重要事件的现场支持服务(例如网络割接、设备搬迁、设备升级、网络拓扑调整等)。3.对设备系统配置及系统更改信息进行归档。4.完成在巡检发现的隐患、故障的解决;5.处理日常的网络故障;响应时间:一级:10 分钟(交换机宕机、网络中断等造成严重后果)二级:30 分钟(交换机告警、不影响正常使用)三级:60 分
12、钟(巡检、业务咨询等)响应支持优化改善服务时间交付方式交付成果1.CPU、内存等系统运行瓶颈分析;2.结合系统软硬件的系统运行状况,进行网络整体拓扑结构化分析;3.IOS 设备微码的使用管理支持及相关升级服务;日常运维 5x9;应急响应 7x24现场/远程巡检报告、服务报告2.2.22.2.2 服务器服务器服务描述服务描述检查硬件设备日常的物理安全维护主机的系统主板、CPU(含 CPU 板)、内存条或内存板等关键部件维护系统电源及附属设备例行巡检维护各种存储设备,包括内置磁盘或外置磁盘阵列、磁带库、光驱等设备维护各种适配器卡和显示设备、磁盘RAID 卡等设备维护系统和 I/O 卡、SCSI 背
13、板等设备维护所有连接设备的各种线缆服务内容远程:1、数据备份与恢复服务2、配置维护服务3、数据清理服务现场:1、硬件故障修复服务;2、技术支持服务;3、辅助故障定位服务;4、应急方案设计与预演服务;5、完成在巡检过程发现的隐患、潜在的故障;响应时间一级:10 分钟(服务器宕机、应用瘫痪等造成严重后果)二级:30 分钟(服务器告警、不影响正常使用)三级:60 分钟(巡检、业务咨询等)1.系统健康检查服务2.性能分析与调优响应支持优化改善巡检频度服务时间交付方式交付成果巡查:1 次/天,巡检:1 次/季(具体可以根据客户需求提供)日常运维 5x9;应急响应 7x24现场/远程巡检报告、服务报告2.
14、2.32.2.3 数据库数据库服务内容服务描述服务描述检查操作系统 cpu 空闲率检查磁盘空间是否不足检查操作系统错误日志检测数据库是否启动,侦听是否正常(客户端)检查和启动实例(服务器端)检测和启动侦听(服务器端)检查状态不是“online”的数据文件检查数据缓冲区命中率检查数据字典缓冲区命中率检查 LIBRARYCACHE 命中率检测使用率大于 80%的表空间检查 Job 是否正常了解数据库备份情况检查阅读 oracle 的报警日志(服务器端)检查当前数据库中表和索引最大可能的数据量检查当前所有用户名和是否锁定检查当前具有 dba 权限的用户名例行巡检检查当前用户的所有角色检查当前用户使用
15、空间的信息检查所有表空间的大小和当前使用率查出最大读的热点文件查出最大写的热点文件检查最近的归档日志生成信息检查当前重做日志的信息备份的数据库所有文件(物理全备)检查 mount 点的数据大小分布检查无效的 trigger检查不起作用的约束检查主键失效的表检查没有主键的表获得当前重建数据库所需要的 ddl 和用户信息当运维的数据库发生故障或存在异常问题时,工程师提供7*24小时的热线响应及电话指导支持,必要时赶到客户现场,进行故障(或问题)的修复,并在承诺时间内排除故障或解决问题或恢复客户业务系统的正常运行。远程:1、数据库日常监控服务2、数据库补丁与升级服务3、数据库主动巡检服务响应支持4、
16、数据库备份与恢复服务现场:1、数据库故障修复服务2、数据库迁移及数据清理服务3、重大事件现场顾问支持服务响应时间:一级:10 分钟(数据库宕机等造成严重后果)二级:30 分钟(数据库告警、不影响正常使用)三级:60 分钟(巡检、业务咨询等)优化改善巡检频度服务时间交付方式交付成果1、数据库性能优化服务按客户的实际需求双方商定(具体可以根据客户需求提供)日常运维 5x9;应急响应 7x24现场/远程巡检报告、服务报告2.2.42.2.4 中间件中间件服务描述服务描述检查 JDK 版本信息检查 weblogic 版本信息检查 web 应用包配置和运行状态检查 EJB 包配置和运行状态检查 JDBC
17、 连接池配置和运行状态例行巡检检查日志信息状态当运维的系统发生故障或存在异常问题时,工程师提供 7*24 小时的热线响应及电话指导支持,必要时赶到客户现场,进行故障(或问题)的修复,并在承诺时间内排除故障或解决问题或恢复客户业务系统的正常运行。远程:1、主动巡检服务2、应用中间件启、停服务现场:1、中间件故障修复服务2、中间件技术支持服务响应支持3、辅助故障定位服务响应时间:一级:10 分钟(中间件不可用等造成严重后果)二级:30 分钟(中间件告警、不影响正常使用)三级:60 分钟(巡检、业务咨询等)1、中间件升级服务优化改善2、中间件配置调优服务3、中间件架构调优巡检 1 次/季,出现故障按
18、合同约定时间内到达现场(具体可以根据客户需求提供)日常运维 5x9;应急响应 7x24现场/远程巡检报告、服务报告服务内容巡检频度服务时间交付方式交付成果2.2.52.2.5 操作系统操作系统服务描述服务描述1)系统空间使用情况,文件系统是否有“满”.2)查看卷组信息,有没有stale状态的逻辑卷3)检查内存交换区(paging space)使用率是否超过 70%4)当前操作系统版本5)系统性能检查:CPU 性能、内存使用情况、检查IO 平衡使用情况、交换空间使用情况6)网络检查7)检查系统合法/非法登陆情况8) 检查系统是否有巨大的 Core 文件生成9)网卡的状态、IP 地址、路由表等例行
19、巡检10) snap -a 来搜索 AIX 系统的大部分配置信息11) 查看错误报告服务内容12)有否发给 root 用户的错误报告(mail)13)查看系统信息14)检查 hacmp.out,smit.log,boot.log15)查看卷组信息,有没有stale状态的逻辑卷16)使用 iostat 命令监控 I/O17)查看系统定时备份情况18)HACMP远程:1、操作系统日常监控服务2、操作系统补丁与升级服务3、操作系统主动巡检服务4、操作系统备份与恢复服务响应支持5、操作系统日志清理服务现场:1、操作系统故障修复服务2、操作系统主动巡检服务3、重大事件现场顾问支持服务响应时间:一级:10
20、 分钟(操作系统不可用等造成严重后果)二级:30 分钟(操作系统告警、不影响正常使用)三级:60 分钟(巡检、业务咨询等)优化改善1、操作系统参数配置及优化服务巡检频度服务时间交付方式交付成果1 次/季(具体可以根据客户需求提供)日常运维 5x9;应急响应 7x24现场/远程巡检报告、服务报告2.2.62.2.6 视频监控视频监控服务描述服务描述检查网络架构的可用性、可靠性、高性能性、安全性及可管理性等;提供设备使用管理支持及相关升级服务;分析系统日志;检查网络系统通讯状态;检查录像运行;调整及清洁云台、固定式枪机;及时排除发现的有隐患的系统问题;提供重要事件现场支持服务(例如割接、设备搬迁、
21、现网测试、组网方案等);根据客户报修及年度巡检(具体可以根据客户需求提供)日常运维 5x930 分钟现场服务报告服务内容巡检频度服务时间响应时间交付方式交付成果2.32.3 系统软件运维系统软件运维乙方为甲方提供的运行环境保障工作,提供三线技术支持服务。编号编号服务项目服务项目服务内容服务内容服务时间服务时间1、在维护协议有效期限内,客户将获得电话支持,由陕西思宇信息技术有限公司公司资深工程师提供技术服务,进行技术咨询,故障分析,远程诊断,并对严重问题迅速升级, 包括将问题升级到专家组或派遣当原厂工程师迅速到达现场。电话支持服务为每周7 天,每天7 天24 小远程支持 24 小时。时2、陕西思
22、宇信息技术有限公司公司会通过邮件系统为客户提供技术支持服务:定期发放系统检查报告,提供技术文档等。3、通过指定电话、邮箱提供远程故障诊断和解决方案的远程支持服务。1、 对于客户IT系统突发性的故障或突发性的性能下降,7 天24 小现场支持时陕西思宇信息技术有限公司公司工程师将根据与客户12编号编号34服务内容服务内容服务时间服务时间协商确认的服务级别和故障紧急程度, 在规定时间内到达现场,排除故障,响应支持服务时间为每周7 天,每天 24 小时。2、对于客户报告的各类问题,我方工程师将本着最小化故障时间,采用现场服务、邮件支持、远程等形式进行指导和解决。 陕西思宇信息技术有限公司公司会对客户反
23、映的技术问题进行问题级别划分, 对严重程度进行级管理,应用户请求,我们可提供不限次数和时间的现场服务。1、根据客户需求,陕西思宇信息技术有限公司公司将定期对客户的系统软件进行健康检查。 并提交相应的系统健康检查报告,巡检报告将评估该 IT 系统的可用性、安全性、稳定性和性能现状,并就发现的问题或隐患提出我方建议的解决方案。2、对可能会产生其他一些影响的问题,或者优化方案系统巡检 需要用户增加资源(如性能瓶颈可能是缺乏某硬件资源)每月我们将在提交的报告中详细描述问题的成因,影响范围,建议的解决方案,以及解决问题的风险,交予用户评估。3、指定专人按月到场例行巡检,提供系统健康检查,配合信息安全加固
24、工作进行补丁升级服务, 提供软硬件平台升级的测试环境。性能诊断此服务指对用户的 IT 系统进行性能方面的分析、评估、与性能调按需调整,以提高该系统的整体性能。优服务项目服务项目2.42.4 硬件产品维护硬件产品维护硬件产品维护服务内容如下:编号编号服务项目服务项目1服务范围服务范围网络设备应用软件服务内容服务内容服务服务时间时间远程支持通过指定电话、 邮箱提供远7 天24程故障诊断和解决方案的小时远程支持服务对不能通过远程支持方式7 天24解决或紧急事件, 指定专人小时提供 2 小时到达现场服务指定专人按月到场例行巡检, 提供硬件健康检查和系统补丁升级服务。每季2现场支持设备清单3系统巡检备品
25、备件服务网络设备、主机设备4硬件设备针对客户现有硬件产品范7 天24围建立备件库, 提供备件服小时务。3 3运维人员组织架构运维人员组织架构3. 13. 1运维组织结构介绍运维组织结构介绍我公司将在此运维项目中投入业务水平高、技术能力强的运维人员和质量控制人员,采用陕西思宇信息技术有限公司严格规范的运维管理模式,进行全方位管理。为了进一步确保运维项目的进度与质量,陕西思宇信息技术有限公司公司在项目运维阶段、质量管理、 技术文档等方面进行严密规范的部署。陕西思宇信息技术有限公司公司的运维队伍组成包括:运维项目总负责人(常务总经理兼任) ;运维管理委员会(项目经理、甲方代表、监理代表) ;运维驻点
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 系统 方案
限制150内