硬件设备运维方案设计.docx
《硬件设备运维方案设计.docx》由会员分享,可在线阅读,更多相关《硬件设备运维方案设计.docx(31页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1概述222 月艮222. 1服务目标223. 2信息资产统计服务234. 3网络、安全系统运维服务235. 4服务器设备、存储系统运维服务266. 5数据库系统运维服务287. 6视频会议系统运维服务308. 7中间件运维服务303 运维服务流程324 服务管理制度规344. 1服务时间344.2彳亍为规344. 3现场服务支持规354. 4问题记录规355应急服务响应措施375. 1应急基本j弼呈375.2预防措施3724服务器设备、存储系统运维服务XXX公司提供的主机、存储系统的运维服务包括:服务器设备、存储设备的日常监控,设备的运行状态监控,故障处理,操作系统维护,补丁升级等容。主机存
2、储系统基本服务容:序号服务模块容描述提供方1现场备件安装配合用户进行。按备件到达现场时间工程IJ话U达现场XXX公司2补丁服务消除软件漏洞给系统带来的安全隐 患,并对安装补丁所引起的系统连 锁反应进行合理的平衡。XXX公司3升级服务对系统进行软件或硬件的升级,以 改进、完善现有系统或消除现 有系 统的漏洞。XXX公司4现场故瞳诊断按服务级别:7X24小时5x8小时XXX公司5远程技术支持7X24/J 时XXX公司6问题管理系统对遇到的问题进行汇总和发布XXX公司7系统优化对客户系统的括主机、存储设备、 操作系统、提供优化服势。XXX公司XXX公司现场值守人员可进行监控管理的容包括: CPU性能
3、管理;存使用情况管理;硬盘利用情况管理;系统进程管理;主机性能管理;实时监控主机电源、风扇的使用情况及主机机箱部温度;监控主机硬盘运行状态;监控主机网卡、阵列卡等硬件状态;监控主机HA运行状况;主机系统文件系统管理;监控存储交换机设备状态、端口状态、传输速度;监控备份服务进程、备份情况(起止时间、是否成功、出错告警);监控记录磁盘阵列、磁带库等存储硬件故障提示和告警,并及时解决故障问题;对存储的性能(如高速缓存、光纤通道等)进行监控。服务器巡视典型作业计划书应用业务类型主机名称主机型号主机序列号IP地址和掩码CPU型号/数量/主频存容量磁盘型号/数量/大小根盘镜像(Y/N )服务器设备状态检杳
4、系统板正常口异常CPU正常口异常存正常口异常I/O板正常口异常RAID卡正常口异常SCSI卡正常口异常网卡正常口异常磁盘及阵列正常口异常AID盘状态系统其它扩展卡正常口异常设备故障灯正常口异常服务器系统性能状况CPU利用率正常口较高存利用率正常口较高性能是否存在瓶颈无口有系统磁盘剩余空间正常口不足巡检意见:工程师:巡检日期:联系:2-6数据库系统运维服务XXX公司提供的数据库运行维护服务是包括主动数据库性能管理,数据库的主动 性能管理对系统运维非常重要。通过主动式性能管理可了解数据库的日常运行状态, 识别数据库的性能问题发生在什么地方,有针对性地进行性能优化。同 时,密切注意 数据库系统的变化
5、,主动地预防可能发生的问题。XXX公司提供的数据库运行维护服务还包括快速发现、诊断和解决性能问题,在 出现问题时z及时找出性能瓶颈,解决数据库性能问题,维护高效的应用 系统。XXX公司的数据库运行维护服务,主要工作是使用技术手段来达到管理的目标, 以系统最终的运行维护为目标,提高用户的工作效率。具体数据库运行维护监控的基本服务容包括:每周7天,每天24小时支持中心,电子答询,以满足业势发展的需要。OraCle产品技术专家直接同客户对话,帮助解决 客OraCle数据库户提出的疑难问题。根据问题的严重程度;I各优先解决客户认为是关键司而紧急的任务。对客户提出的一般性问题进行技术咨询、指导。走期的客
6、户管理报告,避免问题再度发生。库宕机OraCle数据库产品效推坏块XXX公现场服务响应影响业务不能进行的产品问题OraCle数据库产品软件产品的更新及维护。对系统的配置及运作框架提出建议以帮助您得到一个更坚强可靠的运作坏境降氐系统潜在的风险,包括数据丢失、安全漏洞、系统崩溃、性能降低及资源紧检查并分析系统日志及跟踪文件,发现并排除数据库系统错误隐患检查数据库系统是否需要应用最新的补丁集检查数据库空间的使用情况协助进行酷 库空间的规划管理检查数据库备份的完整性 险空数据库性能确认系 统的资源需求明确您系统的能力及不足优化OraCIe SerVer的表现通过改善系统坏境的稳走性来降氐潜在的系统宕机
7、时间分析用户的应用类型和用户行为评价并修改ORACLE数据库的参数设置 评价并调整 ORACLE数据库的数据分布OraCIe数据库产品评价应用对硬件和系统的使用情况,并提出建议性能调优利用先进的性能调整工具实施i我挺库的性能调整培训用户有关性能调整的概念提供用户完整的性能调整报告和解决方法工程师:巡检日期:联系:存储设备巡视典型作业计划书设备型号S/NIPifiiltFirmWare版本(控制器)硬件状态检查检杳容检杳结果备注控制器状态7正常异常N/A电源模块状态7正常异常N/A风扇模块状态7正常异常N/A电池状态7正常异常N/A物理硬盘和逻辑盘状态7正常异常N/A扩展柜状态7正常异常N/A设
8、备故障灯状态7正常异常N/A巡检总结26视频会议系统运维服务视频会议系统是迸行指令下达、工作协调、应急处置等的主要系统,是连接上下级 单位的主要通道,系统的稳定关乎XXX国土资源厅的稳定和有序,具有 重要的地位。XXX公司的视频会议系统维护服务,主要工作是使用技术手段来达到管理的目 标,以系统最终的运行维护为目标,提高用户的工作效率。根据对自治区国土资源视频会议系统现状、问题及服务需求的深度分析,我 们认 为,本项专业服务的核心目标如下:通过预防为主的平”时服务、迅捷为主的战时保瞳、建立持续改进的 服务管理 体系、建立丰富有效的资源保障体系,持续不断的提高视频会议系统的 可靠性!保证视 频会议
9、系统的正常运行及其功能的完美呈现,保证视频会议过程 的顺畅和高质量。2.7中间件运维服务中间件管理是指对BEA WeblogiCs MQ等中间件的日常维护管理和监控工作, 提高对中间件平台事件的分析解决能力”确保中间件平台捋续稳定运行。中间件监控 指标包括配置信息管理、故障监控、性能监控。执行线程:监控WebLogiC配置执行线程的空闲数量。 JVM存:JVM存曲线正常,能够及时的进行存空间回收。 JDBC连接池:连接池的初始容量和最大容量应该设置为相等,并且至少等 于执行线程的数量,以避免在运行过程中创建数据库连接所带来的性能消耗。检查WEBLOG B志文件是否有异常报错如果有WEBLOG集
10、群酉己置,需要检查集群的配置是否正常。3运维服务流程XXX公司建议用户采用的服务方式为两种:一种为技术人员现场值守,另一种 是定期巡检结合故障现场服务。技术人员现场值守运行维护服务的基本操作流程如下图所示:5. 3突发事件应急策略386服务团队40IT资源悄况汇总技术人协用户现场值守,口常状态监控主动式信息系统性能侦测故障现场解决备件更换故障现场解决冲记录捉交给用户倍息系统运行维护报告记录到维护数据库和系统运行分析报告定期巡检结合故障现场运行维护服务的基本操作流程如下图所示:IT资懑悄况汇总用户故障报修备件更换fa用户现场遛检技术人员现场故琢解决用门签署3【障解决 单故绘记录遛检记录及系统可用
11、性分析提交给用户佶#系舟运行雉护报告和集统运行分折报告记录到运行雉护数棚曲4服务管理制度规4 1服务时间(1)接收服务请求和咨询:在5*8小时工作时间设置由专人职守的热线,接听部的服务请求z并记 录服务台事件处理结果。(2)在非工作时间设置有专人7*24小时接听的移动热线z用于解决部的技 术问题以及接听7*24小时机房监控人员的机房突发情况汇报。(3)服务响应时间:故障级别响应时间故障解决时间I级:属于紧急问题;其具体现象为:系统崩 溃导致业务停止、数据丢失。30分钟,2小时提交 故嚏处理方案12小时以n级:属于严重问题;其具体现象为:出现 部 分部件失效、系统性能下降但能正常运行,不 影响正
12、常业务运作。30分钟f 2小时提交 故障处理方案24小时以In级:属于较严重问题;其具体现象为:出现 系统报错或警告,但业务系统能继续运行且性 能不受影响。30分钟,2小时提交 故嚏处理方案48小时以IV级:属于普通问题;其具体现象为:系统 技术功能、安装或配置咨询,或其他显然不影 响业务的预约服务。30分钟,2小时提交 故障处理方案5天技术支持人员在解决故障时,会最大限度保护好数据,做好故障恢复的文档,力争恢复到故障点前的业招状态。对于系统瘫痪,业务系统不能运转的 故障级别,如果不能于12小时解决故障,XXX公司将在16小时提出应急方 案,确保业务系统的运行。故障解决后24小时z提交故 障处
13、理报告。说明故障 种类、故障原因、故障解决中使用的方法及故瞳损失等盾况。4. 2行为规(1)遵守用户的各项规章制度,严格按照用户相应的规章制度办事。(2)与用户运行维护体系其他部门和环节协同工作,密切配合,共同开展技术支持工作。(3)出现疑难技术、业务问题和重大紧急情况时,及时向负责人报告。(4)现场技术支捋时要精神饱满,穿看得体,谈吐文明,举止庄重。接听时要文明礼貌,语言清晰明了,语气和善。(5)遵守原则。对被支捋单位的网络、主机、系统软件、应用软件等的密码、核心参数、业务数据等负有责任,不得随意复制和传播。4. 3现场服务支持规运维服务人员要做到耐心、细心、热心的服务。工作要做到事事有记录
14、、事 事有反馈、重大问题及时汇报。严格遵守工作作息时间,严格按照服务工作流程操作。(1)现场支持工程师应看装整洁、言行礼貌大方,技术专业,操作熟练、严谨、 规;现场支捋时必须遵守用户单位的相关规章制度。(2)现场支持工程师在进行现场支持工作时必须在保证数据和系统安全的前提下开展工作。(3)现场支捋时出现暂时无法解决的故障或其他新的故障时,应告知用户并及时上报负责人,寻找其他解决途径。(4)故障解决后,现场支捋工程师要详细记录问题的发生时间、地点、提出人和问题 描述,并形成书面文档,必要时应向用户介绍故障出现的原因 及预防方法和解 决技巧。4 4问题记录规根据使用人员提出问题的类别,将问题分为咨
15、询类问题和系统缺陷类问题二类:咨 询类问题是指通过服务热线或现场解疑等方式能够当场解决用户提出的问题,具有问题 解答直接、快速和实时的特点,该问题到现场支持人员处即可中止,对于该类问题的记 录可使用咨询类问题记录模版进行记录。系统缺陷类问题是指使用人员提出的问题涉及 到系统相应环节的确认修改,需要经过逐级提交、诊断、确认、处理和回复等环节,处理 解决需要XXX公司项目组的分析确认,问题有 解决方案后,将解决方案反馈给用户。具 体提交流程如下:(1)问题提交。应用信息系统的用户发现属于系统缺陷类的问题时,填写系统缺陷 类问题提交单,提交服务支捋中心。(2)问题分析。服务中心接到用户提交的问题单,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 硬件 设备 方案设计
限制150内