信息技术管理中心运维制度及流程.pdf
《信息技术管理中心运维制度及流程.pdf》由会员分享,可在线阅读,更多相关《信息技术管理中心运维制度及流程.pdf(28页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 信息技术管理中心运维制度及流程 集团标准化工作小组#Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#运行维护管理制度 目 录 一、总则 第一条 为保障信息系统软硬件设备的良好运行,使员工的运维工作制度化、流程化、规范化,特制订本制度。第二条 运维工作总体目标:立足根本促发展,开拓运维新局面。在企业发展壮大时期,通过对网络、桌面、系统等的运维,促进企业稳定可持续性发展。第三条 运维管理制度的适用范围:运维部全体人员。二、编制方法 本实施细则包括运维服务全生命周期管理方法、管理标准/规范、管理模式、管理支撑工具、管理对象以及基于流程的管理方法。本实施细则以ITIL/ISO20000为
2、基础,以信息化项目的运维为目标,以管理支撑工具为手段,以流程化、规范化、标准化管理为方法,以全生命周期的PDCA循环为提升途径,体现了对运维服务全过程的体系化管理。三、运行维护管理工作的基本任务 1、进行信息系统的维护管理,实时监控系统运行状态,保证系统各类运行指标符合相关规定。2、迅速而准确地定位和排除各类故障,保证信息系统正常运行,确保所承载的各类应用和业务正常。3、进行系统安全管理,保证信息系统的运行安全和信息的完整、准确。4、在保证系统运行质量的情况下,提高维护效率,降低维护成本。四、运维服务管理体系 运维服务管理体系规定了运维活动涉及的各类实体,以及这些实体间的相互关系。相关的实体按
3、照运维服务管理体系进行有机组织,并协调工作,按照服务协议要求提供不同级别的IT运维服务。运维服务管理对象 运维服务管理对象包括基础设施、应用系统、用户、供应商、以及IT运维部门和人员,具体内容如下:(1)基础设施包括网络、主机系统、存储/备份系统、终端系统、安全系统、以及机房动力环境等。(2)应用系统包括内部办公系统、门户网站、面向公众的应用系统等。(3)用户包括使用如上应用系统的用户。(4)供应商包括基础设施和应用系统的供应商以及IT运维服务的供应商。(5)运维部门和人员包括内部参与运维活动的相关部门和人员,以及提供运维服务的企业和相关人员。运维系统功能框架 根据建设单位的系统结构和业务开展
4、需要,运维项目组将项目的维护框架分为9个具体组成部分,分别为:服务台、时间管理。工单管理、问题管理、变更管理、配置管理、工程师考核、知识库管理、统计、系统管理等9个子项。而具体运维流程将以此为依据开展工作。运维管理组织结构 本运维项目的运维管理结构为三层模式,具体如下图所示。由项目负责人与甲方进行业务内容的接洽,并将沟通结果向下传递。项目经理负责项目的整体运维工作,包括各种制度的制定和实施,其他运维相关技术人员与非技术人员则在项目经理的指导下开展职责内工作。职责:负责项目商务与其他相关业务方面的事宜协调。职位描述:1)、整体负责建设单位运维项目服务计划的制定,领导项目经理并安排项目工作,指导项
5、目经理完成具体维护工作,每周听取项目经理的工作汇报,负责考核项目经理工作完成情况。2)、协助建设单位完成新增项目的调研、方案设计并指导项目经理进行具体实施。职责:规划、执行、完善信息化项目的具体运维工作,直接管理服务台并指导网络、终端以及数据库管理人员开展工作。职位描述:1、根据公司战略目标,指导下属开展客户服务工作,确保运维工作能够满足客户的实际需要;2、建立和持续完善运维管理体系,优化运维流程,解决运维服务中出现的特殊问题;3、规划并提升运维工程师专业服务能力,在整体上提高客户满意度;4、制定和持续完善绩效考核体系;5、制定、整理运维项目的应急预案系统,并指导运维工程师实施;6、提高自身专
6、业技能,在业务方面给予网络管理员和数据库管理员指导。职责:数据库管理,oracle性能调优,实现应用负载均衡。职位描述:1、负责数据库性能分析与调优,数据库运行状态监控,及时发现异常并快速处理。2、熟练掌握Oracle10G的RAC技术,能够实现部署及调优。3、掌握WAS、Weblogic、Tomcat、websphere等中间件的工作原理,能够实现部署调优及故障解决。4、熟练掌握red-flag、redhat等linux操作系统,部署oracle10g、mysql数据库。熟练掌握dataguard技术,保证oracle数据库冗灾、数据保护、故障恢复。5、负责应用负载均衡的部署和调试。6、负责
7、指导数据库工程师管理员开展工作。职责:故障电话受理,文档管理。职位描述 1、负责业务方面的救助电话受理工作;2、故障处理的发起人,同时进行维护工程师指派,跟踪事件后续处理;3、进行维护故障统计、用户满意度统计、工作报表输出等工作;4、协助项目经理,进行文档整理、归类、保存等工作。职责:维护建设单位网络系统正常,解决网络相关故障。职位描述:1、对现有服务器、局域网络及机房、配线间的日常管理维护;2、对信息安全建设提出相关建议,确保网络的安全;3、保证外网光纤线路正常,保证局域网运行正常;4、对网络系统和网络设备的运行状态进行监控;5、熟练掌握域策略设置、DHCP、DNS、FTP 服务器、NTFS
8、 权限设置等;6、编写网络部分的应用处理预案并实施。应用、数据库管理员 职责:维护建设单位业务系统运行正常,解决应用和数据库故障。职位描述:1、监测业务系统运行状况,对应用系统和数据库性能的监视及优化;2、规划不同数据的生命周期,制订备份、恢复和灾备策略,根据业务的需要执行数据转换及迁移等操作;3、保证应用和数据库系统的安全性、完整性和运行效率。4、负责数据库平台的整体架构及解决方案的制定和实施;5、工作认真、细致,积极主动有条理性,具有良好的沟通能力及团队合作精神.职责:维护建设单位桌面系统运行正常,解决终端、外设故障。职位描述:1、各部门电脑、打印机、传真机的维护;2、对各部门职员进行电脑
9、相关的技术支持及培训工作;3、精通Windows XP及Office的使用,能够熟练使用Excel2003、Word2007及以上版本,能够制作相应教程对其他部门员工进行培训。.运维服务流程 IT 运维服务管理流程涉及服务台、事件管理、问题管理、配置管理、变更管理、发布管理、服务级别管理、财务管理、能力管理、可用性管理、服务持续性管理、知识管理及供应商管理等,随着运维活动的不断深入和持续改进,其他流程也会逐步独立并规范。服务台是支持运维服务的核心功能,与各个流程联系密切。所有管理流程都要通过服务台为用户提供单点联系,解答用户的相关问题和需求并为用户寻求相应的支持人员。在本系统中,服务台是接收各
10、种来源服务请求和相关信息反馈的唯一入口和出口,同时服务台还负责通过知识库(历史事件)解决相应请求,由此可看出服务台也是问题二次处理的主要输出方式。事件管理流程的主要目标是尽快恢复服务提供并减少其对业务的不利影响,尽可能保证最好的服务质量和可用性等级。事件管理流程通常涉及事件的侦测和记录、事件的分类和支持、事件的调查和诊断、事件的解决和恢复以及事件的关闭。本系统把所有服务请求和报警归结为事件。事件管理是提供服务台和事件管理者对于事件记录、处理、查询、审核、派发等功能。它也包括通过和第三方监控系统对接,完成发送报警从而形成事件的功能。工单管理 工单管理:工单是现场运维、二线支持的任务载体,运维工程
11、依据所接收工单进行运维工作。工单管理是对工单实现创建、变更、查询、浏览、派发、监督等功能的模块。问题管理流程的主要目标是预防问题和事故的再次发生,并将未能解决的事件的影响降低到最小。问题管理流程包括诊断事件根本原因和确定问题解决方案所需要的活动,通过合适的控制过程,尤其是变更管理和发布管理,来确保解决方案的实施。问题管理还将维护有关问题、应急方案和解决方案的信息。问题管理是针对已处理事件的遗留问题或处理事件的方案只是治标不治本的不能彻底解决问题而考虑的模块。根据事件、及处理方案,问题处理人经过调查、诊断并提出最终解决方法。变更管理实现所有基础设施和应用系统的变更,变更管理应记录并对所有要求的变
12、更进行分类,应评估变更请求的风险、影响和业务收益。其主要目标是以对服务最小的干扰实现有益的变更。变更管理是要对重大资源的新增、变更、升级等运维活动进行审核的功能,以免这些活动对现有资源的可用性造成没有必要的影响和破坏;同时,他还要实现在工单中产生的变化进行后审计的功能。配置管理流程负责核实基础设施和应用系统中实施的变更以及配置项之间的关系是否已经被正确记录下来;确保配置管理数据库能够准确地反映现存配置项的实际版本状态。配置管理实际上是全部资源的统一管理的功能,包括资源整个生命周期的参数或配置的变化记录的管理。管理信息主要涉及分类、型号、版本、位置,状态、相关资料等基本信息还包括核心参数等 知识
13、库管理:知识库是提供给运维人员重要的技术资料内容,他汇集在工作的遇到的典型案例归纳总结的知识要点和全面实用资料手册。在本系统中,知识库管理提供便于使用的人机接口、快速查询的技术手段和维护手段。运维管理系统提供一线解决率统计、客户满意度统计、按分类的事件汇总统计、工作报告生成的功能,按照一定格式根据事件数据、工单数据、问题数据、配置数据、变更数据可以帮助运维管理者能把运维的所做的工作内容清晰的罗列出来。运维服务内容 运维项目组提供的运行维护服务包括,信息系统相关的主机设备、操作系统、数据库和存储设备的运行维护服务,保证用户现有的信息系统的正常运行,降低整体管理成本,提高网络信息系统的整体服务水平
14、。同时根据日常维护的数据和记录,提供用户信息系统的整体建设规划和建议,更好的为用户的信息化发展提供有力的保障。用户信息系统的组成主要可分为两类:硬件设备和软件系统。硬件设备包括网络设备、安全设备、主机设备、存储设备等;软件设 备可分为操作系统软件、典型应用软件(如:数据库软件、中间件软件等)、业务应用软件等。服务项目范围覆盖的信息系统资源以下方面的关键状态及参数指标:运行状态、故障情况 配置信息 可用性情况及健康状况性能指标 服务内容包括:硬件设备型号、数量、版本等信息统计记录 软件产品型号、版本和补丁等信息统计记录 网络结构、网络路由、网络 IP 地址统计记录 综合布线系统结构图的绘制 其它
15、附属设备的统计记录 从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的运维管理。设备基础性能检测:cpu、内存使用情况监测;设备日志查看;设备 snmp 状态;测试 Ping,tracert 等工具的连通性;网络安全策略应用是否正常;Internet 带宽流量的实时监测;网络拓扑链路状态监测;异常网络数据包流量;Dos、ddos 等网络攻击情况监测;Internet 线路的误码率、丢包率监测;提供的主机、存储系统的运维服务包括:主机、存储设备的日常监控,设备的运行状态监控,故障处理,操作系统维护,补丁升级等内容。进行监控管理的内容包括:CPU 性能管理;内存使用情况管理;硬盘利
16、用情况管理;系统进程管理;主机性能管理;实时监控主机电源、风扇的使用情况及主机机箱内部温度;监控主机硬盘运行状态;监控主机网卡、阵列卡等硬件状态;监控主机 HA 运行状况;主机系统文件系统管理;监控存储交换机设备状态、端口状态、传输速度;监控备份服务进程、备份情况(起止时间、是否成功、出错告警);监控记录磁盘阵列、磁带库等存储硬件故障提示和告警,并及时解决故障问题;对存储的性能(如高速缓存、光纤通道等)进行监控。提供的数据库运行维护服务是包括主动数据库性能管理,数据库的主动性能管理对系统运维非常重要。通过主动式性能管理可了解数据库的日常运行状态,识别数据库的性能问题发生在什么地方,有针对性地进
17、行性能优化。同时,密切注意数据库系统的变化,主动地预防可能发生的问题。进行监控管理的内容包括:数据库基本信息:文件系统、碎片、死锁、CPU 占用率较大或时间较长的 SQL 语句。表空间使用信息监测;数据库文件 I/0 读写情况;Session 连接数量监控;数据库监听运行状态监测;查看每日数据备份、数据同步是否正常;报警日志监测;对表和索引进行 Analyze,检查表空间碎片;检测数据库后台进程;数据库对象的空间扩展情况监测;中间件管理是指对 BEA Weblogic、tomcat、MQ 等中间件的日常维护管理和监控工作,提高对中间件平台事件的分析解决能力,确保中间件平台持续稳定运行。中间件监
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息技术 管理中心 制度 流程
限制150内