《2022年运维制度及流程推荐 .pdf》由会员分享,可在线阅读,更多相关《2022年运维制度及流程推荐 .pdf(22页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、运行维护管理制度名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 22 页 - - - - - - - - - - 1 - 目 录1、总则 . - 2 -2、编制方法. - 3 -4、运维服务管理体系. - 5 -4.1 运维服务管理对象 . - 5 -4.2 运维系统功能框架. - 5 -4.3 运维管理组织结构 . - 6 -4.3.1项目负责人 . - 7 -4.3.2项目经理 . - 7 -4.3.3技术主管 . - 8 -4.3.4服务台 . - 9 -4.3.5
2、网络管理员 . - 9 -4.3.5应用、数据库管理员. - 10 -4.3.7终端管理员 . - 10 -4.4 运维服务流程 . - 11 -4.4.1网站运维服务工作流程图. - 11 -4.4.2服务台 . - 12 -4.4.3事件管理 . - 12 -4.4.4工单管理 . - 12 -4.4.5问题管理 . - 13 -4.4.6变更管理 . - 13 -4.4.7配臵管理 . - 14 -4.4.8知识库管理 . - 14 -4.4.9运维工作报告及考核. - 14 -5、运维服务内容. - 14 -5.1 服务目标 . - 14 -5.2IT 资产统计服务 . - 15 -5
3、.3 网络、安全系统、监控平台运维服务. - 15 -5.4 主机系统运维服务 . - 16 -5.5 数据库系统运维服务 . - 17 -5.6 中间件的运维服务 . - 17 -5.7 终端、外设运维服务 . - 18 -6、应急服务响应措施. - 18 -名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 22 页 - - - - - - - - - - 2 - 6.1 应急预案实施基本流程 . - 19 -6.2 突发事件应急策略 . - 19 -7、服务管理制度规范
4、. - 20 -7.1 服务时间 . - 20 -1、总则第一条为保障公司信息系统软硬件设备的良好运行,使员工的运维工作制度化、流程化、规范化,特制订本制度。第二条运维工作总体目标:立足根本促发展,开拓运维新局面。在企业发展壮大时期,通过网络、桌面、系统等的运维,促进企业稳定可持续性发展。第三条运维管理制度的适用范围:运维部全体人员。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 22 页 - - - - - - - - - - 3 - 2、编制方法本实施细则包括运维服务
5、全生命周期管理方法、管理标准/ 规范、管理模式、管理支撑工具、管理对象以及基于流程的管理方法。本实施细则以信息化项目的运维为目标,以流程化、规范化、标准化管理为方法,体现了对运维服务全过程的体系化管理。3、运维部工作职责一、负责网站运维和技术支持(一)根据网站运营战略和目标,负责网站整体架构、栏目、应用系统等技术开发方案制定和组织开发,保障网站技术的稳定性和先进性。(二)负责网站栏目和应用系统的使用培训和操作使用指南编写,对用户使用过程中出现问题的沟通和解决;(三)网站设备和软件购买计划书的拟定,包括采购数量、品牌规格、技术参数。会同行政部进行采购。(四)网站设备和软件操作规程和应用管理制度的
6、制定,并负责监督执行。(五)网站设备和软件安装、 调试和验收,使用培训和维修保养。(六)网站日常运行过程中信息安全和技术问题的协调解决,保障网站 24*7 小时安全稳定运行。(七)网站技术服务外包管理,主要包括技术外包开发、运行服名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 22 页 - - - - - - - - - - 4 - 务托管和空间域名管理。(八)负责网站管理系统及设备保密口令的设臵和保存,保密口令设定后任何人不得随意更改,保密口令每季度更新一次。二、负责网
7、站信息和技术安全(一)执行国家和省上有关网络信息技术安全的法律法规,与通信管理和网络安全监管部门联络, 及时处理网站信息技术安全方面存在的问题,确保网站安全、稳定、可靠运行。(二)网站信息技术安全保密制度和工作流程的制定,落实信息技术安全保密责任制,执行“谁主管、谁负责,谁主办、谁负责”的原则,责任到人。( 三 ) 在服务器和计算机之间设臵硬件防火墙,在服务器及工作站上均安装防病毒软件, 进行硬件和技术双保护, 确保网站不受病毒和黑客攻击。(四)负责网站信息技术安全应急处理预案制定和实施。(五)建立多机备份网站信息服务系统机制,一旦主系统遇到故障或受到攻击导致不能正常运行, 可以在最短的时间内
8、替换主系统提供服务。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 22 页 - - - - - - - - - - 5 - 4、运维服务管理体系运维服务管理体系规定了运维活动涉及的各类实体,以及这些实体间的相互关系。相关的实体按照运维服务管理体系进行有机组织,并协调工作,按照服务协议要求提供不同级别的IT运维服务。4.1 运维服务管理对象运维服务管理对象包括基础设施、应用系统、用户、供应商、以及IT运维部门和人员,具体内容如下:(1) 基础设施包括网络、主机系统、存储/
9、 备份系统、终端系统、安全系统等。(2) 应用系统包括内部办公系统、 门户网站、 面向公众的应用系统等。(3) 用户包括使用如上应用系统的用户。(4) 供应商包括基础设施和应用系统的供应商。4.2 运维系统功能框架根据公司的系统结构和业务开展需要,运维项目组将项目的维护框架分为 9个具体组成部分,分别为:服务台、时间管理。工单管理、名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 22 页 - - - - - - - - - - 6 - 问题管理、变更管理、配臵管理、工程师
10、考核、知识库管理、统计、系统管理等 9个子项。而具体运维流程将以此为依据开展工作。4.3 运维管理组织结构本运维项目的运维管理结构位三层模式,具体如下图所示。 由项目负责人与甲方进行业务范围接洽,并将沟通结果向下传递。 项目经理负责项目的整体运维工作, 包括各种制度的制定和实施。 运维工程师则在项目经理的指导下开展维护工作。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 22 页 - - - - - - - - - - 7 - 4.3.1 项目负责人职责:负责项目商务、整
11、体协调事宜。职位描述:1)、整体负责建设单位运维项目服务计划的制定,领导项目经理并安排项目工作, 指导项目经理完成具体维护工作,每周听取项目经理的工作汇报,负责考核项目经理工作完成情况。2)、协助建设单位完成新增项目的调研、方案设计并指导项目经理进行具体实施。4.3.2 项目经理职责:规划、执行、完善信息化项目的运维工作,指导网络、数据库维护工程师开展工作。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 8 页,共 22 页 - - - - - - - - - - 8 - 职位描述:
12、1、根据公司战略目标,指导下属工程师开展客户服务工作,确保运维工作能够满足客户的实际需要;2、建立和持续完善运维管理体系,优化运维流程流程,解决运维服务中出现的特殊问题;3、规划并提升运维工程师专业服务能力,在整体上提高客户满意度;4、制定和持续完善绩效考核体系;5、制定整理运维项目的应急预案系统,并指导运维工程师实施;6、提高自身专业技能,在业务方面给予网络管理员和数据库管理员指导。4.3.3 技术主管职责:应用、数据库管理,SQL Server 2008 R2性能调优,实现应用负载均衡。职位描述:1、技术主管非项目常驻人员,根据项目需要进行专业方面指导;2、负责数据库性能分析与调优,数据库
13、运行状态监控,及时发现异常并快速处理。3、熟练掌握 SQL Server 2008 R2 HA技术,能够实现部署及调优。4、掌握IIS 、等中间件的工作原理, 能够实现部署调优及故障解决。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 9 页,共 22 页 - - - - - - - - - - 9 - 5、熟练掌握 VMWare Exsi虚拟化、 Windows Server 2008 R2 、redhat 等linux 操作系统,部署 SQL Server 2008 R2 数据库
14、。熟练掌握数据库镜像, 负载均衡技术,保证SQL Server 2008 R2数据库冗灾、数据保护、故障恢复。6、负责应用负载均衡的部署和调试。7、负责指导数据库工程师管理员开展工作。4.3.4 服务台职责:故障电话受理,文档管理。职位描述1、负责业务的救助电话的受理工作;2、故障处理的发起人,同时进行维护工程师指派,跟踪事件处理状态;3、进行维护故障统计、用户满意度统计、工作报表输出等工作;4、协助项目经理,进行文档整理、归类、保存等工作。4.3.5 网络管理员职责:维护建设单位网络系统正常,解决网络相关故障。职位描述:1、对现有服务器、局域网络及机房、配线间的日常管理维护;2、对信息安全建
15、设提出相关建议,确保网络的安全;3、保证外网光纤线路正常,保证局域网运行正常;4、对网络系统和网络设备的运行状态进行监控;5、熟练掌握域策略设臵、 DHCP 、DNS 、FTP服务器、NTFS权限设名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 10 页,共 22 页 - - - - - - - - - - 10 - 臵等;6、编写网络部分的应用处理预案并实施。7、工作认真、细致,积极主动有条理性,具有良好的沟通能力及团队合作精神 . 4.3.5 应用、数据库管理员职责:维护建设单位
16、业务系统运行正常, 解决应用和数据库故障。职位描述:1、监测业务系统运行状况,应用、数据库性能监视及优化,作必要调整;2、规划不同数据的生命周期,制订备份、恢复、迁移和灾备策略,根据业务的需要执行数据转换及迁移等操作;3、保证应用和数据库系统的安全性、完整性和运行效率。4、负责数据库平台的整体架构及解决方案的制定和实施;5、工作认真、细致,积极主动有条理性,具有良好的沟通能力及团队合作精神 . 4.3.7 终端管理员职责:维护建设单位桌面系统运行正常,解决终端、外设故障。职位描述 : 1、各部门电脑、打印机、传真机的维护;2、对各部门职员进行电脑相关的技术支持及培训工作;名师资料总结 - -
17、-精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 11 页,共 22 页 - - - - - - - - - - 11 - 3、精通 Windows 及Office 的使用,能够熟练使用 Excel2007、Excel2013及以上版本,能够制作相应教程对其他部门员工进行培训4.4 运维服务流程IT 运维服务管理流程涉及服务台、事件管理、问题管理、配臵管理、变更管理、发布管理、服务级别管理、财务管理、能力管理、可用性管理、服务持续性管理、知识管理及供应商管理等,随着运维活动的不断深入和持续改进,其他流程可能
18、会逐步独立并规范。4.4.1 网站运维服务工作流程图名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 12 页,共 22 页 - - - - - - - - - - 12 - 4.4.2 服务台服务台是支持运维服务的核心功能,与各个流程联系密切。所有管理流程都要通过服务台为用户提供单点联系,解答用户的相关问题和需求,或为用户寻求相应的支持人员。在本系统中 , 服务台是接收各种来源服务请求和相关信息反馈的唯一入口和出口,同时服务台还负责一般请求、通过知识库(历史事件)能够解决的请求;他也
19、是复杂问题二线处理的桥梁。4.4.3 事件管理事件管理流程的主要目标是尽快恢复服务提供并减少其对业务的不利影响,尽可能保证最好的服务质量和可用性等级。事件管理流程通常涉及事件的侦测和记录、 事件的分类和支持、事件的调查和诊断、事件的解决和恢复以及事件的关闭。本系统把所有服务请求和报警归结为事件。事件管理是提供服务台和事件管理者对于事件记录、处理、查询、审核、派发等功能。它也包括通过和第三方监控系统对接,把其发送报警形成事件的功能。4.4.4 工单管理工单管理:工单是现场运维、二线支持的任务载体,运维工程依据所接收工单进行运维工作。工单管理是对工单实现创建、变更、查名师资料总结 - - -精品资
20、料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 13 页,共 22 页 - - - - - - - - - - 13 - 询浏览、派发、监督等功能的模块。4.4.5 问题管理问题管理流程的主要目标是预防问题和事故的再次发生,并将未能解决的事件的影响降低到最小。 问题管理流程包括诊断事件根本原因和确定问题解决方案所需要的活动,通过合适的控制过程, 尤其是变更管理和发布管理, 负责确保解决方案的实施。 问题管理还将维护有关问题、应急方案和解决方案的信息。问题管理是针对已处理事件的遗留问题或处理事件的方案只是治标不治本
21、的不能彻底解决问题而考虑的模块。根据事件、及处理方案,问题处理人经过调查、诊断并提出最终解决方法。4.4.6 变更管理变更管理实现所有基础设施和应用系统的变更,变更管理应记录并对所有要求的变更进行分类,应评估变更请求的风险、 影响和业务收益。其主要目标是以对服务最小的干扰实现有益的变更。变更管理是要对重大资源的新增、变更、升级等运维活动进行审核的功能,以免这些活动对现有资源的可用性造成没有必要的影响和破坏;同时,在实现变更前对已有系统进行备份打包,确保可恢复。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - -
22、- - - - - 第 14 页,共 22 页 - - - - - - - - - - 14 - 4.4.7 配臵管理配臵管理流程负责核实基础设施和应用系统中实施的变更以及配臵项之间的关系是否已经被正确记录下来;确保配臵管理数据库能够准确地反映现存配臵项的实际版本状态。配臵管理实际上是全部资源的统一管理的功能,包括资源整个生命周期的参数或配臵的变化记录的管理。管理信息主要涉及分类、 型号、版本、位臵,状态、相关资料等基本信息还包括核心参数等4.4.8 知识库管理知识库管理:知识库是提供给运维人员重要的技术资料内容,他汇集在工作的遇到的典型案例归纳总结的知识要点和全面实用资料手册。在本系统中,知
23、识库管理提供便于使用的人机接口、快速查询的技术手段和维护手段。4.4.9 运维工作报告及考核每次运维完成后生成运维巡检报告,按照一定格式记录故障处理所做的工作内容清晰的罗列出来。根据运维巡检报告、系统无故障率生成KPI 考核报告5、运维服务内容5.1 服务目标运维项目组提供的运行维护服务包括,信息系统相关的主机设备、操作系统、数据库和存储设备的运行维护服务,保证用户现有的信息名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 15 页,共 22 页 - - - - - - - - - -
24、 15 - 系统的正常运行, 降低整体管理成本, 提高网络信息系统的整体服务水平。同时根据日常维护的数据和记录,提供用户信息系统的整体建设规划和建议,更好的为用户的信息化发展提供有力的保障。用户信息系统的组成主要可分为两类:硬件设备和软件系统。硬件设备包括网络设备、安全设备、主机设备、存储设备等;软件设备可分为操作系统软件、典型应用软件(如:数据库软件、中间件软件等) 、业务应用软件等。服务项目范围覆盖的信息系统资源以下方面的关键状态及参数指标:运行状态、故障情况配臵信息可用性情况及健康状况性能指标5.2IT 资产统计服务服务内容包括:硬件设备型号、数量、版本、所在机柜等信息统计记录软件产品型
25、号、版本和补丁等信息统计记录网络结构、网络路由、网络IP 地址统计记录综合布线系统结构图的绘制其它附属设备的统计记录5.3 网络、安全系统、监控平台运维服务从网络的连通性、网络的性能、网络的监控管理三个方面实现对网络系统的运维管理。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 16 页,共 22 页 - - - - - - - - - - 16 - 设备基础性能检测: cpu、内存使用情况监测;设备日志查看;设备 snmp状态;测试 Ping,tracert等工具的连通性;网络安全
26、策略应用是否正常;Internet带宽流量的实时监测;网络拓扑链路状态监测;异常网络数据包流量;Dos 、ddos 等网络攻击情况监测;Internet线路的误码率、丢包率监测;通过监控平台的预警机制,及时响应5.4 主机系统运维服务提供的主机、存储系统的运维服务包括:主机、存储设备的日常监控,设备的运行状态监控,故障处理,操作系统维护,补丁升级等内容。进行监控管理的内容包括:CPU 性能管理;内存使用情况管理;硬盘利用情况管理;系统进程管理;主机性能管理;实时监控主机电源、风扇的使用情况及主机机箱内部温度;监控主机硬盘运行状态;监控主机网卡、阵列卡等硬件状态;名师资料总结 - - -精品资料
27、欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 17 页,共 22 页 - - - - - - - - - - 17 - 主机系统文件系统管理;监控存储交换机设备状态、端口状态、传输速度;监控备份服务进程、备份情况(起止时间、是否成功、出错告警) ;5.5 数据库系统运维服务提供的数据库运行维护服务是包括主动数据库性能管理,数据库的主动性能管理对系统运维非常重要。通过主动式性能管理可了解数据库的日常运行状态, 识别数据库的性能问题发生在什么地方,有针对性地进行性能优化。同时,密切注意数据库系统的变化,主动地预防可能
28、发生的问题。进行监控管理的内容包括:数据库基本信息:内存占用率、死锁、CPU 占用率较大或时间较长的 SQL语句、执行频率最高的前50 条 SQL 。查看每日数据备份、数据同步、数据作业是否正常;报警日志监测;检测数据库镜像的健康状况检测数据库镜像的日志同步状况5.6 中间件的运维服务中间件管理是指对IIS 、Nginx、MQ 等中间件的日常维护管理和监控工作,提高对中间件平台事件的分析解决能力,确保中间件平台持续稳定运行。中间件监控指标包括配臵信息管理、故障监控、性能监控。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精
29、心整理 - - - - - - - 第 18 页,共 22 页 - - - - - - - - - - 18 - 检查中间件日志文件是否有异常报错如果有中间件集群配臵,需要检查集群的配臵是否正常。5.7 终端、外设运维服务负责对终端 PC 、笔记本以及工作站的操作系统、应用软件和硬件的维护,解决使用人员在应用过程中遇到的问题并进行简单培训,完成打印机等其他外设的故障处理工作。6、应急服务响应措施运维项目组制定了详尽的应急处理预案,整个流程严谨而有序。但在服务维护过程中, 意外情况将难以完全避免。 我们将对项目实施的突发风险进行详细分析, 并且针对各类突发事件, 设计了相应的预防与解决措施,同时
30、提供了完整的应急处理流程。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 19 页,共 22 页 - - - - - - - - - - 19 - 6.1 应急预案实施基本流程6.2 突发事件应急策略(1)值班人员平时应做好应急事件的监控工作,对于突发事件应认真分析、准确判定故障发生的数据域, 负责跟踪该事件直至其结束。对于不在运维中心的故障,应在第一时间内通知负责人去现场处理,密切关注事件流程及进展情况,并做好登记工作上报领导。(2)正常情况下,要求值班人员在10 分钟内进行事件确
31、认。如果属于一般事件则按照事件流程进行分派处理,否则应迅速启动 应急预案 ,并严格按照应急预案所规定的步骤快速实施应急处臵,及时汇报上级领导,掌握实时处理情况。(3)在处理过程中,如需其他部门去现场增援处理,应及时向上已解决扩大应急发现故障启动应急预案,并通知领导按事件流程处理初步判定故障恢复联系技术支持处理联系开发人员或硬件厂家工程师现场处理一般事件突发事件总结,修订应急预案已解决未解决突发事件应急组未解决已解决汇报进度汇报进度汇报增援记录名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - -
32、 第 20 页,共 22 页 - - - - - - - - - - 20 - 级领导部门汇报, 协调沟通, 尽快联系技术工程师或厂家技术支持赶赴现场援助处理。7、服务管理制度规范7.1 服务时间(1) 在 5*8 小时工作时间内设臵由专人职守的热线电话,接听内部的服务请求,并记录事件处理结果。(2) 在非工作时间设臵有专人7*24 小时接听的移动电话热线,用于解决内部的技术问题以及接听7*24 小时机房监控人员的机房突发情况汇报。(3) 服务响应时间:故障级别响应时间故障解决时间I 级:属于紧急问题; 其具体现象为:系统崩溃导致业务停止、数据丢失。10 分钟,30 分钟内提交故障处理方案3
33、小时以内II级:属于严重问题;其具体现象为:出现部分部件失效、系统性能下降但能正常运行,不影响正常业务运作。10 分钟,30 分钟内提交故障处理方案6 小时以内III级:属于较严重问题; 其具体现象为:出现系统报错或警告,10 分钟,30 分钟内提交故障12 小时以内名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 21 页,共 22 页 - - - - - - - - - - 21 - 但业务系统能继续运行且性能不受影响。处理方案IV 级:属于普通问题;其具体现象为:系统技术功能、安装或配臵咨询,或其他显然不影响业务的预约服务。10 分钟,2 小时内提交故障处理方案24 小时以内7.2 行为规范(1) 遵守用户的各项规章制度,严格按照用户相应的规章制度办事。(2) 与用户运行维护体系其他部门和环节协同工作,密切配合,共同开展技术支持工作。(3) 出现疑难技术、业务问题和重大紧急情况时,及时向负责人报告。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 22 页,共 22 页 - - - - - - - - -
限制150内