2022年运行维护管理制度.docx
精选学习资料 - - - - - - - - - 1、总就第一条:为保证公司信息系统软硬件设备的良好运行,流程化、标准化,特制订本制度;使职工的运维工作制度化、其次条:运维工作总体目标:立足根本促进展,开拓运维新局面;在企业进展壮 大时期,通过网络、桌面、系统等的运维,促进企业稳固可连续性进展;第三条:运维治理制度的适用范畴:运维部全体人员;2、编制方法本实施细就包括运维服务全生命周期治理方法、治理标准 理支撑工具、治理对象以及基于流程的治理方法;/ 标准、治理模式、管本实施细就以 ITIL/ISO20000 为基础,以信息化项目的运维为目标, 以治理支撑 工具为手段,以流程化、标准化、标准化治理为方法,以全生命周期的 PDCA循 环为提升途径,表达了对运维服务全过程的体系化治理;3、运维部工作职责 一、负责网站运维和技术支持一依据网站运营战略和目标,负责网站整体架构、栏目、应用系统等技术开 发方案制定和组织开发,保证网站技术的稳固性和先进性;二负责网站栏目和应用系统的使用培训和操作使用指南编写,对用户使用过 程中显现问题的沟通和解决;三网站设备和软件购买方案书的拟定,会同行政部进行选购;包括选购数量、 品牌规格、技术参数;四网站设备和软件操作规程和应用治理制度的制定,并负责监督执行;五网站设备和软件安装、调试和验收,使用培训和修理保养;六网站日常运行过程中信息安全和技术问题的和谐解决,保证网站 24 小时 安全稳固运行;七网站技术服务外包治理, 主要包括技术外包开发、 运行服务托管和空间域 名治理;八负责网站治理系统及设备保密口令的设置和储存,保密口令设置后报中心主任备案, 保密口令设定后任何人不得随便更换,保密口令每季度更新一次;九负责网站新程序、新系统和网站改版升级方案技术的设计开发;名师归纳总结 - - - - - - -第 1 页,共 11 页精选学习资料 - - - - - - - - - 二、负责网站信息和技术安全一执行国家和省上有关网络信息技术安全的法律法规,与通信治理和网络安全监管部门联络,准时处理网站信息技术安全方面存在的问题,确保网站安全、稳固、牢靠运行;二网站信息技术安全保密制度和工作流程的制定,落实信息技术安全保密责任制,执行“ 谁主管、谁负责,谁主办、谁负责” 的原就,责任到人; 三 在服务器和电脑之间设置硬件防火墙,在服务器及工作站上均安装防病毒 软件,进行硬件和技术双爱护,确保网站不受病毒和黑客攻击;四负责网站信息技术安全应急处理预案制定和实施;五支配专人监控网站各频道,各页面,各版块,各栏目信息内容,建立网站信息技术安全监控值班登记制度,记;发觉问题准时处理, 并登记问题和处理结果登六建立多机备份网站信息服务系统机制,一旦主系统遇到故障或受到攻击导致不能正常运行,可以在最短的时间内替换主系统供应服务;七建立网站系统集中式权限治理,依据岗位职责设定工作人员操作权限,针对不同应用系统、终端、操作人员,设置共享数据库信息的拜访权限,并设置密码;不同的操作人员设定不同的用户名,4、运维服务治理体系且定期更换,严禁操作人员泄漏密码;运维服务治理体系规定了运维活动涉及的各类实体,以及这些实体间的相互关系;相关的实体依据运维服务治理体系进行有机组织,议要求供应不同级别的 IT 运维服务;4.1 运维服务治理对象并和谐工作, 依据服务协运维服务治理对象包括基础设施、应用系统、用户、供应商、以及 IT 运维部门和人员,具体内容如下:1 基础设施包括网络、主机系统、储备 机房动力环境等;/ 备份系统、终端系统、安全系统、以及2 应用系统包括内部办公系统、门户网站、面对公众的应用系统等;3 用户包括使用如上应用系统的用户;4 供应商包括基础设施和应用系统的供应商以及IT 运维服务的供应商;名师归纳总结 - - - - - - -第 2 页,共 11 页精选学习资料 - - - - - - - - - 5 运维部门和人员包括内部参加运维活动的相关部门和人员,以及供应运维服务的企业和相关人员;4.2 运维系统功能框架运维项目组将项目的爱护框架分为9依据建设单位的系统结构和业务开展需要,个具体组成部分, 分别为:服务台、时间治理; 工单治理、 问题治理、 变更治理、配置治理、工程师考核、学问库治理、统计、系统治理等 流程将以此为依据开展工作;4.3 运维治理组织结构9 个子项;而具体运维本运维项目的运维治理结构位三层模式,具体如以下图所示; 由项目负责人与甲 方进行业务范畴接洽, 并将沟通结果向下传递; 项目经理负责项目的整体运维工 作,包括各种制度的制定和实施; 运维工程师就在项目经理的指导下开展爱护工 作;4.3.1 项目负责人 职责:负责项目商务、整体和谐事宜;职位描述:1、 整体负责建设单位运维项目服务方案的制定,领导项目经理并支配项目工作,指导项目经理完成具体爱护工作,每周听取项目经理的工作汇报,负责考核项目经理工作完成情形;2、帮助建设单位完成新增项目的调研、方案设计并指导项目经理进行具体实 施;4.3.2 项目经理 职责:规划、执行、完善信息化项目的运维工作,指导网络、数据库爱护工程师 开展工作;职位描述:1、依据公司战略目标,指导下属工程师开展客户服务工作,确保运维工作能够 满意客户的实际需要;2、建立和连续完善运维治理体系,优化运维流程流程,解决运维服务中显现的 特别问题;3、规划并提升运维工程师专业服务才能,在整体上提高客户中意度;名师归纳总结 - - - - - - -第 3 页,共 11 页精选学习资料 - - - - - - - - - 4、制定和连续完善绩效考核体系;5、制定整理运维项目的应急预案系统,并指导运维工程师实施;6、提高自身专业技能,在业务方面赐予网络治理员和数据库治理员指导;4.3.3 技术主管职责:应用、数据库治理,职位描述:oracle 性能调优,实现应用负载均衡;1、技术主管非项目常驻人员,依据项目需要进行专业方面指导;2、负责数据库性能分析与调优,数据库运行状态监控,准时发觉反常并快速处理;3、娴熟把握 Oracle10G 的 RAC技术,能够实现部署及调优;4、把握 WAS、Weblogic 、Tomcat、websphere 等中间件的工作原理,能够实现部署调优及故障解决;5、娴熟把握 red-flag、redhat 等 linux 操作系统,部署 oracle10g 、mysql数据库;娴熟把握 dataguard 技术,保证 oracle 数据库冗灾、数据爱护、故障复原;6、负责应用负载均衡的部署和调试;7、负责指导数据库工程师治理员开展工作;4.3.4 服务台职责:故障 受理,文档治理;职位描述:1、负责业务的救助 的受理工作;2、故障处理的发起人,同时进行爱护工程师指派,跟踪大事处理状态;3、进行爱护故障统计、用户中意度统计、工作报表输出等工作;4、帮助项目经理,进行文档整理、归类、储存等工作;4.3.5 应用、数据库治理员职责:爱护建设单位业务系统运行正常,解决应用和数据库故障;职位描述:1、监测业务系统运行状况,应用、数据库性能监视及优化,作必要调整;2、规划不同数据的生命周期,制订备份、复原、迁移和灾备策略,依据业务的名师归纳总结 - - - - - - -第 4 页,共 11 页精选学习资料 - - - - - - - - - 需要执行数据转换及迁移等操作;3、保证应用和数据库系统的安全性、完整性和运行效率;4、负责数据库平台的整体架构及解决方案的制定和实施;5、工作仔细、细致,积极主动有条理性,具有良好的沟通才能及团队合作精 神;4.3.6 终端治理员 职责:爱护建设单位桌面系统运行正常,解决终端、外设故障;职位描述 : 1、各部门电脑、打印机、机的爱护;2、对各部门职员进行电脑相关的技术支持及培训工作;3、熟知 Windows XP及 Office的使用,能够娴熟使用Excel2003、Excel2007及以上版本,能够制作相应教程对其他部门职工进行培训;4.4 运维服务流程 IT 运维服务治理流程涉及服务台、大事治理、问题治理、配置治理、变更治理、发布治理、 服务级别治理、 财务治理、 才能治理、 可用性治理、 服务连续性治理、学问治理及供应商治理等, 随着运维活动的不断深化和连续改良,其他流程可能 会逐步独立并标准;4.4.1 项目运维服务工作流程图4.4.2 服务台服务台是支持运维服务的核心功能,与各个流程联系亲密; 全部治理流程都要通过服务台为用户供应单点联系, 解答用户的相关问题和需求, 或为用户寻求相应 的支持人员;在本系统中 , 服务台是接收各种来源服务恳求和相关信息反馈的唯独入口和出 口,同时服务台仍负责一般恳求、通过学问库历史大事能够解决的恳求;他 也是复杂问题二线处理的桥梁;4.4.3 大事治理 尽可 大事治理流程的主要目标是尽快复原服务供应并削减其对业务的不利影响,能保证最好的服务质量和可用性等级;大事治理流程通常涉及大事的侦测和记名师归纳总结 - - - - - - -第 5 页,共 11 页精选学习资料 - - - - - - - - - 录、大事的分类和支持、大事的调查和诊断、大事的解决和复原以及大事的关闭;本系统把全部服务恳求和报警归结为大事;大事治理是供应服务台和大事治理者对于大事记录、处理、查询、审核、派发等功能;它也包括通过和第三方 监控系统对接,把其发送报警形成大事的功能;4.4.4 工单治理 工单治理: 工单是现场运维、 二线支持的任务载体, 运维工程依据所接收工单进 行运维工作;工单治理是对工单实现创建、变更、查询浏览、派发、监督等功能 的模块;问题治理 4.4.5 问题治理流程的主要目标是预防问题和事故的再次发生,并将未能解决的大事的影响降低到最小; 问题治理流程包括诊断大事根本缘由和确定问题解决方案所需 要的活动, 通过合适的掌握过程, 特别是变更治理和发布治理,负责确保解决方 案的实施; 问题治理仍将爱护有关问题、应急方案和解决方案的信息;问题管 理是针对已处理大事的遗留问题或处理大事的方案只是治标不治本的不能完全 解决问题而考虑的模块;依据大事、及处理方案,问题处理人经过调查、诊断并 提出最终解决方法;4.4.6 变更治理变更治理实现全部基础设施和应用系统的变更,变更治理应记录并对全部要求的变更进行分类, 应评估变更恳求的风险、 影响和业务收益; 其主要目标是以对服 务最小的干扰实现有益的变更;变更治理是要对重大资源的新增、变更、升级等运维活动进行审核的功能,以免这些活动对现有资源的可用性造成没有必要的影响和破坏;工单中产生的变化进行后审计的功能;4.4.7 配置治理同时,他仍要实现在配置治理流程负责核实基础设施和应用系统中实施的变更以及配置项之间的关 系是否已经被正确记录下来; 确保配置治理数据库能够精确地反映现存配置项的 实际版本状态;配置治理实际上是全部资源的统一治理的功能,包括资源整个生命周期的参数或配置的变化记录的治理;治理信息主要涉及分类、型号、版本、位置,状态、相名师归纳总结 - - - - - - -第 6 页,共 11 页精选学习资料 - - - - - - - - - 关资料等基本信息仍包括核心参数等;4.4.8 学问库治理学问库治理: 学问库是供应应运维人员重要的技术资料内容,他集合在工作的遇到的典型案例归纳总结的学问要点和全面有用资料手册;在本系统中, 学问库管理供应便于使用的人机接口、快速查询的技术手段和爱护手段;4.4.9 统计及工作报告运维治理系统供应一线解决率统计、客户中意度统计、按分类的大事汇总统计、工作报告生成的功能,依据肯定格式依据大事数据、工单数据、问题数据、配置数据、变更数据可以帮忙运维治理者能把运维的所做的工作内容清楚的排列出来;5、运维服务内容5.1 服务目标运维项目组供应的运行爱护服务包括,信息系统相关的主机设备、 操作系统、 数据库和储备设备的运行爱护服务,保证用户现有的信息系统的正常运行,降低整体治理成本, 提高网络信息系统的整体服务水平;同时依据日常爱护的数据和记录,供应用户信息系统的整体建设规划和建议,更好的为用户的信息化进展供应有力的保证;用户信息系统的组成主要可分为两类:硬件设备和软件系统; 硬件设备包括网络设备、安全设备、主机设备、储备设备等;软件设备可分为操作系统软件、典型应用软件如:数据库软件、中间件软件等、业务应用软件等;服务项目范围掩盖的信息系统资源以下方面的关键状态及参数指标:运行状态、故障情形;配置信息;可用性情形及健康状况性能指标5.2 IT 资产统计服务服务内容包括:硬件设备型号、数量、版本等信息统计记录;软件产品型号、版本和补丁等信息统计记录;网络结构、网络路由、网络 的绘制;其它附属设备的统计记录 5.3 网络、安全系统运维服务IP 地址统计记录;综合布线系统结构图从网络的连通性、 网络的性能、 网络的监控治理三个方面实现对网络系统的运维名师归纳总结 - - - - - - -第 7 页,共 11 页精选学习资料 - - - - - - - - - 治理;设备基础性能检测: cpu、内存使用情形监测; 设备日志查看; 设备 snmp状态;测试 Ping,tracert等工具的连通性;网络安全策略应用是否正常;Internet带宽流量的实时监测; 网络拓扑链路状态监测; 反常网络数据包流量; Dos、ddos等网络攻击情形监测; Internet 5.4 主机、储备系统运维服务线路的误码率、丢包率监测;供应的主机、储备系统的运维服务包括:主机、储备设备的日常监控,设备的运 行状态监控,故障处理,操作系统爱护,补丁升级等内容;进行监控治理的内容包括:CPU 性能治理;内存使用情形治理;硬盘利用情形治理;系统进程治理;主机性能治理;实时监控主机电源、风扇的使用情形及主 机机箱内部温度;监控主机硬盘运行状态;监控主机网卡、阵列卡等硬件状态;监控主机 HA运行状况;主机系统文件系统治理;监控储备交换机设备状态、端 口状态、传输速度;监控备份服务进程、备份情形起止时间、是否胜利、出错 告警;监控记录磁盘阵列、磁带库等储备硬件故障提示和告警,并准时解决故 障问题;对储备的性能如高速缓存、光纤通道等进行监控;5.5 数据库系统运维服务供应的数据库运行爱护服务是包括主动数据库性能治理,数据库的主动性能治理对系统运维特别重要; 通过主动式性能治理可明白数据库的日常运行状态,识别数据库的性能问题发生在什么地方,有针对性地进行性能优化; 同时,亲密留意数据库系统的变化,主动地预防可能发生的问题;进行监控治理的内容包括:1数据库基本信息:文件系统、碎片、死锁、CPU占用率较大或时间较长的 SQL 语句;2表空间使用信息监测;3数据库文件 I/0 读写情形;4Session 连接数量监控;5数据库监听运行状态监测;6查看每日数据备份、数据同步是否正常;7报警日志监测;名师归纳总结 8对表和索引进行Analyze, 检查表空间碎片;第 8 页,共 11 页- - - - - - -精选学习资料 - - - - - - - - - 9检测数据库后台进程;10数据库对象的空间扩展情形监测;5.6 中间件运维服务 中间件治理是指对 BEA Weblogic 、tomcat 、MQ等中间件的日常爱护治理和监控 工作,提高对中间件平台大事的分析解决才能,确保中间件平台连续稳固运行;中间件监控指标包括配置信息治理、故障监控、性能监控;· 执行线程:监控中间件配置执行线程的闲暇数量;· JVM内存: JVM内存曲线正常,能够准时的进行内存空间回收;· JDBC连接池:连接池的初始容量和最大容量应当设置为相等,并且至少 等于执行线程的数量,以防止在运行过程中创建数据库连接所带来的性能消 耗;· 检查中间件日志文件是否有反常报错· 假如有中间件集群配置,需要检查集群的配置是否正常;终端、外设运维服务 5.7 负责对终端 PC、笔记本以及工作站的操作系统、应用软件和硬件的爱护,解决使用人员在应用过程中遇到的问题并进行简洁培训,障处理工作;6、应急服务响应措施完成打印机等其他外设的故运维项目组制定了详尽的应急处理预案,整个流程严谨而有序; 但在服务爱护过程中,意外情形将难以完全防止;我们将对项目实施的突发风险进行具体分析,并且针对各类突发大事, 设计了相应的预防与解决措施,处理流程;6.1 应急预案实施基本流程 6.2 突发大事应急策略同时供应了完整的应急1值班人员平常应做好应急大事的监控工作,对于突发大事应仔细分析、准 确判定故障发生的数据域, 负责跟踪该大事直至其终止; 对于不在运维中心的故障,应在第一时间内通知负责人去现场处理,亲密关注大事流程及进展情形,并做好登记工作上报领导;2正常情形下, 要求值班人员在 10 分钟内进行大事确认; 假如属于一般大事名师归纳总结 - - - - - - -第 9 页,共 11 页精选学习资料 - - - - - - - - - 就依据大事流程进行分派处理,否就应快速启动应急预案,并严格依据应急预案所规定的步骤快速实施应急处置,况;准时汇报上级领导, 把握实时处理情3在处理过程中,如需其他部门去现场增援处理,应准时向上级领导部门汇报,和谐沟通,尽快联系技术工程师或厂家技术支持赶赴现场救济处理;7、服务治理制度标准7.1 服务时间1 在 5*8 小时工作时间内设置由专人职守的热线,接听内部的服务请求,并记录服务台大事处理结果;2 在非工作时间设置有专人 7*24 小时接听的移动 热线,用于解决内部的技术问题以及接听 7*24 小时机房监控人员的机房突发情形汇报;3 服务响应时间:7.2 行为标准1 遵守用户的各项规章制度,严格依据用户相应的规章制度办事;2 与用户运行爱护体系其他部门和环节协同工作,亲密协作,共同开展技术支持工作;名师归纳总结 3 显现疑难技术、业务问题和重大紧急情形时,准时向负责人报告;第 10 页,共 11 页- - - - - - -精选学习资料 - - - - - - - - - 4 现场技术支持时要精神饱满,穿着得体,谈吐文明,举止庄重;接听时要文明礼貌,语言清楚明白,语气和气;5 遵守保密原就;对被支持单位的网络、主机、系统软件、应用软件等的密码、核心参数、业务数据等负有保密责任,不得随便复制和传播;名师归纳总结 - - - - - - -第 11 页,共 11 页