ITIL服务管理流程手册(70页).doc





《ITIL服务管理流程手册(70页).doc》由会员分享,可在线阅读,更多相关《ITIL服务管理流程手册(70页).doc(70页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、-ITIL服务管理流程手册-第 70 页中国移动业务支撑网网管系统规范服务管理流程分册中国移动通信集团公司2004年4月目录1综述32运维管理流程详述42.1事件管理4事件管理描述4事件管理目的4事件管理范围5相关定义6流程职责/角色11主要内容12流程衡量标准13流程图举例16事件信息项182.2问题管理19问题管理描述19问题管理目的21问题管理范围21相关定义21职责/角色25主要内容25流程衡量标准26流程图举例28问题信息项312.3变更管理32描述32目的33范围33相关定义33职责/角色38主要内容39流程衡量标准41流程图举例44变更请求信息项462.4配置管理47描述47目的
2、48范围48相关定义49职责/角色52主要内容53流程衡量标准54流程图举例55常见配置元素属性表573运维管理流程关系和运维支持体系673.1运维流程相互关系673.2整体运维支持体系694附录714.1ITIL国际规范简介71ITIL国际规范简介71分阶段实施方法734.2名词解释761 综述本文作为中国移动业务支撑网网管规范附件之一,将详细描述本期中国移动业务支撑网网管的四大管理功能,及四大管理功能之关的关系,并借助于流程图的实例进行详细说明。运维管理流程包括:事件管理、问题管理、变更管理、配置管理,本附件将分别对其进行定义和描述,包括:管理目的、管理范围、主要内容、职责/角色规划、流程
3、示例等。在本附件最后,还简单介绍ITIL的相关内容和实施方法。2 运维管理流程详述根据本期业务支撑网网管系统建设目标,本期运维管理主要实现事件管理、问题管理、变更管理和配置管理,而管理流程是运维管理的主线,它将整个运维管理工作有机地联接起来,下面将对每个流程的内容及其实际应用做一个详细介绍。2.1 事件管理2.1.1 事件管理描述事件管理流程是为IT用户尽快回到正常工作状态而设计,其关心的重点是快速响应、快速恢复,使故障对业务的影响最小化。事件管理流程受事件触发和驱动,所谓事件,是指发生了非常规的运作情况,包括系统崩溃、软件故障、任何影响用户业务操作和系统正常运作的事情、以及影响业务流程或违背
4、服务水平协议的情况。事件也包括一个用户的请求,如,重设用户密码。不是所有的事件都由用户产生,监控管理平台产生的告警也可引发事件。通常由帮助台负责记录事件相关信息,向用户提供对已知问题的处理方法,报告事件和尽快恢复服务,目的是在事件管理阶段获得尽可能高的事件解决率。所有的事件应该基于相关配置元素的关键等级和影响度进行优先级分类。事件管理的责任是记录、分类、调查/诊断、解决已知问题、监控跟踪事件、与用户和问题管理流程交流、最终解决事件。2.1.2 事件管理目的事件管理流程的主要功能是尽快解决环境中出现的事件,保持IT环境的稳定性,其目的包括: 在成本允许的范围内尽快恢复服务v 快速响应系统监控产生
5、的故障或用户的电话请求v 在线获得帮助v 沟通问题解决的状态 进行事件控制v 记录事件v 就事件的优先级、紧急性和严重性进行分类v 分析、诊断,必要时进行升级v 监视,并结束事件 支持业务运行v 对业务应用提供二级支持v 解答有关如何使用的问题v 记录关于新服务的需求v 记录关于改变的请求 提供一个与业务部门的日常接口v 提供关于服务状态的信息更新v 新服务的报告v 关于即将到来的新服务或事件的通知v 进行事后回顾 提供IT管理信息v 人力利用情况v 服务可用性v 产品质量v 支持效率v 供应商服务情况2.1.3 事件管理范围 在BOSS系统运维范围内所指的事件,包括所有与IT基础架构和业务相
6、关的如下事件:v 申告v 故障v 咨询v 业务处理v 维护作业工科事件的产生有两类:v 由监控管理平台自动发现并产生的告警事件v 由用户/IT维护人员报告的事件但不包括:v 外部用户汇报的事件v 在开发和测试环境中的设备或系统产生的事件 “事件管理”流程不一定必须找到问题发生的根本原因,其重点在于如何在尽量短的时间内,恢复已经中断的IT服务,提高服务的可用性。2.1.4 相关定义 重分配规则事件的及时、正确分配和接手处理是确保事件在解决时限内解决的关键因素。一线和二线技术人员可以拒绝并根据重分配原则重新分配不属于自己运维范围的事件。 事件性质根据移动的业务要求和管理要求,按照事件性质定义如下六
7、类事件:性质描述申告针对BOSS系统的IT用户投诉故障指因BOSS系统错误或非正常因素由监控管理平台发现的告警事件咨询指对系统操作、业务流程等方面的求助和询问业务处理指需要运维人员进行后台数据处理的要求维护作业指运维人员的日常维护作业或临时进行的维护作业其他其他性质的事件。 事件来源当接到一个问题时,帮助台人员需要记录事件来源的类型。帮助台的事件来源可以包括以下:来源描述用户来自IT用户的事件可以有以下几种记录方式:l 电话/邮件/传真-来自用户/IT维护人员报告的事件l 自助开单-用户/支持人员发现问题,直接在服务台系统客户端开单l 客服平台-来自客服平台的事件l 其他-其他方式进入帮助台的
8、事件监控管理平台监控管理平台发现的告警事件,通过与服务管理平台接口发送告警信息到服务管理系统中 事件优先级优先级是事件管理的一个关键要素,优先级决定处理事件的顺序及所需的资源,事件优先级可分为四级,如下表所示:编号优先级1紧急2高3中4低事件的优先级分两个层面来定义和确认:l 帮助台帮助台在接到来自监控管理平台的告警事件或IT用户报告的事件时,迅速根据事件相关的业务/子业务或IT系统/设备的关键级别及事件的性质,定义该事件的优先级别。如果为紧急事件,立即升级到一线。对于监控管理平台上传的报警事件,应包含该事件相关联的配置元素的搜索代码,帮助台人员据此确定配置元素及其关键级别。帮助台人员可参考下
9、表确定事件优先级:事件优先级本次事件所对应CI的关键级别123事件性质故障1紧急高中2紧急中低3高低低申告高中低咨询/业务处理/维护作业中低低l 一线一线人员在接受到帮助台升级上来的事件后,根据该事件相关的业务或IT系统/设备的实际故障情况,并结合其他相关因素,再次确定事件优先级,如确实为紧急事件,则启动升级机制。确定事件优先级后,即可以确定事件的处理时限,优先级对应的事件解决时限参考下表:优先级紧急高中低解决时限(小时)482448 事件的升级事件升级的目的是确保基于事件的优先级等级及时通知有关技术人员和领导,引起更多的重视,提供合适的资源,从而快速找到解决事件的方案。可根据所要求的处理时间
10、定义事件优先级升级规则,包括不同等级的事件在不同的时间被升级到不同级别的人员:时间优先级即时响应+15分钟处理时限30%处理时限40%处理时限紧急ABD E F-高ABCDE中ABC -D低AB C -升级组群:A 帮助台 B 一线支持人员C二线支持人员D事件经理E管理层F 集团公司各省可以根据业务的实际情况调整升级标准。 事件分类根据移动目前的事件种类,事件的分类层次设计不超过三层,第一级分类,称之为“类别”,第二级分类,称之为”子类”,第三级分类,称之为”条目”。本规范给出第一级、第二级分类。各省市根据自己的情况决定是否要定义到第三层。下表为事件分类表举例:类别子类条目基础架构网络通讯系统
11、服务器存储系统系统软件操作系统数据库中间件双机热备软件系统监控软件业务采集计费结算客服业务管理账务管理账务处理一级BOSS拨测其他配套设施空调UPS机柜照明温湿度传感器外设其他 事件状态代码 事件状态代码表明事件所处的处理状态,本规范规定的事件状态如下:事件状态代码描述新建新开事件记录分配事件在帮助台一线处理 一线支持人员已接手处理事件 二线处理二线支持人员已接手处理事件供应商处理由供应商处理已解决 事件已找到解决方案关闭确认解决方案,事件得以关闭 事件结束代码事件结束代码说明了事件是在何种情况下关闭的,本规范规定的结束代码如下:事件结束代码描述暂时解决用变通办法暂时解决已解决帮助台由帮助台人
12、员成功解决一线解决由一线人员成功解决二线解决由二线人员成功解决第三方解决由第三方成功解决其他包括消失,误操作,可忽略等 处理是否超时事件超时代码描述未超时事件最后时限范围内结束超时事件未能在最后时限范围内结束2.1.5 流程职责/角色事件管理流程主要分为以下几个职责/角色,分别简述如下: 事件经理 作为事件流程的负责人,负责制定流程的规则、策略、步骤 调度资源,协调解决跨小组、部门的事件 指导日常操作,确保流程的执行符合预定的要求和规则 建立流程的衡量指标和报表 与用户、服务商和管理层交流流程的使用情况 确认和实施对流程的变更/改进计划 帮助台人员 在指定的响应时间内响应所有帮助台热线电话、邮
13、件、传真等事件报告 完整记录所有接收的事件信息,包括:记录事件报告人的详细联系方式、事件特征表现、描述、发生时间等 为事件进行适当的分类、为事件分配优先级等属性 尝试使用工具、初步诊断、分析相关信息等方式解决问题 如果帮助台不能解决这个事件,应当将事件分配给最合适的一线支持小组/人员来处理 检查事件记录的处理进度,保持与事件报告人的联系,适时通知事件处理进展 与用户确认事件解决方案,关闭事件 一线支持人员一线支持人员负责提供对帮助台无法解决的事件进行快速有效的分析并提出解决方案以尽快恢复服务,并在必要时提供现场支持。 验证事件的描述和信息,进一步收集相关信息 决定需要采取何种措施恢复服务并实施
14、有效的行动 必要时提供现场支持 根据优先级提供有效的解决方案 已解决的事件转回帮助台,由帮助台关闭事件 实施事件解决方案 更新事件解决信息,已解决的事件转回帮助台,由帮助台关闭事件 如果一线不能解决这个事件,应当决定选择最合适的二线支持小组/人员来处理 二线支持人员二线支持人员是相关问题领域的专家。负责提供对一线支持人员无法解决的问题进一步进行调研,找出解决方案并尽快恢复服务。各省可以考虑按照所维护的应用、系统进行分组,如,网络组、主机组等。 进行事件的深入调查研究 根据经验和专业技能,决定需要采取何种措施恢复服务并实施有效的行动 必要时引入供应商的支持 在系统中更新事件根源和最终解决方案 更
15、新事件记录,确保事件状态代码真实反映事件状态。 及时提供有效解决方案 与其他小组合作,确定解决方案 已解决的事件转回帮助台,由帮助台关闭事件 如果二线不能在解决时限内解决这个事件,应当将事件进行升级2.1.6 主要内容事件管理流程始于事件的探测和报告,结束于事件的解决。该流程包含下述主要内容: 事件接收和记录 这个环节是事件管理流程的起点。所有用户或系统报告的IT 事件必须由此步骤开始。此步骤的目的是在事件发生时快速准确地发现,以协助事件的诊断和解决并通知相关人员。在此步骤中将会收集创建事件记录所需的信息。该环节的关键是信息的准确性和完整性。 分类和在线支持事件可以是一个服务请求、信息请求或服
16、务故障,对于每个事件,需要确立优先级、影响度、和分类。若没有现成的解决方案或临时解决措施,该事件将分配给合适的支持人员对此进行调查。该环节的关键是需要知识库支持和正确的事件分派。 调查和诊断若在线支持人员无法解决事件,可运用自身技能、知识库、诊断工具等进行更加深入的分析以找到恢复服务的临时措施,必要时将使用多名技术员以寻求解决措施。 解决和恢复技术人员实施事件的解决方案,并将解决完毕的事件转回帮助台,由帮助台通知用户解决的结果,并得到用户的确认。 紧急事件和事件升级对于紧急事件,帮助台应立即提交给一线人员,由一线人员判断,上报给事件经理,并同时上报给集团公司,由事件经理决定紧急处理的方式,确保
17、其得到最快速的解决。当事件处理超过预期时限,将自动升级或由运维人员升级,以引起相关人员和管理人员的重视和参与。 结束事件当用户确认事件解决后,此时可结束该事件,并在必要时更新知识库。若用户对此解决方案不满意,则对该事件继续进行处理,不能关闭。2.1.7 流程衡量标准事件管理流程的主要衡量指标如下: 事件记录数量,可按照部门、事件分类等分别统计 事件关闭的数量,可以按照优先级,或者按照分类分别统计 事件成功关闭的数量 规定时间内解决的事件数量/百分比 帮助台解决率 事件解决的平均时间,可以按照事件分类统计 超时的事件数量,可以按人员、组别统计统计报表 事件记录的数量,可按照事件分类、事件性质、事
18、件优先级等分别按月、周、日汇总统计该时间段内创建的事件记录数量故障申告咨询业务处理维护作业其他紧急高中高中低中低中低中低紧急高中低网络设备服务器存储系统计费结算客服 处于各状态的事件数量,可按事件来源、事件分类、事件状态实时汇总事件记录数量新建分配一线处理二线处理供应商处理已解决关闭网络设备服务器存储系统计费结算客服 事件关闭的数量,可按事件来源、事件分类、事件结束代码等分别按月、周、日汇总统计该时间段内创建的事件记录的关闭数量成功解决可忽略事件后续操作解决部分解决部门1监控系统1成功解决可忽略事件后续操作解决部分解决网络设备服务器存储系统 按时、超时解决的事件数量/百分比,可按事件来源、事件
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ITIL 服务 管理 流程 手册 70

限制150内