ITILFoundation中文培训完整版.pdf
1Page 1ITIL FoundationITIL Foundation(学员手册学员手册)闫林闫林13311062733Mail:MSN:Blog:http:/ ITSM/ITIL的流程和架构的流程和架构2.学习一种学习一种IT服务管理的共同语言服务管理的共同语言3.分享不同组织间分享不同组织间IT服务管理的经验服务管理的经验4.参加并通过相关的认证考试参加并通过相关的认证考试2Page 2练习题答疑配置管理连续性管理问题管理结业考试服务级别管理安全管理变更管理下午ITIL小结发布管理能力管理突发事件可用性管理服务台财务管理ITSM&ITIL上午第二天第二天第一天第一天时间时间培训议程培训议程学员分组和介绍学员分组和介绍 姓名姓名:IT背景背景:参加此次学习的目的参加此次学习的目的:期望解决的问题期望解决的问题:3Page 3ITSM是什么?ITSM是什么?IT服务的基本概念IT服务的基本概念ITSM领域的国际权威组织领域的国际权威组织itSMF(国际(国际IT服务管理论坛)认为服务管理论坛)认为ITSM是一种以流程为导向、以客户为中心的方法,它通过整合是一种以流程为导向、以客户为中心的方法,它通过整合IT服务与组织业务,提高组织服务与组织业务,提高组织IT服务提供和服务支持的能力及其水平。服务提供和服务支持的能力及其水平。4Page 4系统管理系统管理网络管理网络管理IT 服务管理服务管理分布式客户机分布式客户机/服务器管理服务器管理95019298IT发展的历程IT发展的历程21世纪:服务管理20世纪:科学管理19世纪:工业化21世纪:服务管理20世纪:科学管理19世纪:工业化CIO 或信息主管所面临的挑战CIO 或信息主管所面临的挑战日益增长的竞争压力日益增长的竞争压力不断降低成本的需求不断降低成本的需求强调流程化的管理强调流程化的管理服务一致性的要求服务一致性的要求量化服务而非尽最大努力量化服务而非尽最大努力技术中心向业务中心的转变技术中心向业务中心的转变分散式的组织结构分散式的组织结构灵活应变灵活应变强调服务而非产品强调服务而非产品伙伴关系而非客户伙伴关系而非客户供应商的关系供应商的关系5Page 5传统IT管理和ITSM的比较传统IT管理和ITSM的比较时代在进步时代在进步ITSM基本原理ITSM基本原理ITSM的基本原理可简单地用二次转换来概括,第一次是梳理,第二次是打包6Page 6什么是 IT 服务管理什么是 IT 服务管理ITSM是 IT 组织用来计划、研发、实施、运维高质量服务的准则特点:面向客户:以客户为中心关注流程:以流程为导向强调成本:在合理的成本下使服务可衡量化:使服务可衡量、可预测目前在全球被10,000多家在各行各业处于领先地位的商家所采用是 IT 组织用来计划、研发、实施、运维高质量服务的准则特点:面向客户:以客户为中心关注流程:以流程为导向强调成本:在合理的成本下使服务可衡量化:使服务可衡量、可预测目前在全球被10,000多家在各行各业处于领先地位的商家所采用ITIL是什么?ITIL是什么?7Page 7ITIL是什么?ITIL是什么?ITIL,全称Information Technology Infrastructure Library,通常被译为“信息技术基础架构库”。“信息技术基础架构库”。它是英国中央计算机和电信局CCTA(现在已并入英国商务部OGC)于80年代中期开始开发的一套针对IT行业的服务管理标准库。Service DeskIncidentManagementProblemManagementChangeManagementConfigurationManagementReleaseManagementSecurityManagementService LevelManagementAvailabilityManagementIT ContinuityManagementCapacityManagementFinancialManagement服务交付服务支持服务交付服务支持ITIL的组成ITIL的组成8Page 8ITSM和ITIL的关系ITSM和ITIL的关系1.先有先有ITSM,后有,后有ITIL。2.因为因为ITIL,ITSM得到关注和发扬。得到关注和发扬。3.ITIL是是ITSM的最佳实践的最佳实践.ITIL为为ITSM提供创建了一组核心流程和专有名词。提供创建了一组核心流程和专有名词。4.ITIL并不是并不是ITSM的全部的全部.ITIL只是告诉我们什么该做,但没有说具体怎么做。而对只是告诉我们什么该做,但没有说具体怎么做。而对ITSM而言,这些都是而言,这些都是ITSM的范围。的范围。谁在使用ITIL?谁在使用ITIL?全世界约有10000家公司已经使用了ITIL。几乎所有世界500强的公司都已经实施了ITIL。主要集中在欧洲、美洲以及亚洲的发达国家。ITIL目前已经被国际标准组织批准通过为ISO20000/BSI 15000我们身边使用ITIL的公司如:Microsoft,HP,IBM 还有GE.9Page 9支持ITIL的工具支持ITIL的工具HP OPENVIEW 系列IBM TIVOLI 系列CA UNICENTER 系列BMC REMEDY 系列Brisk BVM系列ITIL管理机构ITIL管理机构OGC:Office of Government Commerce 2001年4月,CCTA并入英国商务部(OGC),ITIL因此转由OGC所有。OGC的目标是帮助英国公共部门改进它们的采购活动,通过有效应用IT和其它手段提高这些部门的服务水平。OGC在英国公共部门中推广了各种“最佳实践”,并将之整理成一系列指南。BSIBSI(British Standard Institute)即英国标准协会,是世界标准领域一个非常活跃的组织,如ISO9000就是由BSI提出的。BSI以ITIL为基础,制定了IT服务管理标准BS15000。EXIN:Netherlands Examination Institute&ISEB:Information Systems Examining BoardOGC并不具体负责ITIL的认证考试,而是将其授权给EXIN和ISEB。EXIN和ISEB分别是位于荷兰和英国的两个非营利性组织,其中后者负责英国及英联邦国家,前者负责其它国家和地区。itSMF:IT Service Management ForumitSMF全称Information Technology Service Management Forum,即(国际)IT服务管理论坛,成立于1991年,是一个世界性的非营利组织,致力于发展和推动IT服务管理最佳实践标准和认证。itSMF现已成为世界IT服务管理领域唯一受到广泛认可的国际组织,现有15个国家分会,有1000多家公司成为itSMF的公司成员。10Page 10 ITIL-书籍:Service Support(英文原版)Service Delivery(英文原版)IT服务管理 概念、理解与实施(中文)参考书籍参考书籍 http:/www.itil.co.uk/http:/www.itil-itsm- 11ITIL 认证介绍ITIL 认证介绍ITIL的认证机构的认证机构授权的培训机构授权的培训机构ITIL拥有者ITIL认证审批机构ITIL认证培训机构ITIL推广者ITIL拥有者ITIL认证审批机构ITIL认证培训机构ITIL推广者12Page 12ITIL MANAGERITIL MANAGERITIL FOUNDATIONITIL FOUNDATIONIncident management/service deskProblem managementChange managementConfiguration managementService level managementAvailability managementCapacity managementFinancial managementSecurity managementITIL PRACTITIONERITIL的认证体系ITIL的认证体系ITIL的认证体系的认证体系认证内容培训要求考试要求认证内容培训要求考试要求ITIL MANAGER深入理解IT服务支持、交付的十大流程和一个Service Desk功能2-3周的培训为必须,并已经获得foundation的认证3-4小时基于案例分析的问答题,共2部分,都通过才能获得最终认证2小时基于案例分析的单选题和问答题40道单项选择题,要求在1个小时内完成,只需达到65分以上(即40题中最少答对26题)即可通过考试并取得ITIL Foundation Certificate证书ITIL PRACTITIONER深入理解一个ITIL的流程,共有9项认证2-3天的培训为必须,并已经获得foundation的认证ITIL FOUNDATION基本了解IT服务支持、交付的十大流程和一个Service Desk功能2-3天的培训并不是必需的,但EXIN和ISEB仍推荐您参加培训13Page 13服务台服务台在ITIL中的位置在ITIL中的位置Service DeskIncidentManagementProblemManagementChangeManagementConfigurationManagementReleaseManagementSecurityManagementService LevelManagementAvailabilityManagementIT ContinuityManagementCapacityManagementFinancialManagementService DeliveryService Support是功能模块14Page 14案例讨论案例讨论在20分钟的时间里完成规定的任务在20分钟的时间里完成规定的任务?案例学习案例学习?讨论并回答问题讨论并回答问题每队派1名队员呈现,时间5分钟每队派1名队员呈现,时间5分钟WHY?HOW?WHAT?ServiceDesk讨论呈现讨论呈现如何使客户的申告能得到快速的响应?如何使客户的申告能得到快速的响应?如何使客户的申告能得到快速的解决?如何使客户的申告能得到快速的解决?如何解放专家或者二线人员对简单问题的处理?如何解放专家或者二线人员对简单问题的处理?IT系统的使用部门和维护部门之间怎样的沟通机制会更加高效?系统的使用部门和维护部门之间怎样的沟通机制会更加高效?WHY?HOW?WHAT?ServiceDesk15Page 15太多的抱怨太多的抱怨愤怒的客户愤怒的客户 谁能回答我的问题?!我找不着人!谁能回答我的问题?!我找不着人!什么时候才能解决我的问题呀?!还要让我等多久什么时候才能解决我的问题呀?!还要让我等多久焦急的信息主管焦急的信息主管上帝啊,我该怎么办?上帝啊,我该怎么办?疲惫的IT员工疲惫的IT员工 怎么又这么多的事要做,我都累死了!谁来帮我!怎么又这么多的事要做,我都累死了!谁来帮我!怎么才能有效做事?怎么才能有效做事?我快被客户抱怨淹没了!我快被客户抱怨淹没了!客户对服务台的期望客户对服务台的期望?个人期望:个人期望:技术能力高(48%)响应快速,联系方便(26%)乐于提供帮助(20%)主动联系并提供服务(6%)?商业需求:商业需求:解决IT服务相关问题,并借助IT服务来提高员工工作效率16Page 16?在客户、用户、IT服务和第三方支持组织之间的日复一日的重要的联络点在客户、用户、IT服务和第三方支持组织之间的日复一日的重要的联络点?为所有呼叫提供一个重要的中心联络点为所有呼叫提供一个重要的中心联络点?使正常操作服务更易恢复,在议定的服务优先级里对客户的业务影响最小使正常操作服务更易恢复,在议定的服务优先级里对客户的业务影响最小?生成供交流和分析的报告生成供交流和分析的报告?为组织提供价值为组织提供价值服务台的目标服务台的目标服务台的主要工作服务台的主要工作(1)响应用户呼叫响应用户呼叫。即对于用户发出的错误报告、服务请求、变更请求等事件进行记录和处理。这是服务台的最主要工作。(2)提供信息提供信息。服务台是为用户提供IT 服务信息的主要来源,一般可以采用布告栏、Email、屏幕消息等方式为用户提供有关错误、故障或新增服务等方面的信息。(3)客户需求管理和客户关系管理客户需求管理和客户关系管理。服务台不仅仅是客户请求响应中心,同时也是客户关系管理中心。因此服务提供方应采取必要的措施和使用适当的技术对服务台进行有效的管理,从而使服务台可以准确迅速地了解客户的需求,改善客户体验,提高客户满意度。这些措施和技术包括结构化询问技术、详细了解客户和跟踪客户、维护客户数据库和在客户中推广服务台等。(4)供应商联络供应商联络。在IT 服务运作出现故障或因客户提出新的服务请求而需进行有关变更时,服务台通常需要负责与供应商进行联络以维修或替换有关的软硬件组件。(5)日常运作管理日常运作管理。服务台承担的日常运作管理任务包括数据备份与恢复、磁盘空间管理、建立新用户、管理用户口令等。(6)基础架构监控基础架构监控。利用相关工具对IT 基础架构的运作情况进行监控,一旦检测到故障已经发生或即将发生,就应立即评估这种故障对关键设备可能产生的影响,并在必要时将检测到的故障报告事故管理部门。WHY?HOW?WHAT?ServiceDesk17Page 17关键词关键词?呼叫中心呼叫中心?帮助台帮助台?服务台服务台你好,很高兴为您服务!你好,很高兴为您服务!?处理并记录下大量的电话事务,然后交给其他部门处理,不直接回答?管理、协调并尽快解决突发事件?允许将业务流程集成到服务管理基础架构里。不仅能处理突发事件、故障和问题,还可提供与其他活动的接口WHY?HOW?WHAT?ServiceDesk关键词关键词WHY?HOW?WHAT?ServiceDesk?集中式服务台集中式服务台?分布式服务台分布式服务台?虚拟式服务台虚拟式服务台最新发展:“自助”成为提供自动化自动化”服务台功能的一种形式,用户自助访问KMDB和事故记录是降低成本和提高终端用户群自我服务能力的一种重要形式其缺点就在于难以针对各地区用户的特殊情况提供个性化的服务容易造成重复建设利用虚拟桌面和呼叫自动转移等技术实现全球单点统一联系,无地域时间限制18Page 18关键词关键词?非技术性服务台非技术性服务台?技术性服务台技术性服务台?专家性服务台专家性服务台WHY?HOW?WHAT?ServiceDesk流程流程WHY?HOW?WHAT?ServiceDesk电话请求电话请求邮件请求邮件请求传真请求传真请求网站请求网站请求问题识别和登记问题识别和登记服务台服务台服务请求服务请求服务请求步骤服务请求步骤初始支持初始支持服务台服务台是否解决是否解决解决/恢复解决/恢复服务台服务台关闭关闭服务台服务台调查/诊断调查/诊断现场支持现场支持是否解决是否解决解决/恢复解决/恢复现场支持现场支持调查/诊断调查/诊断现场支持现场支持是否解决是否解决解决/恢复解决/恢复现场支持现场支持硬件/应用事件硬件/应用事件是是是否否否是客户服务台第三方支持现场支持是是是否否否是客户服务台第三方支持现场支持坐席Case处理工程师项目经理*坐席Case处理工程师项目经理*第三方支持工程师第三方支持工程师现场工程师人员安排现场工程师人员安排*项目经理也会直接接到用户需求,需要登录case系统记录*项目经理也会直接接到用户需求,需要登录case系统记录19Page 19人员人员?服务台经理服务台经理?一线支持团队一线支持团队?二线支持团队二线支持团队?三线及其他支持团队三线及其他支持团队一线支持二线支持三线支持服务台经理WHY?HOW?WHAT?ServiceDesk技术和工具技术和工具WHY?HOW?WHAT?ServiceDeskInternet/Intranet自服务平台集成服务管理工具及系统管理工具通信技术交互语音应答系统电子邮件传真服务呼叫发送至传呼或移动电话知识搜索与诊断工具自动系统管理与网络工具20Page 20服务台=考核项,成本,注意事项,与其他流程的关系 考核项:指定时间段的呼叫数呼损率客户满意度承诺响应时间内完成的呼叫支持处理呼叫的平均成本由服务台完成的故障支持每一个座席支持的呼叫平均数WHY?HOW?WHAT?ServiceDesk 注意事项:选择不合适的工具热线占线或者接入率低客户信息未准确记录人员缺乏应有的技能未能及时与其他流程共享信息未能与业务考核挂钩没有合适的流程缺乏沟通WHY?HOW?WHAT?ServiceDesk服务台=考核项,成本,注意事项,与其他流程的关系21Page 21回顾回顾?目标目标SPOC(Single Point of Contact,统一服务联络点)减少影响减少影响 保持保持SLA 报告报告?内容内容 呼叫中心呼叫中心/帮助台帮助台/服务台服务台 本地本地/中央中央/虚拟服务台虚拟服务台?3P:process/person/product?成本成本/注意事项注意事项?与其他流程的关系与其他流程的关系?切记:服务台是功能而不是流程!切记:服务台是功能而不是流程!WHY?HOW?WHAT?ServiceDesk突发事件管理突发事件管理22Page 22Service DeskIncidentManagementProblemManagementChangeManagementConfigurationManagementReleaseManagementSecurityManagementService LevelManagementAvailabilityManagementIT ContinuityManagementCapacityManagementFinancialManagementService DeliveryService Support在在ITIL中的位置中的位置WHY?HOW?WHAT?IncidentManagement案例讨论案例讨论在20分钟的时间里完成规定的任务在20分钟的时间里完成规定的任务?案例学习案例学习?讨论并回答问题讨论并回答问题每队派1名队员呈现,时间5分钟每队派1名队员呈现,时间5分钟23Page 23WHY?HOW?WHAT?IncidentManagement讨论呈现讨论呈现讨论在紧急情况下如何应对此类事件,提出你们认为最好的解决办法讨论在紧急情况下如何应对此类事件,提出你们认为最好的解决办法并如何在此类紧急事故发生的情况下依然保障并如何在此类紧急事故发生的情况下依然保障SLA的实现要求?的实现要求?WHY?HOW?WHAT?IncidentManagement事故定义:事故定义:在某一服务中不属于标准操作的并能导致、或可能导致这个服务的中断或服务质量下降的任何事件。突发事件的定义突发事件的定义事故包括:错误和服务请求!事故包括:错误和服务请求!服务请求:服务请求:用户想要获得支持、递送、信息、建议或者文档的请求,它并不属于IT基础架构方面的错误。突发事件管理流程突发事件管理流程24Page 24WHY?HOW?WHAT?IncidentManagement?尽快将服务恢复成正常状态尽快将服务恢复成正常状态?将对业务的负面影响降至最低将对业务的负面影响降至最低?确保服务质量和可用性满足SLA确保服务质量和可用性满足SLA突发事件管理的目标突发事件管理的目标突发事件管理的主要动作突发事件管理的主要动作?检测记录检测记录?分类和初始支持分类和初始支持?诊断分析诊断分析?解决恢复解决恢复?突发事件关闭突发事件关闭?负责、监控、跟踪和沟通负责、监控、跟踪和沟通WHY?HOW?WHAT?IncidentManagement25Page 25突发事件的记录突发事件的记录在系统中记录事件细节:事件报告人、发现时间、影响范围、事件内容每个事件被赋予ID,便于查询跟踪给记录的突发事件标上初始状态明确表示每个突发事件的责任人无效和非授权的事件也应记录,但应该标注为在系统中记录事件细节:事件报告人、发现时间、影响范围、事件内容每个事件被赋予ID,便于查询跟踪给记录的突发事件标上初始状态明确表示每个突发事件的责任人无效和非授权的事件也应记录,但应该标注为“无效无效”突发事件的解决与恢复突发事件的解决与恢复?通过知识库搜索已知故障、事件的解决方法通过知识库搜索已知故障、事件的解决方法?根据经验、培训知识、专业技能提出解决方法根据经验、培训知识、专业技能提出解决方法?通过咨询相应专家获取解决方法通过咨询相应专家获取解决方法?测试解决方法的效果测试解决方法的效果?将有价值的方法和经验更新到知识库将有价值的方法和经验更新到知识库?产生变更请求通过变更管理流程获取解决方案产生变更请求通过变更管理流程获取解决方案?通过问题管理找到突发事件的根本原因,并采取最终的解决方案通过问题管理找到突发事件的根本原因,并采取最终的解决方案我要急用户所急,开动脑筋找到解决办法!尽快恢复业务!我要急用户所急,开动脑筋找到解决办法!尽快恢复业务!26Page 26突发事件的跟踪监控突发事件的跟踪监控?对所有未解决的突发事件的状态和进程进行监控,监控时间和频率应当事先定义好对所有未解决的突发事件的状态和进程进行监控,监控时间和频率应当事先定义好?如果有记录的话,及时更新事件的状态和责任人如果有记录的话,及时更新事件的状态和责任人?向受影响的用户通知进展信息向受影响的用户通知进展信息?对于影响大,风险高的突发事件,要及时通知相关管理层对于影响大,风险高的突发事件,要及时通知相关管理层?如果技术条件允许,采用有自动提醒功能的突发事件管理系统如果技术条件允许,采用有自动提醒功能的突发事件管理系统我要跟踪追击一丝不苟我要跟踪追击一丝不苟突发事件的关闭突发事件的关闭?就解决方案向客户或者事件提出者进行确认就解决方案向客户或者事件提出者进行确认?检查事件登记是否详尽准确检查事件登记是否详尽准确?关闭突发事件关闭突发事件?如果有必要,提出问题管理流程的申请如果有必要,提出问题管理流程的申请我终于大功告成,再检查一下有无疏漏?我终于大功告成,再检查一下有无疏漏?27Page 27突发事件记录的例子突发事件记录的例子关键词关键词?突发事件突发事件?服务请求服务请求?问题问题?临时解决方案临时解决方案?已知错误已知错误?变更请求变更请求?配置管理数据库配置管理数据库WHY?HOW?WHAT?IncidentManagement28Page 28引发突发事件的来源引发突发事件的来源WHY?HOW?WHAT?IncidentManagement?缺乏足够的专业知识缺乏足够的专业知识?配置不合理配置不合理?误操作误操作?设定的服务级别达不到客户的期望值设定的服务级别达不到客户的期望值?安全性突发事件:机密性问题、完整性问题、可用性问题安全性突发事件:机密性问题、完整性问题、可用性问题?。分类(类别)分类(类别)?应用应用 应用不可用 应用缺陷/查询?硬件硬件 自动提醒 打印机不打印?服务请求服务请求 密码忘记?安全突发事件安全突发事件 病毒突发事件的类别可能包括:突发事件的类别可能包括:我还要分出问题的类型!我还要分出问题的类型!29Page 29请您注意:“突发事件管理”不一定必须找到问题发生的根本原因,其重点在于如何在尽量短的时间内恢复软硬件中断的IT服务,提高服务的可用性。WHY?HOW?WHAT?IncidentManagement突发事件和根本原因突发事件和根本原因突发事件管理的升级流程突发事件管理的升级流程30Page 30流程流程突发事件的解决突发事件的解决WHY?HOW?WHAT?IncidentManagement系统错误突发事件问题已知错误变更请求系统解决问题记录检测突发事件问题检测寻找解决方案匹配问题或已知错误突发事件管理流程突发事件解决解决方案信息接受解决方案问题管理流程系统解决人员人员WHY?HOW?WHAT?IncidentManagement突发事件流程责任人突发事件流程责任人一线支持人员服务台人员一线支持人员服务台人员突发事件支持服务人员突发事件支持服务人员三线支持、专家三线支持、专家突发事件管理经理突发事件管理经理突发事件提出者突发事件提出者所有人:用户、领导、同事、系统自动触发所有人:用户、领导、同事、系统自动触发突发事件支持服务人员突发事件支持服务人员其他支持人员其他支持人员突发事件支持服务人员突发事件支持服务人员二线支持、集成运维工程师二线支持、集成运维工程师31Page 31技术和工具技术和工具突发事件管理可能会涉及的工具包括突发事件的自动记录和报警自动的升级机制灵活的处理流程CMDB支持诊断工具/模块WHY?HOW?WHAT?IncidentManagement突发事件的分类和升级突发事件的分类和升级WHY?HOW?WHAT?IncidentManagement一个优先级系统编号的例子一个优先级系统编号的例子紧急度影响度职能型升级:职能型升级:水平性的,有更多技术人员、权限的人参加事故解决结构型升级:结构型升级:垂直性的,需要更高级别的人参与事故解决升级上报升级上报32Page 32突发事件级别升级分类案例突发事件级别升级分类案例问题类型问题类型问题界定问题界定Resolution Fixed time危急对正常业务重大,对大量终端用户的严重影响,收入的影响,对外客户影响,VIP的设备故障,影响销售的关键指标等等2 hour2 hour紧急对业务较重影响,少量用户产生影响,Mini-VIP设备故障,可能影响商业运作,或者用户非常紧急、VIP明确要求等4 hour4 hour普通对业务的较轻影响,每天都会发生的普通需求,对商业运作影响很轻10 business hour(i.e.Next Business day)10 business hour(i.e.Next Business day)特殊主动预测到新的需求,不在服务列表种的设备安装,新的应用软件安装等10 business hour resolution time(i.e.Next Business day)10 business hour resolution time(i.e.Next Business day)WHY?HOW?WHAT?IncidentManagement突发事件管理=考核项,成本,注意事项,与其他流程的关系?突发事件总数突发事件总数?解决或限制突发事件所需要的平均时间解决或限制突发事件所需要的平均时间?规定响应时间内处理的突发事件百分比(SLA)规定响应时间内处理的突发事件百分比(SLA)?每个突发事件的平均成本每个突发事件的平均成本?服务台在不借助其他支持的情况下关闭的突发事件比例服务台在不借助其他支持的情况下关闭的突发事件比例?在线解决的突发事件数目和比例(针对服务台)在线解决的突发事件数目和比例(针对服务台)?突发事件/问题管理转发或升级的准确性突发事件/问题管理转发或升级的准确性33Page 33 注意事项:管理不到位,员工缺乏认知对业务理解不足缺少回顾和改进目标、责任和工作内容定义不完善没有明确SLA 缺乏相关技能培训不足,没有专家资源支持缺少与其他流程的沟通没有专业工具和自动系统的支持抵制改革WHY?HOW?WHAT?IncidentManagement突发事件管理=考核项,成本,注意事项,与其他流程的关系IT服务台和突发事件的关系IT服务台和突发事件的关系突发事件登记突发事件的自动输入突发事件的简要步骤知识库咨询系统流程的自动监控自动升级详细的报告大范围搜索工具突发事件管理系统突发事件管理系统IT服务台是突发事件管理工具IT服务台是突发事件管理工具34Page 34回顾回顾WHY?HOW?WHAT?IncidentManagement?目标目标 尽快恢复服务,并使影响降为最低尽快恢复服务,并使影响降为最低 确保服务质量和可用性满足确保服务质量和可用性满足SLA?职责职责 突发事件的检测和记录突发事件的检测和记录 分类和初始支持分类和初始支持 调查和诊断调查和诊断 解决和恢复,突发事件关闭解决和恢复,突发事件关闭 突发事件关闭突发事件关闭 突发事件的所有权、监控、跟踪和沟通突发事件的所有权、监控、跟踪和沟通?突发事件生命周期管理突发事件生命周期管理?分类:优先级、类别、突发事件、匹配分类:优先级、类别、突发事件、匹配问题管理问题管理35Page 35Service DeskIncidentManagementProblemManagementChangeManagementConfigurationManagementReleaseManagementSecurityManagementService LevelManagementAvailabilityManagementIT ContinuityManagementCapacityManagementFinancialManagementService DeliveryService Support在在ITIL中的位置中的位置WHY?HOW?WHAT?ProblemManagement案例讨论案例讨论在20分钟的时间里完成规定的任务在20分钟的时间里完成规定的任务?案例学习案例学习?讨论并回答问题讨论并回答问题每队派1名队员呈现,时间5分钟每队派1名队员呈现,时间5分钟36Page 36讨论象这样经常性发生的问题,你们有什么好的建议?如何可以将对业务的影响减到最少?开动大家的集体智慧,替IT服务部制定一套可行的应对病毒的解决方案。WHY?HOW?WHAT?ProblemManagement讨论呈现讨论呈现WHY?HOW?WHAT?ProblemManagement来自IT员工的呼声来自IT员工的呼声?如何才能减少突发事件的数量?如何才能减少突发事件的数量??如何避免突发事件的产生?如何避免突发事件的产生??我能从被动变主动吗?我能从被动变主动吗??假如我不能回答客户问题,我怎样才能找出解决方案,谁能帮我呢?假如我不能回答客户问题,我怎样才能找出解决方案,谁能帮我呢?37Page 37WHY?HOW?WHAT?ProblemManagement?稳固IT服务稳固IT服务 将突发事件减到最少 找出突发事件产生的根本原因 避免相关突发事件或问题的再次发生?提高资源的使用率提高资源的使用率问题管理的目标问题管理的目标WHY?HOW?WHAT?ProblemManagement问题管理问题管理管理信息管理信息错误控制错误控制问题控制问题控制协助处理主要突发事件协助处理主要突发事件主动预防主动预防问题回顾问题回顾问题管理的主要动作问题管理的主要动作38Page 38关键词关键词WHY?HOW?WHAT?ProblemManagement问题(问题(Problem)-根本原因未知的一个或一类突发事件。已知错误(已知错误(Known Errors)-根本原因已知的突发事件和问题;-已有折中或彻底的解决方案;-没有实施变更永久的解决问题;-可以根据业务需要提出变更请求。配置项配置项(CI)-基础架构的组件或与该架构有关的变更请求项;-配置项的内容非常复杂,范围也很广。大到整个系统(包括所有的硬件、软件、流程、以及相关文档),小到某个单一模块。变更请求(变更请求(Request of Change)-对配置项提出的变更的请求;-要有书面的详细记录。主动预防:主动预防:在事故发生之前发现和解决可能导致事故产生的问题问题控制:问题控制:注重将问题转化成已知错误找出问题并调查根源,其目标是通过确定问题根源并采取应急措施来把问题转化为已知错误错误控制:错误控制:监控并控制已知错误并提出变更请求(RFC);错误控制注重于通过变更管理过程在结构上解决已知错误问题的生命周期问题的生命周期 突发事件:非标准操作,可能导致服务受损的任何事件 问题:一个问题描述了一种非预料的情况,它表示引起一个或者多个现存或潜在事故的深层根源 已知错误:已经确定产生根源的问题 RFC:变更请求处理变更,如消除一个已知错误39Page 39WHY?HOW?WHAT?ProblemManagement突发事件与问题管理的区别突发事件与问题管理的区别 突发事件管理的目标是迅速恢复服务问题管理的目标是诊断出根本原因我治标我治本?输入输入突发事件的详细信息配置信息规避措施输入与输出输入与输出?输出输出已知错误变更请求更新包括规避措施和解决答案的问题记录管理信息的提交40Page 40人员人员?主要角色:主要角色:?问题管理经理问题管理经理?问题支持组问题支持组?其他角色:其他角色:?服务台人员服务台人员?突发事件管理人员突发事件管理人员?变更管理人员变更管理人员?发布管理人员发布管理人员?配置管理人员配置管理人员WHY?HOW?WHAT?ProblemManagement问题管理经理的职责问题管理经理的职责 制定和维护问题控制流程 审查问题控制流程的效率和有效性 生成管理信息 建立并管理问题支持小组 为支持工作分配资源 监控错误控制的有效性,并提出改进建议 开发并维护问题及错误控制系统 审查主动式问题管理活动的效率和有效性41Page 41问题的分类和分级问题的分类和分级权中问题1问题2问题3问题4严重程度(当前影响)12231严重程度(未来的影响)12213问题的紧急程度(时限/折中方案)12313总分6857优先级第三第一地四第二问题的调查与诊断问题的调查与诊断方法与手段-Kepner-Tregoe 分析法(KT-ATS)-Ishikawa diagrams 分析法(鱼骨图)-经验和常识-脑力激荡法(Brainstorming)-流程图方法-推论-投票具备相应的知识,不要忘记手册操作程序通常是导致问题的根源检测到发生故障的“配置项(CI)”时,将问题状态改为“已知错误(KE)”42Page 42技术和工具技术和工具WHY?HOW?WHAT?ProblemManagement因果图(鱼骨图)因果图(鱼骨图)一个问题受到一些因素的影响时,我们将这些因素加以整理,成为相互有关系且有条理的图形,这个图形成为因果图,由于形状就象鱼的骨头,所以又叫做鱼骨图。WHY?HOW?WHAT?ProblemManagement技术和工具技术和工具脑力激荡法(头脑风暴)脑力激荡法(头脑风暴)是利用集体的思考,使思想相互影响,发生连锁反应,以引导创造性思考的方法。进行的主要原则:主题、目标要明确自由发言禁止批评他人的想法不要太早下判断性的定论意见要记录下来43Page 43被动式问题管理的职责被动式问题管理的职责?确定问题(例如,通过分析突发事件数据)?根据影响调查问题,直至解决问题或确定错误?提出RFC,排除错误?监控解决已知错误的进度?向突发事件管理人员建议处理突发事件最佳的折中方案?与未解决的问题/已知错误有关?帮助处理主要突发事件并确定根本原因主动式问题管理的职责主动式问题管理的职责?确定趋势和潜在的问题源(通过审查突发事件和问题分析)?提出RFC,防止问题再次发生?防止问题在多个系统上复制44Page 44主动式问题管理主动式问题管理趋势分析主要问题回顾确定目标支持措施主动预防 考核项:提交RFC数分析诊断的时间降低突发事件产生的比率分析提交RFC的成功率人工成本其他使用的资源超出预算的成本WHY?HOW?WHAT?ProblemManagement问题管理=考核项,成本,注意事项,与其他流程的关系45Page 45 注意事项:突发事件数据的缺乏没有将突发事件和问题与已知错误关联管理支持不到位已知错误和解决方案未及时共享预防问题没有有效执行安排同一个小组负责突发事件和问题管理安排同一个小组负责突发事件和问题管理WHY?HOW?WHAT?ProblemManagement问题管理=考核项,成本,注意事项,与其他流程的关系回顾回顾WHY?HOW?WHAT?ProblemManagement?目标