服务支持度量标准精品资料(完整版)资料.doc





《服务支持度量标准精品资料(完整版)资料.doc》由会员分享,可在线阅读,更多相关《服务支持度量标准精品资料(完整版)资料.doc(226页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、服务支持度量标准精品资料(完整版)资料(可以直接使用,可编辑 优秀版资料,欢迎下载)服务支持度量标准简介对于已受过 ITIL 培训、阅读过 ITIL 书籍或参加过 ITIL 讨论会或集训的人来说,ITIL 所带来的好处往往是显而易见的。通过推介对公司不同部门具有重要意义的内容,以及传达ITIL 服务交付和服务支持中概括的目标,本系列的前两册的重点集中在 ITIL 高级概念上,这些概念有助于 ITIL 专家培养公司内部非 ITIL 专家的约束感。在本系列的第三册中,将通过重点讨论ITIL 服务支持一书中介绍的监视和测定最佳惯例来继续探讨 ITIL 高级概念,包括以下内容: 事故管理 故障管理 变
2、更管理 发布管理 配置管理 ITIL 服务支持一书的各节详列了管理功能区域的人员需要思考的度量标准。本书总共列出了 80 个推荐的测定方法,以便用于监视和测定这些流程的性能。 在本书中将通过引用 ITIL 定义、用清晰而简明的术语进行表述,以及向 IT 经理和业务经理建议如何充分利用数据来复查每个 ITIL 度量标准。通过重点强调这些关键指标,可以帮助您向 IT 部门内负责管理相关功能区域的人员阐明 ITIL 最佳惯例的价值。本书还将继续介绍 ITIL 推荐的度量标准,并介绍“业务取向指标”。这些关键的度量标准用于拓展 ITIL 最佳惯例,以便凸显那些有助于利用业务优先级定位 IT 目标和目的
3、的信息。第 1 章 - 智慧分层体系信息技术 (IT) 小组一般精于收集大量数据。然而,对于作出与业务相关的决策,收集来的数据并不总是得到了充分地利用。大多数情况恰恰相反。例如,许多 IT 部门测定和监视在服务台发生的所有事件,却仍可能未注意到一台关键服务器已经接近满负荷运转。为什么会出现这种情况?这是因为服务台技术可以自动收集有关服务台性能的大量数据,而测定服务器容量方面的增长则需要进行其他工作和干预。 我们将讨论如何充分利用数据,以协助 IT 经理和业务经理作出有助于保持 IT 不偏离业务目标的决策。我们从了解服务管理中最常用的几个术语开始:“数据”、“信息”、“知识”以及程度较低的“智慧
4、”。虽然这些词的使用率很高,但这些词并不总是用在了适当的语境中。Merriam-Webster 在线辞典 对这些词的定义如下:数据1. 是用作推理、讨论或计算的依据 的实际信息(测定结果或统计信息)。 2. 传感设备或感觉器官输出的信息,包括有用以及无关或冗余信息,必须对其进行处理才能使其具有意义 信息3. 通过调查、研究或指示获取的知识 4. 智力、消息 5. 事实、数据 知识6. 某人的信息范围 智慧7. 累积的哲学或科学学识:知识 8. 明智的态度或行为过程 根据上述定义,“数据”是“信息”的基本单位,“信息”是“知识”的基本单位,而“知识”本身又是“智慧”的基本单位。因此,在理解和决策
5、分层体系中有四个层次。收集数据、信息和知识完全是为了能够做出明智的决策。然而,如果数据来源有问题,那么大多数情况下决策也会出现问题。下图是数据、信息、知识和智慧之间关系的图解:图 1:基于数据构建的智慧分层体系如图所示,“数据包”是从一个层次传递到下一个层次。“智慧”层次具有作出明智决策必需的所有组成部分 数据、信息和知识。当然,可以在任意层次作出决策,这取决于现有的结果和条件。下面的例子用于说明在各个层次进行决策的过程:数据层:服务台经理发现有二十位客户等待打入 。他可能会决定临时增加一线客户服务人员的数量,这是根据一条数据制定的决策。信息层:在另一类似的情况下,有 20 位客户等待打入 ,
6、但这次经理掌握了更多的数据。他知道有一台目前已停机但马上将恢复正常的服务器。在这种情况下,经理可能决定稍后再增加一线客户服务人员的数量,因为他(或她)怀疑这两个问题是相关的。在拥有多个数据源的情况下,经理掌握的信息更多,并将根据可用信息作出决策。知识层:服务台经理发现等待打入 的客户不断增多,而且某台服务器即将接近满负荷运转。因为她拥有用以说明如何应对此情况的信息,所以可以立即采取适当的行动隔离并解决问题。这个决策是基于知识作出的。 智慧层:IT 执行官正在温习上个月的知识,并发现某一供应商提供的几台服务器出了问题。他们将决定要求供应商评估其所有服务器,以确定其他服务器是否会出现同样的问题。这
7、个决策是基于智慧作出的。 尽管这些例子可能过于简单,但它们可作为理解“智慧分层体系”的参考。 第 2 章 - 驱动因素进行监视或测定应该总是事出有因。您应该不断思考“为什么要进行测定?”或“为什么要整理数据?”监视和测定的理由主要有四个:定向:这包括进行监视和测定,以便为活动设定方向,以达到既定的目标。这是进行监视和测定最一般的理由。例如,服务水平协议 (SLA) 用于设定目标度量标准,而 IT 部门的测定是对照这些目标进行的。这些目标为 IT 部门指明了方向。介入:通过进行监视和测定来确定介入点,包括后续变更和纠正措施。例如,可对网络进行监视,并确定网速很慢。结果是 IT 人员将进行调查,这
8、会导致对其进行改动以提高网络性能。可能还会为进行调查执行特殊的监视,以跟踪改动的效果。此外,通常只有在改动期间才会基于这些度量标准进行监视。不过,为了进行定向并确保性能在将来不会恶化,可能必须持续地进行测定。证明:利用实际的征兆或证据证明某一行为过程是必要的。例如,在进行大宗采购之前必须预测投资回报。进行可行性证明通常需要预测趋势、制定财务计划和/或建立财务模型。在通常情况下,我们首先要证明某一项目的可行性,其次验证其交付成果。 验证:进行监视和测定以验证先前作出的决策是否正确。例如,实施配置(资产)管理的理由可能是将购置资产的费用降低 10%。这需要利用测定工具跟踪和监视项目的节约效果,以便
9、验证是否实现了 10% 的节约目标。项目完成后,就不再需要测定以进行验证了。进行监视和测定的四个主要理由引出了两个关键问题:“为什么要进行监视和测定?”和“何时停止?”若要回答上述问题,您必须确定是上述哪个原因导致需要进行或停止测定和监视。在大多数情况下,我们会在无需进行测定之后再持续一段时间。在每次报告时都应考虑“我们是否仍然需要进行监视和测定?”第 3 章 - 固定的测定过程不论是为了定向、介入、证明还是验证而进行测定,您都应该遵循下列的简单过程:图 2:简单监视和测定过程这个过程可能很简单,但执行起来可能很耗费时间且有难度。现在我们详细地了解这个过程:收集:收集 主要是集中搜集监视和测定
10、 IT 服务和组件必需的原始数据。因为 IT 自动收集大量数据,所以乍看起来收集必要数据显得比较简单。不过,收集工作并非总是如此简单。例如,服务台工具主要收集服务台代理输入的数据,但是如果某个关键字段与“事故”记录无关,那就不会收集到有关该参数的数据。您应该确保已准备好数据收集的正确方法。 另外,往往需要收集比所需更多的信息,以便在测定质量很差的情况下,还有可用以进一步调查的数据。有一点是肯定的 若要成功地进行测定和监视,必须收集正确的数据。为了正确地收集数据,您必须了解为什么要收集数据 是要进行定向、介入、验证还是证明? 处理:收集完数据后,下一步就是处理 数据,将其转换为符合要求的格式。例
11、如,您可能每周遇到 3,000 个事故,但仅希望查看每小时的总事故数,以确定需要的员工数量。在这个阶段,您可以使用报告生成技术。这通常意味着将大量数据压缩成将在后续阶段中使用的信息。 分析:数据经过处理转化为信息后,您可以分析 其结果,为下列问题寻找答案,如: 是否可看出任何趋势? 是否需要改动? 是否在按照计划行事? 是否正在超目标努力? 是否需要采取纠正措施? 是否存在潜在的结构性问题? 在寻找问题的答案过程中您要利用知识进行信息的处理。否则,您得到的将仅仅是一串数字,代表着毫无意义的度量标准。仅仅查看这个月的数字并毫无异议地予以接受,这还不够,即使已经达到 SLA 目标。您应该分析数字以
12、占取先机。不进行分析,您所拥有的仅是信息。进行分析后,您所拥有的将是知识。如果发现异常情况或得到很差的结果,那就要寻求改进的方法。呈现或使用:最后的阶段就是将知识呈现出来,即利用知识将其转变为智慧: 报告 监视器 行动计划 复查 评估 变更请求 新机会 可以看出,利用测定和监视可作出明智的决策,以构造性和结构化方式推进 IT 的发展。现在可以合并上面的两幅图,将“智慧分层体系”映射到“测定过程”上:图 3:合并后的智慧分层体系和简单过程此过程定义了一个用以遵循的逻辑方法,但是您如何确保可以有效地进行监视和测定?您需要具备适当的驱动因素,以确保可以生成有效的度量标准: 图 4:固定的测定过程驱动
13、因素影响您收集的数据以及此过程中的所有其他阶段。除非您要构造性地使用这些数据,收集大量数据是毫无意义的。首先确定为什么要监视某一参数。掌握此信息后,就可以确定所需的数据以及可以从哪里获取这些数据。此后您就可以按此过程操作,但要切记一开始就确定驱动因素是成功的关键。 第 4 章 - ITIL 服务支持的监视和测定既然具备了基本条件,我们就可以转而关注监视和测定,因为它们与 ITIL 服务支持流程的每一步都是相关的。对于大多数流程,ITIL 出版物都有说明需要测定和监视内容的章节。这些小节并未标准化,具有不同的标题,如“关键性能指标”、“报告和复查”以及“测定和报告”。在此我们首先将查看 ITIL
14、 推荐的每个流程。然后,在必要时将提出与这些流程尤其是与业务取向领域相关的其他建议。ITIL 出版物中所描述的许多度量标准都是指总体总数和平均数。这些数据适于快速查看,但在试图据其确定工作量和实际值的情况下可能会极易令人误解。接下来看一个例子。服务台一天内收到的事故总数为 1,960 起,而允许发生事故的上限为 2,600 起。每小时的平均事故数为 151 起,而每小时允许发生事故的上限为 200 起。从上述数据看起来一切都很正常。但客户一直对服务质量表示不满。从图 5 中可以看出客户不满意的原因:图 5:每小时的事故总数服务台的工作人员每小时能够处理的最大事故数量为 200 起,但如图所示,
15、在上午 7 点和 11 点以及下午 4 点和 5 点之间,他们每小时遇到的事故数量大于 200 起。怪不得客户不满意。这个简单的例子说明了仅看总数和平均数是不保险的,同时也说明了对总体的把握为何如此重要。 ITIL 推荐的监视和测定最佳惯例往往包括百分比,这也同样令人误解。例如,99.8 % 的系统可用性听起来很高,因为已经接近 100 %。然而,如果某个 100 人的部门连续 10 个小时不能访问系统,那么 99.8 % 的系统可用性并不能反映此情况。此额外数据大大地影响了“99.8 % 系统可用性”的含义。只有在对其进行概括或描述的情况下百分比值才有用。 记住,在我们浏览每个服务支持推荐度
16、量标准的过程中,ITIL 出版物中含有的是推荐标准而非绝对标准,并应该根据公司的特定需要进行调整。 第 5 章 - 事故管理ITIL 服务支持一书中的“事故管理”一节将监视和测定称为关键性能指标 (KPI)。关于 KPI,ITIL 表述如下: “若要判断流程的性能,应该设定定义明确且具有可测定对象的目标 也称为关键性能指标 (KPI)”。 当查看 ITIL 列举的例子时,切记这些例子是与事故管理而非服务台本身相关。对于“事故管理”流程的效果和效率,ITIL 将以下列度量标准为例: 事故总数。 事故得到解决或得以规避的平均时间(按影响代码划分)。 在约定响应时间内已处理事故所占的百分比(如通过影
17、响代码可在 SLA 中指定事故响应时间目标)。 每个事故的平均成本。 在没有求助于其他支持人员的情况下,由服务台查明的事故所占的百分比。 每个服务台工作站处理的事故数量。 无需进行访问而远程解决的事故数量和百分比。 在我们详解这些例子之前,请注意它们都是用于定向的度量标准,而不是用于验证、介入或证明的度量标准。这些度量大部分都将有预设定的对象或目标。 现在我们来仔细研究这些度量标准:事故总数。事故总数是个显而易见的度量标准,但仅在事故报告周期小于等于一天时,此标准才最有用。报告周期也可更长,例如 1 个月或 1 年。 不过,这些报告中的信息应该划分得更细致,可以显示工作流的高峰和低谷。高峰尤其
18、重要。例如,一周中的某一天可能总是比其他时候更为忙碌,或者一个在其中发生更多事故的特定月份。高峰度量标准对于安排员工和制定休假方案很有用。 可设定各个时间段的目标承受能力大小,并将目标承受能力与实际发生的事故量相比较,以便保持适当的员工人数。例如,如果每小时可以处理的事故最多为 200 起,那么实际发生的事故量接近此最大承受能力的频率是多少?如果实际发生的事故量非常接近最大承受能力,那么您就可能需要进行特殊的监视 即介入监视或证明监视。您可以确定容量何时用尽以取得主动。 业务取向指标 用于衡量与您的关键业务客户和合作伙伴之间的工作量,以便根据预计的业务增长量来预测事故的增长量。 事故得到解决或
19、得以规避的平均时间(按影响代码划分)。乍看起来,此度量标准的含义可能并不明显。现在我们来进行分析。在 ITIL 中,“平均用时”通常可以与术语“平均时间”互换。“规避方法”通常称为“解决方案”,而 ITIL 将“影响”描述为“事故对业务危险程度的测定”。对于大多数人来说,“影响”是优先级代码或严重程度代码。此度量标准着眼于事故得到解决或处理所用的平均时间(按照优先级代码或严重程度代码划分)。这是一个很有用的度量标准,因为它有助于确定员工数量的多少。例如,如果知道每个优先级/严重程度级别的平均用时,以及事故的总量,那么您就掌握了用以确定工作用时的基本数据。此外,如果可从近期历史数据中看出平均用时
20、已被改动,那么您就可以通过考虑其对事故管理员工能力的影响来计算其对工作量的影响。 业务取向指标 与您的关键客户和合作伙伴保持紧密联系,以便在业务环境发生变化需要更改影响代码的情况下可立即作出响应。 在约定响应时间内已处理事故所占的百分比(通过影响代码可在 SLA 中指定事故响应时间目标)。 这是一个重要的度量标准。 不过,在约定响应时间内未处理的事故数量更为重要。在每当事故的处理未达到所签定的 SLA 的要求时,您的客户就不会满意。应该对这些事故进行调查,以确定为何在约定的响应时间内这些事故没有得到处理,然后确定将要采取的措施,以确保减少发生此类事情的次数。 业务取向指标 业务经理应该能够跟踪
21、任何用时未达到约定服务级别的事故的进度。当解决事故用时超过约定的时间限制时,将会自动通知业务经理。另外,业务经理应该能够复查与未达到约定服务级别的事故相关的历史数据。 每个事故的平均成本。只需进行简单计算即可算出每个事故的平均成本,并可用于许多财务计算,包括费用分摊。然而,要意识到术语“平均成本”可能会令人误解。例如,重新设定口令用时可能少于一分钟,费用也最低,然而一个准时培训问题可能用时 30 分钟,导致高的多的费用。因此,您应该按事故类型计算平均成本。 业务取向指标 业务经理应该能够随时查看与其业务范围相关的事故成本。理想状态下,应该按种类(如日期或部门)来划分此数据。 在没有求助于其他支
22、持人员的情况下,由服务台查明的事故所占的百分比。这通常也称为“在第一级别解决的事故”,是大多数服务台的主要度量标准。通常,将为第一级别的解决方案设定一个目标,而某些 SLA 包括第一级别的解决方案度量标准。请注意,此度量标准不会错误地塑造服务台的行为,如通过使得查明事故比解决事故更重要进行塑造。 业务取向指标 业务经理倾向于“减少事故”而不是“在第一级别解决事故”。确保有用以通过故障管理减少事故数量的结构化方法。允许业务经理在故障管理中复查第一级别解决方案数据和事故减少情况。 每个服务台工作站处理的事故数量。这是另一个经典的服务台度量标准,用于监视和测定员工的业绩和能力。 必须尽可能高效地处理
23、事故;因此,这是复查事故管理流程性能的重要度量标准。理想状态下,每个服务台工作站发生事故的数量应该是均衡的。失去平衡表明向服务台工作站分配事故时可能出了问题,这可能会导致效率降低。(当然,除非此不平衡情况是事先安排的,例如,某些工作站可能未处在非高峰期)。意外的失衡情况必须加以调查和纠正。 业务取向指标 业务经理可能对此总体度量标准不感兴趣。然而,如果此失衡状态是由业务经理或其员工所致,那就需要与其进行协商,并与其讨论导致失衡的原因。例如,某位业务经理或其员工打进 ,指名寻找某个服务台代理,或者将与事故相关的电子邮件直接发给某个代理。 无需进行访问而远程解决的事故数量和百分比。这是一个越来越重
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 服务 支持 度量 标准 精品 资料 完整版

限制150内