服务水平管理和服务水平协议3.docx





《服务水平管理和服务水平协议3.docx》由会员分享,可在线阅读,更多相关《服务水平管理和服务水平协议3.docx(41页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、办事水平治理和办事水平协议(SLA)本文描述面向高可用性网络的办事水平治理和办事水平协议(SLA)。它包罗办事水平治理的乐成因素以及帮您评估乐成与否的性能指标。本文以一个国际性的网络详细描述遵从高可用性业务事情组确定的最佳方案指导原则的SLA。办事水平治理概述网络公司一直以来都通过构建坚固的网络底子设施及主动处置惩罚每个业务问题来满足不停扩展的网络要求。当业务异常中断时,公司将构建新流程、治理功效或底子设施来防备此类妨碍再次产生。然而,由于快速变动及日益增长的可用性要求,我们现在需要革新模式来预先防备意外妨碍并快速修复网络。许多办事供给商和企业一直都试图更好地界说办事水平以便实现商业目标。要害
2、乐成因素SLA的要害乐成因素用来界说支持乐成构建可得到的办事水平及维护SLA的主要要素。要成为及格的要害乐成因素,流程或流程步调必须可以革新SLA质量并从整体上提高网络的可用性。要害乐成因素还应具备可丈量性,以便使企业能够判断:与界说的步伐相比,它所取得的乐成水平。性能指标性能指标提供了公司丈量要害乐成因素的机制。您通常需要每月审查一次,以确保办事水平界说或SLA运行良好。网络运行小组及须要的东西组可实施以下丈量尺度。注意:对付没有SLA的公司,我们发起您同时实施办事水平界说、办事水平审核及丈量尺度。性能指标包罗: 记载的办事水平界说或SLA,包罗可用性、性能、主动业务应答时间、排障目标及问题
3、升级等。 月度网络办事水平审核集会,审查对办事水平的执行情况并实施革新。 性能指标丈量尺度,包罗可用性、性能、按优先级分别的业务应答时间、按优先级分别的排障时间以及其他可丈量的SLA参数。办事水平治理流程2.创建并维护SLA实施办事水平治理实施办事水平治理包罗十六步,分为以下两个主要领域: 界说网络办事水平步调1-6 创建并维护SLA 步调7-16界说网络办事水平网络治理人员需要界说支持、治理并丈量网络的主要规矩。办事水平为所有网络人员提供目标并可用作整体业务质量的丈量尺度。您也可将办事水平界说用作网络资源预算东西以及投资于更高办事质量的证据。它们还提供评估供给商及运营商的体现的要领。如果没有
4、办事水平界说和丈量,公司不可能制定明确的目标。办事是否满意由用户决定,在应用、办事器/客户机运行或网络支持方面并无明显差距。由于企业对最终结果没有掌握,因此很难作预算。最终,网络公司在提高网络及支持模式方面都趋向于选择被动应答,而非主动预防的方法。我们发起接纳以下步调来构建并支持办事水平模式: 阐发技能目标及限制因素。 确定可用性预算。 创建详细记载要害应用网络特征的应用资料库。 界说可用性、性能权衡尺度及通用术语。 创建办事水平界说,包罗可用性、性能、业务应答时间、排障平均时、妨碍检测、升级门限及上报途径。 收集丈量尺度并监控办事水平界说。第1步:阐发技能目标及限制因素开始阐发技能目标和限制
5、因素的最佳方法是团体讨论或研究技能目标与要求。因为这些人都有特定的业务目标,所以有时这有助于要求其他IT技能人员到场讨论。技能目标包罗可用性级别、吞吐量、发抖、延迟、应答时间、可用性要求、新特性的推出、新应用的推出、宁静性、可治理性及本钱等。随后,公司应研究限制因素,以便使用可用资源实现这些目标。您可为每个目标创建带有对限制因素解释的事情表。最初看似大多数目标都无法实现。随后分别目标的优先级或低落对仍可满足商业要求的目标的期望值。例如,您制定的可用性级别可能是99.999%,或每年5分钟的妨碍停机时间。实现这一目标存在大量限制因素,如硬件的单点妨碍、远程位置中的妨碍硬件的平均修复时间(MTTR
6、)、运营商可靠性、预先妨碍检测、高变动率及当前网络容量限制等。因此,您需要将这个目标调治到越发易于实现的级别。下个章节中介绍的可用性模式可帮您制定现实的目标。您可能也考虑在限制因素相对较少的网络领域提供可用性。当网络公司宣布业务的可用性尺度时,公司中的各业务部分可能发明无法担当这个级别的可用性。这自然而然引发对SLA的讨论,或为可满足商业要求的模式进行投资/做预算。确定所有限制因素或风险的事情包罗要实现技能目标。凭据实现理想目标的最大风险或影响方面分别限制因素的优先级。这可资助公司确定网络革新筹划的优先顺序,并确定解决限制因素的难易水平。限制因素分三类: 网络技能、妨碍规复能力和配置 生命周期
7、方案,包罗:筹划、设计、实施和运行 当前的话务负载或应用行为网络技能、妨碍规复能力及配置限制因素是指与当前技能、硬件、链路、设计或配置相关的任何限制因素或风险。技能限制因素指技能自己造成的任何限制。例如,当前没有一种技能允许冗余网络情况中实现少于1秒的聚适时间,而这恰恰是维持整个网络上的话音连接的要害。另一个例子是数据通过地面链路时的原始速度,约莫是100英里/毫秒。网络硬件妨碍规复能力风险视察应会合在硬件拓扑、分级体系、模块化、冗余、MTBF及界说的路径这几方面。网络链路限制因素应强调企业网络链路及运行商连接。链路限制因素可能包罗链路冗余和多样性、媒介限制、布线底子设施、本地环路连接性以及长
8、距离连接性。设计限制因素与网络的物理或逻辑设计相关,包罗从为设备可用空间到路由协议实施的可扩展性等各个方面。您应在配置、可用性、可扩展性、性能及容量方面考虑所有协议和媒介设计。动态主机配置协议(DHCP)、域名系统(DNS)、防火墙、协议转换及网络地点转换等网络业务限制因素也应列入考虑之列。生命周期方案界说用于实现解决方案的统一摆设、检测和修复妨碍、防备容量或性能问题以及配置一致性和模块化的网络流程和治理。您需要认真考虑这个领域,因为专业技能和流程通常是导致不可用性的最大影响因素。网络生命周期指筹划、设计、实施和运行周期。在每个阶段中,您都必须了解性能治理、配置治理、妨碍治理及宁静性等网络治理
9、功效。思科NSA高可用性办事部(HAS)提供网络生命周期评估办事,确定与网络生命周期方案相关的当前网络可用性限制因素。当前的话务量或应用限制因素只是指当前话务和应用的影响。不幸的是,许多应用都带有大量需要慎重治理的限制因素。当前应用的发抖、延迟、吞吐量及带宽要求通常带有许多限制因素。编写应用的方法也可能产生一些限制因素。汇编应用资料库可帮您更好地了解这些问题;下文将介绍这一特性。研究当前的可用性、话务、容量及性能还可资助网络治理人员了解当前的办事水平目标及风险。这一事情常通过名为网络基准制定的流程来完成,该流程可帮您界说划定时段内(通常是一个月)的平均网络性能、可用性或容量。这些信息通常用于容
10、量筹划和趋势阐发,但也可用来了解办事水平问题。下面的事情表使用了上述目标/限制因素要领来实现防备宁静性打击或拒绝办事打击(DoS)的目标。您也可使用该事情表来决定可最大限度地淘汰宁静性打击的业务范畴。风险或限制因素限制因素类型潜在影响可用的DoS检测东西无法检测出全部DoS打击类型。技能/妨碍规复能力高不具备对告警做出相应所需的人员和流程。生命周期方案高当前网络接入计谋未加执行。生命周期方案一般如果利用带宽拥塞来发动打击,则当前的低带宽互联网连接成为限制因素。网络容量一般资助防备打击的当前宁静性配置不完善。技能/妨碍规复能力一般第2步:确定可用性预算可用性预算是期望在界说的两点间出现的、理论上
11、的网络可用性。准确的理论信息可在多个方面发挥作用: 公司可将其视为内部可用性目标,并且能够立刻界说偏离并进行调停。 网络筹划人员可使用这些信息来确定系统的可用性,以确保设计满足商业要求。造成不可用性或妨碍停机的因素包罗软硬件妨碍、电源和情况问题、链路或运营商妨碍、网络设计、人为错误或缺乏流程等。在评估网络的整体可用性预算时,您必须严格评估上述的所有参数。如果公司目前正在丈量可用性,则可能不需要可用性预算。用可用性丈量尺度作为基准来评估办事水平界说使用的当前办事水平。然而,您可将二者进行比拟,以便了解潜在的理论可用性与实际丈量结果间的差距。可用性指产物或业务在需要时投入运行的可能性。拜见以下界说
12、:1- (总的连接中断时间) / (总办事连接时间)1- 总和(业务中断期间受影响的连接数量 X 业务中断时间) / (运行的连接数量X 运行时间)1-由以下因素造成的可用性或总的连接中断时间:软硬件妨碍、电源和情况问题、链路和运营商妨碍、网络设计、用户错误及流程妨碍等。首先需要研究的领域是潜在硬件妨碍及其对不可用性的影响。要确定这方面的影响,公司应了解所有网络组件的MTBF以及MTTR,以确定两点间的路径中所有设备的潜在硬件问题。如果网络接纳模块化和分级体系结构,则险些任意两点间的硬件可用性都是相同的。MTBF信息可用于所有思科组件,并且可凭据请求、向本地客户经理提供。Cisco NSA H
13、AS项目还使用一种东西来资助确定硬件可用性及网络路径,纵然在系统中存在模块冗余、机底冗余及路径冗余时也可以使用这种东西。硬件可靠性的一个主要因素是MTTR。公司应评估它们修复妨碍硬件的速度。如果公司未制定备用方案,只依赖于尺度Cisco SMARTnet? 协议,则潜在的评估硬件调换时间为24小时。在带有核心冗余但不带有接入。冗余的典范LAN情况中,适当的可用性是 99.99%,平均修复时间是4-小时。下一个需要研究的领域是软件妨碍。出于丈量的目的,思科将软件妨碍界说为由软件错误引发的设备冷启动。思科已经开发出许多流程来资助了解软件的可用性;然而,更新的版本尚需一段时间进行丈量,并且我们认为它
14、的可用性不及一般的摆设软件。IOS 11.2版(18)等一般摆设软件经丈量,证明具备99.9999%的可用性。这个数字是基于修复时间为六分钟(路由器重新装载的时间)的思科路由器的实际冷启动次数来盘算的。接纳差别版本的公司,可用性将随着庞大性的增加、互操纵性的增强以及排障时间的缩短略有低落。接纳最新软件版本的公司,不可用性将有所提高。不可用性的分派也相当遍及,这意味着客户将感觉到很高的不可用性或靠近一般摆设版本的可用性。您还必须考虑情况和电源的可用性问题。情况问题与将设备保持在特定的运行温度范畴内的冷却系统的妨碍相关。当温度大大凌驾技能指标时,许多思科设备只是停止运转,而不会损害所有硬件。出于可
15、用性预算的目的,您必须将电源考虑在内,因为它是造本钱事域中不可用性的主要原因。虽然电源妨碍是造成网络不可用性的重要原因,但对它的讨论照旧受到限制,这是因为无法进行准确的、理论上的电源阐发。企业必须基于所在地区的经验、电源备份功效以及实施的流程,对其设备的电源可用性的约莫丈量结果进行评估,以确保为所有设备提供具备一致质量的电源。基于守旧的预计,我们可以认为配备了备用发电机、不中断供电电源 (UPS)系统并接纳及格电源实施流程的企业,可实现高达六个九(99.9999%)的可用性,而未配备这些系统的企业,其可用性仅为 99.99%,大概说每年有36分钟的妨碍停机时间。固然,您可凭据公司的视察或实际数
16、据来调解这些数值,使其更真实地反应企业的具体情况。链路和运营商妨碍是影响WAN情况中的可用性的主要因素。切记:WAN情况只是同企业网络遭遇同样可用性问题的其他网络,包罗:软硬件妨碍、用户错误及电源妨碍等。许多运营商网络都已经开始对系统进行可用性预算,但得到这些信息并不容易。切记,运营商的可用性包管级别很少基于或底子不基于实际可用性预算。这些包管级别有时只是用来提高运营商知名度的营销和销售要领。在某些情况下,这些网络还宣布看似相互突出的可用性统计数据。切记,这些统计数据可能只适用于完全冗余的核心网络,而不作为导致不可用性的因素(不可用性由本地环路接入引起),本地环路接入才是WAN网络中不可用性的
17、主要因素。对WAN情况进行可用性评估应基于实际的运营商信息以及WAN连接的冗余级别。如果公司拥有多个大楼入口设施, 冗余本地环路供给商、同步光网络 (SONET)本地接入、以及漫衍在多个地区的冗余远程运营商,则WAN的可用性将得到明显增强。电话业务是WAN情况中、非冗余网络连接相当准确的可用性预算。使用类似于本文所描述的可用性预算要领进行丈量,电话业务的端到端连接的可用性预算约莫为99.94%。这种要领业已乐成应用于数据情况中,结果根本相同,目前正被用作办事供给商有线网络中分组有线规程的预算。如果将该数值用于完全冗余的系统,则我们可以假定,WAN可用性会靠近99.9999%。固然,由于本钱及可
18、用性问题,目前很少有哪家公司摆设了漫衍在多个地区且完全冗余的WAN系统,所以应使用适当的判断要领测定这种功效。LAN情况中不太可能产生链路妨碍,然而,筹划人员可能希望假定连接器断开或松动会引发短时间的妨碍停机。对LAN网络而言,守旧的可用性预计约为99.9999%,或约莫30秒妨碍停机/年。网络设计是影响可用性的另一个主要因素。不可扩展的设计、设计错误及网络聚适时间都市对可用性产生负面影响。注意:出于本文的目的,我们将在下面的篇幅中描述不可扩展的设计或设计错误。网络设计被限定在可丈量的数值上(基于网络中导致话务重新路由的软硬件妨碍)。这些数值通常被称作“系统妨碍切换时间”,并且是系统中自治愈协
19、议功效的影响因素。使用与系统盘算相同的要领便可盘算可用性。然而,它只有在网络妨碍切换时间满足网络应用要求时才有效。如果妨碍切换时间可以担当,则不把它盘算在内。如果妨碍切换时间不能担当,则盘算时必须将其考虑在内,例如:预计或实际的妨碍切换时间为30秒的情况中下的IP 话音(VoIP)。在这个例子中,用户只是挂断电话,并有可能重新拨叫。用户肯定会将这30秒看作是非可用时段,但在可用性预算时却未加考虑。凭据系统妨碍切换时间来盘算不可用性时要着眼于理论的软硬件可用性以及冗余路径,因为妨碍切换将出现在这个领域。您必须了解可能产生妨碍并导致冗余路径中出现妨碍切换的设备数量,这些设备的MTBF以及妨碍切换时
20、间。一个简朴的例子就是,冗余的相同设备中,每台设备的MTBF为35433小时,妨碍切换时间为30秒。用35,433除以8766(年平均小时数,包罗闰年),我们可以看出该设备每四年出现一次妨碍。如果使用30秒作为妨碍切换时间,我们便可以假设:由于妨碍切换,每台设备每年平均停机7.5秒。由于用户可能会跨两条路径,因此需要将此结果乘以2,即:每年15秒。当以秒/每年进行盘算时,这个简朴系统中由于妨碍切换引起的可用性的盘算结果为99.99999785%。由于可能出现妨碍切换的网络中的冗余设备数量,在其他情况中,这个数字可能还要略高些。用户错误和流程可用性问题是造成企业和运营商网络中不可用性的主要原因。
21、约80%的不可用性问题是由于无法检测错误、变革妨碍及性能问题造成的。公司在制定可用性预算时,不肯意担当用户错误和流程引发的不可用性是其他所有理论上的不可用性的四倍这一实施,然而,种种证据一致表明,这种情况存在于许多情况中。下面我们将详细论述不可用性的这个方面。由于您无法从理论上盘算由用户错误和流程引发的不可用性数量,我们发起您在制定企业力求完美的可用性预算时不将其考虑在内。但企业必须了解其流程和专业技能水平中现在所面临的可用性风险。透彻地了解了这些风险及抑制因素之后,网络筹划人员便有可能将这些问题引发的一定命量的不可用性考虑在内。Cisco NSA HAS项目深入研究了这些问题,并可资助企业了
22、解由于流程、用户错误或专业技能问题引发的不可用性。您可将以前界说的所有领域的可用性相乘来决定整个可用性预算。这种要领通常适用于任意两点间的连接相类似的同机种情况,如:分级体系模块化LAN情况或分级体系尺度WAN情况等。这下面的例子中,为分级体系模块化LAN情况确定了可用性预算。该情况为所有网络组件都配备了备用发电机和UPS系统,并对电源进行适当的治理。企业未使用VoIP,也不希望将软件妨碍切换时间考虑在内。估算结果如下: 两个端点间的硬件路径可用性= 99.99% 使用GD软件可靠性作为基准的软件可用性= 99.9999% 带有备用系统的情况和电源可用性= 99.999% 考虑LAN 情况中的
23、链路妨碍的可用性= 99.9999% 未将系统妨碍切换时间盘算在内的可用性= 100% 认为不存在用户错误和流程缺陷的可用性= 100%企业希望到达的最终可用性预算是:0.9999 X 0.999999 X0.999999 X 0.999999 = 0.999896,或99.9896%的可用性。如果我们将用户或流程错误引发的潜在不可用性考虑在内,并假设其引发的不可用性是技能因素引发的可用性的四倍,则最终可用性预算是99.95%。对这个例子的阐发使我们了解到,LAN可用性在99.95%与99.989%之间。现在,这些数值能够用作网络公司的办事水平目标。可以丈量系统中的可用性并确定上述六个领域分别
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 服务水平 管理 协议

限制150内