西安世园会运维实施及服务方案(共42页).doc
《西安世园会运维实施及服务方案(共42页).doc》由会员分享,可在线阅读,更多相关《西安世园会运维实施及服务方案(共42页).doc(42页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上正本西安世园会运营阶段组织及整体实施方案 西安互易计算机科技有限公司目录第一章 信息化专业技术运维实施方案1.1 信息化运维现状分析随着IT建设的不断深入和发展,IT系统的运行维护已经成为了CIO和IT部门普遍关注和不堪重负的问题。近日有一个调查问到目前CIO最关注的问题是什么时,大多数CIO表示最关心的是IT运维成本过高和管理的复杂化。原因是在过去的5年中,很多用户都实施了很多IT系统,使到IT运行越来越复杂,也越来越难管理。调查结果显示有50%的受访CIO认为IT运维成本过高的一个原因是IT运维的现代做得还不够好,依靠手工流程来管理,不但使到运维效率不高,而且人力
2、成本更是花费惊人。当下,IT运维已经成为企业的必需品,企业关注的是如何提高IT运维的效率,从而实现IT资源利用率的最大化。国际知名调查机构Gartner调查发现,在IT运维成本中,源自技术或产品(包括硬件、软件、网络等)成本其实只占20%,而流程维护成本占40%,运维人员成本占40%。流程维护成本包括日常维护、变更管理、测试成本等;人员成本包括训练、教育、人员流失、招聘成本等。因此,如何提高IT运维管理效率,降低运维成本是时下IT界和CIO最热门的话题之一。1.2 传统式IT运维管理的问题目前许多IT运维虽然已经实现从人工运维到计算机管理,但这种IT运维仍然是等到IT故障出现后再由运维人员采取
3、相应的措施,所以传统被动的、孤立的、半自动式的IT运维管理模式经常是让IT部门疲惫不堪。主要有以下几个方面:1) 运维人员被动低效率手工救火在IT运维过程中,IT员工被动低效率手工救火,只有当事件已经发生并已造成业务影响时才能发现和着手处理。这种被动“救火”不但使IT运维人员终日忙碌,也使IT运维本身质量很难提高,导致IT部门和业务部门对IT运维的服务满意度都不高。目前绝大多数的企业的IT运维现状是如此:IT运维人员日常大部分时间和精力是处理一些简单重复的问题;由于故障预警机制不完善,往往是故障发生后或报警后才会进行处理,使到IT运维人员的工作经常是处于被动“救火”的状态,不但事倍功半而且故障
4、还常常会出现恶性连锁反应。2) 缺乏一套高效的IT运维机制支撑目前许多企业现有的IT运维机制存在如下问题:IT运维管理过程中缺少现代的运维管理模式,也没有明确的角色定义和责任划分,使到问题出现后很难快速、准确地找到根本原因,并及时地找到相应的人员进行修复和处理;或者是在问题找到后缺乏流程化的故障处理机制,而在处理问题时不但欠缺规范化的解决方案,也缺乏全面的跟踪记录。3) 缺乏高效的IT运维技术工具随着信息化建设的深入,企业IT系统日趋复杂,林林总总的网络设备、服务器、中间件、业务系统等让IT运维人员难以从容应对,即使加班加点地维护、部署、管理也经常会因设备出现故障而导致业务的中断,严重影响企业
5、的正常运转。部分原因是企业缺乏事件监控和诊断工具等IT运维技术工具,因为在没有高效的技术工具的支持下故障事件很难得到主动、快速处理。尽管IT运维管理的技术在不断进步,但实际上很多IT运维人员并没有真正解脱出来,原因并不复杂。目前的技术虽然能够获取IT设备、服务器、网络流量,甚至数据库的警告信息,但成千上万条警告信息堆积在一起更本没法判断问题的根源在哪里。还有,目前许多企业的更新管理绝大多数工作都是手工操作的。即使一个简单的系统变更或更新往往都需要运维人员逐一登录每台设备进行手工变更,当设备数量达至成百上千时,其工作量之大可想而知。而这样的变更和检查操作在IT运维中往往每天都在进行,占用了大量的
6、运维资源。因此,实现运维管理工作的现代和优秀的运维体系来说对企业来说已迫在眉睫。1.3 建立现代化IT运维体系的必要性现在随着IT运维管理工作的复杂度和难度的大大增加,仅靠过去几个“运维英雄”或“技术大拿”来包打天下已经行不通了,企业开始需要运用专业化、标准化和流程化的手段,来实现运维工作的现代管理。因为通过现代监控系统能及时发现故障隐患,主动的告诉用户需要关注的资源,以达到防患于未然。例如,全天候自动检测与及时报警能实现IT运维的“全天候无人值守”,大大降低IT运维人员的工作负担。而且,通过现代诊断能最大限度地减少维修时间,提高服务质量。因此, 对于越来越复杂的IT运维来说,将纯粹的人工操作
7、变为一定程度的现代管理是一个重要发展趋势。首先,IT运维流程现代能够提高流程的可控性,可以基于业务需求来制定个性化的流程,使企业领导有机会看见他们的业务流程,对企业流程有一个深刻的分析和理解,进而改造和优化流程。其次,IT运维流程的现代能提高透明度。因为随着业务需求的变化可能会有多个版本出现,手工流程的不透明将会给流程定制和优化带来相当大的困难,而现代流程可以使用户能够一目了然的看到整个流程的各个节点运转情况,现代工具潜移默化地提升业务保障能力。再者,运维系统实行了现代监控以后,通过工具自动监控对人的工作是一种减负,也是一种降低成本的表现。IT运维已经在风风雨雨中走过了十几个春秋,如今它正以一
8、种全新的姿态摆在我们面前-现代,这是IT技术发展的必然结果。现在,IT系统的复杂性已经客观上要求IT运维必须能够实现数字化、现代维护。所谓IT运维管理的现代是指通过将日常IT运维中大量的重复性工作,小到简单的日常检查、配置变更和软件安装,大到整个变更流程的组织调度,由过去的手工执行转为现代操作,从而减少乃至消除运维中的延迟,实现“零延时”的IT运维。简单的说,IT运维现代是指基于流程化的框架,将事件与IT流程相关联,一旦被监控系统发生性能超标或宕机,会触发相关事件以及事先定义好的流程,可自动启动故障响应和恢复机制。现代工作平台还可帮助IT运维人员完成日常的重复性工作(如备份,杀毒等),提高IT
9、运维效率。同时,IT运维的现代还要求能够预测故障、在故障发生前能够报警,让IT运维人员把故障消除在发生前,将所产生损失减到最低。对于企业来说,要特别关注两类现代工具:一是IT运维监控和诊断优化工具;二是运维流程现代工具。这两类工具主要应用于:监控现代,是指对重要的IT设备实施主动式监控,如路由器、交换机、防火墙等。配置变更检测现代,是指IT设备配置参数一旦发生变化,将触发变更流程转给相关技术人员进行确认,通过自动检测协助IT运维人员发现和维护配置。维护事件提醒现代,是指通过对IT设备和应用活动的时时监控,当发生异常事件时系统自动启动报警和响应机制,第一事件通知相关责任人。系统健康检测现代,是指
10、定期自动地对IT设备硬件和应用系统进行健康巡检,配合IT运维团队实施对系统的健康检查和监控。维护报告生成现代,是指定期自动的对系统做日志的收集分析,记录系统运行状况,并通过阶段性的监控、分析和总结,定时提供IT运维的可用性、性能、系统资源利用状况分析报告。1.4 建立高效IT运维现代化管理的步骤作为CIO,如何在有限的投入下尽快建立高效的现代IT运维体系是首要关注的问题,因为提高IT运维质量已经成为CIO当前面临的重要问题。以下是我的一些经验总结。(1)建立现代运维管理平台第一步是要先建立IT运维的现代监控和管理平台。通过监控工具实现对用户操作规范的约束和对IT资源进行实时监控,包括服务器、数
11、据库、中间件、存储备份、网络、安全、机房、业务应用和客户端等内容,通过自动监控管理平台实现故障或问题综合处理和集中管理。例如,在自定义周期内进行自动触发完成对IT运维的例行巡检,形成检查报告。包括自动运行维护,以完成对系统补丁的同步分发与升级、数据备份、病毒查杀等工作。(2)建立故障事件自动触发流程,提高故障处理效率所有IT设备在遇到问题时要会自动报警,无论是系统自动报警还是使用人员报的故障,应以红色标识显示在运维屏幕上。然后IT运维人员只需要按照相关知识库的数据,一步一步操作就可以。因此,企业需要事先建立自动工单式流程管理,当设备或软件发生异常或超出预警指标时会触发相关的事件,同时触发相关工
12、单处理流程给相关IT运维人员。IT运维人员必须在指定时间内完成流程所规定的环节与工作,以提高IT运维响应问题的效率。(3)建立规范的事件跟踪流程,强化运维执行力度首先需要建立故障和事件处理跟踪流程,利用表格工具等记录故障及其处理情况,以建立运维日志,并定期回顾从中辨识和发现问题的线索和根源。事实上许多实践也证明,建立每种事件的规范化处理和跟踪指南,可以减少IT运维操作的随意性和强化运维的执行力度,在很大程度上可降低故障发生的概率。同时,用户还应可以通过自助服务台、电话服务台等随时追踪该故障请求的处理状态。(4)设立IT运维关键流程,引入优先处理原则设立IT运维关键流程,引入优先处理原则是指要求
13、CIO定义出IT运维的每个关键流程,不仅仅是定义流程是什么,还包括要指出每个关键流程对企业有什么影响和意义。同时,在设置现代流程时还需要引入优先处理原则,例行的事按常规处理,特别事件要按优先级次序处理,也就是把事件细分为例行事件和例外关键事件。总之,实现IT运维的现代管理是指通过将IT运维中日常的、大量的重复性工作现代,把过去的手工执行转为现代操作。现代是IT运维工作的升华,IT运维现代不单纯是一个维护过程,更是一个管理的提升过程,是IT运维的最高层次,也是未来的发展趋势。1.5 IT运维服务管理解决方案1.5.1概述 随着企业的业务的发展、业务模式的变化,市场环境的变化和内部管理模式的变化,
14、以及IT技术的发展,企业的IT基础架构越来越庞大和复杂,无论是终端桌面的数量、服务器和数据库以及应用系统的数量、还是网络规模,都在逐年增加。在这种复杂的架构环境中,IT管理的难度也成倍的增加。但在管理难度增加的同时,必须确保对业务部门提供IT服务的质量,这就对管理的方法和手段提出更高的要求,引入更合理更规范的管理方法和管理工具成为必然选择。 ITIL是一套指导IT组织如何进行IT管理和规划,将IT战略与组织业务战略相融合的最佳实践,也是唯一一套具有详细操作指导的IT管理理论。ITIL能够帮助企业更好的进行IT运营规划、规范运维操作、提高IT服务质量、降低IT运维成本、提高IT运作效率,同时也能
15、很好的支撑企业的IT内控要求,达到较高的IT治理水平。 我公司基于ITIL理论并结合国内实际落地经验,总结了一整套适合国内用户实施和使用的IT服务管理产品套件,为2011西安世园会提供领先的IT服务管理(ITSM)解决方案,致力于帮助西安世园集团构建高效的IT运维管理模式。1.5.2解决方案产品架构 IT服务管理建设最终需要一个优秀的工具平台以满足复杂设计要求的落地,对此我们已有丰富的经验,并以国际上优秀的BMC Remedy工具平台为基础引擎,在多个实例中不断的总结完善了一套完整的ITSM工具套件1.5.3解决方案特点1.5.3.1 强大且符合国内习惯的流程引擎和规则体系 BMC是全球ITS
16、M产品提供商中的巨头,作为BMC的核心合作伙伴,我们采用了BMC公司在全球享有盛誉的Remedy流程平台作为底层工具引擎,并结合国内现状研发了一套适合国内用户使用的流程定义风格。 在流转规则上设计了一套符合国内客户使用习惯的可灵活定制的规则体系,如“接”“派”“转”“批”“退”“升”“会签”等,并且定制简单,操作便捷。如事件单一键式操作界面:1.5.3.2精密的流程规范控制和追溯体系 很多客户在设计流程和落地运行时,都注重于对流程本身流转的描述,而忽视了对流程规则的控制和质量监管,最后导致流程运行效果不佳,执行乏力。我们的解决方案和产品套件对此做了大量的设计和定制,管理规范和工具设计双管齐下,
17、基本上满足了对流程规则和质监的要求,主要包括: 对分类的规范 对流转规则的规范 对严重等级的规范 对引入领导支持和决策的规范 其他规范(等待规范、关闭规范重复事件规范等) 如事件管理,通过上述规范除了可以更加有效的进行事件的记录、处理和质监之外,我们通过这些规范在工单上的具体信息展现,可以在回顾和故障分析时直观清晰的把握一个事件的脉络。1.5.3.3专业的变更管理措施 变更对运维管理来说是需要控制的重点,但对流程流转的控制只是其中一种手段,解决方案专门对变更进行了一些关键技术点的提升,帮助世园会信息技术部运维组人员做出更加准确的风险评估和控制。 流程的审批引擎技术,满足对集中的、复杂的审批规则
18、需要,包括批量审批等 变更影响管理 利用自动的、智能的变更影响评估工具,前瞻性的确定对服务的影响及降低变更请求实施的风险 影响模拟-提供“what-if”CI和服务影响分析 冲突检测,管理和解决变更请求的潜在的有害冲突 1. 确定在同一时间是否存在CI项被不同变更请求处理 2. 基于变更请求计划的开始/结束日期及与变更请求直接关联的CI项 3. 客户价值: 阻止常见的由于变更之间的冲突带来的负面影响。提供机会来整合变更从而提高效率。 图形化变更日历展现和变更窗口时间限制,在管理上有效控制无计划变更的出现 1. 图形化集中展现和排程所有已计划的变更单 2. 允许对变更窗口时间段进行配置,所有变更
19、的排程必须在时间窗口内进行 3. 紧急变更可以例外 变更流程配置引擎,实现不同条件下的不同变更流转路径和审批路径 我们的经验是,变更的流程应该是多样性的,即不同部门,不同等级等因素会导致变更的流程应该有所差异,这一点在我们的实际经验中已经得到的充分的验证。为此我们专门开发了一套变更的流程配置引擎,允许按照多个变更要素选择不同的流转路径。1.5.4. 有效的合规管理手段 流程的质监合规主要包括两个角度考虑:第一,是日常的流程执行质量和合规要求的质监,通过系统和人工手段对每张工单进行实时质监,并对质监出现问题的工单及时介入进行督促协调或者请求领导支持。第二,是收集和整理质监数据,分析流程的执行效率
20、和存在的瓶颈及问题。解决方案对上述两类的质监均有有效的管理辅助手段,帮助提升对质监合规的管理水平。如下图,对工单填写的质监:1.5.5. 独特的闭环管理理念闭环管理是一种管理手段的概念,其主要目标是通过对服务提供和交付工作的端到端闭环管理来达到推进主动提升服务质量的目标闭环管理包括两个层面,对流程的端到端闭环通过质监合规和绩效考核来帮助实现,而对整个运行模式下服务的端到端闭环管理则包括了多个管理科目,在每个科目执行过程中都由不同的措施完成,在事件管理中,对服务的闭环管理配套措施主要是故障分析工作。通过对故障的深入挖掘分析来推进服务质量的主动提升。并且找到各个管理科目之间的闭环联系,并对相关的其
21、他管理科目提出提升要求。1.5.6. 完善的操作规范指导和维护机制操作规范指导流程在执行过程中,由于执行人员对系统的不熟悉所导致的效率下降、质量不高甚至错误也是导致流程运转不利甚至推广失败的主要原因之一,为此我们提出了“运行管理规范”的理念并在解决方案中做到了完全配套。“运行管理规范”是一部“步兵操典”,从细节上指导相关人员在不同场景下如何判断和操作。流程维护机制流程本身是需要不断完善和优化的,在日常工作、流程回顾、故障分析时都会产生对流程本身进行优化调整的需求,对此需要有一套简单易行的维护机制,从管理上和产品实现上对维护工作进行标准化,周期化。解决方案配套有完善的流程维护机制。1.6 运维实
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 西安 世园会运维 实施 服务 方案 42
限制150内