数据中心自动化运维管理及平台的建设.docx
《数据中心自动化运维管理及平台的建设.docx》由会员分享,可在线阅读,更多相关《数据中心自动化运维管理及平台的建设.docx(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据中心自动化运维管理及平台的建设 企业的信息系统平台实现集中化处理的必要基础,其在企业的信息化建设中发挥着重要的作用。科技信息的不断进步促使了企业数据中心相关设备的应用数量渐渐递增,不断强化对数据中心的管理并逐步实现数据中心运维管理的自动化,从而达到节约人力、节约成本的目的。基于此,本文首先阐述了自动化运维的相关理论学问,并进一步分析探讨了自动化运维平台的建设方法。 【关键词】数据中心 运维管理 自动化 运维自动化其实就是将传统的计算机运维工作实现自动化,从而变更了以往传统的手动模式,削减了运维工作人员的数量,全面的提升了计算机运维的工作效率。由于传统的单靠人工计算机运维已经不能满意当前企业
2、服务器及数据量的各项要求,这就要求相关技术人员通过不断学习来应对目前高速发展的信息化时代。同时,对于企业的自动化运维管理系统在设计时要遵循自动化程度高、综合性强、易扩展的原则,从而在实际的工作时实现数据中心的自动化管理。 1 运维自动化的内容和工具 1.1 运维自动化的内容 计算机运维经验了漫长的发展历程,目前它已由原来的几台服务器发展到现在一个海量的数据中心,并逐步实现了运维自动化的一个全新状态,而在当下困难的大数据背景下实现计算机运维自动化管理成为运维人员亟待解决的问题。对于每天的常规检查、配置变更以及软件安装这些平常运维工作中须要重复进行的工作,实现自动化管理代替传统的人工操作即为运维自
3、动化管理。通过运维自动化可以使运维工作中的延迟现象得以削减甚至消退,从而达到计算机运维的“零延迟”目标。另外,运维自动化系统可以帮助运维人员避开日常简洁重复的工作,节约时间的同时使工作效率也得以提高。此外,自动化运维可以对故障进行提前预料并报警,从而帮助运维工作人员在事 故未发生时就能提前预防并消退隐患,大大降低企业在生产过程中不必要的消耗。图1所示为运维自动化程度与运维困难度模型分析,依据这个模型得出,当机器的数量增加时运维的困难度也会相应增加,假如采纳自动化运维则会削减大量人工操作,节约成本。 1.2 自动化运维管理工具 企业运营过程中,自动化T具的应用可以彻底实现运维自动化,主要有运维监
4、控和诊断优化工具、运维流程自动化工具。 1.2.1 白动监控 目前多数企业的运维系统已经逐步完善,但是运维人员及被管理对象的数量比例严峻失调,因此不能刚好发觉运行过程中发生的风险及故障。而监控自动化对工作中重要的计算机组件、业务的运行状况以及处理效率等实时状态进行主动式监控,从而达到刚好并精确的发觉运行中发生的各种故障,然后将故障通知相关用户,达到提前预警防患于未然的效果。 1.2.2 自动检测配置变更 由于运维对象多,变更量大且频率高,运维工作者的工作量很大,从而导致有些流程和制度执行不到位的状况。而一旦计算机设备的配置参数发生变更时,就会触发到变更流程同时将信息传递给运维人员进行确认,通过
5、自动化测试帮助运维人员对配置进行查找和维护。配置变更检测自动化如图2所示。 1.2.3 自动提示待维护事务 传统的计算机运维工作时,运维对象产生大量的事务,由于事务的分级不合理使得工作人员不能刚好发觉并处理一些紧急事项。运维人员要想做到维护事务提示自动化则可以通过适时监控相关的系统服务管理平台,提高管理的可控性和透亮度,一旦出现突发的事故时,系统可以第一时间发觉并启动报警,然后将有效的信息传递给运维技术人员进行解决。 1.2.4 自動生成维护记录 相关技术人员要对计算机设备的运维系统以及一些硬件配置进行定期自动的检查与维护,还要对计算机系统的运行状况定期自动的做好日志的记录、收集与分析,通过对
6、系统阶段性的监管与探讨归总,以此为依据定时的供应计算机运维系统相关的应用状况以及分析报告。 2 数据中心自动化运维平台的建设方法 2.1 构建自动化运维 2.1.1 构建运维自动化管理平台 通过运维自动化管理系统的建立可以实现计算机运维的自动化管理,通过自动化运维管理系统来实现对系统运行过程中出现的故障以及问题集中管理和处理的实力。运维管理平台可以实时的对计算机设备进行管理与监控,例如:服务端、数据库、存档、网路、平安、计算机房、相关应用与服务端等相关项目的管控,通过对海量的网络和服务器等节点的实时监控实现故障的精确预警、报警以及精确定位。 2.1.2 构建系统故障的自动触发流程 运维自动化平
7、台在工作过程中一旦遇到问题和设备故障都会自动报警,在对故障进行汇报时,不论是系统报警还是人工汇报,都要严格切记利用红色标识展示在运维系统的屏幕上。收到故障信息后,运维人员依据相关学问库的数据,然后依据相关流程按步骤操作即可。因此,企业必需要事先建立流程化的故障和事务处理机制,一旦有异样状况或设备出现故障时就会马上触发相关事务,然后将相关工作流程处理程序触发并传递给操作运维人员,以此确保运维人员按规定刚好完成流程规定的工作,这样可以大大提高工作以及运维处理故障事务的效率。 2.1.3 建立规范的事务跟踪流程 要想实现计算机运维的自动化管理,首要工作就是建立流程化的事故处理与时间处理机制,利用表格
8、工具对出现的异样状况和故障处理状况进行相应的运维日志的记录,并且要定期的对记录的信息进行总结,通过分析总结找寻发生故障的线索和根源。多年工作实践发觉,通过建立事务的流程化故障和事务处理机制,可以有效降低运维人员的不规范操作,削减操作的随意性,加大计算机操作和运维工作的执行力度,尽力将系统发生故障和问题的几率降到最低。 2.1.4 建立运维的关键流程 信息技术运维的管理人员为运维部门定制合理的工作流程以及职责,同时其不仅要明确指出工作流程的含义,还要说明每个关键流程对企业的必要性,并建立事务处理机制,引入优先处理的原则。此外,在对运维关键流程的自动化进行设置时,首要条件是要保证紧急事务的优先处理
9、原则,一般事务按常规处理,对于特殊的事务运维工作人员肯定要根据优先级次序,提高事务的处理效率和质量。 2.2 数据中心自动化运维平台的建设方法 在进行运维管理系统平台的建设时要结合业务工作的实际要求,充分将服务与平安两个方面的因素考虑在内,以服务为视角、平安为依托,整合现有不合理的管理模式并采纳模块化和分层次的架构,开发出一套全新的检测、监控和管理软件。 2.2.1 设计目标 运维自动化即是运用最少的运维人员,结合运用脚本以及第三方程序,确保运维系统在一周的时间里每天24小时,高效率平稳地运行。由于企业运维部门设备多、运维技术性强以及人工运维易遗漏等特点,自动化运维平台设计的目标可概括为以下3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据中心 自动化 管理 平台 建设
限制150内