基于VMware的高可用性集群在电力信息系统中的应用.pdf
第26卷第2期上海电力学院学报Vol.26,No.22010年4月JournalofShanghaiUniversityofElectricPowerApr.2010文章编号:1006-4729(2010)02-0193-04基于V Mware的高可用性集群在电力信息系统中的应用 收稿日期:2009-12-15作者简介:耿新民(1949-),男,副教授,江苏南京人.主要研究方向为电力企业网络计算与信息化的研究和应用开发.E2mail:.耿新民,王少峰,许 飞(上海电力学院 计算机与信息工程学院,上海 200090)摘 要:在VMware服务器中安装多个虚拟机,分别作为不同服务器的备用机,并且利用心跳信号持续检测物理服务器的工作状态.当物理服务器出现故障时,高可用性集群自动切换服务,使故障服务器的业务迅速平衡地迁移到虚拟机上,也可以把负载过大的服务器上的应用动态地分配到其他负载较小的服务器上,以确保电力信息系统服务的不间断运行.关键词:虚拟机;电力信息系统;高可用性中图分类号:TP391;T M73文献标识码:AThe Application of High Availability Cluster Based onV Mware in the Power I nformation SystemGENG Xin2min,WANG Shao2feng,XU Fei(School of Computer and Infor m ation Engineering,Shanghai University ofElectric Power,Shanghai200090,China)Abstract:VMware machines are installed in VMware servers to act as backup servers.The heartbeatsignal is used to continuously detect the working status of the physical servers.When a physicalserver fails,the high availability cluster could automatically switch services,in order that the failingservers operations migrate rapidly to a virtual machine.In the same way,the server applicationswith too much load could be dynamically allocated to the server with smaller load,to ensure theuninterrupted operation of the power information system.Key words:VMware;power infor mation system;high availability cluster 在电力信息化建设过程中,电力企业信息系统的可用性和安全性受到越来越多的关注.以某省电力公司数据信息系统为例,其各类服务器的数量就达近200台,但绝大多数服务器工作方式单一,各应用系统之间缺乏有效沟通,致使数据信息难以共享,系统应用效率不高,信息资源浪费严重.据有关调查人员测算,很多服务器处理器的平均利用率不足20%.因此,打破信息孤岛,构建协同一体化的信息化应用环境,已成为电力行业迫在眉睫的任务.采用虚拟机VMware构建电力信息系统的高可用性集群,可以充分利用现有的电力设备,有效地实现电力信息系统的高可用性、可靠性和数据的实时备份,同时也可节约构建高可用系统的成本,保证电力信息系统服务的不间断运行.1V Mware虚拟化实现的主要功能1.1 服务器整合VMware虚拟化技术是将一个完整的X86服务器(包括驱动程序、操作系统、应用程序及配置)封装成虚拟机,移植到VMware ESX server平台上,VMware ESX服务器传输物理系统到逻辑资源池,虚拟构架提供负载隔离,系统和应用程序被分离在包含多虚拟机的单一台物理服务器上.系统资源按需动态地分配到任何操作系统上,提供大型机的性能和服务器资源控制.VMware ESX服务器通过在安全便捷的虚拟机上执行分区和分割服务器资源来简化服务器的基础构架,确保服务器资源能被远程管理,自动预制和标准化,实现在一台物理服务器上独立运行多个操作系统和应用的功能.1.2 系统动态迁移 虚拟机通过VMware ESX server运行在各个服务器上,借助VMotion可以在不中断业务的情况下,将运行中的虚拟机(包括驱动程序、操作系统、应用程序及配置)从一台服务器迁移到另一台物理服务器上,从而实现更高效的资源分配.VMotion通过移动虚拟机,实现零宕机时间的维护行为,使电力公司无需调配停机时间或中断业务操作,就可以完成对内部硬件和存储的维护.1.3 资源动态分配VMware Infrastructure将标准服务器(处理器、内存、存储以及附加网络)虚拟化,并聚合为可根据需要分配给虚拟机的逻辑资源池.VMwareDRS(Distributed Resource Scheduler)是一种分布式服务,可跨越多个逻辑资源池,具有动态分配和平衡计算能力,并且根据业务使用需要和优先级的资源分配规则,在虚拟机之间以智能方式分配可用资源.当虚拟机遇到负载增大的情况时,DRS首先根据既定资源分配规则评估其优先级,如果合理,则通过在物理服务器之间重新分配虚拟机来分配其他资源.动态资源分配可以确保容量能优先分配给优先级最高的应用程序,同时又能实现资源总体利用率的最大化.1.4 高可用性保障VMware HA(High Availability)为所有在虚拟机中运行的应用程序提供便于使用、经济高效的高可用性.当服务器发生故障时,受影响的虚拟机将在留有备用容量的其他服务器上自动重启.VMware HA将停机时间和服务中断减至最低,同时不需要专门的备用硬件或安装附加软件.VMware HA不会局限于某一操作系统或特定的应用程序故障切换,在整个虚拟化环境中提供始终如一的高可用性.其工作方式是在每台服务器上放置一个代理,与其他服务器保持“心跳信号”,并设置各个服务器及虚拟机的优先级.当某一台服务器出现故障时,VMware HA会检测到其“心跳信号”异常,并在正常的服务器上重新启动受影响的虚拟机.2 基于V Mware的高可用性集群系统VMware为构建高可用性集群提供了新的途径,为运行在虚拟机ESX Server中的应用程序提供易于掌握的、经济高效的高可用性.整个虚拟化IT环境具有始终如一的高可用性,而且没有用于操作系统特定应用程序故障切换解决方案的成本和复杂性1.VMware高可用性集群体系结构如图1所示2,3.图1VMware的高可用性集群系统结构(1)VMware ESX Server用于虚拟化服务器、存储和网络的平台;(2)VMware VMFS 用于存储虚拟化的高性491上 海 电 力 学 院 学 报 2010年能群集文件系统;(3)VMware Virtual S MP为虚拟机提供多处理器支持;(4)VMware VirtualCenter 为IT基础架构提供集中化管理、操作自动化和优化;(5)VMware HA 为虚拟机提供经济高效的高可用性;(6)VMwareDRS 为虚拟机提供动态平衡和资源分配;(7)VMware VMotion 虚拟机实时迁移且服务不中断;(8)VMware Consolidated Backup 用于虚拟机的集中式备份软件.VMware高可用性集群不间断地监控资源池中的所有服务器并检测服务器故障.安插在每台服务器上的代理程序不断向资源池中的其他服务器发出“心跳信号”,“心跳信号”的终止将启动所有在其他服务器上受影响的虚拟机.VMware高可用性集群确保资源池中始终有充足的资源,以便于出现服务器故障时在不同的物理服务器上重启虚拟机.虚拟机的群集文件系统为ESXServer实例提供了对同一组虚拟机文件的并行读写访问能力,也使虚拟机的重启成为可能.通过VirtualCenter可以方便地为资源池配置VMware高可用性集群.3 基于VM ware电力企业高可用性集群系统的实现3.1 资源动态分配的实现VMware DRS可以持续不断地监控VMware主机集群中资源池的利用率,并能根据商业需要在虚拟机中智能地分配其所需的资源.一旦将服务器整合到资源较少的物理主机上,虚拟机的资源需求往往会成为意想不到的瓶颈,全部资源需求很有可能超过主机的可用资源.VMware DRS提供了一个自动化机制,通过持续地平衡容量将虚拟机迁移到有更多可用资源的主机上,确保每个虚拟机在任何节点都能及时调用相应的资源.其工作原理如图2所示.在图2的集群中,有A,B,C 3台ESX服务器,上面各有其运行的虚拟机.如果C服务器上的虚拟机开始进行大量CPU计算,导致C上的其他虚拟机开始出现性能降低的情况,此时系统就会检查整个集群,并且将需要CPU计算最多的虚拟机移到目前CPU较空的服务器A或CPU较强大的服务器B上,以实现资源的动态分配功能.图2 资源动态分配的原理示意3.2 高可用性的实现VMware HA为所有在虚拟机中运行的应用程序提供易于使用、经济高效的高可用性,当服务器发生故障时,受影响的虚拟机会在集群中留有备用容量的其他主机上自动重启.HA将停机时间和服务中断减至最低,同时不需要专门的备用硬件和安装附加软件.VMware HA为整个虚拟化环境提供始终如一的高可用性,而且对操作系统和特定应用程序的故障切换解决方案的成本和复杂性没有限制.其工作原理如图3所示.当物理服务器C发生故障时,心跳检测发现服务器C发生故障,C上的资源会自动迁移到A和B服务器上,以保持业务的高可用性.图3 故障自动切换的原理示意3.3 高可用性集群系统的实现 资源动态分配和高可用性的实现为构建高可用性集群系统提供了有力的保障,采用VMware591 耿新民,等:基于VMware的高可用性集群在电力信息系统中的应用构建电力企业高可用性集群,不需要为系统中的每台服务器分别添置备用服务器,就可以有效地降低系统成本4,5.如图4所示,在基于VMware的电力企业高可用性集群中,备用服务器安装了VMware ESXServer,与电力企业数据库服务器、Web服务器、OA服务器和文件服务器等构成高可用性集群,同时采用数据库备份服务器实现差额计划备份.图4 高可用性集群系统的示意 采用磁盘阵列(Redundant Arrays of Inexpen2sive Disks,RA I D)的Storage Area Network(SAN)集中存储方式,可以将每个虚拟机的文件系统创建在共享的SAN集中存储阵列上,VMware VMFS虚拟机文件系统允许多个ESX Server安装并同时访问同一虚拟机存储,支持通过VMware VirtualCenter,VMware VMotion技术,VMware DRS和VMware HA提供的基于虚拟化的分布式基础结构服务.由于VMware的虚拟架构系统中的虚拟机实际上被封装成了一个档案文件及若干相关环境配置文件,将这些文件放在SAN存储阵列上的VMFS文件系统中,可以让不同服务器上的虚拟机都可以访问到该文件,从而消除了单点故障.在VMware ESX Server中安装多个虚拟机,分别作为电力企业数据库服务器、Web服务器、OA服务器和文件服务器的备用机,采用HA软件检测物理服务器的工作状态,当出现故障时可以接管服务.这样就保证了服务的不间断性,提高了整个电力系统的高可用性.在实际运行过程中,效果良好.4 结束语 采用VMware构建电力企业高可用性集群,可有效实现电力企业数据的高可用性与实时备份;充分利用系统原有设备,不必大量购置高性能服务器和交换机等设备,可以降低构建高可用系统的成本.实践证明,该解决方案可以确保电力信息系统服务的不间断性,提高整个电力系统的高可用性.参考文献:1 VMware,Inc.VMware virtual machine importer:user manual1998-2007 EB/OL.2007-11-04.http:/ VMware,Inc.Choosing and installing guest operating systems1998-2007 EB/OL.2007-11-05.http:/ VMware,Inc.The VMware workstation users manual EB/OL.http:/ 张小芳,胡正国,郑继川,等.高可用性集群技术的研究和应用J.计算机工程,2003,29(4):1152117.5 熊盛武,王鲁,杨婕.构建高性能集群计算机系统的关键技术J.微计算机信息(管控一体化),2006,22(123):86288.691上 海 电 力 学 院 学 报 2010年