2022年服务器集群基础知识 .pdf
《2022年服务器集群基础知识 .pdf》由会员分享,可在线阅读,更多相关《2022年服务器集群基础知识 .pdf(18页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、服务器集群知识介绍在发展初期, 一路处理器便可为一台服务器及其所有应用提供动力。接着就发展到了多处理时代, 这时两路或多路处理器共享一个存储池,并能处理更多更大的应用。然后出现了服务器网络, 该网络中的每台服务器都专门处理不同的应用集。现在,发展到了服务器集群,两台或多台服务器像一台服务器一样工作,提供更高的可用性和性能,这已经远远超出了您的想像。 应用可从一台服务器转移到另一台服务器,或同时运行在若干台服务器上所有这一切对用户都是透明的。集群并不是新事物,但在软件和硬件方面,直到最近它们还是专有的。信息系统经理对集群进行了更加仔细的考虑,这是因为现在他们可以使用大规模生产的标准硬件实现集群,
2、如RAID、对称多处理系统、网络和 I/O 网卡及外设。 集群技术在未来将会获得更大的发展,现在,不断推出新的集群选件,而真正的集群标准尚在制定之中。何为集群?简单的说, 集群就是两台或多台计算机或节点在一个群组内共同工作。与单独工作的计算机相比, 集群能够提供更高的可用性和可扩充性。集群中的每个节点通常都拥有自己的资源(处理器、 I/O 、内存、操作系统、存储器),并对自己的用户集负责。故障切换功能提供切换到集群中一个或多个其它节点上。一旦发生故障的节点恢复全面运行,通过前瞻性地将一台服务器的功能切换 到集群中其它服务器上,可以实现升级, 停止该服务器的运行以增加组件,然后将其放回到集群中,
3、再将其功能从其它服务器转回该服务器。利用分布式讯息传递(DMP )可提供额外的可扩充性,DMP 是一种集群内通信技术,该技术允许应用以对最终用户透明的方式扩展到单个对称多处理(SMP )系统以外。集群中的每个节点必须运行集群软件以提供服务,如故障检测、 恢复和将服务器作为约个系统进行管理的能力。集群中的节点必须以一种知道所有其它节点状态的方式连接。这通常通过一条由于局域网路径相分离的通信路径来实现,并使用专用网卡来确保节点间清楚的通信。该通信路径中继系统间的心跳,这样,如果一个资源发生故障因而无法发送心跳,就会开始故障切换过程。实际上,最可靠的配置采用了使用不同通信连接(局域网、SCSI和RS
4、232 )的冗余心跳,以确保通信故障不会激活错误的故障切换。集群级别今天, 对于集群购买者来说,幸运的是有多款不同档次的集群可供选择,它们可提供广泛的可用性。当然,可用性越高,价格也越高,管理复杂性也越大。共享存储共享磁盘子系统往往是集群的基础、它使用共享的SCSI 或光纤通道。每个节点使用其本地磁盘存储操作系统交换空间和系统文件,而应用数据存储在共享磁盘上,每个节点均可读取名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 18 页 - - - - - - - - - 由其
5、它节点写入的数据。应用间的并发磁盘访问需要分布锁定管理器(DLM ),而且共享磁盘子系统与其集群节点之间的距离会受到所选择介质(SCSI 或光纤通道等) 的限制。服务器镜像(镜像磁盘)需要数据冗余而又无需占用额外磁盘子系统的环境有权选择服务器间的镜像数据。除了成本更低以外, 服务器镜像的另一个优势是,在主板服务器与辅助服务器之间的连接可以是基于局域网的,这样就消除了SCSI 距离限制。数据写到主板服务器上后,它还写到了辅服务器上; 通过锁定服务器数据保持了数据的完整性。一些服务器镜像产品还可将工作负载从主服务器转换到辅服务器上。非共享现在, 一些集群产品使用的是 非共享 体系结构, 在此体系结
6、构中,节点既不共享集中式磁盘,也不在节点间镜像数据。发生故障时, 非共享集群所具有的软件能够将磁盘所有权从一个节点传送至另一个节点,而无需使用分布式分布式锁定管理器(DLM )。如何实现故障切换?可以使用多种方法配制集群实现故障切换。第一种方法是路配制,集群中的所有节点在正常情况下都拥有自己的用户和工作负载。一个故障节点的资源可切换到其它节点,但由于剩余的服务器承担了额外的负载,因此其性能将有所下降。N+1配制包括一个热待机系统,它在主系统发生故障之前一直处于空闲模式。在 N+1 配制中,当一个节点发生故障时可避免其它节点的性能下降。但是,由于待机节点在正常情况下并不提供服务,因而成本较高。在
7、任何配制中, 一旦出现问题, 集群软件将能够首先进行本地恢复。本地恢复即在发生故障时,在本地节点自动重新启动应用或服务的能力。对节点并非致命的故障来说,逻辑上本地恢复是首选方式,因为与切换至另一个节点相比,它对用户的中断更少。就故障切换的种类而论,一些集群产品可进行并行恢复,其中资源能够故障切换到不同地区的远程节点上。 这很适合于容灾需求。次外, 为了解决多个节点故障问题,一些集群产品可以进行级联故障切换,其工作方式就像多米诺骨牌一样:节点一故障切换到节点二,节点二发生故障后再切换到节点三等等。故障切换举例以下是双节点集群故障切换举例,其中两个节点都拥有其自己的用户和以下的应用。1. 节点 1
8、 因出现内存问题导致了应用故障。用户讯息错误且其应用停止运行。集群管理软件将这一问题通知系统管理员。2. 节点 1 进行本地恢复,重新启动故障应用。用户能够重新启动其应用。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 18 页 - - - - - - - - - 3. 当应用再次发生故障时,集群软件向节点2 进行故障切换。故障切换需要大约1 分钟,用户必须等待。 (实际时间可能会从几秒至几分钟。)一些应用能够检测故障过程并向用户显示信息,告知她们向另一台服务器传输应用。
9、4. 一旦该应用在节点2 中重新启动,用户即可继续工作。5. 诊断和修理节点1。将已恢复正常的节点1 放回远处后,关恢复(切换)过程就会启动,以使应用和相关资源回到节点1。可人工或自动实现该故障恢复。例如,在非高峰期间,可将其配置为故障恢复状态。集群可扩充性除了提高的可用性,性能可扩充性也是集群的一个主要优势。通常,可通过集群负载平衡提高性能。本质上,负载平衡意味着将相关应用和资源从繁忙节点转移到不繁忙节点。真正的可扩充性是在其它区域实现的。第一个区域是增加可扩充性,这意味着能够在不抛弃以前系统的情况下,不断添加服务器、磁盘存储器等。 实际上, 随着您的计算机需求不断增加,集群提供了随着您的发
10、展进行支付的环境。当能够在集群多个节点上自动分配其工作负载的真正 支持集群 应用在未来形成开发标准后,您将看到第二种类型的可扩充性。 除此之外还可分离应用,以使一个应用的不同线程 运行在不同节点上,从而极大提高可应用如何处理故障切换?下一个问题是 应用如何处理故障切换? 答案是 这取决于所使用的应用和集群产品。一些集群产品为专门应用(如数据库或通信协议)提供了恢复或切换套件。这些套件可在应用故障时进行检测,并可在另一服务器上重新启动该应用。应用处理故障的方法由于集群产品的不同而不同。正如我们以前提到的一样,尽管不同的厂商都试图制定一个通用标准,但现在集群软件还没有公共标准。然而, 必须修改现在
11、的应用以处理故障切换,应用的最终目标不受硬件的影响。一个解决方案是与操作系统共同运行的一组程序和API(应用编程口),从而使得应用厂商能够创建执行这些恢复功能的程序。使用这些 API 使应用 支持集群 。当前集群产品的许多厂商都在努力奋斗,以确保集群产品能够符合这些不同的操作系统API。虚拟接口体系结构(VIA)由英特尔、康柏、惠普、微软、戴尔、SCO和天腾联合推出了虚拟接口体系结构(VIA)计划正为开发集群硬件和软件产品制定标准,该标准将是独立于厂商的,它将为用户购买技术时提供更多的选择。需牢记的重点真正的集群可被认为是多处理发展演变的下一步以前,应用应用跨越一个系统的多个处理器运行,现在,
12、应用可以跨越跨越若干系统的多个处理器运行。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 18 页 - - - - - - - - - 集群提供了两个主要优势:高可用性 (通过故障切换功能)和可扩充性 (通过增加扩展和跨越处理器进行负载平衡)。当节点出现硬件或软件问题后,就会进行故障切换,该节点的应用及通信连接将切换到另一台服务器上。 可使用集群管理产品规定那些应用应进行故障切换,以及那些故障条件可触发这一过程。可以获得许多集群种类和配置,以为用户提供他们所需的确切可用性
13、级别。共享磁盘、 服务器镜像及非共享是这些配置的几个。服务器集群基础知识:集群的形成和操作【 简介 】一旦在服务器上安装并运行了群集服务,该服务器即可加入群集。 群集化操作可以减少单点故障数量, 并且实现了群集化资源的高可用性。下述各节简要介绍了群集创建和群集操作中的节点行为。一旦在服务器上安装并运行了群集服务,该服务器即可加入群集。 群集化操作可以减少单点故障数量, 并且实现了群集化资源的高可用性。下述各节简要介绍了群集创建和群集操作中的节点行为。注意:有关安装群集服务器的信息,请参阅 Windows server 2003 产品家族的帮助和部署指南。创建群集在服务器群集产品中含有用来在服务
14、器上安装群集软件和创建新群集的群集安装实用工具。 创建新群集时, 首先在选择作为群集的第一个成员的计算机上运行该实用工具。第一步是确定群集名称并创建群集数据库和初始的群集成员列表来定义新群集。 Windows server 2003 群集新增了一个群集管理设置向导以及使用 cluster.exe 命令行界面创建(包括从远程创建)群集的功能。创建群集的第二步是, 添加可供所有群集成员使用的共用数据存储设备。这样,创建的新群集将带有一个节点、自己的本地数据存储设备以及群集共用资源 通常是磁盘或数据存储和连接介质资源。创建群集的最后一步是, 在另外将要成为群集成员的每一台计算机上运行安装实用工具。
15、每当将新节点添加到群集中时,新节点都会自动从群集的原始成员获得现有群集数据库的副本。 当节点加入或形成群集时, 群集服务会更新该节点私有的配置数据库副本。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 18 页 - - - - - - - - - 形成群集如果服务器运行了群集服务并且无法找到群集中的其它节点,它自己可以形成一个群集。要形成群集,节点必须能够获得对仲裁资源的独占权。当最初形成群集时, 群集中的第一个节点将包括群集配置数据库。每当有新节点加入群集时, 新节点都
16、会在本地获得并保持群集配置数据库的副本。仲裁资源用恢复日志 (其中含有同节点无关的群集配置和状态数据)的形式存储配置数据库的最新版本。在群集运行中,群集服务使用仲裁恢复日志执行以下操作:保证只有一组活动、可相互通讯的节点才能形成群集仅当某个节点可以获得对仲裁资源的控制权时, 才允许它形成群集仅当某个节点可以同控制仲裁资源的节点通讯时, 才允许它加入或留在现有群集中从群集中的其它节点和群集服务管理接口的角度看,当形成群集时, 群集中的每个节点可能处于三种不同状态中的一种。事件处理器会记录这些状态, 而事件日志管理器会将这些状态复制到群集的其它节点。群集服务状态包括:脱机。此时的节点不是完全有效的
17、群集成员。该节点及其群集服务器可能在运行,也可能未运行。联机。此时的节点是完全有效的群集成员。它遵从群集数据库的更新、 对仲裁算法施加自己的影响、维护心跳通讯,并可以拥有和运行资源组。暂停。此时的节点是完全有效的群集成员。它遵从群集数据库的更新、 对仲裁算法施加自己的影响、 维护心跳通讯, 但它无法接受资源组。 它只能支持它当前已拥有的那些资源组。 之所以提供暂停状态, 是为了允许执行某些维护。 大多数服务器群集组件会将联机和暂停视为等价的状态。加入群集如果一个服务器要加入现有群集,则它必须运行群集服务并且必须成功找到群集中的其它节点。 在找到其它节点后, 加入的服务器必须接受群集成员资格验证
18、,并获得群集配置数据库的副本。加入现有群集的过程开始于 Windows Server 2003 或 Windows 2000 Service Control Manager 在节点上启动群集服务之时。在启动过程中,群集服务会配置并装入该节点的本地数据设备。它并不会试图将共用的群集数据设备作为节点联机,因为现有群集可能正在使用这些设备。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 18 页 - - - - - - - - - 为了查找其它节点, 会启动一个发现过程。当节点
19、发现任何群集成员时,它将执行身份验证序列。 第一个群集成员会对新加入者进行身份验证,并且在新服务器得到成功验证后返回成功状态。如果验证不成功 (未能识别待加入节点的群集成员身份,或者它使用了无效的帐户密码),则加入群集的请求会被拒绝。进行成功验证后,首先联机的群集节点会检查加入节点上的配置数据库副本。如果该副本已过时, 对加入服务器进行验证的群集节点会为加入的服务器发送该数据库的更新副本。 刚加入群集的节点在收到复制的数据库后,可以用它查找共享资源并根据需要将它们联机。脱离群集当节点关闭或群集服务被停止时,节点可能脱离群集。 但当节点不执行群集操作(比如不向群集配置数据库提交更新)时,节点也可
20、能被迫脱离(被逐出)群集。如果节点根据预先的计划脱离群集, 它会向其它所有节点成员发送ClusterExit 消息,通知它们它将脱离群集。 该节点不等待任何响应就会立即进行关闭资源和所有群集连接的操作。由于其余节点收到了退出消息,因此它们不会执行在节点意外失效或网络通讯停止时发生的重新分组过程以重新确立群集成员身份。服务器集群技术及其在视频网络中的应用本文详细阐述了服务器集群的概念、优点、实现模式、 组件及组件之间的相互作用关系,集群故障转移发生的条件和实现过程、故障恢复的过程。分析了电视台视频网络通常选择的集群模式,并结合河南电视台都市频道节目制作网的实例,说明了服务器集群的创建过程。一、前
21、言视频网络的搭建和应用给电视台带来的是技术上的变革、节目制作理念的转变、工作效率的提高。 同时, 由于网络自身的原因,也给整个节目制作过程带了一些不稳定因素,比如网络瘫痪、 带宽堵塞、 素材丢失等。 可用性成为评定视频网络好坏的重要标准,而服务器的可用性在很大程度上又决定了视频网络的可用性,因为服务器是整个网络的心脏,它担当着素材、数据库和硬件设备的管理工作。当然,随着许多先进技术的应用,充分保证了服务器的可用性,其中,比较经济、有效的一种技术就是服务器集群技术。二、服务器集群技术1 、服务器集群概述名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - -
22、- - - - - 名师精心整理 - - - - - - - 第 6 页,共 18 页 - - - - - - - - - 服务器集群是由一组独立的服务器,并像单个系统一样运作,通过将运行着Windows 2000 Advanced Server 的服务器编组,组成集群服务器,从而对资源和应用程序提供了高可用性、可扩展性和可管理性。采用服务器集群的目的是,在出现故障或断电的情况下,保证客户对应用程序和资源的访问。 如果集群里的某服务器由于故障或维护的缘故不可用,资源和应用程序将转移到其它可用的集群节点上。而提起集群,人们容易将双机热备份与集群混为一谈,其实它们有本质上的区别:即能否实现并行处理
23、和服务器失效后的任务平滑接管。双机或多机热备份的原理是一台主机做服务器,其他主机做备份机,服务器失效时,备份机接管。2 、使用服务器集群的优点高可用性。集群技术可以用来避免单台服务器的资源或应用程序出现故障。使用集群技术, 资源的所有权, 如磁盘驱动器和IP 地址将自动地从有故障的服务器上转移到可用的服务器上。 当集群中的系统或应用程序出现故障时,集群软件将在可用的服务器上重启失效的应用程序, 或将失效服务器的工作分配到剩余的服务器上,结果是, 用户只是觉得服务器暂时停顿了一下。可扩展性。 可以很方便地通过添加更多的服务器,来提高集群的计算能力和网络的可用性。可管理性。 可以使用集群管理器来管
24、理集群,并管理应用程序。可以通过拖放集群对象, 在集群里的不同服务器之间移动应用程序,也可以通过同样的方式移动数据。可以通过这种方式来手工平衡服务器的负荷,卸载服务器, 从而方便地进行维护。可以从网络的任意地方的客户端和资源处,监视集群的状态。3 、服务器集群模式根据使用服务器集群的目的不同,服务器集群有三种主要的集群模式:一种是使用静态负载平衡的高可用性集群模式;另一种是具有最大可用性的“热备份” 集群模式; 第三种是混合型集群模式。模式A :使用静态负载平衡的高可用性集群模式在这种模式下, 两台服务器都处在联机状态,每台服务器都以虚拟服务器的形式向整个网络提供自己的资源组,而客户端可以检测
25、并访问到这种虚拟服务器。每台服务器容量的选择应该使每台服务器中的资源在最优性能下运行。但是在发生故障转移时,每台服务器又可以暂时承担其他服务器上资源的运行。根据指定的资源和服务器容量配置,所有的客户服务在故障转移时仍保持有效,但性能要受到影响响。假定某公司内部网络依赖一台运行了两个大型数据库应用程序的服务器。这两个数据库对全天反复连接进来的大量客户来说都是非常关键的。但在高峰连接时间,出现服务器不能满足需求和保持性能的问题。要缓解这个问题,必须将另一台服务器连接到过载的服务器上,形成集群以平衡负载,如图1 所示。系统中有两台服务器,每台运行一个数据库应用程序。如果一台服务器出现故障, 系统将回
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年服务器集群基础知识 2022 服务器 集群 基础知识
限制150内