《SRM使用手册.docx》由会员分享,可在线阅读,更多相关《SRM使用手册.docx(70页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、SRM 使用手册是在上篇安装文档根底上制作邓日期:2023 年 1 月 5 日欢送加 QQ 群 276783670 沟通技术问题1 SRM 介绍VMware vCenter Site Recovery Manager可供给先进的复制、灾难恢复治理、无中断测试、故障切换和故障恢复以及打算内迁移功能。它可以治理从生产数据中心到灾难恢复站点的故障切换,以及两个具有活开工作负载的站点之间的故障切换。2 SRM 所需条件本文通过对一个虚拟机进展从中山机房到拱北机房的容灾和灾难恢复的实现过程来表达如 何通过 VMware SRM 搭建容灾方案。本文着重于具体操作使用,对于理论概念请参考其它资料。一个完整的
2、 SRM 容灾环境需要假设干个组件。下面先介绍下所需环境。1. 两个机房,两套网络,网络互通2. 每个机房都要部署 vMware 虚拟化环境后面称之为站点,需要先安装和配置好 vSphere三大组件,vCenter Server,Replication,SRM。关于如何安装这三大组件请参见本次工程交付的安装配置手册。对于 SRM 容灾方案,我们应当分两局部来看,一局部是 vCenter Server+Replication实现的异地复制方案;别一局部是利用 SRM 组个来调用 Replication 实现 2 个 vCenter 站点之间的灾难恢复治理。所以我们本次实例先介绍 vCenter
3、Server+Replication 实现异地复制和恢复。在此根底上再介绍利用 SRM 实现的容灾。3 用 Replication 实现异地复制和恢复3.1 用 Replication 实现异地复制第一步:环境检查。10.5.112.197 是位于中山机房的 vCenter Server 站点;10.5.5.66 是位于拱北机房的 vCenter Server 站点。通过看截图上的 IP 地有助于我们理解当前操作的对象是谁,这点比较重要。通过以下几个图我们可以看到这是一个搭建的环境,在10.5.112.197 站点中山机房 上有一个 10.5.112.198 的复制效劳器即我们安装的 Repl
4、icatione 效劳器,他的目标站点为空;此时位于 10.5.5.66 站点拱北机房有一个 10.5.5.67 的复制效劳器即我们安装的 Replicatione 效劳器,他的目标站点也为空。在 vCenter Server WEB Clicent 上点主页,会看到我们之前安装的Replicatione,点击进入。看到目标站点为空。看到复制站点为本地站点(由于 10.5.112.198 是装在 10.5.112.197 上,是中山机房)后面我们称中山机房为生产站点。称另一站点为容灾站点。其次步:添加目标站点,目标站点即为容灾站点。输入容灾站点的 vCenter Server IP 地址,用S
5、SO 帐号验证。点”确定“,返回后已经可以看到目标站点己经添加完成了。此时我们去看看容灾站点上的变化,在容灾站点的目标站点上显示了生产站点的信息,是未进展身份验证状态,这个验证没关系统,由于我们是从生产验点往容灾站点的单向复制所以不需要在容灾站点上验证生产站点。第三步:制建虚拟机复制现在我们在生产站点的虚拟机上点右健来配置复制想要复制哪个虚拟机就在哪个虚拟机上做这个动作选择复制到 vCenter Server这里会消灭本地复制站点和目标复制站点 2 个可选站点,是由于 Replication 除了可以往异地复制外还可以在本进 vCenter 站点内进展复制。选择要使用哪个复制效劳器。这里我们需
6、要设置虚拟机复制到目标站点的存储位置,点“编辑”。先择目标站点上的存放位置。点“确定”。下一步选上压缩可以大大节约网络流量,从而节约复制传输时间。设置 RPO 值和快照数量,快照数量最多15 个,后面会介绍这些设置的意思。查看下有没有错误 ,没有点完成第五步:这一步不需要做什么操作主要是分析复制过程返回到 Replictaion 主页点监控由于我们是在从生产站点上进展的复制操作所以我们在出站复制中查看复制任务,这里显示了一个非活动任务,非活动是由于当前要复制的虚拟机没有开机,处于非活动状态,是不会复制的,只能复制活动虚拟机,我们去把虚拟机开启电源即可。入站复制为空,由于没有入站复制任务,可以思
7、考一下容灾站点这里是空的吗?下面我们会看到结果。当我们翻开电源后,会自动开头第一次复制,第一次复制时间会比较长,由于数据量大,以后会短,由于只会复制变化的数据。当电源一翻开,复制会自动开头,并有进度变化,但是这里的进度一般并不是平均值,比方前 98%只需要 3 分钟,后 2%可能需要 30 分钟。同时可以通过监控网络流量也可推断复制状况。我们来看下目标站点的入站复制,己经是显示正在复制了,由于我们并没有在目标站点上做任何操作即没有在目标站点上验证源站点,所以我们看不到进度,我们可以点进度条,输入源站点的 SSO 帐号即可显示。这个过程会比较长,我们去分析下当前发生了什么,我们去看看虚拟机跑在哪
8、台 ESXI 主机上,然后去看下那台 ESXI 主机的网络性能。如以以下图所示我们看到网络消灭了长时间顶峰期。说明正在复制虚拟机。依据实际网络带宽的状况复制时间会有长短,依据本次的实际数据显示,每秒 1600 多 KB 至5000KB 不等,差不多为 1.6MB 至 5MB 每秒。假设取平均值 3.3MB 每秒的话,每分种可复制200M 左右数据,假设备份 10 个虚拟机,每分种允许每个虚拟机有20M 数据量的变化,假设 PRO 时间为 15 分钟则可允许每台虚拟机有 300M 的数据变化。这是一般的计算推断,实际中应依据实际状况调整。需要留意的是,在复制的过程中 WEB Client 操作明
9、显会慢,所以我们常常是 B/S 和 C/S 混用。通过网络流量我们可以看到网络流下的变化,推断己经复制完成,我们去看下 Replcation 的治理界面的状况。从以以下图可以看到,当前己经复制好了这台虚拟机,花费了 70 分钟共复制了 11.87GB 的数据。再看下目标站点的信息,也显示了同样的信息。以上两个图版信息可以很好的让我们分析出复制的状态。至此我们己经完成了一个虚拟机从生产站点到容灾站点的复制,实际上数据已经过去了,但怎么用呢?3.2 用 Replication 实现恢复第一步:恢复测试接下来的操作我们去容灾站点去操作,由于我们可以假设生产站点不行用时,我们只能在容灾站点进展恢复,我
10、们来看下步骤。在开头前我们介绍下时间点的理解。在前面我们做复制的时候除了选择 RPO 时间外还有一个快照的先项,这个选项对应的就是这里的时间点,最多保存15 份快照,当我们在目标站点恢复后恢复完成的虚拟机就可以看到快照信息,就可以选择相应的快照进展恢复。如以下图,复制过来的虚拟机并不会被注册到目标站点的vCenter Server 上。扫瞄下存储可以看到我们复制过来的虚拟机。还没有注册。下面我们来启动恢复可以选择是先同步再恢复还是直接用已复制的数据进展恢复。这里我们选择用已复制的恢复选择恢复的位置恢复的动作是很快的,几秒钟。现在我们己经看到虚拟机在我们刚刚选中的主机上进展了注册这个时候我们就可
11、以翻开电源启动虚拟机了,通过快照治理器我们可以选择要恢复的快照。我们己经可以进入恢复后的系统了,此时该虚拟机的网络是自动关闭的,需要自己翻开。这里需要留意的是虚拟机恢复完成后,要依据恢复站点的网络状况对虚拟机进展网络设置。我们再分别查看源站点和目标站点的复制监控,可以看到复制状态变为己恢复一旦虚拟机已恢复则本次复制工作己完成,也不能从接着进入复制状态了。所以我们就可以把次复制停顿掉了。停顿后我们再查看目标站点和恢复站点己经没有了关于这个虚拟机的复制任务了。至此关于 Replication 的复制和恢复工作已经完毕。4 用 SRM 进展容灾治理通过上节的测试,我们己经撑据了的Replicatio
12、n 的复制技术。接下来我们来基于Replication 用 SRM 来进展容灾治理。第三节中我们建的复制任务已经取消了,这里需要重复上节的动作建立一个复制。本例中 我用另一台全的虚拟机来做,上节中用的那个虚拟机实际上是从生产虚拟机克隆的,全 虚拟机磁盘为 7G 而刚上节那个 11G,为了节约复制时间,使用的可以节约时间对带宽占用也最小。4.1 对两个 SRM 站点进展根本配置接下来直接接着 3.2 的步骤的开头。以以下图是本次 SRM 恢复的样本虚拟机,从图中可以看到己完成了复制任务,这是一个全的Windows 2023 r2 是 7.36G, 本次复制时间是 13 分钟,猛烈建议开启压缩功能
13、,以样原来看同样的网络环境可以节约格外钟左右。先检查下环境。生产站点出站复制完成。容灾站点入站复制完成。第一步:生产站点和容灾站点进展配对。以下步骤在生产站点上操作,转到“站点恢复”。点站点。点对象下面的站点。这是一个全的站点恢复界面,目标站点现在还没配,也是同样的显示内容。首先配对站点输入目标站点 vCenter Server 地址输入 SSO 帐号进展验证。站点配对完成,相应的向导栏呈现灰色并找勾, 警示信息也消退,但此时无法下一步,需要登陆下目标站点。返回“站点恢复”主页。点站点。可以看到增加了一个站点,右键“登陆站点”。输入目标站点的 SSO 帐号,进展验证。完成后返回生产站点,其实不
14、返回也是可以的,只是接下来的配置要留意方向是从哪到哪。本列我们返回到生产站点。这是主站点的状态,我们要依据“ SRM 配置指南”完成列表中的配置,由于我们是基Replication 的 SRM 容灾,所以第 4 步”添加阵列治理器不”就不用配了。其次步:创立资源映射。两边选上点“添加映射”反向映射可以不用配,假设我们只想从生产站点到灾备站点做容灾的话,由于我们接下来除了做容灾和恢复,我们还要做当生产站点重可用后生产再迁回到生产站点,所以这里我们配上反向映射。通过反向映射可以实现两个站点互为灾备。第三步:创立文件夹映射第四步:创立网络映射由于我们的虚拟环境分了生产网和治理网,有两个虚拟网络,所以
15、2 个网映射。第五步:配置存储占位符每个要恢复的虚拟机需要先在对应存储上占个位置先在生产站点配点位数据存储。对于存储占位符的设置需要在目标站点上去配置,是用来标识恢复的虚拟机将恢复到哪个存 储,上面我们是配的生站点上的占位存储,由于我们上面配了反向映射,所以就顺手配下, 后面当生产站点重可用后生产再迁回到生产站点时需要。配完后确定要先去目标站点配存储占位符,才能连续下面的保护组和恢复打算的配置,要不然会出错,在目标站点配完了存储占位符再做接下来的步骤。这个步骤是不必去容灾站点的 vCenter 上操作的,可以直接在生产到站点做,由于他们之间的配置是同步的。下面这图是配的容灾站点的占位存储。第六
16、步:创立保护组在生产站点上配置留意容灾方向不要选错。为什么我们要先做 Replication 复制,是由于保护组要有基于 Replication 的复制对像,固然这不是必需要先做的,实际上是不分先后挨次的。第七步:创立恢复打算选恢复站点,留意别先错方向这里添加保护组,但保护级似乎有配置错误,我们先不选中保护组,做完后去检查下问题。点第一个感慨号进去检查和修改保护组的配置。从中看出是虚拟机的光驱里加了 ISO 位置,而 ISO 己经不在这个存储位置了。点配置保护点分别,下面有个确定可以看到保护组状态良好,解决了故障我们再把保护组添加恢复打算里。现在我们看到摘要内没有警告提示表示己配置好了。至此我
17、们已经建完成了 SRM 配置指南的要求,去看下当前状态。转到站点生产和容灾都可以由于他们是同步的。原则上来说应当是在目标站点上来操作, 由于现在要做恢复测试,假设源站点己经不行用了呢。4.2 利用 SRM 将虚拟机在容灾站点进展恢复第一步:恢复测试转到恢复打算的监控先项卡,可以看到正在进展恢复测试我们会看到那台样本己经启动了,会看到恢复测试打算完成。此时你可对已经翻开的虚拟机进展使用了,只不过他是在测试网络里,对网络络做下配置即可。跟正常虚拟机一样用。其次步:清理“恢复测试”由于我们只是测试下能不能用,所以测试完了我们要清理测试。点那个扫把的图标第三步:进展真实恢复这一步原来应当在目标站点做的
18、,但是开的窗口太多一时没留意在源站点上做了,实际上当源和目标都是好的状况下是无所谓的,由于他们之间会同步,但是当源站点不行用时,就只能在目标站点上来做了。恢复完成后我们会觉察源站点虚拟机变为关机状态,目标站点为启动状态。经过以上步骤我们就完成了虚拟机的异地恢复的真实动作,实际环境中这个虚拟机就可以直接使用了。大家会留意到实际上跟恢测试是一样的过程,这就是 SRM 的历害之处,可以做到即时的容灾演练。第四步:当生产站点修复好了,的处理过程。容灾恢复并不是一个需要常常执行的操作,不到万不得以一般不会用,容这恢复会把容灾站点变成生产站点。接下来我们看下如何恢复到我们之前的容灾环境。点重保护恢复划。这
19、个动作不像恢复那样很快,需要几分钟时间完成。重保护完成,从以以下图我们可以看到全部可配置项又恢复到了原来的内容。只不过从架构上看原来的生产站点变成容灾站点,原来的容灾站点变成了生产站点。完成后我们去看下两个站点的 Replication 状态。上面几张图我们会看到重保护会有一点网络峰值 ,但是很短时间,说明有数据同步,但是不多。重保护指会使保护方向转变,上面的章节里我们配的时候是从ZSvcenter 站点到 ZHvcenter 站点的保护,但是当我们重保护后,就发生方向转变,变从了从 ZHvcenter 站点到 ZSvcenter 站点的保护。那假设我们想要重变成我们工程中规划的那样 ZSvcenter 是生产站 ZHvcenter 是容灾站, 我们就要重复一次与上面同样的恢复操作过程,就变回来了。又或者重制定SRM 保护打算。补充:假设我们想删除容灾架构可以按以下步骤来做。先删 SRM 的容灾打算,再删 SRM 的保护组,再停顿 Replication 的复制打算,最终删除不需要的虚拟机。总结:通过以上的实例我们把握了如何搭建SRM 容灾环境,并在灾难发生后如何就行恢复, 同时知道了恢复完成后我们如何回到我们之前的容灾架构。
限制150内