《两地三中心容灾方案.docx》由会员分享,可在线阅读,更多相关《两地三中心容灾方案.docx(78页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上Xx项目存储方案介绍专心-专注-专业目录1. 现状综述XX市政府网站管理中心自成立之日起,就按照集中建设的原则完成了“XX市电子政务外网统一平台示范工程项目”的建设工作,完成了XX市124家党政部门的接入工作,完成了在全市范围内只铺设一套网络基础设施的工作,实现了市及电子政务外网与省、国家政务外网之间的互联互通,目前共有服务器500多台,存储40多套,部署的虚拟服务器300多台。涵盖了XX市各委办局的大部分数据,包括公安局、财政局、民政局、卫生局、发展改革委、外办/侨办等,并为他们提供了各种电子政务应用系统和业务数据,随着业务应用水平的不断提高,各局对网络办公和数据的
2、依赖程度逐年增加,为保障各委办局业务数据的连续安全运行,迫切需要对他们的数据进行备份,但是采用传统的备份方式需要针对每一个应用配置不同的备份方法、策略及容灾设备,将导致投资浪费和管理成本增加,为解决数据备份问题我们计划引人两地三中心云灾备技术。具体分析,XX市电子政务的业务类型众多、业务系统建设和运行的历史比较长,从系统结构和数据结构两方面来说,都是比较复杂的。从系统结构来说,既有单机运行的网站,也有WEB、应用服务、数据库三层架构的大型业务平台。从数据结构来说,既有结构化数据集中存储的资源库平台,所有关键数据统一存储在数据库集群中,也有非结构化数据如文件、图片等应用系统管理维护的资料数据。另
3、外,XX市电子政务各业务系统需要保护的数据类型复杂多样,既有各种数据库如oracle,sqlserver 多种版本,mysql等)数据,也有各种应用程序(网站类,OA类,业务系统类等)各种文档(word,execle,txt等)各种非结构化数据(关键视频,档案等),当然也需要对虚拟机镜像提供保护(VMWare和Cloudview等)。以上现状表明很难用一种灾备技术满足上述多种数据类型的容灾需求,结合应用和数据的关键级别、现有业务系统状况分类进行设计,我们计划采用数据备份、存储层数据复制以及数据库层数据复制几种容灾技术构建两地三中心灾备方案。2. 总体建设方案2.1. 建设原则和策略2.1.1.
4、 建设原则XX市政务信息化容灾备份及安全系统建设是信息中心信息安全保障体系的重要组成部分,信息中心适应信息化发展趋势作出的一项重大战略部署,XX政务容灾系统建设需要遵循以下建设原则:统筹规划原则。容灾备份系统建设,涉及技术面广,复杂程度高,投资巨大,因此我们必须牢固树立“一盘棋”思想,坚持统筹规划,抓紧资源整合,协调各方力量,着眼实际、着眼全局、着眼长远,切实以统筹的理念推进信息化容灾备份系统建设。循序渐进原则。信息化容灾备份系统建设是一项系统工程,实施周期长,要本着循序渐进的原则,分步建设和实施。在建设之前应做好详细的规划设计,并按照规划的内容,分清主次,依次实施。全部建设完成后,还有定期组
5、织演练,确保灾备系统能够正常工作。平战结合原则。灾难备份资源是为小概率事件准备的,平时处于备份、测试或者演练状态,设备闲置,因此我们可以在不影响灾难备份与恢复功能的前提下,本着平战结合的原则,充分利用数据灾备中心的各类资源,开展信息系统培训、开发等业务,真正让数据灾难备份中心的各类资源得到充分的利用和发挥作用。2.1.2. 建设策略本项目建设策略上从过去注重单一部门、单一系统容灾问题的解决,向支撑全市电子政务系统安全高效运行的转变;二是在建设方式上,从部门独立建设、自成体系,向跨部门跨区域的协同互动和资源共享转变;三是在系统模式上,从粗放离散的模式,向集约整合的模式转变,确保电子政务项目的可持
6、续发展,符合电子政务项目建设“集约化、专业化、规模化”策略。2.1.2.1. 集约化策略在关于加快推进国家电子政务外网建设工作的通知(发改高技2009988号)文件之前,国家各部委应用系统采取垂直管理,各自独立的方式建设。一套灾备系统牵涉到的有基础设施建设、灾备设备资源以及经验丰富的运维人员,往往需要大量的资金投资。我市信息各委办局都有建设灾备系统需求如果都单独建设,将会是一笔巨大的投资,并且各个委办局都需要培养大量相关的专业运维管理人员。如何更为集约化的建设灾备系统,如何更为简单的管理和维护复杂的灾备系统,是我们必须面对和解决的难题。目前,已有地税局、人社局、国土局、财政局、建委等部门提出了
7、灾备建设需求。从这些部门的灾备建设方案来看,普遍包括:服务器、存储设备、网络设备、安全设备、链路等内容,平均需要1000万左右的投资才能实现关键业务应用级容灾的目标。此外,异地容灾还需要租用机房、聘用运维人员、支付链路费用等。经初步估算,已经提出或具有潜在容灾备份需求的部门,若单独建设容灾系统,则最少需要9000万建设投资,灾备系统的运维费至少达到每年1800万。本项目建议为各委办局的多个业务系统建立集中数据灾备中心,相比分别为各个业务系统建立独立的容灾系统,既节约IT设备资源,提高容灾资源利用率,又能大大减少后期的管理和运营成本。系统建设充分调研了XX市电子政务信息系统建设情况设计开放性、可
8、扩展性的容灾策略,支持已有投资系统功能性能,有效的保障了系统的可持续发展。2.1.2.2. 专业化策略XX市电子政务的业务类型众多、业务系统建设和运行的历史比较长,从系统结构和数据结构两方面来说,都是比较复杂的。从系统结构来说,既有单机运行的网站,也有WEB、应用服务、数据库三层架构的大型业务平台。从数据结构来说,既有结构化数据集中存储的资源库平台,所有关键数据统一存储在数据库集群中,也有非结构化数据如文件、图片等应用系统管理维护的资料数据。全市电子政务各业务系统需要保护的数据类型复杂多样,既有各种数据库如Oracle、SQL Server 多种版本、MySQL等)数据,也有各种应用程序(网站
9、类,OA类,业务系统类等)各种文档(Word、Execle、TXT等)各种非结构化数据(关键视频,档案等),当然也需要对虚拟机镜像提供保护(VMWare和Cloudview等)。本项目立足于XX市电子政务系统的容灾备份及安全建设,充分的调研了全市电子政务信息系统的建设和应用情况,从网络接入、系统业务功能及数据量、系统涉密情况、容灾策略需求、性能指标等多方面综合分析。力争满足针对不同的性质的系统提出了数据级、应用级容灾策略,同时分析了不同策略的在线模式与离线模式、远程数据复制、同步与异步容灾、同城与异地等多种容灾方案,专业化的解决未来XX市电子政务信息系统的容灾备份需求。2.1.2.3. 规模化
10、策略本项目集约化建设的基础上实现规模化,项目建成之后将承载XX市95%以上电子政务信息系统的容灾工作,解决我市政府各部门内部业务系统、跨区域纵向业务应用、部门重点应该的容灾备份需求。容灾备份中心依托电子政务外网建设二期工程将完成全市行政区划内共有15个区市县(包括先导区),下辖172个街道(乡、镇)(这里包括个别区市县所管辖的乡镇级别的经济开发区)、1512个社区(村)的全域覆盖。在数据规模方面,容灾备份中心将解决包括国家重点民生工程在内的1000余个业务系统的容灾备份工作。2.2. 建设目标2.2.1. 总体目标XX市政务信息化容灾备份及安全系统建设计划分成两个阶段,即同城灾备中心建设和异地
11、灾备中心建设,最终建设成为两地三中心模式。其中以新建的XX市云计算中心作为各委办局业务系统的主数据中心,XX市网站管理中心作为同城灾备中心,可以选用城市A或是城市B作为异地灾备中心。云计算中心作为主生产中心,负责日常的各委办局所有业务系统的运行。在灾难发生时,在同城容灾中心恢复各委办局关键业务的应用运行。在城市A异地灾备中心完成各委办局关键数据的保护,在发生地区级(XX)的灾难时,保证各个业务系统的核心数据不丢失。2.2.2. 分期目标一期目标:实现xx个委办局关键数据在同城容灾中心的集中备份,以及xx个关键业务在同城容灾中心的应用级容灾。二期目标:实现xx个委办局关键数据在远程容灾中心的集中
12、备份,以及xx个核心业务在同城容灾中心的应用级容灾。2.3. 建设内容一期建设内容: 完成云计算中心、同城灾备中心、异地灾备中心两地三中心容灾总体设计 完成关键技术方案验证、实施方案编制、实施路径设计。 完成容灾中心运行管理模式设计。 建设同城应用级容灾中心二期建设内容: 优化调整新建云计算中心 建设城市A或城市B异地数据级容灾中心2.4. 总体设计方案根据各委办局的技术架构现状与策略制定,结合容灾技术的关键技术分析与最佳实践,制定如下总体容灾架构: 容灾模式为两地三中心灾备模式 容灾级别为数据库系统实现应用级别容灾,其他应用系统基于同城容灾中心实现应用级容灾,关键业务基于远程容灾中心实现应用
13、级容灾 结构化数据复制采用支持异构平台的基于数据库层的数据复制技术,虚拟机镜像等这类关键非结构化数据复制采用基于存储层的数据复制技术 虚拟机之间的系统切换技术以自动切换方式为主,物理机之间以及物理机和虚拟机之间的系统切换以手工切换方式为主,并配合切换脚本减少系统切换时间 容灾网络,建议同城数据中心之间采用大二层的存储网络架构,数据网络和存储网络的物理连接采用DWDM裸光纤高速网络连接,本地和异地数据中心之间采用IP网络连接,网络带宽要保证系统切换的顺畅和数据复制的带宽需求 前端(客户端)网络切换技术有手工切换、DNS重定向和负载均衡器的健康路由注入几种,本方案建议根据实际情况选择以上切换技术的
14、一种或几种 容灾系统和生产系统之间的配对关系为降级配对,就是容灾中心和生产中心之间的软、硬件配置不遵循1:1比例,容灾中心硬件配置的性能低于生产中心,容灾应用服务器以虚拟机平台为主,从而进一步提升灾备系统的投入产出比建成后的两地三中心结构拓扑图如下:3. 容灾的核心技术及选择容灾系统是指在相隔较远的异地,建立两套或多套功能相同的IT系统,互相之间可以进行健康状态监视和功能切换,当一处系统因意外(如火灾、地震等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。容灾技术是系统的高可用性技术的一个组成部分,容灾系统更加强调处理外界环境对系统的影响,特别是灾难性事件对整个IT
15、节点的影响,提供节点级别的系统恢复功能。3.1. 容灾系统衡量指标衡量容灾系统的主要指标有RPO(灾难发生时允许丢失的数据量)、RTO(系统恢复的时间)、容灾半径(生产系统和容灾系统之间的距离)以及ROI(容灾系统的投入产出比)。RPO是指业务系统所允许的灾难过程中的最大数据丢失量(以时间来度量),这是一个灾备系统所选用的数据复制技术有密切关系的指标,用以衡量灾备方案的数据冗余备份能力。RTO是指“将信息系统从灾难造成的故障或瘫痪状态恢复到可正常运行状态,并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态”所需时间,其中包括备份数据恢复到可用状态所需时间、应用系统切换时间、以及备用网络
16、切换时间等,该指标用以衡量容灾方案的业务恢复能力。容灾半径是指生产中心和灾备中心之间的直线距离,用以衡量容灾方案所能防御的灾难影响范围。容灾方案的ROI(Return of Investment,投入产出比)也是用户需要重点关注的,它用以衡量用户投入到容灾系统的资金与从中所获得的收益的比率。显然,具有零RTO、零RPO和大容灾半径的灾难恢复方案是用户最期望的,但受系统性能要求、适用技术及成本等方面的约束,这种方案实际上是不大可行的。所以,用户在选择容灾方案时应该综合考虑灾难的发生概率、灾难对数据的破坏力、数据所支撑业务的重要性、适用的技术措施及自身所能承受的成本等多种因素,理性地作出选择。3.
17、2. 容灾级别按照容灾系统对应用系统的保护程度可以分为数据级容灾、应用级容灾和业务级容灾。 数据级容灾仅将生产中心的数据复制到容灾中心,在生产中心出现故障时,仅能实现存储系统的接管或是数据的恢复。容灾中心的数据可以是本地生产数据的完全复制(一般在同城实现),也可以比生产数据略微落后,但必定是可用的(一般在异地实现),而差异的数据通常可以通过一些工具(如操作记录、日志等)可以手工补回。基于数据容灾实现业务恢复的速度较慢,通常情况下RTO超过24小时,但是这种级别的容灾系统运行维护成本较低。应用级容灾是在数据级容灾的基础上,进一步实现应用可用性,确保业务的快速恢复。这就要求容灾系统的应用不能改变原
18、有业务处理逻辑,是对生产中心系统的基本复制。因此,容灾中心需要建立起一套和本地生产相当的备份环境,包括主机、网络、应用、IP等资源均有配套,当生产系统发生灾难时,异地系统可以提供完全可用的生产环境。应用级容灾的RTO通常在12个小时以内,技术复杂度较高,运行维护的成本也比较高。业务级容灾是生产中心与容灾中心对业务请求同时进行处理的容灾方式,能够确保业务持续可用。这种方式业务恢复过程的自动化程度高,RTO可以做到30分钟以内。但是这种容灾级别的项目实施难度大,需要从应用层对系统进行改造,比较适合流程固定的简单业务系统。这种容灾系统的运行维护成本最高。3.3. 常见容灾建设模式当前,市场上常见的容
19、灾模式可分为同城容灾、异地容灾、双活数据中心、两地三中心几种。3.3.1. 同城容灾同城容灾是在同城或相近区域内(200KM)建立两个数据中心:一个为数据中心,负责日常生产运行;另一个为灾难备份中心,负责在灾难发生后的应用系统运行。同城灾难备份的数据中心与灾难备份中心的距离比较近,通信线路质量较好,比较容易实现数据的同步复制,保证高度的数据完整性和数据零丢失。同城灾难备份一般用于防范火灾、建筑物破坏、供电故障、计算机系统及人为破坏引起的灾难。 3.3.2. 异地容灾异地容灾主备中心之间的距离较远(200KM)因此一般采用异步镜像,会有少量的数据丢失。异地灾难备份不仅可以防范火灾、建筑物破坏等可
20、能遇到的风险隐患,还能够防范战争、地震、水灾等风险。由于同城灾难备份和异地灾难备份各有所长,为达到最理想的防灾效果,数据中心应考虑采用同城和异地各建立一个灾难备份中心的方式解决。 3.3.3. 两地三中心结合近年国内出现的大范围自然灾害,以同城双中心加异地灾备中心的“两地三中心”的灾备模式也随之出现,这一方案兼具高可用性和灾难备份的能力。同城双中心是指在同城或邻近城市建立两个可独立承担关键系统运行的数据中心,双中心具备基本等同的业务处理能力并通过高速链路实时同步数据,日常情况下可同时分担业务及管理系统的运行,并可切换运行;灾难情况下可在基本不丢失数据的情况下进行灾备应急切换,保持业务连续运行。
21、异地灾备中心是指在异地的城市建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。3.3.4. 双活数据中心所谓“双活”或“多活”数据中心,区别于传统数据中心和灾备中心的模式,前者多个或两个数据中心都处于运行当中,运行相同的应用,具备同样的数据,能够提供跨中心业务负载均衡运行能力,实现持续的应用可用性和灾难备份能力,所以称为“双活”和“多活”;后者是生产数据中心投入运行,灾备数据中心处在不工作状态,只有当灾难发生时,生产数据中心瘫痪,灾备中心才启动。“双活”数据中心最大的特点是:一、充分利用资源,避免了一个数据中心常年处
22、于闲置状态而造成浪费,通过资源整合,“双活”数据中心的服务能力是翻倍的; 二、“双活”数据中心如果断了一个数据中心,其业务可以迅速切换到另外一个正在运行的数据中心,切换过程对用户来说是不可感知的。在 “双活”的模式中,两地数据中心同时接纳交易,技术难度很大,需要更改众多底层程序,因而在现实中,国内还没有真正“双活”数据中心的成功应用案例。3.4. 常用的数据复制技术在构建容灾系统所涉及的诸多要素中,数据复制技术是基础,只有保证了数据的安全可用,应用或是业务的恢复才有可能。正常情况下系统的各种应用在数据中心运行,数据存放在数据中心和灾难备份中心两地保存。当灾难发生时,使用备份数据对工作系统进行恢
23、复或将应用切换到备份中心。数据复制技术的选择决定灾备系统的RPO指标,灾难备份系统中数据备份技术的选择应符合数据恢复时间或系统切换时间满足业务连续性的要求。数据复制(Replication)是指利用复制软件把数据从一个磁盘复制到另一个磁盘,生成一个数据副本。这个数据副本是数据处理系统直接可以访问的,不需要进行任何的数据恢复操作,这一点是复制与D2D备份的最大区别。根据不同容灾方案所采用数据复制技术位于企业IT架构不同层面,数据复制可分为基于存储层的复制、基于主机层复制和基于应用的复制。具体到一个I/O从磁盘到应用的流程上,可能经由磁盘阵列、存储网络、卷管理软件、文件系统、数据库系统和应用系统全
24、部流程或是其中的几个流程,那么数据复制就可以在这些流程的任一层次上实现,如下图所示:基于存储层的复制可以是由存储设备的控制器执行,也可以是由网络层的虚拟化存储管理平台来执行,基于存储层的复制基于主机和应用的无关性,兼容性要求最低,实施难度最小,但是由于是卷级别的数据拷贝,对网络带宽要求最高;基于主机的复制可以由安装在主机上的卷管理软件或是文件系统来实现,在实际的应用场景中,以基于卷管理软件的数据复制技术居多,这种方式通常要求主机平台相关,实施难度升高,但是带宽要求降低;基于数据层的复制通过数据库的容灾功能模块来实现,对网络带宽要求最低,但是只能实现数据库数据的容灾;基于应用层的数据复制需要对应
25、用程序进行定制开发,现实场景中很难见到。下面就重点介绍一下几种常见的数据复制技术。3.4.1. 基于存储层的容灾复制方案3.4.1.1. 基于存储设备的数据复制基于存储设备的数据复制技术的核心是利用存储阵列自身的盘阵对盘阵的数据块复制技术实现对生产数据的远程拷贝,从而实现生产数据的灾难保护。在主数据中心发生灾难时,可以直接利用灾备中心的数据建立运营支撑环境,为业务继续运营提供IT支持。同时,也可以利用灾备中心的数据恢复主数据中心的业务系统,从而能够让企业的业务运营快速回复到灾难发生前的正常运营状态。基于存储设备的数据复制技术示意图如下:基于存储设备的复制可以是如上示意图的“一对一”复制方式,也
26、可以是“一对多或多对一”的复制方式,即一个存储的数据复制到多个远程存储或多个存储的数据复制到同一远程存储;而且复制可以是双向的。基于存储的数据复制技术有两种方式:同步方式和异步方式。同步方式:可以做到主/备数据中心磁盘阵列同步地进行数据更新,应用系统的I/O写入主磁盘阵列后(写入Cache中),主磁盘阵列将利用自身的机制同时将写I/O写入后备磁盘阵列,后备磁盘阵列确认后,主中心磁盘阵列才返回应用的写操作完成信息。 异步方式:是在应用系统的I/O写入主磁盘阵列后(写入Cache中),主磁盘阵列立即返回给主机应用系统“写完成”信息,主机应用可以继续进行写I/O操作。同时,主中心磁盘阵列将利用自身的
27、机制将写I/O写入后备磁盘阵列,实现数据保护。采用同步方式,使得后备磁盘阵列中的数据总是与生产系统数据同步,因此当生产数据中心发生灾难事件时,不会造成数据丢失,可以实现RPO为零。为避免对生产系统性能的影响,同步方式通常在近距离范围内(FC连接通常是200KM范围内,实际用户部署多在35KM之内)。而采用异步方式应用程序不必等待远程更新的完成,因此远程备份存储设备的性能的影响通常较小,并且生产中心的距离和灾备中心的距离理论上没有限制(通常基于IP连接来实现数据的异步复制)。采用基于存储设备数据复制技术构建容灾方案的必要前提是: 通常必须采用同一厂家统一系列的且同时具有数据复制技术的高端存储平台
28、,给用户的存储平台选择带来一定的限制。 采用同步方式可能对生产系统性能产生影响,而且对通信链路要求较高,有距离限制,通常在近距离范围内实现(同城容灾或园区容灾方案) 采用异步方式与其他种类的异步容灾方案一样,存在数据丢失的风险,通常在远距离通信链路带宽有限的情况下实施。尽管有以上限制,基于存储设备的数据复制技术仍然是当前选择较多的容灾技术平台,这主要是由于基于存储的复制技术方案有如下优点: 采用基于存储的数据复制独立于主机平台和应用,对各种应用都适用,而且完全不消耗主机的处理资源; 基于存储得数据复制技术,由于在最底层,实施起来受应用、主机环境等相关技术的影响最小,非常适合于主机和业务系统很多
29、、很复杂的环境,采用此种方式可以有效降低实施和管理难度; 采用同步方式可以完全不丢失数据,在同城容灾或园区内容灾方案中,只要通信链路带宽许可,完全可以采用同步方案,而不会对主数据中心的生产系统性能产生显著影响; 采用异步方式虽然存在一定的数据丢失的风险,但没有距离限制,可以实现远距离保护; 灾备中心的数据可以得到一定程度上的有效利用(用作测试或报表等)。构建成本:存储层容灾产品报价,都是采用磁盘阵列的高级功能许可授权方式进行报价。并按照磁盘阵列的具体数量进行报价。越是高端盘阵,高级功能模块授权价格成阶梯式增长。除了这些高级功能授权的许可外,其还有MA(维护)费用以及实施费用,MA费用整体磁盘阵
30、列报价(含高级功能模块)的25%左右。实施费用一般按人天费用方式进行计算,总体成本很高。另外,其对带宽要求很高,容灾网络建设费用更高。适用场景:存储设备复制技术利用磁盘阵列自身卷复制功能实现,首先要求必须是同构高端存储系统,其次对带宽要求较高,实现的是底层数据块级别的复制,属于数据层容灾范畴。这类容灾产品由于其自身的功能特性,作为高端盘阵衍生出来的附加高级功能来实现容灾,其投资巨大,从盘阵本身到链路的要求都极高,需要专门的链路确保数据的一致性。当灾难发生时,需要通过人工调整的方式,将镜像卷提供给远端生产业务系统,实现业务系统的容灾,RTO在数小时以上。经过以上分析可以看出,基于存储层的灾备方案
31、对存储平台要求非常严格,适合用于为底层存储平台单一、服务器平台构成复杂、上层应用繁多的IT系统构建数据级的容灾方案,不适合于复杂、异构存储平台的容灾场景需求。3.4.1.2. 基于虚拟化存储技术的数据复制存储虚拟化的技术方法,是将系统中各种异构的存储设备映射为一个单一的存储资源,对用户完全透明,达到屏蔽存储设备异构的目的。通过虚拟化技术,用户可以利用已有的硬件资源,把SAN内部的各种异构的存储资源统一成对用户来说是单一视图的存储资源(Storage Pool),而且采用Striping、LUN Masking、Zoning等技术,用户可以根据自己的需求对这个大的存储池进行方便的分割、分配,保护
32、了用户的已有投资,减少了总体拥有成本(TCO)。另外也可以根据业务的需要,实现存储池对服务器的动态而透明的增长与缩减。通过存储虚拟化技术可以实现数据的远程复制,这种数据复制技术原理和基于存储设备的原理基本一样,唯一的区别就是前者由存储虚拟化控制器实现,或者由磁盘阵列控制器实现,所以这种技术不要求底层磁盘阵列同构。存储虚拟化技术通常在存储网络层面实现,其数据复制同样也可以有同步复制方案和异步复制方案,需要根据具体的需求选择合适的技术。基于存储虚拟化控制器的两地三中心容灾方案架构采用虚拟存储化技术建设容灾方案有以下优点: 主生产中心和容灾中心的存储阵列可以是不同厂家的产品,存储平台选择不受现有存储
33、平台厂商的限制; 对不同厂家的存储阵列提供统一的管理界面。在虚拟存储环境下,无论后端物理存储是什么设备,服务器及其应用系统看到的都是其熟悉的存储设备的逻辑镜像。即便物理存储发生变化,这种逻辑镜像也永远不变,系统管理员不必再关心后端存储,只需专注于管理存储空间,所有的存储管理操作,如系统升级、建立和分配虚拟磁盘、改变RAID级别、扩充存储空间等比从前的任何产品都容易,存储管理变得轻松简单。采用虚拟存储化技术建设容灾方案需要考虑以下问题: 需要验证选择的产品和技术的成熟性以及和现有设备、未来设备的兼容性能力; 存储虚拟化控制器作为一种带内接管方式,存储系统的性能直接和存储虚拟化控制器相关,在高I/
34、O负载应用场景下,需要考虑存储虚拟化控制器的性能瓶颈问题。虚拟化技术即继承了基于存储设备实现数据复制方案的优点,同时又能兼容异构存储系统,并且切换过程比较简单,甚至可以实现自动切换,成为越来越多容灾用户的选择。构建成本:存储网络层产品报价,一般采用虚拟化网关的数量和容量结合起来的报价方式,存储网关数量的多少和虚拟化存储容量的多少都直接影响整个报价。除此之外还有MA费用和实施费用,MA费用整体价格的25%左右。实施费用一般按人天费用方式进行计算,总体成本较高。另外,其对带宽要求比较高,容灾网络建设费用比较高。适用场景:存储网络层容灾产品,利用了存储虚拟化技术,将后台存储进行统一池化的方式进行管理
35、。利用其镜像和复制技术,实现池化后数据块的镜像和复制,保证数据的一致性。从实现方式上面来讲,属于数据层容灾范畴。其有两种实现方式:一种是镜像的方式,通过镜像技术实现数据块的完全同步,这种采用的是同步方式,对带宽要求极高。另外一种复制的方式,采用虚拟化网关机头之间的数据复制实现,它可以采用同步方式也可以采用异步的方式,往往受限于带宽的限制,这种复制方式往往采用异步的方式进行复制。不管采用哪种方式进行数据的一致性保证,数据卷都存在主备关系,远端数据卷不能被前端业务系统进行访问,当灾难发生时,通过自动切换人工调整的方式,将远端卷提供给远端业务系统,实现业务系统的容灾。这类产品采用的都是带内虚拟化方式
36、,很好的解决了异构存储容灾问题,但是其数据流都要经过虚拟化网关,前端业务系统性能会有所下降,其吞吐能力受到限制。综合这类产品的特性,其适合用于为拥有较多型号的异构磁盘阵列并承担多个应用的现有IT系统构建容灾平台方案。3.4.2. 基于主机数据复制技术的灾备方案采用基于主机复制技术的容灾方案的示意图如下:图3-1. 基于主机的容灾方案示意图采用基于主机系统的数据复制技术的核心是利用主、备中心主机系统通过IP网络建立数据传输通道,通过主机数据管理软件实现数据的远程复制,当主数据中心的数据遭到破坏时,可以随时从备份中心恢复应用或从备份中心恢复数据,从而给企业提供了应用系统容灾的能力。实现主机层数据复
37、制的数据管理软件有很多产品,如Symantec公司的Veritas Volume Replicator(VVR)以及Rose HA公司的Rose Replicator等,这些方案可实现基于主机的远程数据复制,从而构建基于主机的容灾系统。采用基于主机的数据复制技术建设容灾方案有以下优点: 基于主机的方案最主要的优点是只和服务器平台和主机数据管理软件相关,完全不依赖于底层存储平台,生产中心和灾备中心可以采用不同的存储平台; 可同时对数据库和文件系统提供容灾保护; 有很多不同的基于主机的方案,可以满足用户的不同数据保护要求,提供多种不同数据保护模式; 基于IP网络,没有距离限制;同时,采用主机的数据
38、复制技术建设容灾方案有以下局限: 基于主机的方案需要主机平台同构; 基于主机的数据复制方案由于生产主机既要处理生产请求,又要处理远程数据复制,必须消耗生产主机的计算资源,对于主机的内存、CPU进行升级是非常昂贵的,因而对生产主机性能产生较大的影响,甚至是产生严重影响; 灾备中心的数据一般不可用,如果用户需要在远程数据中心使用生产数据进行开发测试、DW/BI应用使用将非常困难; 利用主机数据复制软件的方案比较复杂,尤其是和数据库应用结合的时候需要很复杂的机制或多种软件的结合,从而对生产系统的稳定性、可靠性、性能带来较大影响; 如果有多个系统、多种应用需要灾难保护,采用基于主机的方案将无法用统一的
39、技术方案来实现。 管理复杂,需要大量的人工干预过程,容易发生错误。主流产品列表:厂家名称产品型号容灾功能赛门铁克Storage Foundation镜像/复制构建成本:主机层卷复制容灾产品,通常的报价方式是按照主机的CPU数据进行报价,主机数量越多,CPU数量越多价格也越高,同样也存在MA费用和实施费用。 此类容灾产品,相应的容灾网络建设成本相对较低。适用场景:目前,企业采用基于主机的数据复制技术建设容灾方案的案例相对比较少,通常适合单一应用或系统在I/O规模不大的情况下局部使用。在应用I/O负载比较大,需要灾难保护的应用及应用类型比较多、主机环境复杂的时候,基于主机系统的方案并不适用。3.4
40、.3. 基于数据库的数据复制技术构建灾备方案基于数据库的数据复制技术大体上可分为两类:数据库自己提供的数据容灾模块和第三方厂商提供的数据库复制技术。以最常见的Oracle数据库为例, Oracle自己的数据复制技术有Data Guard,Streams,Advanced Replication和Golden Gate数据复制软件。第三方厂商的数据复制技术有Quest公司的Share Plex和DSG的RealSync等。3.4.3.1. 几种常见数据库复制技术l Data Guard数据复制技术Data Guard是Oracle数据库自带的数据同步功能,基本原理是将日志文件从原数据库传输到目标
41、数据库,然后在目标数据库上应用(Apply)这些日志文件,从而使目标数据库与源数据库保持同步。Data Guard提供了三种日志传输(Redo Transport)方式,分别是ARCH传输、LGWR同步传输和LGWR异步传输。在上述三种日志传输方式的基础上,提供了三种数据保护模式,即最大性能(Maximum Performance Mode)、最大保护(Maximum Protection Mode)和最大可用(Maximum Availability Mode),其中最大保护模式和最大可用模式要求日志传输必须用LGWR同步传输方式,最大性能模式下可用任何一种日志传输方式。最大性能模式:这种模
42、式是默认的数据保护模式,在不影响源数据库性能的条件下提供尽可能高的数据保护等级。在该种模式下,一旦日志数据写到源数据库的联机日志文件,事务即可提交,不必等待日志写到目标数据库,如果网络带宽充足,该种模式可提供类似于最大可用模式的数据保护等级。最大保护模式:在这种模式下,日志数据必须同时写到源数据库的联机日志文件和至少一个目标库的备用日志文件(standby redo log),事务才能提交。这种模式可确保数据零丢失,但代价是源数据库的可用性,一旦日志数据不能写到至少一个目标库的备用日志文件(standby redo log),源数据库将会被关闭。这也是目前市场上唯一的一种可确保数据零丢失的数据
43、库同步解决方案。最大可用模式:这种模式在不牺牲源数据库可用性的条件下提供了尽可能高的数据保护等级。与最大保护模式一样,日志数据需同时写到源数据库的联机日志文件和至少一个目标库的备用日志文件(standby redo log),事务才能提交,与最大保护模式不同的是,如果日志数据不能写到至少一个目标库的备用日志文件(standby redo log),源数据库不会被关闭,而是运行在最大性能模式下,待故障解决并将延迟的日志成功应用在目标库上以后,源数据库将会自动回到最大可用模式下。根据在目标库上日志应用(Log Apply)方式的不同,Data Guard可分为Physical Standby(Re
44、do Apply)和Logical Standby(SQL Apply)两种。Physical Standby数据库,在这种方式下,目标库通过介质恢复的方式保持与源数据库同步,这种方式支持任何类型的数据对象和数据类型,一些对数据库物理结构的操作如数据文件的添加,删除等也可支持。如果需要,Physical Standby数据库可以只读方式打开,用于报表查询、数据校验等操作,待这些操作完成后再将数据库置于日志应用模式下。Logical Standby数据库,在这种方式下,目标库处于打开状态,通过LogMiner挖掘从源数据库传输过来的日志,构造成SQL语句,然后在目标库上执行这些SQL,使之与源数
45、据库保持同步。由于数据库处于打开状态,因此可以在SQL Apply更新数据库的同时将原来在源数据库上执行的一些查询、报表等操作放到目标库上来执行,以减轻源数据库的压力,提高其性能。Data Guard数据同步技术有以下优势:1) Oracle数据库自身内置的功能,与每个Oracle新版本的新特性(如ASM)都完全兼容,且不需要另外付费;2) 配置管理较简单,不需要熟悉其他第三方的软件产品;3) Physical Standby数据库支持任何类型的数据对象和数据类型;4) Logical Standby数据库处于打开状态,可以在保持数据同步的同时执行查询等操作;5) 在最大保护模式下,可确保数据
46、的零丢失;Data Guard数据同步技术的劣势体现在以下几个方面:1) 由于传输整个日志文件,因此需要较高的网络传输带宽;2) Physical Standby数据库虽然可以只读方式打开,然后做些查询、报表等操作,但需要停止应用日志,这将使目标库与源数据不能保持同步,如果在此期间源数据库发生故障,将延长切换的时间;3) Logical Standby数据库不能支持某些特定的数据对象和数据类型;4) 不支持一对多复制,不支持双向复制,因此无法应用于信息集成的场合;5) 只能复制整个数据库,不能选择某个schema或表空间进行单独复制;6) 不支持异构的系统环境,需要相同的操作系统版本和数据库版
47、本;Data Guard技术是Oracle推荐的用于高可用灾难恢复环境的数据同步技术。l Streams数据复制技术Streams是从版本Oracle 9i才开始具有的数据同步功能,是为提高数据库的高可用性和数据的分发和共享功能而设计的,Streams利用高级队列技术,通过用LogMiner挖掘日志文件生成变更的逻辑记录,然后将这些变更应用到目标数据库上,从而实现数据库之间或一个数据库内部的数据同步。Streams数据同步大致分如下几个步骤:1) Capture进程分析日志,生成逻辑记录LCR,将其放入一个队列中;2) Propagation进程将LCR发送到另一个数据库中,通常是目标数据库;3) 在目标数据库中,Apply进程将LCR应用到目标库,实现数据的同步;在简单的Streams配置中,Capture进程一般位于源数据库,因此叫做Local Capture Process,Capture进程在分析日志后将生成的LCR放入队列中,由Propagation进程将LCR发送到目标库中。这样做的好处是不用在网络上传
限制150内