《浅谈容灾与容灾方案设计.doc》由会员分享,可在线阅读,更多相关《浅谈容灾与容灾方案设计.doc(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流浅谈容灾与容灾方案设计.精品文档.浅谈容灾与容灾方案设计自从有了信息技术以来,信息系统面临的各种故障和灾难就从来没有停止过。在企业信息化进程不断加快的今天,保持业务的持续性是企业用户进行数据存储时必须考虑的重要问题。灾难的出现,可能导致生产停顿、客户满意度降低,企业的竞争力会因此大打折扣。震惊世界的“9.11” 事件让全世界都看到了金融、电信企业在灾难中遭受的巨大损失。08年的南方雪灾和汶川地震告诉我们,灾难就在我们身边,容灾系统的建设已经刻不容缓。 容灾是指为了保证关键业务和应用在经历各种灾难后,仍然能够最大限度的提供正常服务所进行的一系列
2、系统计划及建设行为,业务连续性是容灾的最终建设目标。一般来说容灾是一个宏观的概念,IT领域所说的灾备、灾难恢复等只是容灾的一部分,主要讨论数据和信息系统保护的问题,或者说是容灾整体框架中的技术基础部分。容灾技术的进步和需求的增长是企业信息化发展的必然结果,同时也反映了信息化系统及数据对个人、企业和国家的重要程度的不断提升。 信息系统容灾建设的目标是提高信息系统抵御灾难和重大事故的能力,减少意外情况发生所造成的损失,减轻对企业和社会带来的不良影响。容灾与数据安全性是密切相关的,数据的安全性是实现业务连续性的基础。统计结果表明,在过去5年内,全球93的公司有过丢失重要数据而造成业务损失的经历,72
3、% 的业务没有可靠的业务连续性计划,只有18%的最终用户的数据得到了可靠保护。 虽然已经认识到数据安全的重要性,但很多企业在如何建立容灾系统的问题上却存在种种疑惑。我国在实施容灾工程方面尚处于初级阶段,某些已经建成并投入使用的容灾系统,功能单一,而且存在投入成本高、投资回报率低、容灾数据的可恢复性难以验证、管理成本居高不下等问题。以上种种因素使得部分准备建立容灾系统的用户裹足不前。 为此,国务院信息化工作办公室于2005年4月下发了重要信息系统给灾难恢复指南,而后2007年国家标准信息系统灾难恢复规范出台,指明了灾难恢复的流程,灾备建设的等级划分及灾难恢复预案的制定等内容,为企业的相关工作提供
4、了有益的参考。 要建设容灾工程必须提出容灾系统的建设目标,作为衡量和选择容灾产品技术和解决方案的参数。例如: l 备份/恢复的范围 l 灾难恢复计划的状态 l 业务系统与容灾系统之间的距离 l 业务系统与容灾系统之间如何相互连接 l 数据是怎样在两个系统之间传送的 l 允许有多少数据被丢失 l 怎样保证更新的数据在容灾系统被更新 l 容灾系统可以开始支持服务的能力 在设计容灾系统时,还需要提供更加具体的设计指标。建立容灾系统的最终目的,是为了在灾难发生后能够以最快的速度恢复数据服务,所以,容灾中心的设计指标主要与容灾系统的数据恢复能力有关,最常见的设计指标有:RTO 和RPO。 RTO(Rec
5、overy Time Objective)代表容灾系统在灾难发生后数据或者系统恢复所用的时间。RPO(Recovery Point Objective)代表灾难发生时已经备份的数据与生产中心数据的时间差。通常情况下,容灾系统投资较大,使用概率较低,因此,需要对总体投入成本(TCO)和投资回报率(ROI)进行认真的分析和计算。 从经济角度考虑,最佳的容灾技术不一定是最好的容灾解决方案,容灾系统的总体投入TCO和投资回报ROI,对于许多用户来说是十分重要的设计指标。TCO包括建立系统、维护系统和扩充系统的总投入,由于容灾系统的启用概率很低,新技术的发展和新产品的性能价格比的提高,必定造成容灾设备的
6、贬值。所以,对于容灾系统TCO越高,ROI越低。 不同企业的系统环境千差万别,从单机到大型数据中心,从小型单业务到复杂的多业务集成。平台复杂度、数据复杂度、业务复杂度、管理复杂度的区别使得我们很难用简单的思维去理解和规划容灾系统。容灾项目的推进不是需求与技术的简单匹配,而要深入地分析用户的应用环境,找到最适合的解决方案。正所谓“没有最好的产品,只有最合适的方案”。 容灾的建设不能局限于技术类型的划分,而是帮助用户打破产品技术局限,根据不同应用的特点,综合地考虑RTO、RPO、TCO、RIO等指标和技术实现方式,提供从单业务系统到企业数据中心的多套灾难解决方案共用户选择。用户不必过多地考虑不同技
7、术的差异,仅需要理解技术方案与自身业务的匹配度。 例如,针对中小企业,UIT提出的基于主机容灾方案,充分考虑中小企业没有大型存储,环境简单的特点,支持从操作系统 - 应用软件- 数据的全面容灾保护,使得客户不需要关心数据结构和类型的差别。UIT方案兼具HA与远程复制容灾功能,传输数据量小,容灾距离无限制等特点。首先对生产系统做数据镜像,实时捕捉系统byte-level变化,当数据有任何变动时,将变动的部分更新至目标备用服务器,一旦生产数据库宕机,则灾备服务器立即接管相关的服务,系统实时数据复制与保护,最大程度降低服务中断时间,并可加强磁带备份机制,该方案同时支持SAN,NAS或 Microso
8、ft Cluster Server(MSCS)等中小企业常用应用平台,系统环境不需要修改,最大限度的保护了现有设备的投资。 大型企业的容灾建设就需要另外的思路。企业级数据中心的复杂度在于平台繁多,各类系统的RTO、RPO指标可能差距很大。如果分散使用各类容灾技术,会极大的影响产品采购及后期使用维护的整体成本(CTO)。所以在数据中心环境下建立灾备系统,不能单独考虑某个技术或产品适合某个系统的问题。 另外大型企业数据中心进行容灾建设的前提是数据的集中。如果在数据分散存储的状态下做容灾规划是不可想象的。因此统一的SAN存储结构最有利于容灾系统的设计。 UIT提出的存储虚拟化企业级容灾方案即基于以上
9、环境,充分考虑大型数据中心对高可靠性、高性能、高扩展性的要求,利用带外虚拟化技术在现有的SAN存储架构上增加虚拟化管理器来实现高级的统一存储管理和远程容灾功能。UIT方案提供先进的、集中简化的SAN管理及多层次的数据保护功能(快照和复制)。企业用户能够更加有效地管理和利用存储系统,建立可靠的容灾环境,确保业务的可靠性和连续性。同时,该解决方案能够使用户的存储基础构架更具扩展性和灵活性,支持不同厂商的存储平台,将选择权真正交还给用户,现有设备的投资受到保护,从发展的观点看能够真正降低企业的总体拥有成本(TCO)。容灾备份技术的应用,帮助企业在发生不可抗拒灾难之后,能够在第一时间内恢复公司企业的重
10、要数据,以求达到业务连续性的目的,是公司尽最大可能减少灾难下的损失,为企业赢得利益上的保证。灾备建设基本方法的三个要素灾备建设的基本方法,一言以蔽之,就是灾备目标、拥有成本和灾备技术方案选型三者的权衡。灾备目标,就是熟知的RPO和RTO,可对应于灾备信息所规定的灾备系统等级;灾备拥有成本,一般包括首次建设成本和后期运维成本;灾备技术方案,就是实现灾备目标的技术手段,具体包括备份、复制、镜像、集群、虚拟化等技术和技术组合方案。灾备目标和拥有成本的关系是比较容易理解的,要实现或达到怎样的灾备目标或等级,就需要花费相应的成本,绝大部分的情况下,灾备目标和等级越高,总体拥有成本越高。灾备目标和容灾备份
11、技术方案的关系是,灾备目标决定了灾备技术手段的选择范围。这里的“范围”是指一个技术产品群,也就是说达到同一个灾备等级是有多种技术可选择的,每种技术在业内又有不同的产品,如何选择是核心问题,也是用户在灾备建设中的最为困惑的问题之一。本文正是通过对灾备关键技术的介绍,告诉您灾备技术选择的一般方法。灾备技术需求新发展随着IT系统建设的日益复杂化,在灾备实际建设中,除了关注传统的灾备目标和等级要求(RPO和RTO)外,还涌现了一些典型的技术需求。这些需求由于与灾备目标实现和总体拥有成本紧密相关,正逐步成为灾备建设技术评价体系的一部分,越来越受用户的重视。归纳起来有以下几个方面。1.生产系统的影响程度灾
12、备部署和运行对生产系统的架构、性能的影响程度,表现为对生产系统资源的占用程度和部署容灾备份技术对原架构的更改程度,占用和更改程度越大,说明影响程度越高,越需要进行技术改善。2.统一灾备能力目前中大型企业机构的数据中心都有多个IT系统,同时存在多品牌或不同档次的存储、服务器。由于品牌技术的锁定,特别是存储系统的品牌锁定,灾备中心建设面临一个典型的技术无奈:为每套存储系统建立单独的灾备系统,庞大的多套灾备系统由此产生。这样的情况下,不仅灾备成本居高不下,而且灾备日常运行维护投入也很高。因此,越来越多的用户希望获得多个生产系统统一灾备的解决方案。这样的方案有两个特点:第一,灾备中心只建设一套灾备系统
13、,承载多个生产系统的灾备业务;第二,统一管理分散的多套生产系统的灾备业务。3.逻辑软灾难应对需求据权威统计,IT系统计划外宕机的故障原因中,有49%是由于人为误操作、软件bug、病毒等逻辑软灾难造成的。越来越多的灾备建设规划,将具备软灾难的恢复能力作为灾备系统的建设目标需求。4.灾备链路带宽要求灾备建设有灾备距离要求,灾备链路规划是容灾备份技术建设的技术主题之一。目前大部分用户的灾备链路都采用租用公共链路方式,灾备系统的链路需求与总体拥有成本强相关。选用带宽要求小的灾备技术或者部署相关的带宽优化技术成为技术选型的方向。5.灾备数据可用性低级的容灾备份技术需要在数据反向恢复后才能检验灾备数据副本
14、是否完整一致,数据反向恢复操作对源数据是一次覆盖,具有极大风险。用户需要这样的高级的灾备技术,无需进行数据恢复,能实现数据副本的即时可验证;灾备数据的可用性是指多大程度上实现灾备数据副本的可用,分为不可用、可用(需进行少量低风险操作后可用)、实时可用(源数据及其副本可同时提供业务访问)。灾备基础数据同步技术灾备技术源于数据保护技术,其核心的技术思想是为数据在异地创建副本。灾备技术就是利用数据保护的基础技术在几十公里、数百公里甚至千里之外的系统中创建数据的副本,实现生产系统和灾备系统的数据同步。虽然实现某一灾备等级和目标有多种技术和产品,但纵观业界的灾备产品,万变不离其宗,都是基于以下几个数据保
15、护与同步基础技术。灾备数据同步技术实现与选型1.备份技术传统备份技术的实现已经被当前的用户大量应用并被熟知,技术实现不再赘述。备份技术在技术成熟度和成本上是有优势的,但这个技术部署在灾备系统中是有明显局限性的,主要体现在以下几个方面:备份时间长,存在备份窗口,无法实时灾备,所以RPO至少在半天以上容灾备份技术有效性无法检验,灾备可靠性差备份有数据格式转换,灾备恢复时间长备份技术近几年有了一定的优化,主要有两个方面:基于磁盘备份技术,产生了D2D(磁盘到磁盘)和D2VTL(磁盘到虚拟磁带库)的备份方案。这种技术方案大大缩短了备份时间,备份窗口进一步减小。但总体上说,相对于其它灾备技术,灾备实时性
16、、恢复可靠性和恢复时间还是处于劣势。备份软件中植入了类似复制、快照技术的功能,这些新功能在技术上可独立归入主机级复制和快照技术,但在灾备系统部署上依赖备份功能,需在备份功能部署基础上完成部署。因此,备份技术一般用于RPO和RTO等灾备目标和容灾备份技术等级不高的灾备系统中。2.镜像技术的实现镜像有两种实现方式,同步镜像和异步镜像。两种镜像技术的相同点如下:都需要完成生产卷和镜像卷的数据同步数据同步的处理单位是每个写I/O数据同步链路一般为FC链路或者高速IP链路两者的实现方式区别和适用场合见下表。3.复制技术的实现复制技术作为容灾备份技术之一,其特点如下:复制技术是一项远距离数据同步技术,一般
17、采用IP网络作为灾备链路。IP链路情况下,数据同步无距离限制,IP可达,灾备可达;复制技术的数据同步机制基于变化的数据块(有数据写入发生的数据块),区别于镜像技术基于I/O;复制技术的数据同步机制对于源数据卷和复制目标卷来说是顺序的,即数据先写入源数据卷,然后根据事先设定的策略,将一段时间内发生了写操作的数据块数据再写入复制目标卷。这一点区别于镜像技术数据并发写入源数据卷和镜像卷;复制技术发展到今天,所实现产品按照数据同步方式不同,大致可分为两类,一类是策略性复制,一类是实时性复制。策略性复制基于一定的策略,自动触发复制。策略一般基于时间或者基于数据变化量。前者比如说每天间隔多长时间或者在哪些
18、时刻触发复制,后者如数据变化累积到10M的时候触发复制。两种策略所触发的复制,都是将上次复制触发时间点到本次触发时间点之间变化的数据块数据同步到灾备系统。策略性复制的RPO为策略性复制的触发时间间隔。实时性复制一旦某个数据块发生了变化,就将该数据块数据同步到灾备系统。在理想的灾备复制部署中,策略性复制和实时性复制是结合部署的,能增强灾备系统的灵活性和适应性。策略性复制能有效降低对灾备系统的影响并确保灾备数据的一致性,而实时复制技术能有效降低单独部署策略性复制技术的RPO目标风险。4.快照技术快照技术是用来快速创建数据副本的技术,是一种数据变化捕获技术。快照的技术特点如下:创建快照数据副本十分迅
19、速,无快照备份窗口快照操作实际上是将上个快照时间点到当前时间点这个时间段内数据的变化量存储下来,所以快照数据副本创建十分迅速;多个恢复点目标多个时间点下的快照操作就是创建数据的多个历史时间点的副本,这样以来,数据能恢复到多个历史时间点。快照数据副本可提供数据服务快照提供一份接近实况数据的拷贝,可供测试、归档、查询使用,既保护生产系统又赋予备份数据新的用途。虽然快照具备以上突出优势,但单独部署快照技术无法实现容灾备份技术。快照技术通常结合镜像技术、复制技术,构建更完备的灾备系统。比如前面介绍的策略性复制技术,就是运用了快照技术来快速捕获数据变化量,再通过复制技术将数据变化量同步到灾备系统。这种结
20、合的另一个重大意义是灾备系统具备了防范软灾难的能力,能将数据恢复到多个时间点。5.复制与镜像的选择灾备数据同步的实现层次一般IT系统由四部分组成:业务网络、主机、存储网络、存储阵列。生产系统和灾备系统作为两个独立的IT系统,灾备过程其实就是两个系统之间的数据同步。灾备数据同步可以部署在两个系统的主机与主机之间,或者存储阵列之间,或者存储网络之间,这就构成了灾备技术的三个基本实现层次:主机级、存储阵列级、存储网络级。进一步,主机级的灾备技术实现层次,按照主机数据处理视图,可大致细分为逻辑卷或文件系统级、应用(软件)级两个层次。以上介绍的四大容灾备份技术,除了备份是基于主机级的实现层次,其它三种技
21、术,镜像、复制、快照都有主机级、存储阵列级和存储网络级这三种实现层次。在遇到相关产品时,可参考下表予以考察:容灾备份技术其它相关技术简介1.存储虚拟化存储虚拟化,主要是基于存储网络的虚拟化。其基本价值是存储资源整合和统一管理,以提高存储资源的利用率。近些年来,这类技术大部分情况下是运用于灾备系统建设。因为存储网络级虚拟化能兼容并屏蔽底层各种存储阵列的访问差异性,对存储资源进行统一虚拟化管理,在此基础上能够结合镜像、复制技术,实现多生产系统、多存储阵列下的数据统一灾备。也就是说,存储虚拟化技术是实现存储网络级灾备数据同步的重要一环,能打破灾备建设中存储阵列类型和品牌限制,能进行多个存储阵列环境下
22、的统一灾备。2.灾备链路带宽精简技术灾备链路带宽精简技术,是减少对灾备链路带宽要求的技术。技术实现原理是通过减少数据传输量来降低对灾备链路的带宽要求。带宽精简技术在实现方式上主要有两种方法:采用精细的扫描算法,将数据的变化扫描定位到细小的磁盘扇区级别,数据同步仅针对变化扇区数据。这样以来,对于一个数据块的写入只涉及某些细小扇区的情况,数据同步量将有大幅减少。采用压缩算法还有一种方法是采用重复数据删除技术来精简数据传输量,但由于数据的重复数据删除过程耗时较长,数据同步效率显著降低,所以极少被应用。存储级的灾备链路带宽技术,多是基于数据块的实现方式,所以一般同复制技术结合部署,能进一步降低数据复制
23、的链路带宽要求,提高灾备的网络适应性。3.日志同步技术日志同步技术是目前容灾备份技术,技术原理可简单理解为生产系统不直接将数据同步给灾备系统,而只告诉灾备系统在哪个文件或者存储区域写了哪些数据.灾备系统实际是先接受生产系统的“日志指令”,然后根据指令将实际数据写入文件或者存储区域。日志同步技术广义上可以归为复制技术的范畴,因为数据写入都具备顺序性,即先源后目标。但在数据同步机制上,有很大差别,复制技术的数据同步机制是基于数据块的,日志同步技术是基于日志的。日志同步技术由于是基于日志的数据同步机制,其突出特点是:灾备链路带宽需求小数据同步效率高,能很好地实现较高的RPO目标日志同步技术目前在存储阵列和主机应用层有实现产品,特别是基于数据库的日志同步技术产品,由于基本能达到灾备等级6的高RPO和RTO要求,而被运用于某些高端灾备系统中。总结:灾备等级要求与容灾备份技术同步镜像+集群技术的容灾备份技术方案,是在数据保持严格同步的基础上,利用主机集群技术和存储阵列集群技术,实现灾难发生后生产系统到灾备系统的自动或手动的快速切换,达到灾备6级RPO和RTO几乎为0的恢复目标要求。
限制150内