OracleDataGuard容灾方案(50页).doc
《OracleDataGuard容灾方案(50页).doc》由会员分享,可在线阅读,更多相关《OracleDataGuard容灾方案(50页).doc(49页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、-OracleDataGuard容灾方案-第 49 页Oracle数据库异地容灾方案介绍2008年11月目录第一章 需求分析41.1 序言41.2 用户现状4 系统平台4 数据库平台61.3 用户需求7 日常功能7 故障切换7 基本要求7 性能要求8 数据一致性9 系统兼容性9 高可用性10 健壮性要求10 设备无关性10 管理监控功能11第二章 Oracle Data Guard介绍122.1 Data Guard实现原理122.2 Oracle Data Guard 优势152.3 Data Guard提供的保护模式162.4 Data Guard实现方式以及对系统的限制要求172.5 切
2、换方式17第三章 系统建议方案183.1 Data Guard优势183.2 Data Guard运行模式193.3 Data Guard保护模式193.4 Data Guard初始安装步骤193.5 用户需求点对点应答20 日常功能20 故障切换21 基本要求22 性能要求23 数据一致性24 系统兼容性25 高可用性25 健壮性要求26 设备无关性27 管理监控功能27第一章 需求分析1.1 序言在信息时代,数据是企业创造商业价值的生产资料,数据的丢失将为企业带来毁灭性的灾难。据Gartner Group的调查数据表明,在经历过大型灾难或长时间系统停运的公司中,有2/5的公司再也未恢复运行
3、,而在其余的公司中,有1/3的公司在两年内破产。有句古谚叫“别把鸡蛋放在一个篮子里”。现在的信息系统,各种数据高度集中,“鸡蛋”全放在一个篮里了。一旦出现突然停电、意外死机或者人为破坏,造成数据丢失是不可避免的。面对各种未可预知的灾难,越来越多的企业将容灾备份系统作为企业安全的保障。银联数据异地灾备项目的目标是保证SF25K上各银行(民生银行贷记卡系统拟迁移至IBM主机,故此次灾备项目暂不考虑;邮储银行贷记卡系统主机为IBM P570,也不在考虑范围之内)发卡系统的安全,在灾难情况下,最大限度地保护公司资产,减少公司各方面的损失,保证发卡系统的业务连续性。本方案仅对异地容灾数据库复制软件部分做
4、相应阐述。1.2 用户现状1.2.1 系统平台发卡系统运行在一台SunFire E25K企业级服务器上,通过两台Brocade SW4900 SAN交换机与两台企业级存储ST9990、SE9970相连,应用系统核心文件和数据库数据文件均存放在该存储上,存储系统磁盘采用RAID 1+0方式。SF25K划分为四个物理分区(Domain),每家银行均使用其中的两个,一个Domain作为生产主机,另一个Domain作为热备主机。Domain操作系统为Solaris 10,数据库系统为Oracle 10 RAC。通过Sun Cluster集群软件,实现了生产机房内的双机热备份,保证了系统的高可用性。此外
5、,在主机端还通过Sun MPXIO多通道负载均衡软件,实现两条光纤通道的负载均衡,进一步避免了单点故障。以下是发卡系统SAN架构图:SW4900 SW4900 SE9970 L180 (2 LTO-3)V280RNBU Master Server ST9990 SF25KDomain ADomain BDomain CDomain DVTL通过在主机端使用VxVM 4.1卷管理软件,已建立了同机房数据灾备系统,两台存储SE9970与ST9990之间实现了同步数据复制,达到了以下灾难恢复目标:l 日常工作,保证两台存储的数据实时同步保持一致,所有数据不丢失。l 计划外停机,任一台存储发生灾难,保
6、证数据不丢失,即RPO=0,并确保应用不中断运行,即RTO=0。SE9970ST9990生产主机VxVM Mirror Volume1.2.2 数据库平台发卡系统中的数据库系统,是整个生产系统中最关键、最复杂的数据对象,发卡系统的业务运转直接依赖于这些数据的可用性。截至到2008年8月底,各数据库实例数据量情况见下表:实例名总数据量(GB)Archive log数据量(GB)高峰期Archive log变化量(MB/s)平均每天最大帐单日HX25140.42 SZ15120.20 CR934.550.40 DE381.550.58 UC27512162.95 合计44620324.55 1.3
7、 用户需求银联数据拟为提供外包服务的各银行发卡系统建设异地灾备系统,生产系统位于上海,灾备系统位于北京。主备中心之间采用数据库复制软件进行异步数据复制,以保证生产数据的安全性,满足发卡系统的业务连续性需求。1.3.1 日常功能l 将生产中心发卡系统上的数据库变化实时异步复制到灾备中心;l 灾备中心的Oracle数据库处于打开状态,可提供实时数据查询;l 对生产系统的资源占用不能太多,不能影响到生产系统的正常运行;l 对网络带宽的占用较低。1.3.2 故障切换l 当生产中心的系统无法正常运行,而又不能在短期内恢复时,可利用灾备中心提供业务接管。 l 灾备中心必须在生产中心不可用6小时之内完成业务
8、接管。l 当生产中心服务器恢复正常后,数据复制系统需要将灾备中心的最新数据反向复制回生产中心,实现业务的恢复。1.3.3 基本要求l 复制软件应满足在单机或RAC环境下,对Oracle在线日志(Online redo log)的捕捉及复制;l 支持Oracle中所有的常用数据类型,如Oracle中的LONG 、LONG RAW、BLOB、CLOB、NCLOB、TIMESTAMP等,可实现用户自定义表、字段进行复制;l 支持对数据库中常用DDL操作的复制;l 支持事务复制,要求对数据库中较大的事务不会出现过多延迟;l 支持没有PK/UK字段的表的同步。l 数据复制过程可根据需要灵活地进行控制或修
9、改复制的方向,以满足业务需求;l 支持在数据复制过程中对数据正确性进行校验,如正在复制的数据在之前就已经不一致,应提供报警功能,以便及时发现错误,避免错误的扩大;l 提供专用图形化集中管理软件。1.3.4 性能要求l 数据库初始化同步要求数据库复制软件能够将发卡系统的数据库中已有数据初始化同步到灾备中心数据库。在初始化同步过程中,业务不能停止,但可选择业务量较小时段进行。在解决方案书中要求详细描述初始化数据同步解决方案,以及整个首次同步操作所需要的时间(以100GB数据为标准),并且要求列出整个首次初始化过程中是否需要人为干预,从而可以有效地评估整个首次数据初始化的工作量。为了保证生产中心日后
10、业务扩展存在更换服务器厂商以及数据库版本等情况,需要注明是否支持异构平台下的首次数据初始化同步,是否支持跨数据库版本之间数据库的初始化同步操作。l 数据复制性能指标数据复制的性能指标与系统平台、网络带宽、应用系统等因素密切相关,参照下列运行环境:项目配置数据源SF15K 24个CPU,32GB内存, ORACLE 10.2.0.2 RAC目标端SF15K 24个CPU,32GB内存, ORACLE 10.2.0.2总数据量500GB左右(数据+索引)每天的日志量每天20GB日志网络带宽100M和20M要求提供相应的性能参数指标:类别指标参考值首次数据初始化同步首次数据库初始化同步时间(100M
11、带宽) 小于10小时首次数据库初始化同步时间(20M带宽)小于48小时首次数据库初始化同步源端CPU占用小于30 增量数据同步(单个复制链路)源端CPU占用小于5目标端CPU占用小于5源端内存占用小于200M目标端内存占用小于200M复制数据延迟平均值10s以内业务高峰期对系统的影响 源端CPU占用小于10目标端CPU占用小于10复制数据延迟平均值10s以内1.3.5 数据一致性要求数据库复制软件提供数据库初始化同步、数据恢复后以及日常的数据一致性检查方案,要求方案中详细注明该数据一致性比对方案的特点以及操作复杂度,并可满足如下要求:l 可在应用不停机的情况下,查找和发现不一致的数据;l 一致
12、性检查需要能够进行对象属性、记录条数和记录的字段内容进行一致性检查;l 提供全库的记录级一致性检查时间(以100GB的数据为例)。l 支持不含PK/UK字段的表的一致性检查和修复。请提供在没有PK/UK字段的表中有1000万条记录的比对时间。对于不一致的数据,需要提供不一致记录详细信息,以便进行精确的修复,同时提供数据修复方案。数据修复工作要求操作简单,修复速度快,且修复过程中不影响业务正常运行。1.3.6 系统兼容性数据库复制软件应支持以下操作系统平台:l Sun Solaris 9,10l IBM AIX 5.x数据库复制软件应支持Oracle 9i,Oracle 10g,Oracle 1
13、1g及后续数据库版本;支持异构平台,源端和目标端不同数据库版本;支持Cluster/HACMP和RAC模式,并支持不同操作系统下不同数据库版本之间的复制。1.3.7 高可用性主系统和备用系统的数据库处于双活状态,以保证在灾难发生前可在两个系统上运行不同类型的应用程序。数据库复制软件应支持本地Cluster/HACMP的高可用方式,在本地单节点出现故障时,可通过Cluster软件接管到其它节点。1.3.8 健壮性要求数据库复制软件在各种大压力和各种故障情况下不会造成数据复制失败。l 网络故障:长时间中断、短时间中断及网络时断时续情况下的正常复制;l 数据库故障:在目标端数据库故障下, 源端数据库
14、不能受到影响。当目标端数据库修复后,复制软件继续工作;l 服务器硬件故障:在目标端服务器故障下, 源端生产系统不能受到影响,当目标端修复后,复制软件继续工作。1.3.9 设备无关性独立于任何硬件设备、操作系统和Oracle数据库的不同版本,能够实现不同平台之间数据库的复制。1.3.10 管理监控功能数据库复制软件需提供统一的管理监控功能,能实现对复制软件的运行状态、运行日志、系统配置等方面进行统一的管理及监控,保证出现错误时具有完整方便的报警及跟踪机制,方便故障的快速定位和解决。第二章 Oracle Data Guard介绍容灾系统主要包括数据保护和应用切换两大方面,其中最为重要的是数据保护部
15、分。除了要将这些数据存放在高可用的存储设备上之外,最重要的是这些关键数据应该在异地之间保持一致,以使灾难发生后,系统可以尽快恢复。下面是几种主要的数据保护技术。实现数据的异地复制,有软件方式和硬件方式两种途径。软件方式,是通过主机端软件来实现,如第三方软件或者数据库厂家提供的远程数据容灾工具来实现业务数据的远程复制。硬件方式,是基于智能存储系统的控制器的远程拷贝,可以在主、备存储系统之间通过硬件实现复制。在实际的容灾系统中,由于系统的环境不同,安全性要求不同以及采用的软硬件产品不同,数据复制过程中的工作机制也不尽相同。概括地讲,数据复制地工作机制主要包括同步和异步两种。同步远程镜像(同步复制技
16、术)是指通过远程镜像软件,将本地数据以完全同步的方式复制到异地,每一本地的I/O事务均需等待远程复制的完成确认信息,方予以释放。异步远程镜像(异步复制技术)保证在更新远程存储视图前完成向本地存储系统的基本I/O操作,而由本地存储系统提供给请求镜像主机的I/O操作完成确认信息,远程的数据复制以后台同步的方式进行。因为带宽等因素限制,本次容灾方案仅包括了异步复制的方式的讨论。2.1 Data Guard实现原理Oracle Data Guard 是当今保护企业核心资产(数据)的最有效解决方案,它能够使数据在 24x7 的基础上可用,而无论是否发生灾难或其它中断。Oracle Data Guard
17、是管理、监控和自动化软件的基础架构,它创建、维护和监控一个或多个备用数据库,以保护企业数据结构不受故障、灾难、错误和崩溃的影响。 Data Guard 使备用数据库保持为与生产数据库在事务上一致的副本。这些备用数据库可能位于距生产数据中心数千公里的远程灾难恢复站点,或者可能位于同一城市、同一校园乃至同一建筑物内。当生产数据库由于计划中断或意外中断而变得不可用时,Data Guard 可以将任意备用数据库切换到生产角色,从而使与中断相关的停机时间减到最少,并防止任何数据丢失。 作为 Oracle 数据库企业版的一个特性推出的 Data Guard 能够与其它的 Oracle 高可用性 (HA)
18、解决方案(如真正应用集群 (RAC) 和恢复管理器 (RMAN))结合使用,以提供业内前所未有的高水平数据保护和数据可用性。下图提供了 Oracle Data Guard 的一个概述。Oracle Data Guard 包括一个生产数据库,也称为主数据库,以及一个或多个备用数据库,这些备用数据库是与主数据库在事务上一致的副本。Data Guard 利用重做数据保持这种事务一致性。当主数据库中发生事务时,则生成重做数据并将其写入本地重做日志文件中。通过 Data Guard,还将重做数据传输到备用站点上,并应用到备用数据库中,从而使备用数据库与主数据库保持同步。Data Guard 允许管理员选
19、择将重做数据同步还是异步地发送到备用站点上。 备用数据库的底层技术是 Data Guard 重做应用(物理备用数据库)和 Data Guard SQL 应用(逻辑备用数据库)。物理备用数据库在磁盘上拥有和主数据库逐块相同的数据库结构,并且使用 Oracle 介质恢复进行更新。逻辑备用数据库是一个独立数据库,它与主数据库包含相同的数据。它使用 SQL 语句进行更新,其相对优势是能够并行用于恢复以及诸如报表、查询等其他任务。 Data Guard 简化了主数据库和选定的备用数据库之间的转换和故障切换,从而减少了由计划停机和计划外故障所导致的总停机时间。 主数据库和备用数据库以及它们的各种交互可以使
20、用 SQL*Plus 来进行管理。为了获得更简便的可管理性,Data Guard 还提供了一个分布式管理框架(称为 Data Guard Broker),它不但自动化了 Data Guard 配置的创建、维护和监控,并对这些操作进行统一管理。管理员可以使用 Oracle Enterprise Manager 或 Broker 自己的专用命令行界面 (DGMGRL) 来利用 Broker 的管理功能。 下图显示了 Oracle Data Guard 组件。 2.2 Oracle Data Guard 优势 灾难恢复和高可用性 Data Guard 提供了一个高效和全面的灾难恢复和高可用性解决方案
21、。易于管理的转换和故障切换功能允许主数据库和备用数据库之间的角色转换,从而使主数据库因计划的和计划外的中断所导致的停机时间减到最少。 完善的数据保护 使用备用数据库,Data Guard 可保证即使遇到不可预见的灾难也不会丢失数据。备用数据库提供了防止数据损坏和用户错误的安全保护。主数据库上的存储器级物理损坏不会传播到备用数据库上。同样,导致主数据库永久损坏的逻辑损坏或用户错误也能够得到解决。最后,在将重做数据应用到备用数据库时会对其进行验证。 有效利用系统资源 备用数据库表使用从主数据库接收到的重做数据进行更新,并且可用于诸如备份操作、报表、合计和查询等其它任务,从而减少执行这些任务所必需的
22、主数据库工作负载,节省宝贵的 CPU 和 I/O 周期。使用逻辑备用数据库,用户可以在模式中不从主数据库进行更新的表上执行数据处理操作。逻辑备用数据库可以在从主数据库中对表进行更新时保持打开,并可同时对表进行只读访问。最后,可以在维护的表上创建额外索引和物化视图,以获得更好的查询性能和适应特定的业务要求。灵活的数据保护功能,从而在可用性与性能要求之间取得平衡 Oracle Data Guard 提供了最大保护、最高可用性和最高性能等模式,来帮助企业在系统性能要求和数据保护之间取得平衡。 自动间隔检测及其解决方案 如果主数据库与一个或更多个备用数据库之间的连接丢失(例如,由于网络问题),则在主数
23、据库上生成的重做数据将无法发送到那些备用数据库上。一旦重新建立连接,Data Guard 就自动检测丢失的存档日志序列(或间隔),并将必要的存档日志自动传输到备用数据库中。备用数据库将重新与主数据库同步,而无需管理员的任何手动干预。 简单的集中式管理 Data Guard Broker 使一个 Data Guard 配置中的多个数据库间的管理和操作任务自动化。Broker 还监控单个 Data Guard 配置内的所有系统。管理员可以使用 Oracle Enterprise Manager 或 Broker 自己专用的命令行界面 (DGMGRL) 来利用这个集成的管理框架。 与 Oracle
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- OracleDataGuard 方案 50
限制150内