金融行业灾难备份方案探析样本.doc
金融行业灾难备份方案现在金融系统关键业务系统,全部是经过以下方法来加强系统可靠性:· 主机经过采取双机方法来加强系统工作可靠性和可用性; · 存放设备经过冗余RAID技术确保数据可靠性 · 脱机数据备份 · 关键网络设备和通讯线路冗余 但以上方法无法确保当发生火灾、电源系统故障等灾难性事故时,业务系统运行连续性。灾备中心建设目标是对金融行业现有业务系统建立一个完整灾难备份体系。当因为灾难(火灾、地震、电源故障等)原因无法工作时,经过灾难备份体系,关键业务数据得到快速恢复,从而确保业务应用系统能立即恢复运行。各系统现实状况现在关键生产系统全部采取服务器双机热备份工作方法,服务器为IBMAIX主机。 各生产系统采取存放系统各不相同,支付系统采取了IBM FAStT500,同城支付结算系统采取了EMC存放系统;主机系统和存放系统之间连接,支付系统是经过光纤交换机连接,同城支付结算系统是采取直接连接方法。 各应用系统及外网之间,经过电信DDN和ISDN线路连接(DDN为根本路,ISDN为备份线路),关键网络设备全部是双机热备。系统由两种类型平台组成:IBM小型机平台和PC SERVER 平台,前者是高性能处理器,完成最关键业务处理和存放功效。PC SERVER平台关键作为WEB应用,处理不一样种类业务接入。在IBM小型机平台中,其中一台作为应用服务器,另外一台小型机作为数据库服务器。两台服务器使用EMC共享存放,而且是互为热备份,能够在任意一台主机发生故障时,自动切换业务到另外一台服务器上,确保服务连续性。PC SERVER 平台中,一个是企业WEB服务器,另外是银行WEB服务器,最终是WEB应用服务器。PC SERVER 平台和小型机平台信息传输是经过WEB应用服务器和小型机平台应用服务器之间MQ通讯连接来完成。应用服务器:P570:处理器8*POWER5 1.65GHZ ,内存16G.内置硬盘4块74G软件AIX 5.2 MQ:5.3.0.2 ORACLE 9.2.0.4数据库服务器:P570:处理器8*POWER5 1.65GHZ ,内存16G.内置硬盘4块74G软件AIX 5.2 MQ:5.3.0.2 ORACLE 9.2.0.4WEB 应用服务器:IBM X226: 2*3.2GHZ XEON ,内存2G.,内置2块镜像74G盘。 软件 LINUX 9.0 ORACLE 9.2.0.4 MQ 5.0.6WEB服务器:IBM X226: 2*3.2GHZ XEON ,内存2G.,内置2块镜像74G盘。 软件:WIN ,IIS ,ORACLE 9I 用户端。建设目标灾备中心建设目标是为各生产系统建立远程灾难备份系统,经过灾备系统,实现以下要求: · 影响各业务系统计算机系统硬件、软件、应用故障不会影响各业务系统提供服务; · 因为灾难(火灾、地震、电源故障)等原因无法工作时,灾备数据中心能够立即接管各业务系统,使系统在短时间内恢复运行; · 系统恢复正常后,应用能够根据要求快速切换回结算中心运行。 · 对关键系统首优异行建设,逐步扩展灾难备份中心规模。 容灾目标: RTO: 1小时 RPO: 零或靠近零数据丢失 容灾等级: 根据灾难备份技术等级划分,灾备系统实现第6级“零数据丢失”指标要求,网络和应用系统则经过人工干预实现切换。 容灾早期工作: 因为有三台web服务器数据是存放在本机硬盘上,所以在建立容灾系统前必需将web服务器存放迁到外部存放中,确保这些数据立即做好备份,方便灾难发生时全部系统数据得以恢复。 金融行业灾难备份方案(续一)灾备中心地理位置选择依据现有基础设施资源考虑,有两种灾难备份中心位置选择,一是10公里以内办公楼宇,二是在5070公里内办公楼宇。二者距离不一样,对灾难备份中心建设要求也不一样,10公里内灾难备份中心,数据镜像效果比很好,基础上对生产中心性能没有影响,在存放线路和网络线路上投入全部比较小。 依据现有条件,可临时将灾备中心建在距500米左右某电信机房。条件成熟时可依据需要迁移至同城其它地点。 系统备份策略依据前面讨论,以灾备系统达成6级“零数据丢失”指标要求为标准,灾备中心应经过远程数据镜像方法来确保和数据中心数据一致性。 储系统硬件级灾备技术方案现在关键数据镜像灾备技术方案有三类,分别是基于主机灾备技术方案、基于存放灾备技术方案、基于SAN网络灾备技术方案。 基于硬件等级数据远程备份,是使用智能存放内部远程数据同时功效进行,要求将系统全部相关数据全部集中放置在一台智能存放设备当中,智能存放设备使用其内部数据备份功效和异地另外一台同类型数据设备进行数据传输。基于硬件数据备份,对软件系统来说完全是透明。 现在应用比较多智能存放异地备份技术有:EMCSRDF、IBM(ESS)PPRC和NetApp SyncMirror,HITACHI (HDS)TrueCopy。 操作系统等级灾备技术方案该方法需要增加数据备份软件,专门对操作系统文件系统数据进行监控,使用数据日志方法和异地另外一套系统进行数据备份。该软件对于应用软件来说也是完全透明。 这类方案现在较流行有Veritas企业相关产品:VVM(VERITAS Volume Manager),VVR(Veritas Volume Replicator),VCS(Veritas Cluster Server),GCM(Global Cluster Manager); IBM企业相关产品:HAGEO (High Availability Geographic Cluster )基于SAN网络(存放虚拟化)灾备技术方案基于SAN网络复制技术,又称存放虚拟化技术。在SAN网络上实现存放虚拟化技术能够屏蔽存放本身限制,实现异种存放之间数据镜像,保护现有存放系统投资。 存放虚拟化技术经过定义虚拟卷方法,使得生产中心和灾备中心主机能够共享异种存放设备(而基于存放灾备技术要求生产中心和灾备中心使用完全相同存放系统),而且不增加系统故障点。 以StoreAge SVM 产品为例,虚拟化存放I/O工作原理以下: 1、SVM设备作为一个一般服务器,经过SAN发觉全部存放,服务器等设备。不需要SVM发觉设备,能够使用Zoneing,LUN Masking等方法屏蔽。 2、SVM将选定LUN放入Pool中,即,在LUN上利用一个Sector署名 3、SVM在Pool中定义虚拟卷 4、SVM将虚拟卷地址和真实设备地址形成一个虚实地址对照表 5、全部安装Agent主机每10秒发送一个Polling给SVM,索取最新虚实地址对照表,并将其装入内存中 6、Agent过滤全部主机I/O,假如是使用虚拟地址I/O,Agent将地址翻译成为真实SAN地址,再将I/O转发到操作系统I/O子系统。假如是使用真实地址I/O,Agent简单Bypass这个I/O给操作系统I/O子系统。 在实现虚拟化I/O基础上,可实现虚拟卷复制、镜像等功效。 以上数据备份方法全部能够在各个层面进行实现,但各个方案有不一样优点和缺点,差异关键表现在技术复杂度、实现效果、投资大小、网络带宽要求、维护工作量等方面。 金融行业灾难备份方案(续二)下面对多种灾难备份方案进行比较具体探讨,并比较差异,作为方案选择参考。存放系统硬件级灾备技术方案基于存放设备数据备份方法,就是利用高端智能存放对系统全部数据进行集中存放,和异地另外一台同类型智能存放进行底层数据同时,该同时因为是基于硬件,所以对软件系统完全是透明,无需修改软件和进行人工干预。基于存放设备数据备份方法,有以下多个特点:1. 系统数据统一放置在存放设备上,便于统一完成数据备份传输.假如现有系统数据分散传输,那么需要完成数据集中改造. 2. 使用特定网络传输环境,对网络通讯环境要求高.存放设备为了完成数据传输提供多个接口,高性能传输方法如ESCON,要求特定网络传输设备,而且对网络传输带宽要求比较高。 3. 因为数据备份工作是基于底层硬件,对于软件系统来说完全是透明,也无需人工对数据传输进行干预。 4. 不占用主机设备资源,存放系统使用本身处理机制和传输机制。 基于存放设备数据备份方法存在以下缺点: 1. 必需使用相同存放设备,存放设备之间数据传输要求设备是同类型,对于设备选择上没有多出空间,而且存放设备全部是高级智能存放,所以投资成本很高。 2. 必需要求数据统一放置,为了使用存放设备数据备份,系统数据全部必需放置在同一台存放设备上,便于完成对异地数据备份。 3. 网络建设成本高,因为要求特定网络通讯线路,为了完成其数据传输,还必需租用高带宽网络通讯线路,在网络通讯上投资将是异地数据备份关键成本。 4. 基于存放设备数据备份,只完成IO上数据同时,不能确保业务交易一致性,有可能在生产中心发生灾难情况下,还需要在业务上对数据进行查对,回退没有完成交易。 基于操作系统数据备份在操作系统上安装备份软件,备份软件控制操作系统存放管理:包含卷组、文件系统和裸设备。要求存放管理使用逻辑卷管理软件(LVM).经典基于卷管理备份软件是VERITAS 企业卷组复制软件基于操作系统卷管理数据备份功效有以下特点:1. 对存放设备没有特定要求,软件只要求存放使用卷管理(LVM)即可,所以能够灵活地、充足利用现有硬件资源,而不需要为备份数据进行存放架构改造; 2. 对传输网络没有特定要求,只要求生产中心和备份中心能够完成网络传输就能够,在软件等级上能够忽略在传输方法上差异。能够充足利用现有网络传输环境。 3. 卷管理数据备份方法,对应用软件来说全部是透明,无需进行附加设置。 4. 卷管理能够实现跨平台数据备份方法,对主机设备没有特定要求,只要求使用相同卷管理软件。 使用卷管理备份方法存在以下缺点: 1. 需要在每台主机上安装卷管理软件,而且软件需要对存放系统进行管理。需要附加安装配置和维护工作; 2. 因为是软件实现系统数据传输,需要占用主机CPU资源; 3. 该方法也需要对卷管理备份进行投资,成本相对较高; 4. 因为是基于数据备份方法,也无法确保业务交易一致性,在灾难恢复时仍然需要人工干预。 假如需要达成较高数据同时性能,对网络带宽要求高。 金融行业灾难备份方案(续三)基于SAN网络(存放虚拟化)灾备技术方案SVM镜像(MultiMirror)分为同时和异步两种方法,其中异步工作原理以下: 1,SVM定义一个新空间(PiT)给源数据卷,并通知Agent2,Agent将指向源数据卷写I/O改向到新空间PiT,指向源数据卷读I/O不改变。3,SVM拷贝源数据卷到目标数据卷。目标数据卷能够是同一个SVM Domain里虚拟数据卷,也能够是另外一个Domain里虚拟数据卷。假如是后者,两个Domain之间连接网络是IP。 4,SVM拷贝PiT到目标PiT5,反复实施1,2,4三步 使用存放虚拟化灾难备份方案特点: 1:能够使用异构设备,将现有存放设备最大程度上进行使用,节省对硬件设备投资; 2:在数据备份上,进行透明处理,应用程序不关心底层对数据处理过程。 3:管理简易。经过统一管理界面对现有存放空间进行管理,能够很好地使用空间资源。 缺点关键是不能使用同时数据,也就是不能达成基于硬件存放之间完成数据同时效果推荐备份方案为了达成6级零数据丢失功效,推荐使用基于存放灾难备份方案。购置两台高性能存放进行生产中心和备份中心数据备份功效,附加地要对生产中心存放进行数据集中、迁移工作。 对于主机选择,为确保设备处理性能,使用同型号主机设备。其它是在SAN网络组建需要附加设备和通讯投资。首先,考虑到现在使用存放系统3630年限已久,所以需要新购两套存放系统,以建立SRDF关系。 存放系统A和B端全部需要配置SRDF/S数据远程复制软件,及支持单跳SRDF/AR软件。同时还需要配置数据当地快速复制软件TimeFinder,及存放系统软件ECC。假如用于SAN连接,还需要配置SAN管理器软件投资预算1、运行主机系统 (应用和数据库服务器)2台IBM System p5 570 配置:8颗1.9G Power5+处理器;16G内存 ; 8块146.8G内置硬盘; 4块2Gb光纤卡 ;(带逻辑分区功效) ;(含机柜)2、数据存放 (含灾备实施费用)2台EMC CX-700 配置:2TB CX700(含mirroview)或 2TB DMX800(含SRDF)3、光纤交换机 SAN16B-2 4台 4、PC SERVER 3台5、微机 2台