《最新XX灾备数据中心设计方案.doc》由会员分享,可在线阅读,更多相关《最新XX灾备数据中心设计方案.doc(62页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-dateXX灾备数据中心设计方案XX灾备数据中心设计方案XXX 容灾中心 方案建议书 目录第 1章灾备中心建设意义 . 31.1 概述 . 31.2 容灾建设的相关标准 . 31.2.1 国标家备级别规范表 . . 41.2.2 容灾恢复能力指标 . . 41.2.3 不同级别的容灾能力要求 . . 5第 2章灾备中心建设模式 . 62.1 容灾系统的组成 . 62.2 容灾
2、模式 . 7第 3章灾备中心详细建设方案 . 93.1 灾备中心容灾级别设计 . 93.2 灾备中心网络设计 . 103.2.1 灾备中心拓扑设计 . . 103.2.2 灾备中心网络详细设计 . . 103.2.3 广域网链路带宽设计 . . 123.3 计算、存储、网络、虚拟化融合合设计 . 123.4 灾备中心数据备份设计 . 14第 4章技术方案亮点 . 154.1 数据中心融合安全 . 154.2 计算、存储、网络、虚拟化融合 . 17第1章灾备中心建设意义1.1概述随着 XXX 业务的发展,XXX 厂建设了自己的数据中心,数据大集中提升了核心竞 争力与工作效率的同时,也带来了数据在
3、突发情况下丢失的风险,如何应对和有效化解 数据集中带来的风险?如何保证数据在各种灾难情况下的安全和业务的连续性, 容灾备 份系统的建设成为一项非常重要的工作。灾备中心是信息化建设的重要组成部分, 是信息化时代防范灾难、 降低损失的重要 手段。 而灾备中心的选址也非常关键, 失误将导致灾备中心本身面临灾难, 最终导致灾 难备份措施的失效。异地灾备中心是在异地的城市建立一个备份的灾备中心,用于主中心的数据备份, 当主中心出现自然灾害等原因而发生故障时, 异地灾备中心可以用备份数据进行业务的 恢复。1.2容灾建设的相关标准国际标准 SHARE78定义了灾难恢复的多个级别,灾难恢复解决方案可根据多个方
4、 面制定,包括备份/恢复的范围、灾难恢复计划的状态、在应用中心与备份中心之间的 距离、 应用中心与备份中心之间是如何相互连接的、 数据是怎样在两个中心之间传送的、 有多少数据被丢失、怎样保证更新的数据在备份中心被更新、备份中心可以开始备份工 作的能力。参考国际上相关组织在灾难恢复上的研究与实践,我国的国家标准GB20988-2007-T 信息安全技术 信息系统灾难恢复规范 对容灾备份进行了标准化。 表 1为 SHARE78与国标在各层次上的大致对应关系。1.2.1国标家备级别规范表SHARE78信息系统灾难恢复规范 GB/T 20988-2007Tier-0无异地备份数据 第 1级 基本级。备
5、份介质场外存,安全保 管、定期验证Tier-1有数据备份,无备用系统 用卡车运送备份数据Tier-2有数据备份,有备用系统 用卡车运送备份数据。 第2级备份场地支持。网络和业务处理系 统可在预定时间内调配到备份中心Tier-3电子链接, 消除运送工具的需 要,提高了灾难恢复速度 第3级电子传输和部分设备支持。灾备中 心配备部分业务处理和网络设备, 具备部分通讯链路。Tier-4灾难恢复具有两个中心彼此 备份数据, 允许备份行动在任 何一个方向发生。 两个中心之 间, 彼此的关键数据的拷贝不 停地相互传送着。 在灾难发生 时, 需要的关键数据通过网络 可迅速恢复,通过网络的切 换, 关键应用的恢
6、复也可降低 到小时级或分钟级。 第4级电子传输和完整设备支持。数据定 时批量传送,网络 /系统始终就绪。 温备中心模式。Tier-5保证交易的完整性为关键应用使用了双重在线 存储,在灾难发生时,仅传送 中的数据被丢失, 恢复时间被 降低到分钟级。 第5级实时数据传输及完整设备支持。采 用远程复制技术,实现数据实时复 制,网络具备自动或集中切换能力, 业务处理系统就绪或运行中。Tier-6/ 7 无数据丢失, 同时保证数据立即自动地被传输到恢复中心。Tier6被认为是灾难恢复的最高的级别, 在本地和远程的所有数据被更新的同时, 利用了双重在线存储和完全的网络切换能力。 第 7层实现能够提供一定程
7、度的跨站点动态负载平衡和自动系统故障切换功能。第6级数据零丢失和远程集群支持。数据 实时备份,零丢失,系统 /应用远程 集群,可自动切换,用户同时接入 主备中心表 1 SHARE78与国标的对应1.2.2容灾恢复能力指标在设计容灾系统时,容灾要达到什么样的目标与层次,需要用一些定量的指标来衡 量,这就是灾难恢复能力指标,如图 1所示。RTO(Recovery Time Object:恢复时间目标,指信息系统从灾难状态恢复到可运行状态所需要的时间,用来衡量容灾系统的业务恢复能力。RPO(Recovery Point Time:恢复点目标,指业务系统所允许的在灾难过程中的最 大数据量丢失,用来衡量
8、容灾系统的数据冗余备份能力。NRO(Network Recovery Object:网络恢复时间目标,指在灾难发生后网络恢复 或切换到灾备中心的时间。通常,网络要先于应用恢复才有意义,但应用恢复后才能提 供业务访问。 图 1容灾恢复能力指标1.2.3 不同级别的容灾能力要求在容灾设计和灾难恢复规划中,主要采用恢复能力指标(RPO和 RTO定量的分 析灾难恢复目标,由此形成了灾难恢复的不同等级,如表 2所示阶段RTO RPO 初期建设目标 1级天以上1天至 7天 2级 小时以上1天至 7天 3级 小时以上 1天 中期 4级 2天 1天 最终目标5级 2天 至 30分钟 6级表 2 不同等级的容灾
9、能力要求XXX 灾备中心方案建议书 第2章 灾备中心建设模式 2.1 容灾系统的组成 一个典型的容灾系统由灾备中心基础环境设施、数据备份系统、备份处理系统和网 络通信系统、灾难恢复计划等组成,如图 2 所示。 图 2 容灾系统组成 基础设施环境:要求能够保障数据备份系统和备份处理系统的工作,可提供完备的 网络通讯设施,全面的供配电系统、综合布线、精密空调系统、消防及自动气体灭火系 统、中心闭路监控、漏水检测等。 数据备份系统:是灾难备份系统的最基本要素。如何将数据(包含系统、应用和业 务数据)完整、实时地复制到容灾中心,是烟业复烤在系统建设需要重点考虑的事项。 备份处理系统:是指在灾难恢复时需
10、配备的主机系统、存储系统、应用软件等。容 灾中心的网络通讯系统要求能够提供正常业务运行的数据备份通道和灾难发生时系统 切换后的业务数据流转,保证关键备份业务峰值性能要求;备份处理系统所需要达到的 处理能力和范围应基于恢复目标及成本效益等因素综合考虑。 6 XXX 灾备中心方案建议书 灾难恢复计划:为保证灾备系统在故障发生时可按预期及时替代生产系统而制定的 管理制度、规范和流程,如:安全管理、运维管理、恢复管理、变更管理、灾难恢复演 练流程等。灾难恢复计划需定期维护、测试和演练及审核,以保持其持续可用性。 根据容灾效果,容灾系统分为数据级容灾和应用级容灾。 数据级容灾:异地容灾系统数据是本地关键
11、应用数据的一个副本,当本地系统发生 灾难时,系统至少在异地保存有一份可用的关键业务的数据。该数据可以是本地生产数 据的完全复制(一般在同城实现,也可以比本地数据略微落后,但必定是可用的(一般在 异地实现,而差异的数据通常可以通过一些工具(如操作记录、日志等可以手工补回。 应用级容灾:是在数据级容灾基础上,在同城或异地建立一套与本地生产系统相当 的备份环境,包括主机、网络、应用、IP 等资源均有配套,当本地系统发生灾难时,异 地系统可以提供完全可用的生产环境。 目前的实际应用:按目前建设情况来看,异地一般只能建设数据级的容灾,主要是 局限于网络链路及网络带宽的限制,在异地灾备中,存储数据一般需要
12、裸纤连接才能进 行同步备份,但在异地灾备中心中,一般不具备裸纤连接的条件,数据只能进行异步备 份,暂未达到应用级的容灾。 2.2 容灾模式 在灾备中心,IT 系统主要包括网络、计算、存储几个方面,分别对应着容灾系统的 网络通信系统、备份处理系统、数据备份系统。灾备中心作为业务中心的备份,基于是 否需要备用处理系统(服务器)以及专业人员支持,可以分为不同的灾备中心模式。 冷备模式(ColdStandby) :备份系统未安装或未配置成与主用系统相同或相似的 运行环境,应用系统数据没有及时装入备份系统。 缺点:恢复时间长,一般要数天或者更长时间,数据的完整性与一致性差。 7 XXX 灾备中心方案建议
13、书 灾备等级:3 级,适合于烟叶复烤数据大集中初期的要求。 暖备模式(Warm Standby) :具备备份系统安装场地、备份主机、存储设备和通 信设备,备份系统已经安装配置成与主用系统相同或相似的系统和网络运行环境,安装 了应用系统业务定期备份数据。一旦发生灾难,直接使用定期备份数据,手工逐笔或自 动批量追补孤立数据,恢复业务运行。 缺点:恢复时间较长,一般要十几小时至数天,数据完整性与一致性较差。 灾备等级:45 级 目前烟草行业的主流建设标准。 热备模式(hot Standby) :备份系统处于联机状态,主用系统通过高速通信线路 将数据实时传送到备份系统,保持备份系统与生产系统数据的同步
14、。也可定时在备份系 统上恢复主用系统的数据。一旦发生灾难,不用追补或只需追补很少的孤立数据,备份 系统可快速接替主用系统运行,恢复生产。 优点:恢复时间短,一般几十分钟到数小时,数据完整性与一致性最好,数据丢失可能 性最小。 灾备等级:56 级 目前烟草行业容灾建设方向。 8 XXX 灾备中心方案建议书 第3章 灾备中心详细建设方案 XXX 厂目前的数据中心建设在贵阳八公里,考虑在贵州都匀建设一个异地灾备中 心,本次异地灾备中心建设建议为异地暖备模式,可以最大程度的保护数据和业务连续 性,应对重大区域性灾难。 3.1灾备中心容灾级别设计 根据目前业务系统及使用需求考虑,目前都匀灾备中心考虑为国
15、标第 4 级灾备级 别,做到数据中心灾备的暖备模式。 第4级 电子传输和完整设备支持。数据定时批量传送,网络/系统始终就绪。温备中 心模式。 暖备技术是在主备数据中心的基础上实现的,前提是拥有两个一主一备的数据中 心。备用数据中心为暖备部署,应用业务由主用数据中心响应,当主用数据中心出现故 障造成该业务不可用时,需要在规定的 RTO(Recover Time Objective,即灾难发生 后,信息系统从停顿到恢复正常的时间要求)时间以内,实现数据中心的整体切换。在 具体实现上,主备数据中心的两套业务系统网络配置完全一样,备用数据中心路由平时 不对外发布。当实现主备数据中心切换时,需要断开主用
16、数据中心路由链路,并连接备 用数据中心路由链路,保证同一时间只有一个数据中心在线。暖备技术还是手工方式, 从知道主用数据中心故障到备用数据中心工作需要有人值守才能完成。 9 XXX 灾备中心方案建议书 3.2灾备中心网络设计 3.2.1 灾备中心拓扑设计 3.2.2 灾备中心网络详细设计 为满足 XXX 数据中心灾备建设的要求,在贵州都匀建设异地容灾备份中心,实现 异的数据灾备。 灾备数据中心网络采用二层架构,分为:核心层、接入层,具体建设规划如下: 3.2.2.1 核心层设计 核心层是灾备数据中心网络的核心,需满足数据中心内部大流量的业务数据交互, 对设备的选择要求较高,不仅要求能提供大容量
17、、无阻塞的数据交换,还需具备持续扩 展的能力,支持高密度的万兆接口、分布式缓存机制、精细化 QoS 等。交换架构是网 10 络设备的核心,就像人的心脏一样重要,决定了一台设备的容量、性能、扩展性以及 QoS 等诸多关键属性。考虑网络的高扩展性及高性能,需采用 CLOS 多级交换架构的 核心交换机作为数据中心核心交换机。在设备的选择上,我们建议每个数据中心各使用两台高性能的数据中心核心交换 机,采用虚拟化技术进行均衡热备作为数据中心核心,每台配置单引擎、冗余电源、多 块块交换网板, 保证设备级的可靠性。 根据目前业务的需要及考虑后期业务的扩展, 数 据中心核心交换机需提供 8个以上业务扩展插槽,
18、 本次两个数据中心根椐实际业务需要 配置相应万兆、 千兆接口板, 配置防火墙及 IPS 入侵防御业务板, 满足现有业务需求及 安全防护的要求, 并为后期业务扩展预留扩展空间。 数据中心接入交换机采用万兆多模 光纤与两台核心交换机进行双归属连接,提高网络主干速率及链路的可靠性。 为保证数据中心业务的安全性,在核心交换机上部署防火墙与入侵防御业务板卡, 扩展核心交换机的安全防护能力, 通过虚拟防火墙技术, 实现数据中心与园区网间、 不 同业务分区间的安全隔离和可控互访。部署两台出口路由器,用于与主中心数据中心进行连接,路由器采用分布式架构, 考虑后期的业务扩展,预留一定的业务槽位。2台核心路由器进
19、行备份,通过两条不同 运营商的出口链路连接到广域网。3.2.2.2 接入层设计接入层主要用于接入服务器, 存储设备, 计算与存储的融合是目前数据中心建设的 必然趋势, 通过融合接入交换机接入计算与存储设备, 减少了服务器与前端网络交换机 和后端存储交换机连接的复杂性,布线简单,维护更方便。为保证服务器接入的高性能和高可靠性, 建议部署一台 48端口全千兆/4万兆接口 接入交换机, 采用万兆光纤与两台核心交换机进行双归属互联。 部署一台融合接入交换 机 48个 Uport 融合端口,设备端口可在 FC/FCOE/Ethernet三种形态之间灵活切换, 采用万兆光纤与两台核心交换机进行双归属互联。
20、3.2.3广域网链路带宽设计在本次异地灾备中心建设中, 需要部署两条广域网链路, 一条数据备份专线线, 具 体如下:广域网链路 2条:用于两个数据中心之间广域网互连接, 链路带宽与业务量的大小 强相关,根椐目前业务量的大小,建议广域网出口带宽为:150M。专线:用于两个数据中心后端存储之间的数据异步备份, 具体需要带宽及链路类型 由存储与备份厂商确定。3.3计算、存储、网络、虚拟化融合合设计在数据大集中的趋势下,数据灾备中心的规模越来越大。随着服务器、存储、网络 规模的成倍增加, 硬件成本也水涨船高, 同时管理众多的基础设施的维护成本也随着增 加。传统 IT 基础设施建设往往采用机架式设备,一
21、整套设施至少需要占用 1个机柜的 空间, 各设备之间通过繁杂的线缆连接, 维护较为困难。 同时传统情况下服务器的利用 率长期保持在 20%以下,各设备间分开供电与散热,带来了大量的空间、电力、能耗 等方面的浪费。融合基础架构设备通过在一个刀箱中集成了服务器、存储、网络、虚拟 化软件等设备,大大提高了服务器的利用率,减少了空间、电力、能耗等方面的消费。 经测试统计得出, 采用融合基础架构设备, 可以提升至少 3倍的服务器利用率, 降低至 少 75%的空间占用,减少至少 27%的电力消耗,降低初始购买和后期运维成本。为了降低数据中心的硬件成本和管理难度,对大量的 IT 硬件基础资源进行整合成了必然
22、的 趋势。IT 硬件基础资源的整合和虚拟化正在不断发展,这需要高度可扩展的永续安全数 据中心网络基础。 网络不但能让用户安全访问各种数据中心服务, 还能根据需要实现共 享数据中心组件的部署、互联和汇聚,包括各种应用、服务器、设备和存储。适当规划 的数据中心网络不仅能保护应用和数据完整性, 提高应用可用性和性能, 还能增强对不 断变化的市场状况、业务重要程度和技术先进性的反应能力。融合基础设施能够改善数据中心环境, 令企业可以专注于创新, 使科技成为改变业 务的关键所在。 共享服务池可在运行中随时调用, 提高业务环境的灵活性, 加速实现应 用程序的价值。 融合基础设施充分利用现有的技术投资, 消
23、除数据中心的技术设备冗积 问题, 化繁为简。 通过统一的管理, 所有资产都成为资源池的一部分, 能够分割、 组合、 变化,动态适应任何业务、负载或应用的需求。这些资源的使用也经过优化,帮助企业提高利用率,降低使用能耗和成本。 在本方案中建议配置 2套 统一基础架构,通过将计算、网络、存储访问和虚拟化 统一到一个综合系统中, 进行集中管理, 并且可配套使用虚拟化平台、 云管理系统等软 件进行协调, 解决了上面提到的问题。 根据目前的业务需求, 配置一定数量的机架服务器,满足业务应用的需求。考虑到虚拟化的应用,考虑一定数量的服务器虚拟化,承载 非结构化数据的业务应用。3.4灾备中心数据备份设计数据
24、复制是容灾中的关键技术,一般分为同步复制和异步复制。同步复制可以保证两地数据的完全一致性, 但同步容灾过程中本地系统必须等到数 据成功写入异地系统,才能进行下一个 I/O操作,同步容灾数据复制一般只在较短距离 或同城范围部署(10km80km。超过 80公里以上一般采用异步复制方式进行容灾, 异步复制中,本地 I/O操作完 成后直接返回,而不需等待异地 I/O的返回,甚至,异步复制并非针对每个 I/O进行复 制,而是根据数据的增量或时间等方式进行复制。此方案中数据备份设计主要由备份软件厂商设计。第4章技术方案亮点4.1数据中心融合安全在传统的网络安全部署时, 往往是网络与安全各自为战, 在网络
25、边界或关键节点串 接安全设备(如 FW、IPS、LB 等。随着网络部署的安全设备的种类和数量也越来越多, 这将导致网络中心机房布线、空间、能耗、运维管理等成本越来越高。建议采用安全插卡方式可以很好的解决上述问题,安全插卡(FW、IPS、LB、SSL VPN 等可直接插在核心交换机的业务槽位,通过交换机背板互连实现流量转发,共 用交换机电源、 风扇等基础部件。 达到简化机房布线、 节省机架空间、 简化管理的目的。 安全融合网络解决方案示意图如下:XXX 灾备中心方案建议书 灾备中心拓扑设图: 依据 XXX 厂灾备中心的组网架构,结合整体业务流量的分布,建议在数据中心核 心上部署防火墙业务插卡及入
26、侵防御业务插卡,以实现骨干网络 27 层的深度安全防 御。 融合部署优点 智能引流:安全插卡支持baypass引流技术,针对网络中的数据、语音、监控、 视频等不同报文流量可进行区分引流,从而减少数据量过大对安全设备、核心 交换设备的负荷。如本次组网中,可针对监控视频流量进行引流,不对其进行 安全报文检测,以实现高速监控视频数据的交换。 互连带宽高:安全插卡采用背板总线与交换机进行互连,背板总线带宽一般可 超过40Gbps,相比传统的独立安全设备采用普通千兆以太网接口进行互连, 在互连带宽上有了很大的提升,而且无需增加布线、光纤和光模块成本。 16 XXX 灾备中心方案建议书 减少单点故障:安全
27、插卡采用背板与交换机互连,所以互连线路可靠性高,不 会存在互连线路故障点。此外,交换机的背板具备健康检测机制,在透明模式 部署的安全插卡(如IPS、ACG)上可根据业务要求配置“二层回退”功能,当 检测到SecBlade插卡出现故障时, 交换机可直接对原来经过SecBlade安全插卡 的流量进行旁路,使业务流不中断,避免设备级的单点故障。 业务接口灵活:安全插卡上不对外提供业务接口(仅提供配置管理接口) ,当交 换机上插有安全插卡时,交换机上原有的所有业务接口均可配置为安全业务接 口。此时再也无需担心安全业务接口不够而带来网络安全部署的局限性。 性能平滑扩展:当一台交换机上的一块安全插卡的性能
28、不够时,可以再插入一 块或多块插卡实现性能的平滑叠加。而且所有插卡均支持热插拔,在进行扩展 时无需停机中断现有的业务。 4.2计算、存储、网络、虚拟化融合 (1)全虚拟化、统一管理 统一基础架构系统不仅融合了服务器、存储和网络等硬件设备,同时采用虚拟化技 术实现了全套硬件设备的虚拟化。 全虚拟化的实现保证了统一基础架构系统设备的高可 靠,任何一台设备宕机都不会影响业务的正常运行和数据丢失。并且通过在一个管理平 台上实现了对服务器、存储、网络、虚拟机、虚拟网络设备等进行统一管理,极大地简 化了管理工作,使用户的管理效率提高至少 3 倍。 (2)高度集成、化繁为简 传统 IT 基础设施建设往往采用
29、机架式设备,一整套设施至少需要占用 1 个机柜的 空间,各设备之间通过繁杂的线缆连接,维护较为困难。同时传统情况下服务器的利用 率长期保持在 20%以下,各设备间分开供电与散热,带来了大量的空间、电力、能耗 17 XXX 灾备中心方案建议书 等方面的浪费。 统一基础架构系统通过在一个不高的刀箱中集成了服务器、 存储、 网络、 虚拟化软件等设备,大大提高了服务器的利用率,减少了空间、电力、能耗等方面的消 费。经测试统计得出,采用统一基础架构系统,可以提升至少 3 倍的服务器利用率,降 低至少 50%的空间占用,减少至少 40%的电力消耗。 (3)深度融合 统一基础架构系统融合了虚拟化平台,所有设备的管理统一集中在云管理中心上, 实现了设备管理的融合。 (4)一站式运维 实现了服务器、存储、网络、虚拟化软件和云管理软件的整体交付,选择了统后, 就不必考虑云计算 IT 基础设施的兼容性和性能匹配等问题, 使用户从繁琐的设备选型、 采购等环节中解放出来,从而把更多的精力投入自身业务的规划当中。统一基础架构系 统内基础设施组件进行统一的售后保障,用户不必担心传统数据中心多厂商协调难度 大、响应速度慢等问题,极大的提高了用户数据中心问题定位和处理的效率。 18 -
限制150内