XX阅读三期建设及机房搬迁方案汇报0421b.ppt
《XX阅读三期建设及机房搬迁方案汇报0421b.ppt》由会员分享,可在线阅读,更多相关《XX阅读三期建设及机房搬迁方案汇报0421b.ppt(58页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1China Mobile Communications Co.,Ltd.Mobile Reading Base 华为2010年4月构建掌上数字阅读世界 打造全新 阅读产业 阅读基地三期建设及机房搬迁方案12China Mobile Communications Co.,Ltd.Mobile Reading Base 目录三期扩容和搬迁总体方案 123China Mobile Communications Co.,Ltd.Mobile Reading Base 按照本次工程建设要求,在三墩机房14楼,建设一套1500万用户规模环境,提前完成业务安装及对外接口调测,准备搬迁后承担业务。三墩机房3
2、4楼的生产环境在目前800万基础上扩容到1500万对外提供业务服务至8月底,到期后割接到三墩1#4楼。割接完成后34楼设备搬迁至14楼,14楼 阅读机房支撑3000万用户规模,满足2010年底业务发展需求。小型机到货时间较晚,本次方案暂时全部考虑ATAE方案,预计9月小型机到货后替换14楼数据库。总体说明34China Mobile Communications Co.,Ltd.Mobile Reading Base 搬迁服务总流程图45China Mobile Communications Co.,Ltd.Mobile Reading Base 搬迁总体计划为最大程度保证 阅读业务延续性,搬
3、迁分三个部分进行:一、适当扩容现网平台:考虑搬迁期间业务的增长,34楼的生产环境在目前800万基础上,将部分在线业务模块扩容到1500万;二、新建过渡平台,割接业务:在14楼新机房,建设一套1500万用户规模的平台(数据库全为ATAE板),将在线所有业务割接;三、整合所有设备,数据库替换为小型机 1、割接完成后,34楼设备搬迁至14楼,所有硬件整合,新平台总体业务支撑能力不小于3000万用户规模,满足2010年底业务发展需求。2、在小型机到货后,将数据库替换为小型机。序号 割接 所需时间1适当扩容现网平台至少30个工作日(预计7月上旬完成)2 新建过渡平台,割接业务 至少110个工作日(预计8
4、月底完成)3 重新安装调测业务,接入手机阅读平台 至少50个工作日(预计10月完成)在按时到货的前提下,预计6月开工,时间安排如下:56China Mobile Communications Co.,Ltd.Mobile Reading Base 新平台实施计划序号 工程实施内容 达到目标 工期 需移动配合1 备货、到货三期扩容和搬迁新增设备到新机房30日 机房环境具备2 硬件安装和上电完成硬件安装、通过硬件质量检查、设备上电10日 机房环境具备3 操作系统和数据库安装 10日 4 业务调测 20日 5 和外部接口联调 20日 需移动配合联调6 业务测试 10日需移动基地人员进行业务测试7 业
5、务割接 10日 8 原平台设备割接并入新平台 60日 67China Mobile Communications Co.,Ltd.Mobile Reading Base 原平台设备搬迁计划序号 工程实施内容 工期 需移动配合1 业务观察期 15日 2 原平台设备拆卸 5日 需移动先将设备下电3 原平台设备硬件安装 5日需移动先将设备打包并运输到新机房4 原平台设备软件安装和系统调试 25日 5 质量检查 5日 6 原平台设备割接 10日 78China Mobile Communications Co.,Ltd.Mobile Reading Base 新建机房环境准备要求对新机房(14楼机房)
6、要求:电源:交流、直流电源柜;机架:考虑 阅读三期扩容和备份,以及冗余要求,阅读至少需要服务器机架60个、网络设备机架2个、传输配线机架2个室内走线架:上走线网络条件:CMNET:5对千兆光纤(或者直接连接骨干网)DCN:2对千兆光纤,需要和支撑DCN、网管DCN打通 电信:需要电信2对千兆光纤公网IP地址128个,其中24个白名单用户重点要求:割接业务的同时,为保证业务延续可用性,必须将原有分配给3#4楼在线设备的所有公网IP也一并割接到新平台上。89China Mobile Communications Co.,Ltd.Mobile Reading Base 新建系统周边网络和环境准备要求
7、 新建系统需要重新联调与平台接口网元,在网络环境要提前打通,要提前知会各个部门进行配合联调:省BOSS省GGSN集团BOSS集团VGOP短信网关彩信网关一级终端系统MM平台910China Mobile Communications Co.,Ltd.Mobile Reading Base 目录适当扩容现有平台的硬件计算 11011China Mobile Communications Co.,Ltd.Mobile Reading Base 现有平台扩容考虑要素扩容硬件配置需考虑要素:满足2010年8月底要支撑1500万月访问用户的规模需求。增加客户端BS架构、行业网关等新业务模块。根据业务发展
8、需要改造现网关键模块,增加FTP服务器。1112China Mobile Communications Co.,Ltd.Mobile Reading Base 项目 数值注册用户数(万)2000月访问用户数(万)1500日访问用户数(万)225WAP门户峰值每秒PV请求次数(次)8750峰值WEB门户每秒PV数(次)750手机客户端峰值每秒PV请求数(次)750G3阅读器行业应用峰值每秒PV请求数(次)375G3阅读器在线书城峰值每秒PV请求数(次)375无线网络带宽(Kbps)64话单在线保存时长(天)365日志原始文本文件保存时长(天)155 报表数据保存时长(天)155 杂志 50000
9、书籍数量 300000动漫数量 500001500万月访问用户系统配置需求1213China Mobile Communications Co.,Ltd.Mobile Reading Base 服务器名称现网当前部署R2 调配R2三期扩容新增R2+三期规划新增R2+及调配R2说明WEB 门户服务器 1 2 WAP 门户服务器 12 4 手机客户端/手持终端门户服务器与下载服务器 4 0 短信门户服务器 2 0 动漫服务器 9 09块业务版支撑到年底,不按用户规模计算。门户引擎服务器 6 4 radius 服务器 0 0 网管服务器 1 0 计费服务器(BOSS话单)2 0 计费服务器(VGOP
10、实时订购)1 0 结算服务器 3 0 业务管理服务器(固定配置)2 0 DRM 服务器 3 0 营销服务器(营销群发)1 0 无高可靠性要求,使用单机营销服务器(单发)1 0 暂时使用单机,搬迁后再组双机报表预统计服务器 1 1新增一台服务器报表查询服务器 1 0 智能分析服务器 2 1 新增一台服务器业务数据库服务器 0 12 已经借货7块R2+报表数据库服务器 5 3 MCP自服务系统服务器 1 0 现有平台扩容设备汇总(一)1314China Mobile Communications Co.,Ltd.Mobile Reading Base 服务器名称 现网当前部署 调配R2三期扩容新增
11、R2+三期规划新增R2+及调配R2说明日志文件服务器 1 0 0 客服服务器 1 0 行业接口机 2-2 2 使用新到R2+承载业务,已有R2替换下来给测试服务器使用行业管理门户 1-1 1 使用新到R2+承载业务,已有R2替换下来给测试服务器使用行业数据库服务器 2-2 2 使用新到R2+承载业务,已有R2替换下来给测试服务器使用行业报表数据库服务器 0 0 行业代理网关 0 5 OCF加密服务器 0 1 目前现网CP数量比较少,系统没有实时性要求,配置一套OCF加密服务器双机,暂时使用单机,搬迁后再组双机部署应用服务器及数据库。互动业务 0 7 手机客户端端B/S架构 0 5 测试服务器
12、12+5 0 将行业相关替换下来的5台R2服务器作为新业务测试服务器服务器总计 77 0 50 交换机 S5624P-使用现网设备不变防火墙 Edumon 1000E-使用现网设备不变负载均衡 F5 6900-使用现网设备不变存储1(S3200)5(S2300E)214(SAS 300G)56(FC 300G)3(S2300E)148(SAS 300G)现有平台扩容设备汇总(二)共计:新增50块R2+板(已经借货7块),148块 SAS 300G硬件;1415China Mobile Communications Co.,Ltd.Mobile Reading Base 目录过渡平台的硬件计算
13、11516China Mobile Communications Co.,Ltd.Mobile Reading Base 过渡平台配置考虑要素过渡平台硬件配置需考虑要素:满足支撑1500万月访问用户的规模需求,业务模块数及各模块服务器承载能力都要与现网机房相同,保障能够顺利承接现网业务。减少后期现网机房搬迁后的整合工作量,避免频繁迁移关键数据,FTP,业务管理等关键模块需要提前做好双机。数据库与内容库需要考虑冗余保护。1617China Mobile Communications Co.,Ltd.Mobile Reading Base P590 P570FC-SW FC-SW S3200 磁盘
14、阵列硬件P570 高端小型机*3 Huawei S3200 Disk Array软件或6Oracel 11g RAC 集群(ASM)三期扩容后业务数据库系统组网P570Oracle RAC 集群1718China Mobile Communications Co.,Ltd.Mobile Reading Base 数据库可能遇到的风险分析 硬件层面 单台P570小机完全崩溃-不影响业务,数据库服务由其他两台服务器接管.两台P570小机同时崩溃-极小出现几率,中等影响业务,数据库服务由最后1台服 务器接管,但此时P570的处理负载偏高.三台P570小机同时崩溃-此时已经发生整个机房整体的灾难,需要
15、进行灾难切换.单台光纤交换机损坏-不影响业务,服务器、存储将自动调整I/O路径到可用路径.两台光纤交换机同时损坏-极小出现几率,数据不可用.业务中断.存储单电源故障-不影响业务,单电源能够支撑整个存储的电力供应.存储单控制器损坏-小影响业务,数据处理由单个控制器完成,能力下降.存储整体损坏-影响业务,数据全部不可用,业务中断.软件层面 AIX操作系统-IBM AIX经过十几年运营商的7*24小时运行考验,非常稳定,几乎很难出现系统级崩溃的事件.ORACLE数据库-通过3台P570组成的oracle RAC集群,RAC已经是ORACLE最高的业务连续性保护机制,单服务器/实例的故障,对数据库服务
16、没有影响.总结,对于双交换同时损坏和存储整体损坏的情形,需制订数据保护策略,实现业务的连续运行.1819China Mobile Communications Co.,Ltd.Mobile Reading Base 风险情形 出现几率 解决思路 投资情况双光纤交换机同时损坏 极小(小于10万分之一)1、每台P570增加2块HBA卡(总6块)2、额外增加1台光纤交换机 2个方案投资额均小于10万元,但对于十万分之一的几率来说,是不必要的,对于双交换机同时损坏的情况建议是不做考虑单台存储损坏 小几率出现增加1台存储,并通过主机层的LVM逻辑卷镜像功能,实现oarcle数据库的数据完全一致的分布在两
17、个存储上,即使有1个存储完全损坏,另外一台存储可以零时间接管业务,保证业务的连续性.增加一台存储,与现网数据库存储三期扩容后容量相同,数据写2份,一份到主存储,一份到备存储.数据库保护策略通过增加一台存储,形成前端服务器、SAN网络、后端存储 前中后三端全冗余;通过LVM的逻辑卷镜像和ORACLE RAC集群技术,从软件层面保证数据库的可靠性,降低数据库崩溃的几率.1920China Mobile Communications Co.,Ltd.Mobile Reading Base P590 P570FC-SW FC-SW S3200 磁盘阵列硬件P570 高端小型机*3 Huawei S32
18、00 Disk Array软件或6Oracel 11g RAC 集群(ASM)LVM逻辑卷镜像组网图P570Oracle RAC 集群 S5600 磁盘阵列数据保护通过AIX 系统自带的LVM(逻辑卷管理)的镜像功能,将一份数据分裂为两份,分别写到两个存储上,即使一个存储损坏,也完全不影响业务.2021China Mobile Communications Co.,Ltd.Mobile Reading Base FTP 服务器FC-SW FC-SW 集群NAS 引擎硬件FTP服务器ATAE R2 单板*2N8000集群NAS系统引擎(4节点)后端存储(S5600)软件CFS并行集群系统包括Sy
19、mantec SFW三期扩容后内容库系统组网FTP 服务器 N8000 后端S5600 存储N8000 NAS 系统2122China Mobile Communications Co.,Ltd.Mobile Reading Base 内容库可能遇到的风险分析 硬件层面 1-2个集群节点崩溃-不影响业务,数据库服务由其他两台服务器接管.3个集群节点同时崩溃-极小出现几率,中等影响业务,数据库服务由最后1个节点接管,但此时处理负载偏高.4个集群节点小机同时崩溃-此时已经发生整个机房整体的灾难,需要进行灾难切换.单台光纤交换机损坏-不影响业务,服务器、存储将自动调整I/O路径到可用路径.两台光纤交
20、换机同时损坏-极小出现几率,数据不可用.业务中断.后端存储单电源故障-不影响业务,单电源能够支撑整个存储的电力供应.后端存储单控制器损坏-小影响业务,数据处理由单个控制器完成,能力下降.后端存储整体损坏-影响业务,数据全部不可用,业务中断.文件系统层面 文件系统整体损坏-此时内容库完全不可用,业务中断.文件系统需要修复-文件系统有时存在信息不一致,需要进行fsck,根据中央音乐平台经验,10TB的文件系统 需要8小时左右.此时业务不可用.总结,对于内容库的风险保护,重点是文件系统层面及后端存储整体损坏发生时的应对措施.2223China Mobile Communications Co.,Lt
21、d.Mobile Reading Base 风险情形 出现几率 解决思路 投资情况单台存储损坏、(等同于文件系统损坏)小几率出现增加1台存储,并通过主机层的LVM逻辑卷镜像功能,实现oarcle数据库的数据完全一致的分布在两个存储上,即使有1个存储完全损坏,另外一台存储可以零时间接管业务,保证业务的连续性.增加一台存储,与现网数据库存储三期扩容后容量相同数据写2份,一份到主存储,一份到备存储.文件系统做fsck 小几率出现 在通过CFS的卷镜像功能分别写到两台存储时,通过使用快照技术,形成数据保护,将数据回滚到某一时间点(建议以1天为单位),通过快照卷来拉起业务,正常的逻辑卷在后台进行fsck
22、,首先保证业务的及时恢复.1、考虑到内容库未来可达到7TB的大小,卷大小不得小于8.75TB(卷空间使用率在超过80%时,性能会明显下降).2、快照卷需要考虑额外的空间,根据我们的经验,对于数据更新频繁的内容库,按照30%的比例,至少需要2TB的快照卷空间.内容库保护策略通过增加一台存储,形成前端服务器、SAN网络、后端存储 前中后三端全冗余;通过CFS(N8000内置Symantec卷管理软件)的卷镜像,保证一台存储整体损坏或文件系统全部损坏时,能快速恢复系统.通过快照功能,保证文件系统需要在fsck需要花费比较长时间时,也能提供额外的保护,保证业务运行.2324China Mobile C
23、ommunications Co.,Ltd.Mobile Reading Base 总结核心数据内容 保护机制 磁盘空间量 投资情况 数据库数据库完全镜像到另外一台存储或其他在线存储的磁盘空间1、按照磁盘空间利用率50%,3000万访问量时磁盘 空间(5TB),2、考虑到数据库是做RAID 10,则需要10TB,3、300GB磁盘使用空间为280GB,至少需要38块盘.增加一台存储或从其他存储中增加磁盘空间,处理性能不低于扩容后的S5600,否则数据在镜像写时容易出现性能瓶颈)50%的磁盘使用率 38块 300GB FC磁盘 70%的磁盘使用率 28块 300GB FC磁盘 内容库内容库完全镜
24、像到另外一台存储或其他在线存储的磁盘空间内容库做卷快照,快照同时也镜像到两台存储 1、镜像存储不低于3000万访问 量时磁盘空间(7TB)2、镜像存储做快照保护需要7*0.3=2.1TB 3、三期扩容在N8000后端存储需 增加2.1T的卷快照空间 4、总计增加11.2TB空间 5、考虑到内容库是RAID5,300GB 磁盘使用空间为280GB,按300GB FC磁盘计算,至少需要增加42块盘 增加一台存储,或从其他存储中增加磁盘空间,存储处理性能不低N8000后端的S5600,否则数据在镜像写容易出现性能瓶颈50%的磁盘使用率 84块 300GB FC磁盘 70%的磁盘使用率 60块 300
25、GB FC磁盘 做为业务数据保护的数据空间,备用存储在保证性能不受影响的情况下,可以通过提高磁盘的利用率来减少投资,以磁盘空间利用率70%为宜2425China Mobile Communications Co.,Ltd.Mobile Reading Base 14楼机房过渡平台新建设备汇总(一)服务器名称三期扩容新增R2+说明WEB门户服务器 4 WAP门户服务器 9 手机客户端/手持终端门户服务器与下载服务器 3 短信门户服务器 1 动漫服务器 5门户引擎服务器 6 radius服务器 0 网管服务器 1 计费服务器(BOSS话单)1 计费服务器(VGOP实时订购)2 预先做好双机,减少后
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- XX 阅读 建设 机房 搬迁 方案 汇报 0421
限制150内