云平台运维与运营服务方案.docx
《云平台运维与运营服务方案.docx》由会员分享,可在线阅读,更多相关《云平台运维与运营服务方案.docx(23页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、平台系统基础支撑平台与运维保障平台用户桌面虚拟化平台数据中心虚拟化平台虚拟应用/桌面承载服务器集群虚拟应用/执享费而淞jRIHnn虚拟应用/ 共享桌面池独占京百池:虚拟桌面/基础架构 服务器集群(三)第三阶段,XXX国土运维保障平台建设统一规划XXX国土 GIS、0A等业务系统的运维保障平台的建设。运维保障架构图如下:用户桌面虚拟化平台蚊务器数据运维保障系统黄岛数据中心虚拟化平台虚拟桌面技术方案设计云桌面总体架构设计如下:这种基于服务器运行模式的应用交付架构已经在全球被大量的电信、金融、政府 和企业客户所采用,可以在管理维护、投资成本、应用性能、安全和业务连续性各个 方面得到提升: 首先从管理
2、维护的角度,这种集中管理的优势显而易见:以前的软件部署和 管理,工程师们需要对每一台电脑进行安装和维护工作,低级的重复劳动消 耗了大量的人力物力。而现在PC机上不再安装复杂的软件,成为标准终端设 备,如果一台坏了,换一台备用标准设备就可以继续工作,对工作没有影 响。IT管理人员只管理和维护中心服务器,通过应用策略去设定每个用户或 用户组的行为,管理人员足不出数据中心,通过服务器上各种数据、策略和 信息管理着整个企业用户对应用的使用,达到事半功倍的效果。 其次性能同样得到提升,集中发布降低了应用对网络和终端硬件的依赖,使 其不再成为性能瓶颈,同时还可以集中对应用进行优化,使得用户访问效率 大大提
3、高;从安全性来看,所有的生产数据和监控逻辑全部保留在数据中心内,防止了 敏感信息的泄漏,可以精确地控制对各应用程序的安全访问;同时管理人员 可以通过审计录像对敏感操作进行记录,以备审计追踪等。 从总体成本衡量,传统模式需要不断地对PC机和带宽进行无底洞式地投入, 在集中式架构下,XXX国土的应用不再依赖于PC机和客户端网络带宽,只要 为每个业务人员配备一台终端和十几K的带宽就可以正常工作;每次系统和 软件升级只需对少量服务器升级即可,节省了大量成本。 各网段访问虚拟化平台还提供了各种安全和管理功能,可以实现全面的用户 接入的安全控制和管理,包括用户行为控制、远程监控、远程培训、行为审 计、对各
4、个应用的口令管理,以及整体系统的性能监控管理等等。服务器虚拟化方案设计虚拟化总体架构设计图如下:用户应用/桌面虚拟化平台黄岛数据中心虚拟化平台这种基于服务器运行模式的虚拟化架构已经在全国大量用户采用,可以在管理维 护、投资成本、应用性能、安全和业务连续性各个方面得到提升: 资源快速部署。通过虚拟化系统,业务部门提交IT需求时,可以在几分钟内部署一台新的服务器环境供使用,新的服务器环境供使用,大大缩短IT与业务需求落地的时间差。 提高利用资源。通过虚拟化的部署,将传统的硬件资源转化为软件资源,提高现有的硬件资源利用率,并且,硬件资源利用率,并且,可以将所有硬件资源通过利旧、整合到新的虚拟化系统平
5、台中。 绿色数据中心。虚拟化概念一直是绿色数据中心的倡导者。我行通过虚拟化部署,可 以使系统资源高度集中,节约机房空间的同时,更降低了机房用电的开销(包括服务器用电、 空调用电等)。 降低运维成本。除了对电量和空间使用的降低外,在人力成本方面,也可以通过虚拟 化,减轻因为业务成本增长,带来的运维压力,帮助我行的IT人员应对快速的增长业务。业务系统运维保障设计 架构设计业务系统运维保障架构设计如下:黄岛数据中心虚拟化平台 用户应用/桌面虚拟化平台网络访问安全接入网关数据中心服务器虚拟化 承载服务器集群数据运维保障系统业务系统应急25台服务器的实时虚拟化镜像一台设备能接机房内任意故障服务器一台CD
6、AP设备自身可随机应急机房内任何几 台故障X86服务器,保护多达25台。系统和数据 保持完全一致。5/0分钟完全顶替原机使用。数据保障离线快照R- H R- B B物理服务器一种独特的备份技术和容灾架构将服务器整机备份 成虚拟机,磁盘块 级实时复制比传统 方式更快。最“傻瓜式”备份 系统。整机实时备 份(0S+APP+DATA) 整机一体化恢复。支持任何应用数据 类型。瞬间验证和 瞬间恢复;可实现 低成本应用级容灾。运维迁移不同品牌服务器迁移IBM HP DELL 联想P2V V2VV2P P2P不同类型服务器迁移不同虚拟化迁移支持服务器“异机”在线迁移应用于机房搬迁项目 防范搬迁过程中硬件损
7、坏: 确保搬迁过程中数据不丢失: 保障搬迁过程中重要业务不间断.应用于老旧服务器更新 整机一次性迁移,立即可用: 无须重新安装系统和配置应用: 投脱了应用厂商支持的依赖。项目实施计划项目实施计划如下:阶段任务一、分析阶段云平台环境评估|对现有的IT环境进行全面的技术评估分析评估结果,定位风险点和成功部署要素 和集成商团队共同制定出明确的可执行的项目方案记录并交付评估结果二、设计阶段云平台平台设计|集成商团队设计云平台,并与其一起进行设计讨论设计结果包含下面各个方面:/网络架构/系统架构,服务器虚拟化/存储架构,桌面虚拟化三、构架和测试阶段四、发布阶段虚拟化环境架构 网络环境架构 虚拟桌面环境架
8、构,安装并配置下歹1玄平台产品组件,/部署服务器虚拟化/部署桌面虚拟化/创建数据存储/授权服务器部署用户配置文件方案集成现有基础架构(目录服务,文件服务等等)试运行支持 确定试运行用户 支持试运行部署并解决响应的问题 确认接受度投产支持部署可以支持设计用户容量的应用虚拟化环境进行投产上线实现知识转移项目组织保障工作领导小组为保障XXX区基础支撑平台与运维保障平台项目建设顺利推动,建议由局信 息化建设领导小组直接负责对本项目的组织领导。领导小组拟设立“基础支撑平 台与运维保障平台”建设办公室,具体负责项目建设各项工作的统筹推进,制定 建设方案、工作计划和相关标准,明确任务分工。项目专家小组项目专
9、家小组主要负责配合系统建设项目技术小组完成现状分析、平台设计以及 平台测试与发布的工作。项目专家小组的主要职责如下: 充分发挥在技术以及信息化认识等方面的特长和能力,指导项目技术小组进 行现状梳理、分析工作。 参与项目技术小组的各个阶段的成果评审活动。 对项目实施中有关的业务、技术以及资源配置等可能出现问题,向项目技术 小组提出改进意见。 在信息系统建设涉及到的业务和技术问题上,对项目领导小组负责。项目技术小组项目技术组的主要工作职责如下: 负责通过用户访谈、用户问卷、专题讨论、资料收集等方式获取项目建设的 需求,并对调查结果进行整理分析,提交各个部门进行确认,并提交项目领导小组和 专家小组进
10、行评审。 负责按阶段按时完成项目的分析设计、设计、搭建、测试、试运行、运行工 作。 负责完成平台的使用及维护培训等集成系统建设的伴随服务,完成项目验收 和鉴定的准备工作。 在整个项目建设过程中,每周末(月末)向工作领导小组提交本周(本月) 的工作总结和下周(下月)工作计划;要在项目计划完成、需求调研中期、需求调研 结束、系统设计完成、系统集成中期、系统试运行前以及项目收尾等各个阶段,向项 目领导小组进行专题工作汇报。 当遇到业务问题或困难时,及时向专家小组进行专门咨询,以保证项目顺利 实施。云平台下的运维体系建设工作内容-、系统运维系统运维负责IDC、网络、CDN和基础服务的建设(LVS、NT
11、P、DNS) 负责资产管理,服务器选型、交付和维修。详细的工作职责如下:IDC数据中心建设收集业务需求,预估未来数据中心的发展规模,从骨干网的分布,数 据中心建筑,以及Internet接入、网络攻击防御能力、扩容能力、空间 预留、外接专线能力、现场服务支撑能力等方面评估选型数据中心。 负责数据中心的建设、现场维护工作。网络建设设计及规划生产网络架构,这里面包括:数据中心网络架构、传输网 架构、CDN网络架构等,以及网络调优等日常运维工作。1 项目概述21.1 项目背景21.2 项目目标21.3 建设内容2现状及需求分析31.4 信息化现状31.5 存在的问题41.5.1 运维保障面临主要问题.
12、41.5.2 现有保障手段不能满足需求4223管理运维问题.4方案总体设计63.1 设计原贝IJ63.2 总体架构设计73.3 实施思路7虚拟桌面技术方案设计104 服务器虚拟化方案设计11业务系统运维保障设计134.1 架构设计134.2 业务系统应急144.3 数据保障144.4 运维迁移15项目实施计划155 项目组织保障175.1 工作领导小组175.2 项目专家小组175.3 项目技术小组17LVS负载均衡和SNAT建设LVS是整个站点架构中的流量入口,根据网络规模和业务需求,构建负 载均衡集群;完成网络与业务服务器的衔接,提供高性能、高可用的 负载调度能力,以及统一的网络层防攻击
13、能力;SNAT集中提供数据中心的公网访问服务,通过集群化部署,保 证出网服务的高性能与高可用。CDN规划和建设CDN工作划分为第三方和自建两部分。建立第三方CDN的选型和调度 控制;根据业务发展趋势,规划CDN新节点建设布局;完善CDN业务 及监控,保障CDN系统稳定、高效运行;分析业务加速频道的文件特 性和数量,制定最优的加速策略和资源匹配;负责用户劫持等CDN日 常故障排查工作。服务器选型、交付和维护负责服务器的测试选型,包含服务器整机、部件的基础性测试和业务 测试,降低整机功率,提升机架部署密度等。结合对公司业务的了解, 推广新硬件、新方案减少业务的服务器投入规模。负责服务器硬件故 障的
14、诊断定位,服务器硬件监控、健康检查工具的开发和维护。OS、内核选型和OS相关维护工作责整体平台的os选型、定制和内核优化,以及Patch的更新和内部版 本发布;建立基础的YUM包管理和分发中心,提供常用包版本库;跟 进日常各类OS相关故障;针对不同的业务类型,提供定向的优化支持。资产管理记录和管理运维相关的基础物理信息,包括数据中心、网络、机柜、 服务器、ACL、IP等各种资源信息,制定有效的流程,确保信息的准确 性;开放API接口,为自动化运维提供数据支持。基础服务建设业务对DNS、NTP、SYSLOG等基础服务的依赖非常高,需要设计高可用 架构避免单点,提供稳定的基础服务。应用运维应用运维
15、负责线上服务的变更、服务状态监控、服务容灾和数据备份 等工作,对服务进行例行排查、故障应急处理等工作。详细的工作职 责如下所述。设计评审在产品研发阶段,参与产品设计评审,从运维的角度提出评审意见, 使服务满足运维准入的高可用要求。服务管理负责制定线上业务升级变更及回滚方案,并进行变更实施。掌握所负 责的服务及服务间关联关系、服务依赖的各种资源。能够发现服务上 的缺陷,及时通报并推进解决。制定服务稳定性指标及准入标准,同 时不断完善和优化程序和系统的功能、效率,提高运行质量。完善监 控内容,提高报警准确度。在线上服务出现故障时,第一时间响应, 对已知线上故障能按流程进行通报并按预案执行,未知故障
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 平台 运营 服务 方案
限制150内