云存储架构设计最佳实践.docx
《云存储架构设计最佳实践.docx》由会员分享,可在线阅读,更多相关《云存储架构设计最佳实践.docx(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、云存储架构设计最正确实践前言2.概述21 .云存储技术分析22. 1云存储通用框架22.2云存储硬件架构31集中式存储41.1.1 分布式存储-独立部署架构5分布式存储-超融合架构52. 3分布式底层存储技术6. 1分布式文件系统72.1 .2分布式键值存储83.云存储架构框架设计93. 1总体设计原那么和方法93.1 需求分析10. 1应用场景分析103.2 .2数据存储需求103.2 云存储总体架构113.3 架构设计评估123. 5技术选型133.2 需求分析应用场景分析不同行业、业务场景往往决定了云存储不同的应用场景,传统行业和互 联网行业之间往往也有着明显差异: 核心业务应用场景:传
2、统行业核心业务逻辑的变化不频繁,核心系 统的业务量增长是规律的,可预估的,系统架构稳定;而互联网行业 来说,业务系统追求敏捷迭代,业务量起伏变化较大,系统架构从简 单到复杂,要求弹性伸缩;互联网业务应用场景:对于传统行业来说,互联网是一种新的业务 拓展渠道,是业务转型的方向,需要逐步试点开放的; 非结构化数据场景:非结构化数据场景也有很大差异,在局部场景 下,非结构化数据多是系统产生或提供的临时数据,一次写入屡次读 取,要求10性能稳定,如个人网盘场景;另外一些场景下,非结构 化数据要求长期存放,一次写入很少读取,逐渐成为冷数据,典型的 如银行保险业务双录场景;数据灾备与平安:无论是传统行业还
3、是互联网行业,都需要考虑业 务连续性需求,建立数据灾备体系和敏感数据保护方案。而金融行业 还有着更加严格的国家法律法规和金融监管部门要求,业务系统的 RT0、 RP0要求更加明确,重要、敏感数据需要平安可控,一般会 审慎选择云存储的部署模式。3.2.1 数据存储需求部署模式敏感数据情况决定了云存储的部署模式,对于涉及敏感数据较多的系 统,一般采用私有部署模式;对于非敏感数据,云存储的本钱往往是一个是 重要的考虑点,公有云部署除了考虑数据存储费用外,也还需考虑存储流量 费用。综合考虑我司的业务应用场景,云存储排除了公有云模式,而是采用了私有 部署模式。存储访问接口存储访问接口对应的是云存储的功能
4、需求,对于我司来说,包括块存储、NAS存储接口和对象存储S3接口。块存储对应于云服务器硬盘需求,NAS 存储对应于多个云服务器间的文件共享需求,对象存储S3接口对应于互 联网类业务非结构化数据存储和冷数据归档需求。数据存储分级数据存储分级可以在满足不同业务系统存储需求的基础上,降低整体 云存储本钱,结合我司业务情况分为:a) .核心业务类型系统及其数据库,需要最高的存储性能和可靠性;.其他轻量级数据库,需要较高的存储性能和可靠性;b) .互联网类新业务和其他非关键类应用,需要一定的存储性能和较 好的扩展性;.非结构化类型业务数据,需要较高的扩展性,存储性能要求不高;c) .数据备份与归档,数据
5、存储冷热分层;.开发测试系统,利旧存储。3.3 云存储总体架构从行业开展趋势和企业IT战略转型方向看,我司传统业务依然处于 基础性的重要地位,这也决定了集中式存储架构将与分布式存储架构长期 并存的状态。分布式存储架构主要用于新的线上业务场景,集中式SAN存 储和NAS存储在传统业务场景依然占据重要地位。最终确立了统一纳管异构存储资源,提供多种类型数据接口、面向海量 数据场景的云存储架构,如图7所示.可通过引入超融合架构来构建私 有云laaS平台,实现IT基础架构云化转型,分别构建开发测试、互联 网类新业务应用等超融合集群。而海量的半结构化和非结构化数据需要通 过分布式对象存储来构建可弹性扩容的
6、数据湖,采用基于策略的数据全生 命周期管理,提供热、温、冷不同资源池,实现数据在不同资源池以及云平 台间的流动和分层。云存储服务身份认证对象存储身份认证对象存储访问控制文件共享存储备份归档大数据存储云存储资源池存储系统API接块窑文仲喜对象备存飞接口层存储抽象层敷堀存储层图7.云存储架构示意图3.4 架构设计评估云存储架构设计是否合理,需要从敏感点、权衡点以及架构风险点这三 个方面去评估: 敏感点敏感点对应于不同数据存储的共有的一些特性,比方存储的软硬件成 本、可靠性、存储10性能、架构复杂度、灵活扩展能力、资源孤岛、故障 域隔离和可管理性等属性; 权衡点权衡点那么是影响多个架构质量属性的敏感
7、点,需要架构师评估取舍的 局部。比方存储架构是集中式还是分布式决定了存储的架构复杂度和灵活 扩展能力;存储的软硬件本钱也很大程度上决定了存储的可靠性和性能;资 源孤岛虽然会造成资源浪费,但合理规划好,也是故障域隔离的前提。 风险点对于架构师来说,最需要关注的往往是架构中的风险点,是架构设计成 败的关键。分布式存储架构存在着复杂度高、新技术引入风险以及版本迭代 速度快等风险点;超融合架构还面临着扩展性受限、资源孤岛等风险;而传 统存储架构主要风险点在于难以应对海量数据存储扩展,本钱较高,与新技 术的适配度也不高。对应于我司的云存储架构设计,传统SAN存储性能稳定,10延时低, 本钱高,不易扩展,
8、但适合于核心业务场景;NAS存储性能不高,但易于使 用和文件共享,本钱也不高,适合于绝大多数文件共享访问场景;分布式对 象存储性能一般,架构复杂度高,但可以灵活扩展,支持海量数据存储,成 本低,适合于海量结构化数据存储和互联网业务场景;而超融合架构可以很 好地与计算资源融合,架构简单,本钱低,虽然有扩展性受限和资源孤岛问 题,但结合公司业务和计算资源配比建立不同超融合集群,可以做好数据存 储分级,隔离不同的故障域。3.5 技术选型按照云存储架构设计评估,我司还需要分别引入分布式对象存储和超 融合两种不同硬件架构的云存储方案。结合云存储底层存储技术的分析,分 布式对象存储更适宜采用基于分布式键值
9、存储的产品,性能需求不高,扩展 性更强;超融合那么倾向于基于分布式文件系统的产品,逻辑架构更加清晰, 并不追求超大规模部署,而小规模部署下性能更有优势。对于传统行业来说,开源云存储技术并不能拿来即用,是不适应不同业 务系统的存储需求的。要在云存储这样的基础架构领域做到技术自主是非 常困难的,也缺乏相应的技术积累、人才队伍建设和研发资源投入。因此大 多数传统企业都需要选择不同厂商的云存储产品,做技术选型也就是在筛 选不同厂商产品。不同厂商的分布式存储都会有其清晰的市场定位和优势场景,其中厂 商对于存储产品核心技术的把控能力是最重要的,其次是厂商的售后服务 水平,当然还要看产品的定价水平。对于我司
10、这样的中小企业来说,更倾向 于跟随策略,筛选市场份额前列、有大规模的同行业落地案例的厂商产品。 在筛选出了厂商产品之后,技术层面还需要做好P0C测试,来验证技术选 型。对于云存储产品来说,选型测试还需要考虑以下六点:业务应用场景业务类型决定了数据存储分级标准,数据类型决定了使用存储连接方 式以及云存储产品类型等功能需求,数据容量那么决定了云存储的扩展性能 力要求; 兼容性对于云存储产品来说,软硬件的兼容性是一个重要指标,包括通用服务器选型、设备微码驱动版本、操作系统版本、不同虚拟化平台等的兼容性; 10性能10性能也是云存储是产品是否适配业务应用场景的另一个重要考量 点,相比于通用的存储性能指
11、标数据,业务场景下的测试更有说服力; 高可靠性通过开展破坏性测试,来验证云存储产品的高可靠性; 易管理性分布式架构复杂度高,云存储的易管理性关系到运维人员是否能很好 地管控云存储; 数据保护和容灾数据保护和容灾会增加本钱,但依然需要考虑数据多维度的平安。随着互联网类新兴业务的激增、业务数据快速增长,云存储技术应运而 生。本文深入剖析了云存储通用框架、硬件架构以及其底层原理这三个技术层 面的差异性,为云存储架构框架设计提供了理论依据;再结合细分行业及其业 务应用场景的差异性需求,最终确定了满足企业需求的云存储总体架构,并详 细介绍了架构设计评估和技术选型过程中的一些实践经验。1 .概述随着互联网
12、类新兴业务的激增、业务数据快速增长,使得企业数据中心 存储系统面临新的挑战:大数据、云计算等新技术应用带来了新的存储应用 场景;海量数据存储冲击着传统存储架构,性能容量成为瓶颈;存储系统扩 容和新建周期长,无法满足业务敏捷需求。云存储技术应运而生,敏捷、资源可弹性部署、按需获取的特性很好地 满足了数据中心海量数据和新兴业务快速上线的存储需求。2 .云存储技术分析顾名思义,云存储是在云计算基础上衍生和开展出来的,通过网络将大 量异构存储设备构成了统一的存储资源池,在集中式存储技术基础上,融合 了分布式存储、多租户共享、软件定义存储等多种云存储技术。新技术应用都有其两面性,在设计构建云存储架构框架
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 存储 架构 设计 最佳 实践
限制150内