2022年分布式存储.docx
《2022年分布式存储.docx》由会员分享,可在线阅读,更多相关《2022年分布式存储.docx(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2022年分布式存储 张恒均 摘要:分布式存储与传统集中式存储截然相反,集中式存储采纳的存储服务器存放数据,更多地依靠于硬件设备,面对大规模存储需求,很简单成为制约系统性能发挥的因素。分布式存储所谓一种概念,最早由美国的谷歌公司提出,它包含的种类有许多,比如分布式文件系统、分布式对象存储、分布式数据存储等,但无论是哪种存储,核心内容和思想都是一样的。与传统集中式存储相比,分布式存储所用到的物理设备较少,主要是靠整合、划分和安排存储资源来建立一个虚拟的存储空间,再由详细某些虚拟存储空间动身,扩展出更多系统结构,在提高牢靠性和有效性的同时,也解决了冗余等诸多问题。下面本文将对分布式存储数据中心建设
2、解决策略进行探讨。 关键词:分布式数据;HDFS;Cepf;问题解决策略 一、透析分布式存储 (一)HDFS分布式存储体系结构 HDFS是一种实现分布式文件存储的体系结构,它类似于一个文件传输系统,当客户端须要读取某个文件数据时,首先会从元数据,也就是namenode服务器获得文件信息,然后在元数据服务器和实际存储数据服务器(datanode)的交互作用下,获得详细有效数据。通过分析整个交互过程我们发觉,作为整个HDFS文件系统中的管理者,namenode主要负责文件系统的命名空间、集群配置信息和存储块的复制;datanode则是文件存储的基本单元,当客户端向namenode发送文件写入和读取
3、恳求后,namenode会根据事先制定好的规则反馈给客户端自己所管理的datanode信息。一般来说,一个集中中只有一个namenode的设计大大简化了系统结构。 (二)Ceph分布式存储系统结构 Ceph分布式存储系统的设计初衷是为了供应更好的牢靠性、可扩展性和性能。它所采纳的是 CRUSH 算法和数据分布均衡,这与传统集中式存储的元数据寻址有着特别大的不同,可实现各种类型的负载副本放置规则,存储节点规模非常浩大。Ceph的核心组件有Monitor服务、OSD服务和MDS服务,其中OSD是负责响应客户恳求返回详细数据的进程操作,它的元数据被保存在Monitor里。一般来说,Ceph分布式存储
4、系统中的块存储须要Monitor服务、OSD服务和客户端软件,Monitor负责维护存储系统的硬件逻辑关系,OSD负责磁盘管理,以实现真正的数据读写。 块存储是Ceph分布式存储系统三种存储类型中的一种,另外两种是文件存储和对象存储,每种类型的存储都有各自的优点和缺点,如块存储的优点是利用Raid和LVM来爱护数据的完成性,通过组合廉价硬盘来提高存储容量,由多磁盘合成的逻辑盘能够提升读写效率,缺点在于,数据共享无法在主机之间实现,且由光纤交换机等构建的硬件网络平台成本较高;文件存储类型的优点是,造价低廉,文件共享是可行的,但读写和数据传输速度慢也是不容忽视的问题,并且在运用场景和日志存储方面也
5、有比较特别的要求;而对象存储类型既具备了块存储读写速度高的优点,也具备了文件存储共享的特性,但更适合去更新变动较少的数据。 二、不同分布式存储系统存在的问题 (一)HDFS的缺点 1.短时间、低延迟恳求的响应实力不足 受自身性质和结构的限制,HDFS在处理用户要求时间比较短的低延迟恳求时会显得力不从心。HDFS最初是为了处理和解决大型数据集问题而设计的,实现高吞吐量的代价就是出现高延迟。 2.小文件存储量的有效性低 由于元数据会被存放在内存中,因此文件系统所能容纳的文件数量必定是有限的,假如以每个文件160字节去计算,200万份文件就须要占用至少600MB的内存空间,虽然以目前的状况来看是可行
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022 年分 存储
限制150内