2022年分布式文件系统综述 .pdf
《2022年分布式文件系统综述 .pdf》由会员分享,可在线阅读,更多相关《2022年分布式文件系统综述 .pdf(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Software Engineering and Applications 软件工程与应用, 2017, 6(2), 21-27 Published Online April 2017 in Hans. http:/www.hanspub.org/journal/seahttps:/doi.org/10.12677/sea.2017.62003文章引用 : 杜振南 , 朱崇军 . 分布式文件系统综述J. 软件工程与应用 , 2017, 6(2): 21-27. https:/doi.org/10.12677/sea.2017.62003A Survey of Distributed File
2、SystemZhennan Du, Chongjun Zhu College of Computer Science, National University of Defense Technology, Changsha Hunan Received: Mar. 27th, 2017; accepted: Apr. 10th, 2017; published: Apr. 14th, 2017 Abstract The file system is an important part of the computer system. With the development of persona
3、l computer and network technology, the generation of distributed file system has effectively solved the problem of infinite growth of massive information storage. This paper summarizes the origin of the distributed file system and comprehensively analyzes and organizes the architecture of several ty
4、pical distributed file systems by consulting a large number of documents. Keywords Distributed File System, Storage Technology 分布式文件系统综述杜振南,朱崇军国防科学技术大学计算机学院,湖南长沙收稿日期: 2017 年3月27日;录用日期:2017年4月10日;发布日期:2017年4月14日摘要文件系统是计算机系统的重要组成部分,随着个人计算机和网络技术的发展,分布式文件系统的产生有效解决了无限增长的海量信息存储问题。本文通过查阅大量文献,概述了分布式文件系统的起源并
5、综合分析整理了几种典型分布式文件系统的体系架构。关键词分布式文件系统,存储技术名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 8 页 - - - - - - - - - 杜振南,朱崇军22 Copyright ? 2017 by authors and Hans Publishers Inc. This work is licensed under the Creative Commons Attribution International License (CC BY)
6、. http:/creativecommons.org/licenses/by/4.0/1. 引言随着科学技术的发展以及云计算、P2P 等技术的普及,全球数据量呈现爆炸式的增长,尤其是大数据时代的到来,通过互联网,用户制造了海量的数据。2017 年 1 月 22 日中国互联网络信息中心发布的第 39 次中国互联网络发展状况统计报告中指出:我国2016 年全年共计新增网民4299 万人,增长率为 6.2%,其中,手机网民规模达6.95 亿,占比达95.1%,增长率连续3 年超过 10%。手机网民最常使用即时通信APP:2016 年,网民在手机端最经常使用的APP 应用前三位分别是微信、QQ、淘宝
7、,无论是微信、 QQ、微博等社交通信软件还是淘宝、京东等电商软件,其图片的上传、分享与展示所产生的数据量都达到了指数级。传统的存储系统无法满足呈爆炸性增长的海量数据存储需求,为解决信息存储容量、数据备份、数据安全等问题,分布式文件系统应运而生,如今已得到广泛应用。使用分布式文件系统时,用户不必考虑底层的存储设备以及实现细节,系统会将用户的数据进行存储、归档、备份,实现对数据的使用、共享以及保护的目的。本文阐述了分布式文件系统的概念和发展历程,结合近年来分布式文件系统的应用情况,对几种典型分布式文件系统的概念、特点、体系架构进行研究,旨在帮助学习研究人员进一步了解分布式文件系统。2. 分布式文件
8、系统概述本地文件系统只能访问与主机通过I/O 总线直接相连的磁盘上的数据。当局域网出现后,各台主机间通过网络互连起来。如果每台主机上都保存一份大家都需要的文件,既浪费存储资源,又不容易保持文件的一致性。于是就提出文件共享的需求,即一台主机需要访问其它主机的磁盘。这直接导致了分布式文件系统的诞生。2.1. 分布式文件系统的概念分布式文件系统(Distributed File System,DFS)是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连文件系统管理的物理存储资源。分布式文件系统基于客户机/服务器 (C/S)模式而设计,通常一个网络内可能包括多个可供用
9、户访问存储资源的服务器。同时,分布式文件系统的对等特性也允许一些系统在扮演客户端的同时扮演服务端。例如,用户可以发布一个允许其他客户机访问的目录,一旦被访问,这个目录对于其他客户机来说就像使用本地驱动器一样。2.2. 分布式文件系统发展历程分布式文件系统的发展主要经历了四个阶段1 :第一代分布式文件系统(19801990) 早期的分布式文件系统一般以提供标准接口的远程文件访问为目的,更多地关注访问的性能和数据的可靠性。早期的文件系统以NFS (Network File System)和 AFS (Andrew File System)最具代表性,它们对以后的文件系统设计也具有十分重要的影响。第
10、二代分布式文件系统(19901995) 这一时期的分布式文件系统主要需求是广域网和大容量。XFS (Extended File System) 、Tiger Shark 并Open Access名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 8 页 - - - - - - - - - 杜振南,朱崇军23 行文件系统及Frangipani 等分布式文件系统应运而生。其中,XFS 借鉴了当时对称多处理器的设计思想,解决了广域网上缓存和减少网络流量的难题。后来出现的Tiger
11、Shark 文件系统则是专门针对规模比较大的多媒体应用。它做的创新主要集中在预留资源和针对资源优化的调度策略,保证了访问的高性能。第三代分布式文件系统(19952000) 这一阶段,网络技术的发展和普及极大地推动了分布式文件系统的研究与应用,出现了许多优秀的分布式文件系统,如General Parallel File System (GPFS)等。数据容量、性能和共享的需求使得这一时期的分布式文件系统管理的系统规模更庞大、系统更复杂,更多的先进技术也得以应用到系统中实现,如分布式锁、缓存管理技术、Soft Updates 技术、文件级的负载平衡等。第四代分布式文件系统(2000 年后 ) 随着
12、 SAN (Storage Area Network and SAN Protocols)和 NAS (Network Attached Storage)两种体系结构逐渐成熟,研究人员开始考虑如何将两种体系结构结合起来,以充分利用两者的优势。另一方面,基于多种分布式文件系统的研究成果,人们对体系结构的认识不断深入,网格的研究成果等也推动了分布式文件系统体系结构的发展。各类应用对于分布式文件系统的要求也越来越高:如大容量、高性能、可扩展性、高可用性、可管理性等。2.3. 分布式文件系统的优势相对于传统存储方式,分布式文件系统具备如下优势:一是节约成本。分布式文件系统使用大量廉价的设备存储数据,对
13、于企业,减少了购买昂贵存储服务器的成本,分布式文件存储技术的应用,使得企业对设备的维护以及管理成本大幅度降低。二是方便管理。分布式文件系统在设计时就考虑了数据的管理,特别是海量数据的管理,通过使用虚拟化技术,可以方便的完成数据的备份以及迁移等操作。三是扩展性好。支持线性扩容,当存储空间不足时,可以采用热插拔的方式增加存储设备,扩展方便。四是可靠性强。分布式文件系统包含冗余机制,自动对数据实行备份,在数据发生损坏或丢失的情况下,可以迅速恢复。五是可用性好。用户只需要拥有网络就可以随时随地的访问数据,不受设备、地点的限制。3. 典型分布式文件系统介绍3.1. Google 文件系统Google 文
14、件系统 (Google File System ,GFS)是 Google 公司为了存储海量搜索数据而设计开发的面向搜索引擎的分布式文件系统,为大量用户提供高可靠、高性能、良好扩展的数据存储服务2。主要用于大型的、分布式的、需要对大量数据进行访问的应用。它对硬件要求不高,只需运行在廉价的普通硬件上即可为大量用户提供总体性能较高的服务。在Google 搜索引擎中, 最大的分布式存储系统集群中已经广泛的在Google 内部进行部署,能够同时支持数百个客户端的访问,是处理整个WEB 范围内难题的一个重要工具。GFS 架构一个 GFS 由一个 master 和多个 chunk servers 组成,并
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年分布式文件系统综述 2022 年分 文件系统 综述
限制150内