Hadoop介绍移动云计算服务端技术.pptx
《Hadoop介绍移动云计算服务端技术.pptx》由会员分享,可在线阅读,更多相关《Hadoop介绍移动云计算服务端技术.pptx(23页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、HADOOP介绍介绍2011年5月15WhatisHadoopApacheHadoop是一个用java语言实现的软件框架,在由大量计算机组成的集群中运行海量数据的分布式计算,它可以让应用程序支持上千个节点和PB级别的数据。Hadoop组成Hadoop Hadoop corecorePIGPIGHBaseHBaseZooKeeperZooKeeperHadoop组成HadoopcoreHadoop的核心子项目,提供了一个分布式文件系统(HDFS)和支持MapReduce的分布式计算。HBase建立在Hadoop内核之上,提供可靠的,可扩展的分布式数据库。ZooKeeper一个高效的,可扩展的协调
2、系统。分布式应用可以使用ZooKeeper来存储和协调关键共享状态。PIG建立于Hadoop内核之上,是一种支持并行计算运行框架的高级数据流语言。HadoopcoreMapReducepMap:任务的分解pReduce:结果的汇总两大核心设计两大核心设计HDFSpNameNodepDataNodepClientMapReduceHDFSHDFSNameNode可以看作是分布式文件系统中的管理者,存储文件系统的meta-data,主要负责管理文件系统的命名空间,集群配置信息,存储块的复制。DataNode是文件存储的基本单元。它存储文件块在本地文件系统中,保存了文件块的meta-data,同时周
3、期性的发送所有存在的文件块的报告给NameNode。Client就是需要获取分布式文件系统文件的应用程序。HDFS操作举例文件写入:1.Client向NameNode发起文件写入的请求。2.NameNode根据文件大小和文件块配置情况,返回给Client它所管理部分DataNode的信息。3.Client将文件划分为多个文件块,根据DataNode的地址信息,按顺序写入到每一个DataNode块中。文件读取:1.Client向NameNode发起文件读取的请求。2.NameNode返回文件存储的DataNode的信息。3.Client读取文件信息。文件块复制:1.NameNode发现部分文件的
4、文件块不符合最小复制数或者部分DataNode失效。2.通知DataNode相互复制文件块。3.DataNode开始直接相互复制。HBase-数据模型每个数据行都包括一个可排序的关键字,和任意数目的列 HBase利用的是column-oriented列导向存储机制,不同于传统的row-oriented行导向存储机制对于Null值的存储是不占用任何空间的 最适合使用HBase存储的数据是非常稀疏的数据所有数据库更新操作都有时间戳。HBase对每个数据单元,只存储指定个数的最新版本。HBase-概念模型一个表格是一些行的集合,每行包含一个行关键字(和一个可选的时间戳),和一些可能有数据的列(稀疏)
5、,如下图:HBase-物理模型在概念上表格是一个稀疏的行/列矩阵,但是在物理上,它们按照列存储,上面“概念模型”中的表格在物理上的存储方式如下所示:ZooKeeperWhatisZooKeeper?一个高效的,可扩展的协调系统WhyisZooKeeper?p保证用户读取的数据是最新的p当用户正在查看的数据被修改时,保证用户会被及时告知p保证来至一个用户的所有请求会被按顺序处理p保证所有用户得到的数据是一致的ZooKeeper-DataModelpZooKeeper提供的命名空间和一般的文件系统是极为相似的,除了ZooKeeper的文件系统的每个节点(node)既可以包含数据又可以包含子节点pZ
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Hadoop 介绍 移动 计算 服务端 技术
限制150内