Google云计算原理-分布式锁服务Chubby.ppt
《Google云计算原理-分布式锁服务Chubby.ppt》由会员分享,可在线阅读,更多相关《Google云计算原理-分布式锁服务Chubby.ppt(54页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Cloud Computing电子工业出版社 刘鹏主编云计算教材配套课件4课程回顾3GFS的容错措施有哪些?GFS的容错机制Chunk Server容错每个Chunk有多个存储副本(通常是3个),分别存储于不通的服务器上每个Chunk又划分为若干Block(64KB),每个Block对应一个32bit的校验码,保证数据正确(若某个Block错误,则转移至其他Chunk副本)Master容错(影子节点热备)三类元数据:命名空间(目录结构)、Chunk与文件名的映射以及Chunk副本的位置信息前两类通过日志提供容错,Chunk副本信息存储于Chunk Server,Master出现故障时可恢复51
2、、处理流程2、分片方式MapReduce处理流程中各类文件的存储位置在哪里?MapReduce的容错方法?MapReduce的处理优化方法?MapReduce仅能对GFS之上的文件进行处理吗?所有步骤均可控,可灵活处理各类分布式问题除了排序,新增两道题目使用MapReduce实现倒排索引输入:100个文本文档输出:倒排索引任务实现算法,给出数据结构描述、执行过程描述等作业要求同“排序”要求尽可能提高执行效率,节约网络IO带宽除了排序,新增两道题目使用MapReduce实现快速查询查询目标是存储在BigTable之中的网页数据,给定关键字,快速查询含有该内容的网页(假定没有倒排索引)要求设计Bi
3、gTable存储方式(表含有哪些列、无需关心数据如何取得)设计快速查询的MapReduce处理方法作业要求同“排序”分布式锁服务Chubby11主要用于解决分布式一致性问题在一个分布式系统中,有一组的Process,它们需要确定一个Value。于是每个Process都提出了一个Value,一致性就是指只有其中的一个Value能够被选中作为最后确定的值,并且当这个值被选出来以后,所有的Process都需要被通知到粗粒度的分布式锁服务Chubby是Google为解决分布式一致性问题而设计的提供粗粒度锁服务的文件系文件系文件系文件系统统其他分布式系统可以使用它对共享资源的访问进行同步12需要实现的特
4、性高可用性高可靠性支持粗粒度的建议性锁服务支持小规模文件直接存储不作考虑的特性高性能存储能力1314文件系统中文件操作的权限有哪些?这些权限之间的互斥关系是怎样的?Chubby系统本质上就是一个分布式的、存储大量小文件的文件系统Chubby中的锁就是文件在GFS的例子中,创建文件就是进行“加锁”操作,创建文件成功的那个server其实就是抢占到了“锁”用户通过打开、关闭和存取文件,获取共享锁或者独占锁;并且通过通信机制,向用户发送更新信息1617主节点选举独占锁共享锁数据存取应用获取GFS ChunkServer信息元数据存储18分布式数据表BigTable19为什么需要设计BigTable?
5、Google需要存储的数据种类繁多网页,地图数据,邮件如何使用统一的方式存储各类数据?海量的服务请求如何快速地从海量信息中寻找需要的数据?BigTable:基于GFS和Chubby的分布式存储系统对数据进行结构化存储和管理与GFS的联系20数据存储可靠性高速数据检索与读取存储海量的记录(若干TB)可以保存记录的多个版本21与写操作相比,数据记录读操作占绝大多数工作负载单个节点故障损坏是常见的磁盘是廉价的可以不提供标准接口Google既能控制数据库设计,又能进行应用系统设计22具有广泛的适应性支持Google系列产品的存储需求具有很强的可扩展性根据需要随时加入或撤销服务器应对不断增多的访问请求高
6、可用性单个节点易损,但要确保几乎所有的情况下系统都可用简单性简单的底层系统可减少系统出错概率,为上层开发带来便利23总体上,与关系数据库中的表类似Row KeyTime StampColumn ContentsColumn AnchorColumn“mime”my.look.ca“n.www”T9CNNT8CNN.COMT6“.“Text/htmlT5“.“t3“.“24关系数据库中的表是什么样的?有什么特征?关系数据库中的表设计需要遵循什么原则?行每行数据有一个可排序的关键字和任意列项字符串、整数、二进制串甚至可串行化的结构都可以作为行键表按照行键的“逐字节排序”顺序对行进行有序化处理表内数
7、据非常稀疏,不同的行的列的数完全目可以大不相同URL是较为常见的行键,存储时需要倒排统一地址域的网页连续存储,便于查找、分析和压缩/index.asp/index.asp25列特定含义的数据的集合,如图片、链接等可将多个列归并为一组,称为族(family)采用 族:限定词 的语法规则进行定义fileattr:owning_group”,“fileattr:owning_user”,etc同一个族的数据被压缩在一起保存族是必须的,是BigTable中访问控制的基本单元26时间戳保存不同时期的数据,如“网页快照”“A big table”表中的列可以不受限制地增长表中的数据几乎可以无限地增加通过(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Google 计算 原理 分布式 服务 Chubby
限制150内