《分布式数据库系统及应用》知识总结.docx
《《分布式数据库系统及应用》知识总结.docx》由会员分享,可在线阅读,更多相关《《分布式数据库系统及应用》知识总结.docx(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精品名师归纳总结可编辑资料 - - - 欢迎下载精品名师归纳总结1、 懂得分布式数据库系统的特点:第一章分布式数据库系统概述可编辑资料 - - - 欢迎下载精品名师归纳总结(1) 物理分布性:数据不是存放在一个站点上(2) 规律整体性:是与分散式数据库系统的区分(3) 站点自治性:是与多处理机系统的区分(4) 数据分布透亮性(5) 集中与自治相结合(6) 存在适当的数据冗余度(7) 事务治理的分布性2、 能够依据不同标准描述分布式数据库系统的分类:(1) 按局部 DBMS 的数据模型分类1 同构型 DDBSa) 同构同质型(同一个公司的同一种模式)b) 同构异质型(不同公司不同模式)2 异构型
2、 DDBS(2) 按 DDBS的全局掌握类型分类1 全局掌握集中型 DDBS:全局掌握机制和全局数据词典位于中心站点2 全局掌握分散型 DDBS:全局掌握机制和全局数据词典分散在网络的各个站点上。3 全局掌握可变型 DDBS:也称主从型 DDBS。分成两组站点,一组包含全局掌握机制和全局掌握词典,另外一组不包含。3、懂得分布式数据库中数据的独立性和分布透亮性: 规律独立性物理独立性(表示用户程序与数据的全局规律结构和数据的物理结构无关)分布独立性(用户不必关怀全局数据的分布情形,包括规律分片、物理位置安排情形以及各站点数据库的数据模型等)分三个层次:分片透亮性 (完全分布透亮性) :位于全局概
3、念模式与分片模式之间,用户编写应用程序只对全局关系进行操作,不必考虑数据的规律分片位置透亮性(中级分布透亮性) :位于分片模式和安排模式之间。包括两情形各片段被复制情形和片段及其各副本的站点位置安排情形。局部数据模型透亮性(低级分布透亮性):需要知道数据的分片情形和站点安排情形其次章分布式数据库系统设计1、懂得分布式数据库的设计目标:(1) 本的性或近的性1 尽量削减通信次数和通信量,90/10 准就2 分片和分布方案(本的和远程拜访次数)择优(2) 掌握数据适当冗余1 冗余增加了牢靠性、可用性,提高了效率2 保护数据一样性开销增加(3) 工作负荷分布1 各站点可以分担整个工作任2 本的性降低
4、(4) 储备才能和费用2、懂得水平分片的定义、分类和应用:定义:水平分片是对全局关系执行“挑选 ”操作,把具有相同性质的元祖进行分组,构成如干个不相交可编辑资料 - - - 欢迎下载精品名师归纳总结的子集。可以分为两类:初级分片、导出分片(应用看课件_分布式数据库系统设计1,15 页开头)。3、 懂得垂直分片的定义和应用定义:垂直分片通过 “投影 ”操作把一个全局关系的属性分成如干组,基本目标是将使用频繁的属性集合在一起。(应用看课件 _分布式数据库系统设计2, 9 页开头)4、 能够描述分片的基本原就:原就:完整性、不相交性、可重构性5、把握数据片段安排的分类和常用方法: 分类:水平、垂直安
5、排方法:( 1)非冗余安排设计方法1 正确适应法2 分片和分布方案(本的和远程拜访次数)择优( 2)冗余安排的设计方法1 全部得益站点法2 附加复制法6、把握正确适应法和全部得益站点法的基本特点:(1) 正确适应法特点:对每一种安排都进行估算,然后挑选正确站点。(2) 全部得益站点法特点:确定非复制问题的解确定一组站点安排副本。7、能够描述 DATAID-D方法设计分布式数据库的各个阶段:(1) 分片设计(2) 非冗余安排(3) 冗余安排(4) 局部模式的重新构造8、能够依据给出的条件对关系进行具体分片,给出正确的限定关系(见课后题67 页 2.9,2.10)第三章分布式数据库系统中的查询处理
6、和优化(连接与等值连会见课件3.1)1、把握分布式数据库查询的分类局部查询:只涉及本的单个站点的数据, 优化同集中式。远程查询:也只涉及单个站点的数据, 但要远程通讯 , 挑选站点。全局查询:涉及多个站点数据, 优化复杂。2、懂得关系代数运算的交换率(书上83 页)3、把握直接连接优化算法的分类利用站点依靠信息的算法分片与复制算法站点依靠和数据复制结合算法Hash 划分算法4、把握半连接运算(课件3.2 )5、把握半连接和直接连接查询优化算法的区分1) 取决于数据传输和局部处理的相对费用2) 假如传输费用是主要的,采纳半连接,SDD-13) 假如本的费用是主要的,采纳直接连接,System R
7、* 6、懂得 Hash 划分算法的特点1) 数据传送量是 R2) 索引方面 ,比片段复制算法更低3) 每个站点的连接数据量同站点依靠算法7、能够描述基于半连接算法查询优化的基本原理和步骤可编辑资料 - - - 欢迎下载精品名师归纳总结基本原理1) 通常有两次传输2) 但是传输的数据量和传输整个关系相比,要远远少3) 一般有: T 半card( R),可削减站点间的数据传输量5) 半连接的缺失:传输B S =C0+C1* size B* val BS6) 基本原理是在传到另一个站点做连接前,排除与连接无关的数据,削减做连接操作的数据量,从而减小传输代价采纳半连接优化算法的步骤1) 运算每种半连接
8、方案的代价,并从中挑选一种正确方案2) 挑选传输代价最小的站点,运算采纳全连接的方案的代价3) 比较两种方案,确定最优方案8、能够描述基于关系代数等价变换的查询优化算法原理、算法实现步骤基本原理1) 查询问题关系代数表达式(是转变的意思)2) 分析得到查询树3) 进行全局到片段的变换得到基于片段的查询树4) 利用关系代数等价变换规章的优化算法,尽可能先执行挑选和投影操作实现步骤和方法1) 转换一: 查询问题 关系代数表达式( 是转换的意思)2) 转换二: 关系代数表达式 查询树3) 转换三: 全局查询树分拆成片段查询树4) 优化: 利用关系代数等价变换规章的优化算法,优化查询树,进而优化查询9
9、、能够依据供应的条件完成分片和复制算法应用,通过运算判定哪个关系保持分片最优(课件3.3 习题,书本 88 页)可编辑资料 - - - 欢迎下载精品名师归纳总结1、把握事务的四大特性第四章分布式数据库中的事务治理和复原可编辑资料 - - - 欢迎下载精品名师归纳总结特性:原子性、一样性、长久性、隔离性。2、能够描述两阶段提交协议的工作流程表决阶段可编辑资料 - - - 欢迎下载精品名师归纳总结执行阶段目的是形成一个共同的打算第一,和谐者给全部参加者发送“预备”消息,进入等待状态 其次,参加者收到“预备”消息后,检查是否能够提交本的事务.如能,给和谐者发送“建议提交”消息,进入就绪状态.如不能,
10、给和谐者发送“建议撤销”消息,可以单方面撤销 第三,和谐者收到全部参加者的消息后,他就做出是否提交事务的打算,.只要有一个参加者投了反对票,就打算撤销整个事务,发送“全局撤销”消息给全部参加者,进入撤销状态.否就,就打算提交整个事务,发送“全局提交”消息给全部参加者,进入提交状态实现表决阶段的打算,提交或者撤销可编辑资料 - - - 欢迎下载精品名师归纳总结3、把握事务故障的分类站点故障1) 介质故障:2) 事务故障可编辑资料 - - - 欢迎下载精品名师归纳总结3) 系统故障通讯故障4) 报文故障5) 网络分割故障4、把握分布式数据库事务执行的掌握模型的分类主从模型三角模型层次掌握模型5、懂
11、得日志文件的特点Log:记录全部对 DB 的操作事务标识:每个事务给定一个具有惟一性的标识符Log 记录项start_transaction, Twrite_item, T, x,旧值,新值 read_item, T, xcommit, T abort, T写动作:写 Log 比写数据优先Log 储备:一般存在盘上 , 仍会定期备份到磁带上6、懂得分布式数据库数据更新常见方法多站点数据更新1) 方法:站点 A 上有事务 T 对 X 更新, X 在 B1,Bn 和 C1, Cm 上有副本 , 就也要对这些副本更新主文本更新2) 指定主副本 , 修改只对主副本进行, 修改帮助副本时 , 也按在主副
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分布式数据库系统及应用 分布式数据库系统及应用知识总结 分布式 数据库 系统 应用 知识 总结
限制150内