2022年分布式数据库复习要点.docx
《2022年分布式数据库复习要点.docx》由会员分享,可在线阅读,更多相关《2022年分布式数据库复习要点.docx(24页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精品_精品资料_资料word 精心总结归纳 - - - - - - - - - - - -学习好资料欢迎下载分布式数据库复习要点第一章1、 分布式数据库的定义(P4)物理上分散而规律上集中的系统,它使用运算机网络将的理位置分散而治理和掌握又需要不同程度集中的多个规律单位(通常是集中式数据库系统)连接起来,共同组成一个统一的数据库系统.分布式数据库系统可以看成是运算机网络和数据库系统的有机结合.2、 分布式数据库的两种分类方法(P7) 按局部 DBMS 的数据模型分同构型 DDBS:各个站点上数据库使用同一数据模型同构同质型 -数据模型相同,且是同一种DBMS(同一厂家)同构异质型 -数据模型相
2、同,不是同一种DBMS异构型 DDBS :各站点上数据库的数据模型类型不同按 DDBS的全局掌握类型分全局掌握集中型DDBS:全局掌握机制和全局数据词典位于中心站点全局掌握分散型DDBS:全局掌握机制和全局数据词典分散在网络的各个站点上.全局掌握可变型DDBS:也称主从型DDBS.分成两组站点,一组包含全局掌握机制和全局掌握词典, 另外一组不包含.3、分布式数据库的组成成分(两部分)(P9)数据:分布式数据库的主体,包括局部数据和全局数据.数据目录:数据结构的定义、全局数据的分片、分布、授权、事务复原等描述,包括局部和全局数据目录.4、 分布式数据库的数据分片的定义和类型(3 种)( P10)
3、数据分片:又称数据分割、数据分段,局部数据库是由全局数据库分割而成.三种类型:水平分片: 按特定条件把全局关系的全部元组划分成如干个互不相交的子集,对全局关系施加挑选运算.垂直分片:把全局关系的属性集分成如干个子集,对全局关系施加投影运算.混合分片:以上两种方法的混合.5、 分布式数据库的分布策略(4 条)( P11)数据分布:依据某种策略把数据分片所得的规律片断分散的储备在各个站点上.集中式:全部数据都支配在同一站点上分割式:全部数据只有一份,被分割成如干个规律片段,每个片段被放置在特定的站点复制式:全部数据有多个副本,每个站点都有一个完整的数据副本混合式:分割式和复制式的混合可编辑资料 -
4、 - - 欢迎下载精品_精品资料_学习资料 名师精选 - - - - - - - - - -第 1 页,共 12 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品_精品资料_资料word 精心总结归纳 - - - - - - - - - - - -学习好资料欢迎下载6、 分布式数据库的模式结构(P13) 分四层:全局外层: 全局外模式-全局应用的用户视图.全局概念层: 全局概念模式-描述全局数据的规律结构和数据特性.分片模式-描述全局数据 的规律划分.安排模式-依据数据分布策略,定义各片段的物理存放站点.局部概念层: 局部概念模式-各个站点上全部物理映像的集合.局
5、部内层: 局部内模式-全局 / 本站点数据在本站点的储备描述.7、 分布式数据库的功能模块(P.16-17) 查询处理模块:任务是削减查询处理的代价完整性处理模块:负责爱护数据库的完整性和一样性调度处理模块:发布局部处理命令,治理数据传输牢靠性处理模块:负责监视系统的各个部分是否有故障显现.8、 分布透亮性的层次(三层P.25-26)分布透亮性也叫分布独立性,包括三个层次:分片透亮性:用户编写应用程序只对全局关系进行操作,不必考虑数据的规律分片.位置透亮性:也叫安排透亮性.用户编写应用程序需要明白数据分片情形,但不必明白副本和各片段的站点位置情形.局部数据模型透亮性:不必明白站点上数据库的数据
6、模型及其数据对象的表示性质.其次章DDB 设计1、DDB 设计的两个方法P39-40自顶向下:(对应于DDB 创建方法中的重构法)从头开头设计分布式数据库.依据系统的实现环境和用户需求,依据分布式数据库系统的设计思想和方法,采纳统一的观点,从总体设计做起,包括各站点上的数据库系统,重新建立一个DDBS.可以有效解决数据一样性、完整性 和牢靠性问题.通常是同构异质或者同构同质的.自底向上:(对应于DDB 创建方法中的组合法)通过集合现存数据库来设计分布式数据库.利用现有的运算机网络和独立存在于各个站点上的现存数据库系统,通过建立一个分布式和谐 治理系统,将它们集成为一个统一的DDBS.通常是异构
7、或者同构异质.2、 DATAID-D 方法 P52这是自顶向下设计分布式数据库的一个典型方法,增加的两个阶段:分布要求分析阶段输入:用户分布要求、全局数据概念模型、全局数据操作模式.输出:频率表(各个站点每一应用激活次数)、划分表(各实体的潜在水平分片规章)、极化表(由一个站点发出的一给定应用拜访一给定片段的频率).分布设计阶段 分片设计:对实体进行水平分片和垂直分片.可编辑资料 - - - 欢迎下载精品_精品资料_学习资料 名师精选 - - - - - - - - - -第 2 页,共 12 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品_精品资料_资料wor
8、d 精心总结归纳 - - - - - - - - - - - -学习好资料欢迎下载 非冗余安排:利用正确适应法,把各片段映射到使用最多的站点上. 冗余安排:起初使用非冗余安排,在每次迭代时,运算因增加一副本使其变成本的拜访的得益与为爱护该副本一样性所需要附加远程修改的缺失之差值,假如是个整数,就把该副本储备到该得益站点. 局部模式的重新构造:重新构造片段安排站点上的局部模式.3、数据片断安排法P50,同时参见 PPT相关部分4、DATAID方法的应用P55,同时参见 PPT 相关部分第三章分布式查询处理和优化1、 关系代数学问,并能进行实例运算,类似习题3.6 的运算要明白 (重点 PPT上例
9、题)2、 查询树 , 查询变换 , 限定关系等定义查询树: 将一个查询的关系代数表达式进行语法分析得到一颗语法树:叶子节点是查询涉及的关系,各个节点是关系代数操作符,根节点是查询结果.语法树又称查询树.查询变换:从全局查询到片段查询的变换?限定关系 : R:QR 称为 R 的限定关系,其中QR 表示查询.规律片段就是一个限定关系.city= londonSupplier 的限定关系 : Supplier:city= london 3、 基于关系代数等价变换的查询优化实例(重点看P80-82)基本原理:把查询问题转换为关系表达式.关系表达式到查询树(语法树)的变换.全局查询到片段查询的变换(把全
10、局查询树中的全局关系名,用重构该全局关系的各片段名替换,变换成相应片段上的查询树).利用关系代数等价变换规章的优化算法,尽可能先执行挑选和投影操作.4、 基于半连接的算法的查询优化的操作过程和代价估算(83-84) (重点看 PPT例题)5、 基于直接连接算法的查询优化处理的四种方法,重点1、2、4 算法. 重点看书 P85站点依靠: 假如两个关系不同站点的分片在属性A 上没有交集 (说明它们之间连接结果为空,只进行本站点片段连接再合并就够了),就可以只在同一站点上做片段连接操作,然后合并连接结果.分片和复制:假如不符合站点依靠的条件,就挑选一组站点,把查询引用的某个关系的全部片段分布到这些站
11、点上,其余被引用关系就复制到每个选定站点中去,这样在每个站点进行本的连接,再合并结果,必定会掩盖到全部该连接的元组(由于每一个站点都有另一个关系的完全副本).Hash 划分:假如两个关系不符合站点依靠的条件,利用Hash 函数对分片关系上的连接属性作站点依靠运算,再据此分片,比如按连接属性取值为奇偶数来把元组发送到不同站点,这样分片后两个关系必定就满意站点依靠条件,再进行本的连接.这实际是构造站点依靠的一种方法.第四章分布式数据库中的事务治理和复原1、分布式事务的定义和特性P97可编辑资料 - - - 欢迎下载精品_精品资料_学习资料 名师精选 - - - - - - - - - -第 3 页
12、,共 12 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品_精品资料_资料word 精心总结归纳 - - - - - - - - - - - -学习好资料欢迎下载定义:事务是拜访数据库的最小规律工作单位,它是一个操作序列.分布式事务是一个分布式操作的序列,被操作的数据分布在不同站点上.ACID特性:原子性( Atomicity ):事务的操作要么全部执行, 要么全部不执行,保证数据库一样性状态.一样性( Consistency):事务的正确性.并发执行的多个事务,其操作的结果应与以某种次序串行执行这几个事务所得的结果相同.长久性( Durability ):事务
13、提交后, 其操作的结果将永久化, 与提交后发生的故障无关. 隔离性(Isolation ):事务在提交前,决不答应把它对共享数据所作转变的结果供应应其他事务使用.2、分布式事务的结构P99(一个应用由如干个分布式事务组成,每个分布式事务由不同站点的如干子事务组成)分布式事务的一般结构:Begin Transaction 原语:开头一个事务T1T2: 子事务或操作序列: TnCommit 原语:事务胜利完成的终止Rollback 或 Abort 原语:事务失败的终止3、 分布式事务执行的掌握模型(三种)P105分布式事务掌握模型是指和谐分布式事务中各成员DBMS 执行其子事务的通用方法,有三种:
14、主从模型:分布式事务治理器作为主掌握器,局部事务治理器(LTM)作为从属掌握器,LTM 之间无通信.三角模型:掌握权是分布式事务治理器和LTM 之间共享的. LTM 之间可以传递数据,防止了主从之间不必要的传输.层次掌握模型:LTM 仍可再创建 Agent,掌握其它LTM 执行,比前两种复杂. 4、事务复原的概念P108当发生故障时,保证事务原子性的措施称为事务故障复原,简称事务复原,主要依靠日志来实现.5、事务的状态和状态转移P109事务在执行过程中的状态变化:事务开头后立刻进入活动状态,可以进行读写操作.事务终止时进入部分提交状态.事务到达提交点时进入提交状态.假如检查出故障或者事务在活动
15、状态期间被撤销,就进入故障状态.终止状态说明事务已经离开系统.6、本的事务复原的过程(P.112)本的事务复原的过程类似于集中式数据库系统中事务的复原:可编辑资料 - - - 欢迎下载精品_精品资料_学习资料 名师精选 - - - - - - - - - -第 4 页,共 12 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品_精品资料_资料word 精心总结归纳 - - - - - - - - - - - -学习好资料欢迎下载1)从“重启动文件”读出最近 Checkpoint 的的址 , 定出 Checkpoint 在 Log 文件中的位置. (找最近的检查点)
16、2) 创建 Redo 表(初态为空).创建Undo 表即 Checkpoint Record 中的活动事务表. 3) 从 Checkpoint Record 起沿 log 向前检索,遇到begin transaction 的 log 记录,其对应的事务记入 Undo 表.遇到 commit 的 log 记录, 其对应事务从UNDO 表移入 Redo 表,直至 log完. (在 Undo 表和 Redo 表中加响应的事务) 4) 反向检索 Log, 将 Undo 表中事务 , 按 log 记录的操作,做Undo,直到遇到对应的BeginTransaction . ( 执 行 Undo) 5)从
17、Checkpoint Record 起正向检索 Redo表中事务的 Log 记录 , 并执行之 , 直到对应的 Commit记录.(执行 Redo) 7、两阶段提交协议定义和原就(P115-116)将本的原子性提交行为的成效扩展到分布式事务, 保证了分布式事务提交的原子性.基本思想是:坚持在分布式事务结果生效之前,全部参加执行分布式事务的站点都同意提交.(2PC把提交过程分为两个阶段:表决阶段 目的是形成共同的打算.执行阶段 目的是实现这个打算.)全局提交规章:只要至少有一个参加者撤销事务,和谐者就必需做出全局撤销的打算.只有全部参加者都同意提交事务,和谐者才能做出全局提交的打算.8、两阶段提
18、交协议的通信结构(P117,仍是把 ppt 上图看一下). 集中式:通信只发生在和谐者和参加者之间,参加者之间不交换信息. 分层式:和谐者是在树根的DTM 代理者,和谐者与参加者之间的通信不使用直接广播,而是使用报文在树中上下传播.每个 DTM 代理是通信树的一个内部节点,它从下层节点处收集报文或向它们广播报文. 线性:参加者之间可以相互通信.系统中的站点间要排序,消息串行传递. 分布式:答应全部参加者在第一阶段相互通信,从而可以独立做出事务终止打算.9、主文本更新法分布式数据库中数据更新方法之一.指定一个副本为主文本, 更新时只对主文本进行.然后由主文本站点将主文本更新内容准时发送到各辅文本
19、站点,各辅文本的更新可以并行进行.问题 -更新传播必需在短时间内完成 , 否就将获得“过时”数据.主文本不行用 , 将引起其它辅文本也不行用.改进方法 -移动主文本法.第五章分布式数据库中的并发掌握1、并发掌握的定义P131并发掌握就是负责正确和谐并发事务的执行,保证并发存取操作不至于破坏数据库的完整性和一样性,确保并发执行的多个事务能够正确的运行并获得正确的结果.2、串行调度、可串行化调度和一样性调度的定义P133可编辑资料 - - - 欢迎下载精品_精品资料_学习资料 名师精选 - - - - - - - - - -第 5 页,共 12 页 - - - - - - - - - -可编辑资料
20、 - - - 欢迎下载精品_精品资料_资料word 精心总结归纳 - - - - - - - - - - - -学习好资料欢迎下载. 串行调度:如一个调度S,其每个事务的执行均有TiTj,即事务 Ti 的全部操作都先于事务Tj的操作,每个事务相继执行,这样的调度S 为称串行调度. 可串行化调度:假如一个调度等价于某个串行调度,就该调度称为可串行化调度. 一样性调度:执行一个调度可以使得数据库从一个一样性状态转变为另一个一样性状态,就称调度为一样性调度. 事务的可串行性:如干个事务并发执行的结果与按期望那个的次序执行的结果相同时,称诸事务是可串行的.3、并发掌握算法的分类P140并发掌握机制分为
21、两种类型:悲观算法和乐观算法.悲观算法使事务的并发执行在执行生命周期的开头就同步化,而乐观算法将同步化推迟到事务执行周期的终止.4、基于封锁的并发掌握算法P141基本思想:事务拜访数据项之前要对该数据项加锁,假如已经被其他事务加锁,就要等待,直到那个事务释放该锁为止.5、封锁粒度、锁的类型P141锁的粒度:锁定数据项的范畴.锁粒度小,并发度高,锁开销大.包括以下几个层次:. 数据库记录中的一个字段值. 一条数据库记录. 一个磁盘块(页面). 一个完整的文件. 整个数据库锁的类型:共享锁: Share 锁, S 锁或者读锁排它锁: eXclusive 锁, X 锁,拒绝锁或写锁更新锁: Upda
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年分布式数据库复习要点 2022 年分 数据库 复习 要点
限制150内