分布式数据库系统的设计精选PPT.ppt
《分布式数据库系统的设计精选PPT.ppt》由会员分享,可在线阅读,更多相关《分布式数据库系统的设计精选PPT.ppt(60页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、分布式数据库系统的设计1 1第1页,此课件共60页哦课本知识目录2.1 分布式数据库系统设计概述2.5 自底向上设计分布式数据库2.2 自顶向下设计分布式数据库2.3 DATAID-D方法2.4 实例研究:飞机订票系统2 2第2页,此课件共60页哦2.1分布式数据库系统设计概述1 分布式数据库系统定义2 分布式数据库设计的目标3 分布式数据库系统设计的内容4 分布式数据库系统的创建方法5 分布式数据库设计的方法3 3第3页,此课件共60页哦2.1.1分布式数据库系统定义分布式数据库系统中的数据是物理分布在用计算机网络连接起来的各个站点上;每一个站点是一个集中式数据库系统,都有自治处理的能力,完
2、成本站点的局部应用;而每个站点上的数据并不是互不相关的,它们构成一个逻辑整体,统一在分布数据库管理下,共同参与并完成全局应用,并且分布式数据库系统中的这种“分布”对用户来说是透明的,也就是说,本地与远程结合的“接缝”是被隐蔽的,用户几乎感觉不到远程与本地结合的接缝的存在,即“一个分布式系统应该看起来完全像一个非分布系统”。4 4第4页,此课件共60页哦2.1.2分布式系统设计的目标1 分布式数据库的本地性或近地性 尽可能减少站点之间的通信次数和通信量2 控制数据的适当冗余 考虑到本地性,并发性,可靠性,一致性,开销等3 工作负荷分布 充分利用每个站点计算机的能力和资源提高性能4 存储的能力和费
3、用5 5第5页,此课件共60页哦2.1.3分布式数据库系统设计的内容相类似于集中式数据库设计:数据库+应用数据库设计:全局模式设计+局部模式设计关键点:全局模式如何划分并映射到站点新设计问题:数据的分片、片段的位置分配需求增加:各个应用的发出点/各个应用在每个站点被激活 的频率/各个应用对访问对象的每个数据对象的访问次 数,类型和统计分析6 6第6页,此课件共60页哦2.1.4分布式数据库系统的创建方法组合法:自底向上的创建方法7 7第7页,此课件共60页哦2.1.4分布式数据库系统的创建方法重构法:自顶向下的创建方法8 8第8页,此课件共60页哦2.1.5分布式数据库设计的方法自顶向下方法:
4、从头开始设计自底向上方法:聚集现存数据库然而!许多情况下,设计者都是一部分使用自顶向下方法,另一部分使用自底向上方法GO ON:分别详述这些方法9 9第9页,此课件共60页哦2.2自底向上设计分布式数据库1 构造全局模式的设计问题2 构造全局模式的解决方法3 自底向上综合的一个示例1010第10页,此课件共60页哦2.2.1构造全局模式的设计问题在异构分布式数据库设计中特别重要:1 选择公有数据库模型来描述数据库的全局 模式2 把每个站点上的本地模式翻译成公有的数据模型3 把各站点上本地数据模式集成一个公有的全局模式1111第11页,此课件共60页哦2.2.2构造全局模式的解决方法1 识别相似
5、性2 识别冲突:命名冲突/域差异/定标差异/结构差异3 处理操作期间的不一致性4 经典解法是生成三个实体:一个具有共同属性 另两个具有非相交属性1212第12页,此课件共60页哦2.2.3自底向上综合的一个示例问题:假设已存在两个飞机订票系统A和B,可供查询各自班机的可用情况。二者有不同的概念模型。现需要将这两个系统合为一个分布式数据库系统,以便从两个公司的任一办公室能查询班机的可用情况。结果:综合后建立起来的全局模式中,有一个概括分层被用来表示两个子类型班机A和班机B。值得注意的是,对两个局部模式,应以不同的方法翻译一个需要有关班机从一给定机场起飞的信息的查询。1313第13页,此课件共60
6、页哦2.2.3自底向上综合的一个示例1414第14页,此课件共60页哦2.2.3自底向上综合的一个示例1515第15页,此课件共60页哦2.2.3自底向上综合的一个示例1616第16页,此课件共60页哦2.3自顶向下设计分布式数据库1 自顶向下设计分布式数据库的步骤和内容2 数据的分片设计3 数据库片段的位置分配设计1717第17页,此课件共60页哦2.3.1步骤和内容集中式:需求分析 概念设计 逻辑设计 物理设计分布设计:位于逻辑设计与物理设计之间,以一个全局的与站点无关的模式作为输入,以产生分布式数据库各站点的子模式为结果输出,包括数据的分片设计和片段的位置分配设计分片:把一全局对象(实体
7、或关系)细分成若干逻辑片段的过程分配:把各片段映射到一个或多个站点的过程,片段是最合适的数据分配单位1818第18页,此课件共60页哦2.3.2数据的分片设计基本目标:产生一个对全局数据合适的划分方案。这种方案得到的片段作为分布式数据库中数据的分配和存储单位,不但能够减少应用中的操作量,而且能够对于应用具有最大可能的本地性,即使得各片段位于其使用最多的站点,或者说,使用绝大多数应用所使用的数据位于该应用的原发始点。当分片的好处太小,不足以补偿分片造成的开销时,不必要分片1919第19页,此课件共60页哦分片方法:水平分片 垂直分片 混合分片遵守规则:完整性 可重构 不相交 水平分片:对全局关系
8、执行“选择”操作,可以具体分为初始分片和导出分片两种垂直分片:对全局关系执行“投影”操作,组之间必须只在某个键属性上重叠,而垂直群集的组在其他属性上也可以重叠2.3.2数据的分片设计2020第20页,此课件共60页哦数据片段位置分配的方法1 非冗余分配:估算每种分配后选择最佳冗余分配:2 所有得益站点法:非复制问题的解+若干唯一复本3 附加复制法:非复制问题的解+从最有益处起逐步附加复本,直至无明显好处2.3.3数据库片段的位置分配设计2121第21页,此课件共60页哦数据片段分配的费用和得益估算假定i 表示片段的下标 j 表示站点的下标k 表示应用的下标 Fkj 表示应用k在站点j上被激活的
9、频率Rki 表示应用k被激活一次,对片段i进行检索访问的次数Uki表示应用k被激活一次,对片段i进行更新访问的次数Nki=Rki+Uki表示应用k被激活一次,访问片段i的总次数2.3.3数据库片段的位置分配设计2222第22页,此课件共60页哦水平分片情况1 非冗余分配:将片段分配到访问次数最多的站点2.3.3数据库片段的位置分配设计2 所有得益站点:本站点的应用的检索访问费用总比任何一个其他站点发出的应用对该片段进行更新访问的费用要低3 附加复制法:Dj表示片段Ri冗余度;Fi表示Ri在每个站点都复制的得益2323第23页,此课件共60页哦2.3.3数据库片段的位置分配设计垂直分片情况假定把
10、站点r上的关系R垂直分成两个片段Rs和Rt,并将Rs和Rt分别分配在站点S和t,然后将应用分组并估算它们的利益情况2424第24页,此课件共60页哦2.3.3数据库片段的位置分配设计垂直分片情况1 应用组As:自站点s发出,它们只使用Rs,因而是本地应用,得益2 应用组At:自站点t发出,它们只使用Rt,因而是本地应用,得益 3 应用组A1:自r发出,原使用Rt或Rs,现在需要一次额外的远程访问,损失:4 应用组A2:自r发出,原来使用R,现在需要两次额外的远程访问,损失:5 应用组A3:与r,s,t不同,访问Rs和Rt,现需一次额外的远程访问,损失:2525第25页,此课件共60页哦2.3.
11、3数据库片段的位置分配设计垂直群集情况与垂直分片的情况类似,只是要注意检索及更新要同时涉及到Rs和Rt了GO ON:详述自顶向下法中的一个具体方法:DATAID-D方法以飞机订票系统为例讲述分布式数据库系统设计2626第26页,此课件共60页哦2.4 DATAID-D 方法2.4.1 DATAID-D方法概述2.4.2 分布要求分析阶段2.4.3 分布设计阶段2727第27页,此课件共60页哦2.4.1 DATAID-D方法概述是自顶向下设计分布式数据库的一个典型方法,由意大利米兰工业大学提出作为集中式数据库设计DATAID-1方法论的扩充而构造的集中式数据库设计的四个阶段需求分析,概念设计,
12、逻辑设计和物理设计增加两个阶段:分布要求分析阶段和分布设计阶段2828第28页,此课件共60页哦DATAID-D 方法的分布式数据库设计步骤2929第29页,此课件共60页哦主要设计步骤简要概述需求分析 需求分析简单地说就是分析用户的要求概念设计 将需求分析得到的用户需求抽象为信息结构 即概念结构设计,如画-图逻辑设计 将E-R图转换为相应的数据模型相符合的 逻辑结构,如关系模型3030第30页,此课件共60页哦主要设计步骤简要概述物理设计 确定数据库的物理结构;对物理结构进行评价分布要求分析 收集关于分布的信息,如水平分片的划分谓词 每一应用在各站点激活的频率等分布设计 产生全局数据的分片模
13、式和片段的位置分配模 式,分配模式描述了分配在各站点上的数据情况3131第31页,此课件共60页哦2.4.2 分布要求分析阶段目的:收集以后用于推动分布设计所需要的信息输入:用户对分布的要求和全局数据概念模型与操作模式输出:应用的频率表,实体的划分表和数据与应用的极化表3232第32页,此课件共60页哦三种类型的表1.1.频率表频率表给出各给出各站点站点上每上每一应用一应用激活次数这里假设所有应用在激活次数这里假设所有应用在所有站点上都有可能执行所有站点上都有可能执行2.2.划分表划分表指明可使用于模式中各指明可使用于模式中各实体实体的潜在水平分片规则的潜在水平分片规则3.3.极化表极化表基于
14、定量分析方法来说明分片如何影响着应用处理的本地性基于定量分析方法来说明分片如何影响着应用处理的本地性一个极化值表指明由一给定一个极化值表指明由一给定站点站点发出的一给定发出的一给定应用应用访问一给访问一给定定片段片段的概率的概率3333第33页,此课件共60页哦2.4.3分布设计阶段目标:从全局数据模式,逻辑访问表和分布要求出发,将数据分配在站点上输出:各站点的逻辑模式和逻辑访问表包括四个阶段:分片设计,非冗余分配,冗余分配和局部模式的重新构造3434第34页,此课件共60页哦分片设计分片设计对实体进行水平分片和垂直分片,以便为以后设计阶段确定可能的分配单位要使每一片段是一个合适的分配单位,就
15、必须保证由各站点上执行的各应用,大约以同一方式(即相同频率)访问在片段中的事例(元组)分片设计主要包括逻辑判定,进行逻辑判定时,从极化表中选择某些谓词,并用它们定义逻辑片段3535第35页,此课件共60页哦目标目标:是把各片段映射到使用该片段最多的站点上问题问题:如何识别最频繁访问该片段的站点?方法方法:根据频率表与极化表,采用“最佳适应法”,令Fij应用i使用站点j的频率;Pijk应用i使用站点j时片段k的极化值于是从站点j访问片段k的次数给出如下:因此,片段k被分配到站点j,使得非冗余分配3636第36页,此课件共60页哦冗余分配冗余分配的执行是使用“贪婪”启发式,可以采用上面已经阐述过的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分布式 数据库 系统 设计 精选 PPT
限制150内