第2讲 分布式数据库设计精选PPT.ppt
《第2讲 分布式数据库设计精选PPT.ppt》由会员分享,可在线阅读,更多相关《第2讲 分布式数据库设计精选PPT.ppt(85页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第2讲 分布式数据库设计第1页,此课件共85页哦内容概要内容概要pp分布式数据库系统设计内容分布式数据库系统设计内容分布式数据库系统设计内容分布式数据库系统设计内容pp分布式数据库设计目标分布式数据库设计目标分布式数据库设计目标分布式数据库设计目标pp分布式数据库设计方法分布式数据库设计方法分布式数据库设计方法分布式数据库设计方法pp自顶向下设计分布式数据库自顶向下设计分布式数据库自顶向下设计分布式数据库自顶向下设计分布式数据库pp实例研究:飞机订票系统实例研究:飞机订票系统实例研究:飞机订票系统实例研究:飞机订票系统pp自底向上设计分布式数据库自底向上设计分布式数据库自底向上设计分布式数据库
2、自底向上设计分布式数据库2022/10/72第2页,此课件共85页哦1 1 分布式数据库设计内容分布式数据库设计内容pp集中式数据库系统设计的内容包括:集中式数据库系统设计的内容包括:集中式数据库系统设计的内容包括:集中式数据库系统设计的内容包括:数据库设计数据库设计数据库设计数据库设计和围绕数据库和围绕数据库和围绕数据库和围绕数据库而展开的而展开的而展开的而展开的应用设计应用设计应用设计应用设计两个部分。分布式数据库系统设计的内容也可两个部分。分布式数据库系统设计的内容也可两个部分。分布式数据库系统设计的内容也可两个部分。分布式数据库系统设计的内容也可分为:分布式数据库的设计和围绕分布式数据
3、库而展开的应用设计分为:分布式数据库的设计和围绕分布式数据库而展开的应用设计分为:分布式数据库的设计和围绕分布式数据库而展开的应用设计分为:分布式数据库的设计和围绕分布式数据库而展开的应用设计两个部分。两个部分。两个部分。两个部分。pp分布式数据库系统的设计远比集中式数据库系统的设计复分布式数据库系统的设计远比集中式数据库系统的设计复分布式数据库系统的设计远比集中式数据库系统的设计复分布式数据库系统的设计远比集中式数据库系统的设计复杂。为了要满足应用需求和优化系统性能,需要增加站点杂。为了要满足应用需求和优化系统性能,需要增加站点杂。为了要满足应用需求和优化系统性能,需要增加站点杂。为了要满足
4、应用需求和优化系统性能,需要增加站点互联,数据和程序在站点间的优化分布等。互联,数据和程序在站点间的优化分布等。互联,数据和程序在站点间的优化分布等。互联,数据和程序在站点间的优化分布等。2022/10/73第3页,此课件共85页哦pp数据库系统设计的核心部分是数据库设计,数据库设计的主数据库系统设计的核心部分是数据库设计,数据库设计的主数据库系统设计的核心部分是数据库设计,数据库设计的主数据库系统设计的核心部分是数据库设计,数据库设计的主要问题是要问题是要问题是要问题是模式模式模式模式和和和和内模式问题内模式问题内模式问题内模式问题。这两个问题在分布式数据库中变为。这两个问题在分布式数据库中
5、变为。这两个问题在分布式数据库中变为。这两个问题在分布式数据库中变为全局模式设计全局模式设计全局模式设计全局模式设计和每个站点的和每个站点的和每个站点的和每个站点的局部数据库设计局部数据库设计局部数据库设计局部数据库设计的问题,其中的的问题,其中的的问题,其中的的问题,其中的关键问题是数据库的全局模式应如何划分,并映射到合适关键问题是数据库的全局模式应如何划分,并映射到合适关键问题是数据库的全局模式应如何划分,并映射到合适关键问题是数据库的全局模式应如何划分,并映射到合适的站点上。这就产生了分布式数据库设计所特有的两个问的站点上。这就产生了分布式数据库设计所特有的两个问的站点上。这就产生了分布
6、式数据库设计所特有的两个问的站点上。这就产生了分布式数据库设计所特有的两个问题:数据的题:数据的题:数据的题:数据的分片设计分片设计分片设计分片设计和和和和片段的位置分配设计片段的位置分配设计片段的位置分配设计片段的位置分配设计。2022/10/74第4页,此课件共85页哦分片设计研究的是全局模式分片的分片设计研究的是全局模式分片的分片设计研究的是全局模式分片的分片设计研究的是全局模式分片的“逻辑准则逻辑准则逻辑准则逻辑准则”。片段的位置分配设计研究的是处理数据在各站点上的片段的位置分配设计研究的是处理数据在各站点上的片段的位置分配设计研究的是处理数据在各站点上的片段的位置分配设计研究的是处理
7、数据在各站点上的“物理布局物理布局物理布局物理布局”。这个两个问题是相互关联的,不可能独立地解决它们而能这个两个问题是相互关联的,不可能独立地解决它们而能这个两个问题是相互关联的,不可能独立地解决它们而能这个两个问题是相互关联的,不可能独立地解决它们而能确定最优的分片和分配。确定最优的分片和分配。确定最优的分片和分配。确定最优的分片和分配。2022/10/75第5页,此课件共85页哦pp在分布式数据库系统设计中,为使分片设计和片段的位置分配设计在分布式数据库系统设计中,为使分片设计和片段的位置分配设计在分布式数据库系统设计中,为使分片设计和片段的位置分配设计在分布式数据库系统设计中,为使分片设
8、计和片段的位置分配设计得到的模式能够高效地支持应用,还要知道应用的确切要求,包括:得到的模式能够高效地支持应用,还要知道应用的确切要求,包括:得到的模式能够高效地支持应用,还要知道应用的确切要求,包括:得到的模式能够高效地支持应用,还要知道应用的确切要求,包括:各个应用的各个应用的各个应用的各个应用的“原发站点原发站点原发站点原发站点”,即发出该应用的站点。,即发出该应用的站点。,即发出该应用的站点。,即发出该应用的站点。各个应用在每个站点被激活的频率(单位时间内被激活的次数)各个应用在每个站点被激活的频率(单位时间内被激活的次数)各个应用在每个站点被激活的频率(单位时间内被激活的次数)各个应
9、用在每个站点被激活的频率(单位时间内被激活的次数)各个应用对所要求访问的每个数据对象的访问次数、类各个应用对所要求访问的每个数据对象的访问次数、类各个应用对所要求访问的每个数据对象的访问次数、类各个应用对所要求访问的每个数据对象的访问次数、类型和统计分布。型和统计分布。型和统计分布。型和统计分布。很容易获知很容易获知不太容易获知不太容易获知很难获知很难获知2022/10/76第6页,此课件共85页哦pp数据的分布情况设计会影响系统的总体性能。数据的分布情况设计会影响系统的总体性能。数据的分布情况设计会影响系统的总体性能。数据的分布情况设计会影响系统的总体性能。访问多个数据对象所需的时间和费用。
10、会因为这些数据对象访问多个数据对象所需的时间和费用。会因为这些数据对象访问多个数据对象所需的时间和费用。会因为这些数据对象访问多个数据对象所需的时间和费用。会因为这些数据对象是存放在同一站点,还是分布在多个站点有很大区别。因为是存放在同一站点,还是分布在多个站点有很大区别。因为是存放在同一站点,还是分布在多个站点有很大区别。因为是存放在同一站点,还是分布在多个站点有很大区别。因为如果分布在多个站点上,就要进行站点与站点之间的通信。如果分布在多个站点上,就要进行站点与站点之间的通信。如果分布在多个站点上,就要进行站点与站点之间的通信。如果分布在多个站点上,就要进行站点与站点之间的通信。2 2 分
11、布式数据库设计目标分布式数据库设计目标影响分布式数据库性能的因素内容影响分布式数据库性能的因素内容2022/10/77第7页,此课件共85页哦pp数据是否被复制、复制副本的多少也会影响系统的性能。数据是否被复制、复制副本的多少也会影响系统的性能。数据是否被复制、复制副本的多少也会影响系统的性能。数据是否被复制、复制副本的多少也会影响系统的性能。数据的多副本不但可以提高系统的可用性和可靠性,而且还可数据的多副本不但可以提高系统的可用性和可靠性,而且还可数据的多副本不但可以提高系统的可用性和可靠性,而且还可数据的多副本不但可以提高系统的可用性和可靠性,而且还可以提高系统处理的并发度。然而,为了维护
12、数据的一致性,对以提高系统处理的并发度。然而,为了维护数据的一致性,对以提高系统处理的并发度。然而,为了维护数据的一致性,对以提高系统处理的并发度。然而,为了维护数据的一致性,对某个数据进行更新,则需要对数据的所有副本同样进行更新。某个数据进行更新,则需要对数据的所有副本同样进行更新。某个数据进行更新,则需要对数据的所有副本同样进行更新。某个数据进行更新,则需要对数据的所有副本同样进行更新。pp分布式数据库设计者必须仔细考虑数据是否分片,片段如何复制,分布式数据库设计者必须仔细考虑数据是否分片,片段如何复制,分布式数据库设计者必须仔细考虑数据是否分片,片段如何复制,分布式数据库设计者必须仔细考
13、虑数据是否分片,片段如何复制,以及数据或片段如何分布。以及数据或片段如何分布。以及数据或片段如何分布。以及数据或片段如何分布。2022/10/78第8页,此课件共85页哦pp尽量减少对网络的利用,即尽可能地减少站点之间的通信尽量减少对网络的利用,即尽可能地减少站点之间的通信尽量减少对网络的利用,即尽可能地减少站点之间的通信尽量减少对网络的利用,即尽可能地减少站点之间的通信次数和通信量,也就是使数据和应用实现最大程度的本地次数和通信量,也就是使数据和应用实现最大程度的本地次数和通信量,也就是使数据和应用实现最大程度的本地次数和通信量,也就是使数据和应用实现最大程度的本地性。性。性。性。解决方法:
14、尽可能地使数据考性使用该数据的应用进行分配。解决方法:尽可能地使数据考性使用该数据的应用进行分配。解决方法:尽可能地使数据考性使用该数据的应用进行分配。解决方法:尽可能地使数据考性使用该数据的应用进行分配。在一个精心设计的分布式数据库中,在一个精心设计的分布式数据库中,在一个精心设计的分布式数据库中,在一个精心设计的分布式数据库中,“90%90%90%90%的数据应当在本的数据应当在本的数据应当在本的数据应当在本地站点找到,而只有地站点找到,而只有地站点找到,而只有地站点找到,而只有10%10%10%10%的数据需要在远程站点上进行访的数据需要在远程站点上进行访的数据需要在远程站点上进行访的数
15、据需要在远程站点上进行访问问问问”。设计目标设计目标2022/10/79第9页,此课件共85页哦pp控制数据的适当冗余,即为了提高系统的本地性、并发度控制数据的适当冗余,即为了提高系统的本地性、并发度控制数据的适当冗余,即为了提高系统的本地性、并发度控制数据的适当冗余,即为了提高系统的本地性、并发度和可靠性,需要增加数据的副本。和可靠性,需要增加数据的副本。和可靠性,需要增加数据的副本。和可靠性,需要增加数据的副本。冗余不仅使系统那个具有高度的可用性和本地性,也可冗余不仅使系统那个具有高度的可用性和本地性,也可冗余不仅使系统那个具有高度的可用性和本地性,也可冗余不仅使系统那个具有高度的可用性和
16、本地性,也可以使数据的任何一个副本可以从另一站点的副本中得到以使数据的任何一个副本可以从另一站点的副本中得到以使数据的任何一个副本可以从另一站点的副本中得到以使数据的任何一个副本可以从另一站点的副本中得到恢复,从而提高可靠性。恢复,从而提高可靠性。恢复,从而提高可靠性。恢复,从而提高可靠性。但是为了维护数据的一致性,减少同步更新的开销,又要控制但是为了维护数据的一致性,减少同步更新的开销,又要控制但是为了维护数据的一致性,减少同步更新的开销,又要控制但是为了维护数据的一致性,减少同步更新的开销,又要控制数据副本的增加。数据副本的增加。数据副本的增加。数据副本的增加。2022/10/710第10
17、页,此课件共85页哦pp进行工作负荷分布,目的是充分利用每个站点计算机的能力和进行工作负荷分布,目的是充分利用每个站点计算机的能力和进行工作负荷分布,目的是充分利用每个站点计算机的能力和进行工作负荷分布,目的是充分利用每个站点计算机的能力和资源,以提高应用执行的平行程度,从而提高系统的性能。资源,以提高应用执行的平行程度,从而提高系统的性能。资源,以提高应用执行的平行程度,从而提高系统的性能。资源,以提高应用执行的平行程度,从而提高系统的性能。工作负荷分布对处理本地性具有相反的影响,所以需要工作负荷分布对处理本地性具有相反的影响,所以需要工作负荷分布对处理本地性具有相反的影响,所以需要工作负荷
18、分布对处理本地性具有相反的影响,所以需要在数据分布设计时考虑到两者之间的矛盾。在数据分布设计时考虑到两者之间的矛盾。在数据分布设计时考虑到两者之间的矛盾。在数据分布设计时考虑到两者之间的矛盾。pp考虑各站点的存储能力。考虑各站点的存储能力。考虑各站点的存储能力。考虑各站点的存储能力。数据库的分布会受到各站点的存储能力的影响。数据库的分布会受到各站点的存储能力的影响。数据库的分布会受到各站点的存储能力的影响。数据库的分布会受到各站点的存储能力的影响。2022/10/711第11页,此课件共85页哦pp分布式数据库系统的创建方法有重构法和组合法两种,相分布式数据库系统的创建方法有重构法和组合法两种
19、,相分布式数据库系统的创建方法有重构法和组合法两种,相分布式数据库系统的创建方法有重构法和组合法两种,相应的分布式数据库设计方法即自顶向下方法和自底向上方应的分布式数据库设计方法即自顶向下方法和自底向上方应的分布式数据库设计方法即自顶向下方法和自底向上方应的分布式数据库设计方法即自顶向下方法和自底向上方法。法。法。法。pp自顶向下方法的设计特点:自顶向下方法的设计特点:自顶向下方法的设计特点:自顶向下方法的设计特点:一般是重新设计数据库。一般是重新设计数据库。一般是重新设计数据库。一般是重新设计数据库。首先定义数据库的全局内容,然后再对其进行分片成多个首先定义数据库的全局内容,然后再对其进行分
20、片成多个首先定义数据库的全局内容,然后再对其进行分片成多个首先定义数据库的全局内容,然后再对其进行分片成多个数据库子集,再分别定义局部数据库的模式与位置。数据库子集,再分别定义局部数据库的模式与位置。数据库子集,再分别定义局部数据库的模式与位置。数据库子集,再分别定义局部数据库的模式与位置。3 3 分布式数据库设计方法分布式数据库设计方法2022/10/712第12页,此课件共85页哦pp自底向上方法的设计特点:自底向上方法的设计特点:自底向上方法的设计特点:自底向上方法的设计特点:一般是在现有已分布的数据库基础上进行设计。一般是在现有已分布的数据库基础上进行设计。一般是在现有已分布的数据库基
21、础上进行设计。一般是在现有已分布的数据库基础上进行设计。须综合各站点的规格说明,以便得到分布式数据库的全局概念须综合各站点的规格说明,以便得到分布式数据库的全局概念须综合各站点的规格说明,以便得到分布式数据库的全局概念须综合各站点的规格说明,以便得到分布式数据库的全局概念模式。模式。模式。模式。pp在许多实际情况中,设计者都是一部分使用自顶向下方法,在许多实际情况中,设计者都是一部分使用自顶向下方法,在许多实际情况中,设计者都是一部分使用自顶向下方法,在许多实际情况中,设计者都是一部分使用自顶向下方法,另一部分又使用自底向上方法。另一部分又使用自底向上方法。另一部分又使用自底向上方法。另一部分
22、又使用自底向上方法。2022/10/713第13页,此课件共85页哦pp需求分析需求分析需求分析需求分析收集用户数据库应用的非结构规格说明,并产生一种无歧收集用户数据库应用的非结构规格说明,并产生一种无歧收集用户数据库应用的非结构规格说明,并产生一种无歧收集用户数据库应用的非结构规格说明,并产生一种无歧义的定义和在设计数据库中要考虑的元素分类。这些信息义的定义和在设计数据库中要考虑的元素分类。这些信息义的定义和在设计数据库中要考虑的元素分类。这些信息义的定义和在设计数据库中要考虑的元素分类。这些信息被收集在设计数据字典中。被收集在设计数据字典中。被收集在设计数据字典中。被收集在设计数据字典中。
23、pp概念设计概念设计概念设计概念设计有时进一步分成视图设计和视图综合,产生全局、综合数据库有时进一步分成视图设计和视图综合,产生全局、综合数据库有时进一步分成视图设计和视图综合,产生全局、综合数据库有时进一步分成视图设计和视图综合,产生全局、综合数据库模式的一种概念规格说明和在此模式上执行应用的概念规格说模式的一种概念规格说明和在此模式上执行应用的概念规格说模式的一种概念规格说明和在此模式上执行应用的概念规格说模式的一种概念规格说明和在此模式上执行应用的概念规格说明。明。明。明。4 4 自顶向下设计分布式数据库自顶向下设计分布式数据库集中式数据库自顶向下设计过程集中式数据库自顶向下设计过程20
24、22/10/714第14页,此课件共85页哦pp逻辑设计逻辑设计逻辑设计逻辑设计将综合概念模式转换成一给定的将综合概念模式转换成一给定的将综合概念模式转换成一给定的将综合概念模式转换成一给定的DBMSDBMSDBMSDBMS类型的数据库模式。类型的数据库模式。类型的数据库模式。类型的数据库模式。选择选择选择选择DBMSDBMSDBMSDBMS类型将受数据类型的要求以及应用考虑的影响。类型将受数据类型的要求以及应用考虑的影响。类型将受数据类型的要求以及应用考虑的影响。类型将受数据类型的要求以及应用考虑的影响。pp物理设计物理设计物理设计物理设计要遵照所选择的特定要遵照所选择的特定要遵照所选择的特
25、定要遵照所选择的特定DBMSDBMSDBMSDBMS的能力和特征进行,并产生实现的能力和特征进行,并产生实现的能力和特征进行,并产生实现的能力和特征进行,并产生实现数据库的物理访问结构的定义。数据库的物理访问结构的定义。数据库的物理访问结构的定义。数据库的物理访问结构的定义。2022/10/715第15页,此课件共85页哦pp在逻辑设计与物理设计之间增加分布设计。在逻辑设计与物理设计之间增加分布设计。在逻辑设计与物理设计之间增加分布设计。在逻辑设计与物理设计之间增加分布设计。以一个全局的、与站点无关的模式作为输入,以产生分布式数据库以一个全局的、与站点无关的模式作为输入,以产生分布式数据库以一
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第2讲 分布式数据库设计精选PPT 分布式 数据库 设计 精选 PPT
限制150内