第2讲 分布式数据库设计PPT讲稿.ppt
《第2讲 分布式数据库设计PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《第2讲 分布式数据库设计PPT讲稿.ppt(85页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第2讲 分布式数据库设计第1页,共85页,编辑于2022年,星期一内容概要内容概要pp分布式数据库系统设计内容分布式数据库系统设计内容分布式数据库系统设计内容分布式数据库系统设计内容pp分布式数据库设计目标分布式数据库设计目标分布式数据库设计目标分布式数据库设计目标pp分布式数据库设计方法分布式数据库设计方法分布式数据库设计方法分布式数据库设计方法pp自顶向下设计分布式数据库自顶向下设计分布式数据库自顶向下设计分布式数据库自顶向下设计分布式数据库pp实例研究:飞机订票系统实例研究:飞机订票系统实例研究:飞机订票系统实例研究:飞机订票系统pp自底向上设计分布式数据库自底向上设计分布式数据库自底向
2、上设计分布式数据库自底向上设计分布式数据库2022/10/112第2页,共85页,编辑于2022年,星期一1 1 分布式数据库设计内容分布式数据库设计内容pp集中式数据库系统设计的内容包括:集中式数据库系统设计的内容包括:集中式数据库系统设计的内容包括:集中式数据库系统设计的内容包括:数据库设计数据库设计数据库设计数据库设计和围绕数据和围绕数据和围绕数据和围绕数据库而展开的库而展开的库而展开的库而展开的应用设计应用设计应用设计应用设计两个部分。分布式数据库系统设计的内容两个部分。分布式数据库系统设计的内容两个部分。分布式数据库系统设计的内容两个部分。分布式数据库系统设计的内容也可分为:分布式数
3、据库的设计和围绕分布式数据库而展开的也可分为:分布式数据库的设计和围绕分布式数据库而展开的也可分为:分布式数据库的设计和围绕分布式数据库而展开的也可分为:分布式数据库的设计和围绕分布式数据库而展开的应用设计两个部分。应用设计两个部分。应用设计两个部分。应用设计两个部分。pp分布式数据库系统的设计远比集中式数据库系统的设计复分布式数据库系统的设计远比集中式数据库系统的设计复分布式数据库系统的设计远比集中式数据库系统的设计复分布式数据库系统的设计远比集中式数据库系统的设计复杂。为了要满足应用需求和优化系统性能,需要增加站点杂。为了要满足应用需求和优化系统性能,需要增加站点杂。为了要满足应用需求和优
4、化系统性能,需要增加站点杂。为了要满足应用需求和优化系统性能,需要增加站点互联,数据和程序在站点间的优化分布等。互联,数据和程序在站点间的优化分布等。互联,数据和程序在站点间的优化分布等。互联,数据和程序在站点间的优化分布等。2022/10/113第3页,共85页,编辑于2022年,星期一pp数据库系统设计的核心部分是数据库设计,数据库设计的数据库系统设计的核心部分是数据库设计,数据库设计的数据库系统设计的核心部分是数据库设计,数据库设计的数据库系统设计的核心部分是数据库设计,数据库设计的主要问题是主要问题是主要问题是主要问题是模式模式模式模式和和和和内模式问题内模式问题内模式问题内模式问题。
5、这两个问题在分布式数据库中。这两个问题在分布式数据库中。这两个问题在分布式数据库中。这两个问题在分布式数据库中变为变为变为变为全局模式设计全局模式设计全局模式设计全局模式设计和每个站点的和每个站点的和每个站点的和每个站点的局部数据库设计局部数据库设计局部数据库设计局部数据库设计的问题,其的问题,其的问题,其的问题,其中的关键问题是数据库的全局模式应如何划分,并映射到合适中的关键问题是数据库的全局模式应如何划分,并映射到合适中的关键问题是数据库的全局模式应如何划分,并映射到合适中的关键问题是数据库的全局模式应如何划分,并映射到合适的站点上。这就产生了分布式数据库设计所特有的两个问题:的站点上。这
6、就产生了分布式数据库设计所特有的两个问题:的站点上。这就产生了分布式数据库设计所特有的两个问题:的站点上。这就产生了分布式数据库设计所特有的两个问题:数据的数据的数据的数据的分片设计分片设计分片设计分片设计和和和和片段的位置分配设计片段的位置分配设计片段的位置分配设计片段的位置分配设计。2022/10/114第4页,共85页,编辑于2022年,星期一分片设计研究的是全局模式分片的分片设计研究的是全局模式分片的分片设计研究的是全局模式分片的分片设计研究的是全局模式分片的“逻辑准则逻辑准则逻辑准则逻辑准则”。片段的位置分配设计研究的是处理数据在各站点上的片段的位置分配设计研究的是处理数据在各站点上
7、的片段的位置分配设计研究的是处理数据在各站点上的片段的位置分配设计研究的是处理数据在各站点上的“物理布物理布物理布物理布局局局局”。这个两个问题是相互关联的,不可能独立地解决它们而能确定这个两个问题是相互关联的,不可能独立地解决它们而能确定这个两个问题是相互关联的,不可能独立地解决它们而能确定这个两个问题是相互关联的,不可能独立地解决它们而能确定最优的分片和分配。最优的分片和分配。最优的分片和分配。最优的分片和分配。2022/10/115第5页,共85页,编辑于2022年,星期一pp在分布式数据库系统设计中,为使分片设计和片段的位置在分布式数据库系统设计中,为使分片设计和片段的位置在分布式数据
8、库系统设计中,为使分片设计和片段的位置在分布式数据库系统设计中,为使分片设计和片段的位置分配设计得到的模式能够高效地支持应用,还要知道应用分配设计得到的模式能够高效地支持应用,还要知道应用分配设计得到的模式能够高效地支持应用,还要知道应用分配设计得到的模式能够高效地支持应用,还要知道应用的确切要求,包括:的确切要求,包括:的确切要求,包括:的确切要求,包括:各个应用的各个应用的各个应用的各个应用的“原发站点原发站点原发站点原发站点”,即发出该应用的站点。,即发出该应用的站点。,即发出该应用的站点。,即发出该应用的站点。各个应用在每个站点被激活的频率(单位时间内被激活的次各个应用在每个站点被激活
9、的频率(单位时间内被激活的次各个应用在每个站点被激活的频率(单位时间内被激活的次各个应用在每个站点被激活的频率(单位时间内被激活的次数)数)数)数)各个应用对所要求访问的每个数据对象的访问次数、类型和统各个应用对所要求访问的每个数据对象的访问次数、类型和统各个应用对所要求访问的每个数据对象的访问次数、类型和统各个应用对所要求访问的每个数据对象的访问次数、类型和统计分布。计分布。计分布。计分布。很容易获知很容易获知不太容易获知不太容易获知很难获知很难获知2022/10/116第6页,共85页,编辑于2022年,星期一pp数据的分布情况设计会影响系统的总体性能。数据的分布情况设计会影响系统的总体性
10、能。数据的分布情况设计会影响系统的总体性能。数据的分布情况设计会影响系统的总体性能。访问多个数据对象所需的时间和费用。会因为这些数据访问多个数据对象所需的时间和费用。会因为这些数据访问多个数据对象所需的时间和费用。会因为这些数据访问多个数据对象所需的时间和费用。会因为这些数据对象是存放在同一站点,还是分布在多个站点有很大区对象是存放在同一站点,还是分布在多个站点有很大区对象是存放在同一站点,还是分布在多个站点有很大区对象是存放在同一站点,还是分布在多个站点有很大区别。因为如果分布在多个站点上,就要进行站点与站点别。因为如果分布在多个站点上,就要进行站点与站点别。因为如果分布在多个站点上,就要进
11、行站点与站点别。因为如果分布在多个站点上,就要进行站点与站点之间的通信。之间的通信。之间的通信。之间的通信。2 2 分布式数据库设计目标分布式数据库设计目标影响分布式数据库性能的因素内容影响分布式数据库性能的因素内容2022/10/117第7页,共85页,编辑于2022年,星期一pp数据是否被复制、复制副本的多少也会影响系统的性能。数据是否被复制、复制副本的多少也会影响系统的性能。数据是否被复制、复制副本的多少也会影响系统的性能。数据是否被复制、复制副本的多少也会影响系统的性能。数据的多副本不但可以提高系统的可用性和可靠性,而且还可以数据的多副本不但可以提高系统的可用性和可靠性,而且还可以数据
12、的多副本不但可以提高系统的可用性和可靠性,而且还可以数据的多副本不但可以提高系统的可用性和可靠性,而且还可以提高系统处理的并发度。然而,为了维护数据的一致性,对某个提高系统处理的并发度。然而,为了维护数据的一致性,对某个提高系统处理的并发度。然而,为了维护数据的一致性,对某个提高系统处理的并发度。然而,为了维护数据的一致性,对某个数据进行更新,则需要对数据的所有副本同样进行更新。数据进行更新,则需要对数据的所有副本同样进行更新。数据进行更新,则需要对数据的所有副本同样进行更新。数据进行更新,则需要对数据的所有副本同样进行更新。pp分布式数据库设计者必须仔细考虑数据是否分片,片段如何分布式数据库
13、设计者必须仔细考虑数据是否分片,片段如何分布式数据库设计者必须仔细考虑数据是否分片,片段如何分布式数据库设计者必须仔细考虑数据是否分片,片段如何复制,以及数据或片段如何分布。复制,以及数据或片段如何分布。复制,以及数据或片段如何分布。复制,以及数据或片段如何分布。2022/10/118第8页,共85页,编辑于2022年,星期一pp尽量减少对网络的利用,即尽可能地减少站点之间的通信次数和尽量减少对网络的利用,即尽可能地减少站点之间的通信次数和尽量减少对网络的利用,即尽可能地减少站点之间的通信次数和尽量减少对网络的利用,即尽可能地减少站点之间的通信次数和通信量,也就是使数据和应用实现最大程度的本地
14、性。通信量,也就是使数据和应用实现最大程度的本地性。通信量,也就是使数据和应用实现最大程度的本地性。通信量,也就是使数据和应用实现最大程度的本地性。解决方法:尽可能地使数据考性使用该数据的应用进行解决方法:尽可能地使数据考性使用该数据的应用进行解决方法:尽可能地使数据考性使用该数据的应用进行解决方法:尽可能地使数据考性使用该数据的应用进行分配。在一个精心设计的分布式数据库中,分配。在一个精心设计的分布式数据库中,分配。在一个精心设计的分布式数据库中,分配。在一个精心设计的分布式数据库中,“90%90%90%90%的数据的数据的数据的数据应当在本地站点找到,而只有应当在本地站点找到,而只有应当在
15、本地站点找到,而只有应当在本地站点找到,而只有10%10%10%10%的数据需要在远程站点上的数据需要在远程站点上的数据需要在远程站点上的数据需要在远程站点上进行访问进行访问进行访问进行访问”。设计目标设计目标2022/10/119第9页,共85页,编辑于2022年,星期一pp控制数据的适当冗余,即为了提高系统的本地性、并发度和控制数据的适当冗余,即为了提高系统的本地性、并发度和控制数据的适当冗余,即为了提高系统的本地性、并发度和控制数据的适当冗余,即为了提高系统的本地性、并发度和可靠性,需要增加数据的副本。可靠性,需要增加数据的副本。可靠性,需要增加数据的副本。可靠性,需要增加数据的副本。冗
16、余不仅使系统那个具有高度的可用性和本地性,也可冗余不仅使系统那个具有高度的可用性和本地性,也可冗余不仅使系统那个具有高度的可用性和本地性,也可冗余不仅使系统那个具有高度的可用性和本地性,也可以使数据的任何一个副本可以从另一站点的副本中得到以使数据的任何一个副本可以从另一站点的副本中得到以使数据的任何一个副本可以从另一站点的副本中得到以使数据的任何一个副本可以从另一站点的副本中得到恢复,从而提高可靠性。恢复,从而提高可靠性。恢复,从而提高可靠性。恢复,从而提高可靠性。但是为了维护数据的一致性,减少同步更新的开销,又要控制但是为了维护数据的一致性,减少同步更新的开销,又要控制但是为了维护数据的一致
17、性,减少同步更新的开销,又要控制但是为了维护数据的一致性,减少同步更新的开销,又要控制数据副本的增加。数据副本的增加。数据副本的增加。数据副本的增加。2022/10/1110第10页,共85页,编辑于2022年,星期一pp进行工作负荷分布,目的是充分利用每个站点计算机的能力和资进行工作负荷分布,目的是充分利用每个站点计算机的能力和资进行工作负荷分布,目的是充分利用每个站点计算机的能力和资进行工作负荷分布,目的是充分利用每个站点计算机的能力和资源,以提高应用执行的平行程度,从而提高系统的性能。源,以提高应用执行的平行程度,从而提高系统的性能。源,以提高应用执行的平行程度,从而提高系统的性能。源,
18、以提高应用执行的平行程度,从而提高系统的性能。工作负荷分布对处理本地性具有相反的影响,所以需要在数工作负荷分布对处理本地性具有相反的影响,所以需要在数工作负荷分布对处理本地性具有相反的影响,所以需要在数工作负荷分布对处理本地性具有相反的影响,所以需要在数据分布设计时考虑到两者之间的矛盾。据分布设计时考虑到两者之间的矛盾。据分布设计时考虑到两者之间的矛盾。据分布设计时考虑到两者之间的矛盾。pp考虑各站点的存储能力。考虑各站点的存储能力。考虑各站点的存储能力。考虑各站点的存储能力。数据库的分布会受到各站点的存储能力的影响。数据库的分布会受到各站点的存储能力的影响。数据库的分布会受到各站点的存储能力
19、的影响。数据库的分布会受到各站点的存储能力的影响。2022/10/1111第11页,共85页,编辑于2022年,星期一pp分布式数据库系统的创建方法有重构法和组合法两种,相分布式数据库系统的创建方法有重构法和组合法两种,相分布式数据库系统的创建方法有重构法和组合法两种,相分布式数据库系统的创建方法有重构法和组合法两种,相应的分布式数据库设计方法即自顶向下方法和自底向上方应的分布式数据库设计方法即自顶向下方法和自底向上方应的分布式数据库设计方法即自顶向下方法和自底向上方应的分布式数据库设计方法即自顶向下方法和自底向上方法。法。法。法。pp自顶向下方法的设计特点:自顶向下方法的设计特点:自顶向下方
20、法的设计特点:自顶向下方法的设计特点:一般是重新设计数据库。一般是重新设计数据库。一般是重新设计数据库。一般是重新设计数据库。首先定义数据库的全局内容,然后再对其进行分片成多个首先定义数据库的全局内容,然后再对其进行分片成多个首先定义数据库的全局内容,然后再对其进行分片成多个首先定义数据库的全局内容,然后再对其进行分片成多个数据库子集,再分别定义局部数据库的模式与位置。数据库子集,再分别定义局部数据库的模式与位置。数据库子集,再分别定义局部数据库的模式与位置。数据库子集,再分别定义局部数据库的模式与位置。3 3 分布式数据库设计方法分布式数据库设计方法2022/10/1112第12页,共85页
21、,编辑于2022年,星期一pp自底向上方法的设计特点:自底向上方法的设计特点:自底向上方法的设计特点:自底向上方法的设计特点:一般是在现有已分布的数据库基础上进行设计。一般是在现有已分布的数据库基础上进行设计。一般是在现有已分布的数据库基础上进行设计。一般是在现有已分布的数据库基础上进行设计。须综合各站点的规格说明,以便得到分布式数据库的全局须综合各站点的规格说明,以便得到分布式数据库的全局须综合各站点的规格说明,以便得到分布式数据库的全局须综合各站点的规格说明,以便得到分布式数据库的全局概念模式。概念模式。概念模式。概念模式。pp在许多实际情况中,设计者都是一部分使用自顶向下方法,在许多实际
22、情况中,设计者都是一部分使用自顶向下方法,在许多实际情况中,设计者都是一部分使用自顶向下方法,在许多实际情况中,设计者都是一部分使用自顶向下方法,另一部分又使用自底向上方法。另一部分又使用自底向上方法。另一部分又使用自底向上方法。另一部分又使用自底向上方法。2022/10/1113第13页,共85页,编辑于2022年,星期一pp需求分析需求分析需求分析需求分析收集用户数据库应用的非结构规格说明,并产生一种无歧义的收集用户数据库应用的非结构规格说明,并产生一种无歧义的收集用户数据库应用的非结构规格说明,并产生一种无歧义的收集用户数据库应用的非结构规格说明,并产生一种无歧义的定义和在设计数据库中要
23、考虑的元素分类。这些信息被收集在定义和在设计数据库中要考虑的元素分类。这些信息被收集在定义和在设计数据库中要考虑的元素分类。这些信息被收集在定义和在设计数据库中要考虑的元素分类。这些信息被收集在设计数据字典中。设计数据字典中。设计数据字典中。设计数据字典中。pp概念设计概念设计概念设计概念设计有时进一步分成视图设计和视图综合,产生全局、综合数有时进一步分成视图设计和视图综合,产生全局、综合数有时进一步分成视图设计和视图综合,产生全局、综合数有时进一步分成视图设计和视图综合,产生全局、综合数据库模式的一种概念规格说明和在此模式上执行应用的概据库模式的一种概念规格说明和在此模式上执行应用的概据库模
24、式的一种概念规格说明和在此模式上执行应用的概据库模式的一种概念规格说明和在此模式上执行应用的概念规格说明。念规格说明。念规格说明。念规格说明。4 4 自顶向下设计分布式数据库自顶向下设计分布式数据库集中式数据库自顶向下设计过程集中式数据库自顶向下设计过程2022/10/1114第14页,共85页,编辑于2022年,星期一pp逻辑设计逻辑设计逻辑设计逻辑设计将综合概念模式转换成一给定的将综合概念模式转换成一给定的将综合概念模式转换成一给定的将综合概念模式转换成一给定的DBMSDBMSDBMSDBMS类型的数据库模式。选择类型的数据库模式。选择类型的数据库模式。选择类型的数据库模式。选择DBMSD
25、BMSDBMSDBMS类型将受数据类型的要求以及应用考虑的影响。类型将受数据类型的要求以及应用考虑的影响。类型将受数据类型的要求以及应用考虑的影响。类型将受数据类型的要求以及应用考虑的影响。pp物理设计物理设计物理设计物理设计要遵照所选择的特定要遵照所选择的特定要遵照所选择的特定要遵照所选择的特定DBMSDBMSDBMSDBMS的能力和特征进行,并产生实现数据的能力和特征进行,并产生实现数据的能力和特征进行,并产生实现数据的能力和特征进行,并产生实现数据库的物理访问结构的定义。库的物理访问结构的定义。库的物理访问结构的定义。库的物理访问结构的定义。2022/10/1115第15页,共85页,编
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第2讲 分布式数据库设计PPT讲稿 分布式 数据库 设计 PPT 讲稿
限制150内