哈工大数据库课件-第七讲数据库系统体系结构.ppt
《哈工大数据库课件-第七讲数据库系统体系结构.ppt》由会员分享,可在线阅读,更多相关《哈工大数据库课件-第七讲数据库系统体系结构.ppt(88页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、n n教学目的教学目的教学目的教学目的n n本本本本章章章章在在在在一一一一个个个个更更更更高高高高的的的的层层层层次次次次上上上上认认认认识识识识数数数数据据据据库库库库系系系系统统统统,首首首首先先先先简简简简要要要要介介介介绍绍绍绍一一一一下下下下数数数数据据据据库库库库的的的的存存存存储储储储结结结结构构构构,然然然然后后后后从从从从传传传传统统统统的的的的集集集集中中中中式式式式系系系系统统统统开开开开始始始始,依依依依次次次次讨讨讨讨论论论论客客客客户户户户-服服服服务务务务器器器器系系系系统统统统、并并并并行行行行数数数数据据据据库库库库系系系系统统统统和和和和分分分分布布布布式
2、式式式数数数数据据据据库库库库系系系系统统统统,使使使使学学学学生生生生了了了了解解解解如如如如何何何何根根根根据不同的计算环境搭建与之相适应的数据库系统。据不同的计算环境搭建与之相适应的数据库系统。据不同的计算环境搭建与之相适应的数据库系统。据不同的计算环境搭建与之相适应的数据库系统。n n主要内容主要内容主要内容主要内容n n数数数数据据据据存存存存储储储储,数数数数据据据据库库库库系系系系统统统统体体体体系系系系结结结结构构构构概概概概述述述述,集集集集中中中中式式式式数数数数据据据据库库库库系系系系统统统统,数据库系统,并行数据库系统,分布式数据库系统数据库系统,并行数据库系统,分布式
3、数据库系统数据库系统,并行数据库系统,分布式数据库系统数据库系统,并行数据库系统,分布式数据库系统n n教学方法教学方法教学方法教学方法n n课堂讲授为主课堂讲授为主课堂讲授为主课堂讲授为主n n重点重点重点重点n n集集集集中中中中式式式式数数数数据据据据库库库库系系系系统统统统、数数数数据据据据库库库库系系系系统统统统、并并并并行行行行数数数数据据据据库库库库系系系系统统统统、分分分分布布布布式式式式数据库系统的概念及特点,分布式查询处理数据库系统的概念及特点,分布式查询处理数据库系统的概念及特点,分布式查询处理数据库系统的概念及特点,分布式查询处理n n难点难点难点难点n n分布式查询处
4、理分布式查询处理分布式查询处理分布式查询处理第七章第七章 数据库系统体系结构数据库系统体系结构第七章第七章 数据库系统体系结构数据库系统体系结构内容出处:内容出处:1.Abraham Silberschatz1.Abraham Silberschatz数据库系统概念数据库系统概念第十一第十一章章1-31-3节,第十八章,第十九章节,第十八章,第十九章2 2,7 7节节物理存储介质物理存储介质n n特性n n数据存取速度数据存取速度n n每单位数据的成本每单位数据的成本n n可靠性可靠性n n电源故障或系统崩溃时的数据丢失电源故障或系统崩溃时的数据丢失n n介质故障介质故障n n介质分类n n易
5、失介质(易失介质(volatile storagevolatile storage)n n电源关时数据丢失电源关时数据丢失n n非易失介质(非易失介质(non-volatile storagenon-volatile storage)n n电源关时数据持久保留,包括二级和三级存储电源关时数据持久保留,包括二级和三级存储物理存储介质物理存储介质n n高速缓冲存储器(Cache)n n最快最昂贵的存储介质,一般由操作系统来管理最快最昂贵的存储介质,一般由操作系统来管理n n主存储器(Main memory)n n用于存放可被处理的数据的存储介质用于存放可被处理的数据的存储介质n n快速访问,但一般
6、不能存放整个数据库快速访问,但一般不能存放整个数据库n n如如果果发发生生电电源源故故障障或或系系统统崩崩溃溃,主主存存储储器器中中的的数数据会丢失据会丢失n n快闪存储器(Flash memory)n nEEPROMEEPROM:电可擦可编程只读存储器电可擦可编程只读存储器n n电源故障时数据会保存电源故障时数据会保存n n读速度:读速度:0.10.1s;s;写速度:写速度:1010s s物理存储介质物理存储介质n n磁盘存储器(Magnetic-disk storage)n n用于长期联机数据存储用于长期联机数据存储n n一般存放整个数据库一般存放整个数据库n n数据必须从磁盘移入主存才能
7、访问数据必须从磁盘移入主存才能访问n n直接存取直接存取(direct-accessdirect-accessdirect-accessdirect-access)n n按任意顺序存取数据按任意顺序存取数据n n如果发生电源故障或系统崩溃,数据不会丢失如果发生电源故障或系统崩溃,数据不会丢失n n光盘存储(Optical storage)n nCD-ROMCD-ROM:只读,提供预先记录的数据只读,提供预先记录的数据n nWORMWORM:一次写,多次读,用于数据归档一次写,多次读,用于数据归档物理存储介质物理存储介质n n磁带存储(Tape storage)n n用于数据的备份和归档用于数据
8、的备份和归档n n顺序访问(顺序访问(sequential-accesssequential-access)n n速度慢速度慢n n容量大容量大n n价格低价格低存储层次存储层次基本存储基本存储辅助存储辅助存储三级存储三级存储易失性存储易失性存储非易失非易失性存储性存储存储层次存储层次n n基本存储(primary storage)n n快速但易失快速但易失n ncache,main memorycache,main memoryn n辅助存储(secondary storage)n n非易失,相对快速非易失,相对快速 n n联机存储(联机存储(on-line storageon-line s
9、torage)n nflash memory,magnetic disksflash memory,magnetic disksn n三级存储(tertiary storage)n n非易失,速度慢相对快速非易失,速度慢相对快速n n脱机存储(脱机存储(off-line storageoff-line storage)n nmagnetic tape,optical storagemagnetic tape,optical storage磁盘结构磁盘结构磁盘性能估计磁盘性能估计n n访问时间访问时间n n从发出请求到数据开始传输之间的时间从发出请求到数据开始传输之间的时间n n寻道时间寻道时间
10、(Seek timeSeek time)n n磁盘臂定位时间,即磁盘臂移动到正确的磁道所需时间磁盘臂定位时间,即磁盘臂移动到正确的磁道所需时间n n与移动距离成正比,平均寻道时间是最坏时间的与移动距离成正比,平均寻道时间是最坏时间的1/31/3n n旋转等待时间旋转等待时间(Rotational latency Rotational latency)n n寻道结束后,等待被存取的扇区出现在读写头下面的时间寻道结束后,等待被存取的扇区出现在读写头下面的时间n n平均旋转等待时间是磁盘旋转一周时间的平均旋转等待时间是磁盘旋转一周时间的1/21/2n n数据传输率数据传输率n n从磁盘获得数据或向磁
11、盘存储数据的速率从磁盘获得数据或向磁盘存储数据的速率n n平均故障时间(平均故障时间(MTTFMTTF)n n预期系统无故障连续运行的时间预期系统无故障连续运行的时间n n是指基于全新磁盘发生故障的可能性是指基于全新磁盘发生故障的可能性RAIDRAIDn n廉价磁盘冗余阵列(RAID)n nRedundant Arrays of Inexpensive DisksRedundant Arrays of Inexpensive Disksn n是一种利用大量廉价磁盘进行磁盘组织的技术是一种利用大量廉价磁盘进行磁盘组织的技术n n价价格格上上,大大量量廉廉价价的的磁磁盘盘比比少少量量昂昂贵贵的的大
12、大磁磁盘盘合合算得多算得多n n性能性能上,使用大量磁盘可以提高数据的并行存取上,使用大量磁盘可以提高数据的并行存取n n可可靠靠性性上上,冗冗余余数数据据可可以以存存放放在在多多个个磁磁盘盘上上,因因此一个磁盘的故障不会导致数据丢失此一个磁盘的故障不会导致数据丢失n n过过去去RAIDRAID是是大大而而昂昂贵贵的的磁磁盘盘的的替替代代方方法法;今今天天,使使用用RAIDRAID是是因因为为它它的的高高可可靠靠性性和和高高数数据据传传输输率率;因此因此“I”“I”代表代表independentindependent,而非而非inexpensiveinexpensiveRAIDRAIDn n通
13、过冗余提高可靠性通过冗余提高可靠性n nNN个个磁磁盘盘组组成成的的集集合合中中某某个个磁磁盘盘发发生生故故障障的的概概率率比比特特定定的的单个磁盘发生故障的概率高很多单个磁盘发生故障的概率高很多 n n假假定定单单个个磁磁盘盘的的MTTFMTTF是是100,000100,000小小时时 (约约为为1111年年),则则由由100100个磁盘组成的阵列的个磁盘组成的阵列的MTTFMTTF是是10001000小时小时(约为约为4141天天)n n冗余(冗余(RedundancyRedundancy)n n存储额外的信息,以便当磁盘故障时能从中重建存储额外的信息,以便当磁盘故障时能从中重建n n镜像
14、镜像(Mirroring or shadowing)(Mirroring or shadowing)n n一个逻辑磁盘由两个物理磁盘组成,写操作在每个磁盘上执行一个逻辑磁盘由两个物理磁盘组成,写操作在每个磁盘上执行n n如果其中一个发生故障,数据可以从另一个磁盘读出如果其中一个发生故障,数据可以从另一个磁盘读出n n只只有有第第一一个个磁磁盘盘的的故故障障尚尚未未恢恢复复,第第二二个个磁磁盘盘也也发发生生故故障障,这这时时才才会发生数据丢失会发生数据丢失n n假假定定一一个个磁磁盘盘的的MTTFMTTF是是100,000100,000小小时时,修修复复时时间间是是1010小小时时,则则镜镜像像
15、磁磁盘盘系系统统的的MTTFMTTF是是100,000100,0002 2/(2*102*10)=500*10=500*106 6小小时时,约约为为5700057000年年RAIDRAIDn n通过并行提高性能通过并行提高性能n n负负载载平平衡衡多多个个小小的的存存取取操操作作(即即页页面面存存取取),以以提提高高这这种种存取操作的吞吐量存取操作的吞吐量n n并行执行大的存取操作,以减少大的存取操作的响应时间并行执行大的存取操作,以减少大的存取操作的响应时间n n通过在多个磁盘上对数据进行拆分来提高传输率通过在多个磁盘上对数据进行拆分来提高传输率n n比特级拆分(比特级拆分(Bit-leve
16、l stripingBit-level striping)n n将每个字节按比特分开,存储到多个磁盘上将每个字节按比特分开,存储到多个磁盘上n n例例如如,对对于于一一个个由由8 8个个磁磁盘盘组组成成的的阵阵列列,将将每每个个字字节节的的第第i i个个比比特特位位写到第写到第i i个磁盘上;它的存取速度是单个磁盘的个磁盘上;它的存取速度是单个磁盘的8 8倍倍n n对对于于由由4 4个个磁磁盘盘组组成成的的阵阵列列,将将每每个个字字节节的的第第i i个个比比特特位位和和第第i+4i+4个个比特位写到第比特位写到第i i个磁盘上个磁盘上n n块级拆分(块级拆分(Block-level strip
17、ingBlock-level striping)n n对对于于由由n n个个磁磁盘盘构构成成的的阵阵列列,文文件件的的第第i i块块 存存放放在在第第(i(i mod mod n)n)+1 1个个磁盘上磁盘上RAIDRAIDn nRAID级别n n镜镜像像提提供供高高可可靠靠性性,拆拆分分提提供供高高数数据据传传输输率率,通通过过利利用用与与奇奇偶偶校校验验相相结结合合的的磁磁盘盘拆拆分分思思想想,可可以以实现以较低成本提供冗余的方案实现以较低成本提供冗余的方案n n不不同同的的RAIDRAID级级别别,具具有有不不同同的的代代价价、性性能能和和可可靠靠性性CP代表数据的第二个拷贝表示纠错位R
18、AIDRAIDn nRAID 0n n块块级级拆拆分分且且没没有有任任何何冗冗余余(如如镜镜像像或或奇奇偶偶校校验验位位)的磁盘阵列的磁盘阵列n n用用于于高高性性能能访访问问并并且且数数据据丢丢失失不不十十分分重重要要的的应应用用场合场合RAID 0:无冗余拆分RAIDRAIDn nRAID 1n n带块级拆分的磁盘镜像带块级拆分的磁盘镜像n n完全容错,成本高完全容错,成本高n n一一般般用用于于类类似似于于数数据据库库系系统统中中日日志志文文件件存存储储的的应应用场合用场合RAID 1:镜像的磁盘CCCCRAIDRAIDn nRAID 2n n按比特级拆分,具有内存风格的纠错码按比特级拆
19、分,具有内存风格的纠错码n n纠错码(纠错码(ECCECC:Error-Correcting-CodesError-Correcting-Codes)n n内内存存中中每每个个字字节节都都有有一一个个奇奇偶偶校校验验位位与与之之相相连连,它它记记录录这这个个字字节节中中为为1 1的的比比特特位位的的总总数数是是偶偶数数(=0=0)还还是是奇奇数数(=1=1),如如果果字字节节中中有有一一位位被被破破坏坏,则则字字节节的的ECCECC与与存存储储的的ECCECC就就不不会会相相匹匹配配;通通过过ECCECC可可以以检检测测到到所所有有的的1 1位位错错误误;通通过过更更多多的的附附加加位位,当当
20、数数据据遭遭到到破破坏坏时时,还还可可以以重建数据重建数据RAID 2:内存风格纠错码PPPRAIDRAIDn nRAID 3RAID 3n n磁盘控制器能够检测一个扇区是否被正确的读出磁盘控制器能够检测一个扇区是否被正确的读出n n如如果果一一个个扇扇区区被被破破坏坏,我我们们先先能能准准确确地地知知道道是是哪哪个个扇扇区区坏坏了了,然然后后对对扇扇区区的的每每一一位位,通通过过计计算算其其他他磁磁盘盘上上对对应应扇扇区区的的对对应应位位的的奇奇偶偶值值来来推推断断该该位位是是1 1还还是是0 0。如如果果其其余余位位的的奇奇偶值等于存储的奇偶值,则丢失的位是偶值等于存储的奇偶值,则丢失的位
21、是0 0,反之为,反之为1 1n nRAID 3RAID 3效果与效果与RAID 2RAID 2一样,但只有一个磁盘的额外开销一样,但只有一个磁盘的额外开销n n使使用用NN道道数数据据拆拆分分的的RAID RAID 3 3对对一一个个字字节节的的读读写写散散布布在在多多个个磁磁盘盘中中,因因此此读读写写一一个个块块的的传传输输率率是是使使用用NN道道数数据据拆拆分分的的RAID 1RAID 1的的NN倍倍n n每个磁盘参与每个每个磁盘参与每个I/OI/O请求,每秒请求,每秒RAID 3RAID 3支持的支持的I/OI/O数较少数较少RAID 3:位交叉奇偶校验PRAIDRAIDn nRAID
22、 4n n块块级级拆拆分分,在在一一个个独独立立的的磁磁盘盘上上为为其其他他NN个个磁磁盘盘上上对应的块保留一个奇偶校验块对应的块保留一个奇偶校验块n n读取一个块只访问一个磁盘读取一个块只访问一个磁盘n n每每个个存存取取操操作作的的传传输输率率低低,但但可可以以并并行行地地执执行行多多个读操作,从而产生较高的总的个读操作,从而产生较高的总的I/OI/O率率n n读读取取大大量量数数据据的的操操作作有有很很高高的的传传输输率率,因因为为所所有有磁盘可以并行地读磁盘可以并行地读RAID 4:块交叉奇偶校验PRAIDRAIDn nRAID 5RAID 5n n将将数数据据和和奇奇偶偶校校验验位位
23、都都分分布布到到所所有有的的N+1N+1个个磁磁盘盘上上;对对每每个块,一个磁盘存储奇偶校验位,其余磁盘存储数据个块,一个磁盘存储奇偶校验位,其余磁盘存储数据n n例例如如由由5 5个个磁磁盘盘组组成成的的阵阵列列,第第n n块块的的奇奇偶偶校校验验位位存存储储在在第第(n n mod mod 5)+15)+1上上,其其余余4 4个个磁磁盘盘的的第第n n块块存存储储了了对对应应这这个个块块的实际数据的实际数据n n奇偶校验块不能和这个块对应的数据存储在同一个磁盘上奇偶校验块不能和这个块对应的数据存储在同一个磁盘上n n所所有有磁磁盘盘都都参参与与对对读读请请求求的的服服务务,而而RAID R
24、AID 4 4中中奇奇偶偶校校验验磁磁盘不参与读操作盘不参与读操作n nRAID RAID 5 5包包容容了了RAID RAID 4 4,同同时时在在相相同同成成本本下下,提提供供了了更更好好的的读写性能读写性能RAID 5:块交叉的分布奇偶校验PPPPPRAIDRAIDn nRAID 6RAID 6n n类似于类似于RAID 5RAID 5,存储了额外的冗余信息存储了额外的冗余信息n n不不采采用用奇奇偶偶校校验验位位的的方方法法,使使用用类类似似Reed-SolomonReed-Solomon码码的的编编码码n n对每对每4 4位数据存储位数据存储2 2位冗余信息位冗余信息n n可以容忍两
25、个磁盘发生故障可以容忍两个磁盘发生故障RAID 6:P+Q冗余PPPPPP高性能可靠性差完全容错成本高高数据传输率大数据量高的总I/O率适合随机读大数据量高可靠性用于数据安全性不是很重要的高性能应用相对于RAID5,RAID3很少使用适于日志文件的存储相对于RAID1,具有较低的存储开销,但写操作开销高,因此适于经常进行读而很少写的应用适于数据安全十分重要的应用数据库系统体系结构数据库系统体系结构数据库系统体系结构数据库系统体系结构n n数据库系统体系结构概述n n集中式数据库系统n n数据库系统n n并行数据库系统n n分布式数据库系统数据库系统体系结构概述数据库系统体系结构概述n n数据库
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 哈工大 数据库 课件 第七 系统 体系结构
限制150内