关系数据理论 (2)优秀课件.ppt
《关系数据理论 (2)优秀课件.ppt》由会员分享,可在线阅读,更多相关《关系数据理论 (2)优秀课件.ppt(92页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关系数据理论(2)第1页,本讲稿共92页第五章第五章规范化设计规范化设计 (8学时)学时)第七章第七章数据库设计数据库设计 (4学时)学时)第八章第八章 数据库的管理数据库的管理 (8 8学时)学时)第第九九章章分布式数据库系统分布式数据库系统 (4学时)学时)第十章第十章 对象关系对象关系数据库数据库(4学时)学时)习题分析、总复习习题分析、总复习(2学时)学时)数据库原理二数据库原理二数据库原理二数据库原理二课堂教学(课堂教学(课堂教学(课堂教学(3030学时学时学时学时)内容及安排:内容及安排:内容及安排:内容及安排:第2页,本讲稿共92页实验五实验五:编程实施学分制教务管理信息系统(编
2、程实施学分制教务管理信息系统(12学时)学时)(教材教材P.373)实验实验六:六:SQL Server 2000 高级技术使用高级技术使用(6学时)学时)(教材教材P.303)验验收:收:(2学时)学时)数据库原理二数据库原理二数据库原理二数据库原理二实验内容和安排(实验内容和安排(实验内容和安排(实验内容和安排(20202020学时)学时)学时)学时)第3页,本讲稿共92页 第五章第五章 规范化设计规范化设计本章讨论如何设计关系数据库的模式问题。本章讨论如何设计关系数据库的模式问题。关系数据库关系数据库规范化设计理论规范化设计理论即即“模式设计理论模式设计理论”数据依赖数据依赖研究数据之间
3、的联系研究数据之间的联系范范式式关系模式的标准关系模式的标准模式设计方法模式设计方法规范化的方法规范化的方法第4页,本讲稿共92页 本章重要概念本章重要概念:关系模式的一般形式和关系模式的冗余和异常问题。关系模式的一般形式和关系模式的冗余和异常问题。数据依赖的定义、数据依赖与关键码的联系;平凡的数据依赖的定义、数据依赖与关键码的联系;平凡的FD。关系模式的范式:关系模式的范式:1NF,2NF,3NF,BCNF。逻辑蕴涵、闭包、数据依赖的公理系统和推理规则;属性集的逻辑蕴涵、闭包、数据依赖的公理系统和推理规则;属性集的闭包;闭包;FD集的等价;最小依赖集。集的等价;最小依赖集。无损分解的定义、性
4、质、测试;保持依赖的分解定义。无损分解的定义、性质、测试;保持依赖的分解定义。分解算法:分解成分解算法:分解成3NF、BCNF模式集的算法。模式集的算法。MVD、4NF和和5NF的定义。的定义。第5页,本讲稿共92页1概述概述一、关系模式的一般形式一、关系模式的一般形式:R第6页,本讲稿共92页R其中:其中:U:为组成关系为组成关系R的全部属性的集合,即的全部属性的集合,即UA1,A2,An。D:为域的集合,即属性的取值范围的集合。为域的集合,即属性的取值范围的集合。Dom:为为U与与D之间的映象,即之间的映象,即Dom:UD|Dom安全约束集。安全约束集。F:为属性为属性U上的上的一组约束,
5、即数据依赖集。一组约束,即数据依赖集。例如:学习关系例如:学习关系SC中存在如下数据依赖:中存在如下数据依赖:(SNO,CNO)GRADE学生关系学生关系S中存在如下数据依赖:中存在如下数据依赖:SNOSNAME(SNO,SNAME)AGE第7页,本讲稿共92页关系模式一般形式可简化为:关系模式一般形式可简化为:R 泛关系模式泛关系模式满足上述满足上述制约条件制约条件F的关系用符号的关系用符号r 表示表示r 表示的关系称为表示的关系称为:泛关系泛关系例如例如:学习关系模式学习关系模式SC 其其中中:U=SNO,CNO,GRADE F=(SNO,CNO)GRADE 第8页,本讲稿共92页设计关系
6、数据库的核心问题是关系模式的设计。设计关系数据库的核心问题是关系模式的设计。对于一个数据库设计,可以有多个关系模式的选择。对于一个数据库设计,可以有多个关系模式的选择。按照什么原则来选择关系模式?按照什么原则来选择关系模式?标准是什么?标准是什么?如何实现?如何实现?第9页,本讲稿共92页二关系模式的存储异常问题二关系模式的存储异常问题在数据管理中在数据管理中,数据冗余一直是影响系统性能的大问题。数据冗余一直是影响系统性能的大问题。数据冗余是指同一个数据在系统中多次重复出现。数据冗余是指同一个数据在系统中多次重复出现。例:例:SPJ_A(SNOSPJ_A(SNO,PNOPNO,JNOJNO,J
7、NAMEJNAME,JCITYJCITY,PRICEPRICE,QTY)QTY)属性分别表示属性分别表示:供应商号、供应商号、零件号、工程项目号、工程项目名称、零件号、工程项目号、工程项目名称、工程项目所在城市、零件单价、供应数量。工程项目所在城市、零件单价、供应数量。SPJ_ASPJ_A的一个实例:的一个实例:第10页,本讲稿共92页存在的存在的问题:问题:数据冗余数据冗余修改异常修改异常 插入异常插入异常 删除异常删除异常关系模式关系模式 SPJ_A SPJ_A 的一个实例:的一个实例:SPJ_A1SPJ_A1关系关系SNOSNOPNOPNOJNOJNOJNAMEJNAMEJCITYJCI
8、TYPRICEPRICEQTYQTYS1S1P1P1J1J1东方明珠东方明珠上海上海22.6022.608080S1S1P1P1J4J4明珠线明珠线上海上海22.6022.606060S1S1P3P3J1J1东方明珠东方明珠上海上海22.8022.80100100S1S1P3P3J4J4明珠线明珠线上海上海22.8022.806060S1S1P3P3J6J6南浦大桥南浦大桥上海上海22.8022.806 6S3S3P3P3J5J5炼钢工地炼钢工地天津天津22.1022.10100100S3S3P4P4J1J1东方明珠东方明珠上海上海11.9011.903030S3S3P4P4J4J4明珠线明珠
9、线上海上海11.9011.906060S3S3P4P4J6J6南浦大桥南浦大桥上海上海11.9011.906 6S4S4P2P2J4J4明珠线明珠线上海上海33.8033.806060S4S4P2P2J6J6南浦大桥南浦大桥上海上海33.8033.808 8S5S5P5P5J1J1东方明珠东方明珠上海上海22.8022.802020S5S5P5P5J4J4明珠线明珠线上海上海22.8022.806060S5S5P5P5J6J6南浦大桥南浦大桥上海上海22.8022.808 8S8S8P3P3J1J1东方明珠东方明珠上海上海13.0013.002020第11页,本讲稿共92页关系可定义为笛卡儿积
10、的一个子集,并不是每个子集都是有意义的。关系可定义为笛卡儿积的一个子集,并不是每个子集都是有意义的。对关系的值要作各种限制,这种限制称为数据完整性约束条件。对关系的值要作各种限制,这种限制称为数据完整性约束条件。数据完整性约束主要有两种:数据完整性约束主要有两种:1.依赖于值域的限制依赖于值域的限制-由由DBMS完整性子系统实现;完整性子系统实现;2.只依赖于属性间取值的相等与否的只依赖于属性间取值的相等与否的限制限制-仅取决于仅取决于两个元组的某些分量是否相等两个元组的某些分量是否相等-统称为数据依赖统称为数据依赖数据依赖描述的是属性与属性之间的对应关系。数据依赖描述的是属性与属性之间的对应
11、关系。2 2 函数依赖函数依赖第12页,本讲稿共92页一、一、函数依赖定义函数依赖定义定定 义义:设设 有有 关关 系系 模模 式式 R(A1,A2,An),X和和 Y是是 属属 性性 集集(A1,A2,An)的的子子集集,如如果果对对于于R的的任任何何一一个个关关系系r中中的的任任两两个个元元组组u和和v,对对应应于于X的的属属性性分分量量的的值值相相等等,而而对对应应于于Y的的属属性性分分量量的值也相等,即:只要有的值也相等,即:只要有uX=vX,就有,就有uY=vY,称,称“X函数确定函数确定Y”或称或称“Y函数依赖于函数依赖于X”,其符号表示为:其符号表示为:XYFD的确切语义的确切语
12、义:表示了关系模式集:表示了关系模式集X值与值与Y值的多对一联系。值的多对一联系。(SNO,PNO,JNO)(JNAME,JCITY).JNO(JNAME,JCITY)更明确地说:更明确地说:对于对于r r中属性或属性组中属性或属性组X X的每一个值,的每一个值,r r中中Y Y只有一个值与之对应。只有一个值与之对应。第13页,本讲稿共92页二、二、完全完全函数依赖函数依赖定义:定义:在关系模式在关系模式R(A1,A2,An)中,已知)中,已知XY,对于对于X中任中任何真子集何真子集X(X X)都不能函数确定都不能函数确定Y,称称 X X Y Y是完全函数依赖是完全函数依赖,用符号用符号XY表
13、示表示。完全依赖也称为完全依赖也称为“左部不可约依赖左部不可约依赖”。f三、部分函数依赖三、部分函数依赖定义:定义:在关系模式在关系模式R(A1,A2,An)中,已知)中,已知XY,如果存在一如果存在一个真子集个真子集X(X X),满足,满足XY Y,则称,则称Y对对X是部分函数依赖,是部分函数依赖,用符号用符号XY表示。表示。p四、传递函数依赖四、传递函数依赖定义:定义:在关系模式在关系模式R(A1,A2,An)中,已知)中,已知XY,Y Y Z Z(Y X,Z Y不存在不存在YX X),),则则称称 X Z X Z 是传递函数依赖是传递函数依赖。t第14页,本讲稿共92页 定义定义:如果如
14、果A是关系模式是关系模式R的候选键的候选键K中属性,那么称中属性,那么称A是是R的的主属性主属性;否则称;否则称A是是R的非主属性。的非主属性。五、函数依赖和关键码的联系五、函数依赖和关键码的联系定义定义:设有关系模式设有关系模式R(A1,A2,An),K是属性集是属性集(A1,A2,An)的一个子集。如果的一个子集。如果KU(U完全函数依完全函数依赖于赖于K)在在R上成立,那么称上成立,那么称K K是是R R的一个的一个候选键候选键。f如果如果X U(K X)在在R R上成立上成立,那么称那么称X X是是R R的一个的一个超键超键。p第15页,本讲稿共92页3关系模式的范式关系模式的范式用什
15、么标准来衡量关系模式设计的好与坏用什么标准来衡量关系模式设计的好与坏?-关系模式的范式关系模式的范式(NormalForms,简记为简记为NF)。一、一、第一范式(第一范式(1NF)定义定义:如果关系模式如果关系模式R的每个关系的每个关系r的属性值都是不可分的属性值都是不可分 的原子值的原子值,那么称那么称R是是第一范式第一范式(firstnormalform)的模式。的模式。满足满足1NF的关系称为规范化的关系,否则称为非规范化的关系。的关系称为规范化的关系,否则称为非规范化的关系。关系数据库研究的关系都是规范化的关系。关系数据库研究的关系都是规范化的关系。第16页,本讲稿共92页既使关系模
16、式是既使关系模式是1NF,但很可能具有不受欢迎的冗余和异常现象。,但很可能具有不受欢迎的冗余和异常现象。因此需把关系模式作进一步的规范化。因此需把关系模式作进一步的规范化。如果数据库模式中每个关系模式都是2NF,则称数据库模式为2NF的数据库模式。二、二、第二范式(第二范式(2NF)定义定义:如果关系模式如果关系模式R 1NF,并且并且R中中每个非主属性都每个非主属性都完全函数依赖于完全函数依赖于R的候选键,的候选键,称称R是第二范式是第二范式(2NF)的模式。)的模式。第17页,本讲稿共92页三、第三范式(三、第三范式(3NF3NF)定义定义:如果关系模式如果关系模式R 1NF,并且并且R中
17、中每个非主属性每个非主属性都不传递依赖于都不传递依赖于R的候选键的候选键,那么称那么称R是第三是第三范式(范式(3NF)的模式。)的模式。如果数据库模式中每个关系模式都是如果数据库模式中每个关系模式都是3NF,则称,则称其为其为3NF的数据库模式。的数据库模式。在在3NF模式中,并未排除主属性对候选键的传递依赖,模式中,并未排除主属性对候选键的传递依赖,仍有可能有冗余和异常现象。仍有可能有冗余和异常现象。3NF分解第18页,本讲稿共92页四、四、BCNF模式模式定义:定义:如果关系模式如果关系模式R 1NF,并且,并且R中每个属性都中每个属性都不传递依赖于不传递依赖于R的候选键的候选键,那么称
18、那么称R是是BCNF的模式。的模式。由由BCNFBCNF的定义得出如下结论:的定义得出如下结论:1.非主属性对码完全函数依赖;非主属性对码完全函数依赖;2.主属性对不包含它的码也是完全函数依赖;主属性对不包含它的码也是完全函数依赖;3.没有属性完全依赖非码的任何属性组。没有属性完全依赖非码的任何属性组。如果数据库模式中每个关系模式都是BCNF,称其为BCNF的数据库模式。第19页,本讲稿共92页例如:关系模式例如:关系模式R(C,S,Z)其中其中C:城市名称:城市名称S:街道名称:街道名称Z:邮政编码邮政编码假定:假定:F=CSZ,ZCCSZ:表示地址表示地址(城市和街道城市和街道)决定决定邮
19、政编码邮政编码;Z Z C:C:表示表示邮政编码邮政编码决定决定城市名称城市名称。R的候选码为:的候选码为:CS和和SZ。第20页,本讲稿共92页R(C,S,Z)的候选码为:的候选码为:CS 和和SZ。由于由于F中存在中存在Z C:主属性主属性C对不包含它的码对不包含它的码SZ不是完全函数依赖,不是完全函数依赖,所以所以R(C,S,Z)不是不是BCNF模式,但模式,但R(C,S,Z)是是3NF,因为没有任何非主属性对码传递函数依赖或部分函数依赖。因为没有任何非主属性对码传递函数依赖或部分函数依赖。如果把如果把R(C,S,Z)分解为分解为:R1(S,Z)R2(Z,C)能解决冗余问题,而且能解决冗
20、余问题,而且R1,R2都是都是BCNF模式集。模式集。但丢失了但丢失了CSZ,数据语义将会引起新的矛盾。,数据语义将会引起新的矛盾。第21页,本讲稿共92页 4 4 数据依赖的公理系统数据依赖的公理系统 一、函数依赖一、函数依赖 FD FD 的逻辑蕴涵的逻辑蕴涵 F F 逻辑蕴涵逻辑蕴涵 XYXY,记为:记为:F F XYXY 。定义一:设定义一:设F是关系模式是关系模式R(A1,A2,An)上成立的函数依赖集,上成立的函数依赖集,X和和Y是属性集(是属性集(A1,A2,An)的子集)的子集,XY是一个其他的是一个其他的函数依赖。函数依赖。如果如果对于对于R的每个满足的每个满足F的关系的关系r
21、也满足也满足XY(或从(或从F推导出推导出XY也在也在R(U)上成立),)上成立),那么称那么称第22页,本讲稿共92页定义二:定义二:设设F F是关系模式是关系模式R R(A1,A2,An)上成立的函上成立的函数依赖集,数依赖集,X X和和Y Y是属性集是属性集(A1,A2,An)的子集,的子集,F的所有逻辑蕴涵组成的集合称为函数依赖集的所有逻辑蕴涵组成的集合称为函数依赖集F的闭包的闭包,记为记为F+。F+=XY|F XY 即:从给定的函数依赖集合即:从给定的函数依赖集合F推出的所有函数依赖组成推出的所有函数依赖组成 的集合,称为的集合,称为F的闭包。的闭包。第23页,本讲稿共92页二、二、
22、FD推理规则(推理规则(Armstrong公理)公理)设设U是关系模式是关系模式R的属性集,的属性集,F是是R上成立的一组函数依赖集上成立的一组函数依赖集X、Y分别是分别是U上的子集,存在上的子集,存在如下规则如下规则:1、FD公理(函数依赖公理):公理(函数依赖公理):自反性:自反性:若若Y X U,则,则XY在在R上成立。上成立。增广性:增广性:若若XY在在R上成立,且上成立,且Z U,则,则XZYZ在在R上成立。上成立。传递性:传递性:若若XY和和YZ在在R上成立,则上成立,则XZ在在R上成立。上成立。第24页,本讲稿共92页2、FD推理规则推理规则并规则:并规则:若若XY,XZ,则,则
23、XYZ。伪传递伪传递规则规则:若若XY,YWZ,则,则XWZ。分解规则:分解规则:若若XY,Z Y,则,则XZ。复合规则复合规则:若XY,WZ,则XWYZ。通用一致性定理通用一致性定理:若XY,WZ,则X(WY)YZ。从并规则和分解规则可得到下面的定理。从并规则和分解规则可得到下面的定理。定理:如果A1An是关系模式R的属性集,那么那么XA1An成立成立的充分必要条件是的充分必要条件是XAi(i=1,n)成立。)成立。第25页,本讲稿共92页例例:已知关系模式已知关系模式R(ABC),F=AB,BC,求求F+。答:根据函数依赖公理系统,可推出答:根据函数依赖公理系统,可推出F的的F+有有43个
24、个FD。其中:。其中:据自反性据自反性可得出可得出27个个FD:ABCABBCCAABCAABBCCABABCBCAAABCAABBBCCCACABCBABABBCBCCACAABCCABCABABCBCABCCAABCABC第26页,本讲稿共92页据增广性据增广性可得出可得出7个个FD:ABBCABC(AB,ABB,BC)AABBBCABABCCABC(CAA,AB,BBC)据传递性据传递性可得出可得出9个个FD:AC(AB,BC)CAB(CAA,AB)ACAABC(ACA,CABC)ABBC(ABA,ABC)CAAB(CAA,AAB)CAAB(CAA,AAB)ABCA(ABA,ACA)AA
25、BC(ACA,CAABC)第27页,本讲稿共92页在在实实际际使使用用中中,经经常常要要判判断断能能否否从从已已知知的的函函数数依依赖赖集集F推推导导出出函函数数依依赖赖XY,那么可先求出F的闭包F+,然后再看XY是否在F+中。但是从F求F+是一个复杂且困难的问题(NP完全问题,指数级问题)。下面引入属性集闭包概念,将使判断问题化为多项式问题。使判断问题化为多项式问题。定义三:定义三:对于函数依赖对于函数依赖XY,如果如果Y X,那么称,那么称XY是一个是一个“平凡的平凡的FD”;否则称为否则称为“非平凡的非平凡的FD”。平凡的FD并没有实际意义,根据自反性就可推出。我们感兴趣的是非平凡的FD
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 关系数据理论 2优秀课件 关系 数据 理论 优秀 课件
限制150内