第4章+关系数据库的规范化设计.ppt
《第4章+关系数据库的规范化设计.ppt》由会员分享,可在线阅读,更多相关《第4章+关系数据库的规范化设计.ppt(61页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第4章 关系数据库的规范化设计 本章重要概念(1)关系模式的冗余和异常问题。(2)FD的定义、逻辑蕴涵、闭包、推理规则、与关键码的联系;平凡的FD;属性集的闭包;推理规则的正确性和完备性;FD集的等价;最小依赖集。(3)无损分解的定义、性质、测试;保持依赖集的分解。(4)关系模式的范式:1NF,2NF,3NF,BCNF。分解成2NF、3NF模式集的算法。(5)MVD、4NF、JD和5NF的定义。前言v关系数据库的规范化设计是指面对一个现实问题,如何选择一个比较好的关系模式集合。规范化设计理论主要包括三个方面的内容:数据依赖、范式和模式设计方法。其中数据依赖起着核心的作用。数据依赖研究数据之间的
2、联系,范式是关系模式的标准,模式设计方法是自动化设计的基础。规范化设计理论对关系数据库结构的设计起着重要的作用。4.1.1 关系模型的外延和内涵v外延就是通常所说的关系、表或当前值,它的基本性质已在第2章介绍过。由于用户经常对关系进行插入、删除和修改操作,因此外延是与时间有关的,随着时间的推移在不断变化。v内涵是与时间独立的,是对数据的定义以及数据完整性约束的定义。对数据的定义包括对关系、属性、域的定义和说明。对数据完整性约束的定义涉及面较广,主要包括以下几个方面:v静态约束,涉及到数据之间联系(称为“数据依赖,data dependences)、主键和值域的设计。v动态约束,定义各种操作(插
3、入、删除、修改)对关系值的影响。4.1.2 关系模式的冗余和异常问题(一)v例4.1 TNAMEADDRESSC#CNAMEt1a1c1n1t1a1c2n2t1a1c3n3t2a2c4n4t2a2c5n2t3a3c6n44.1.2 关系模式的冗余和异常问题(二)v数据冗余。如果一个教师教几门课程,那么这个教师的地址就要重复几次存储。v操作异常。由于数据的冗余,在对数据操作时会引起各种异常:修改异常。譬如教师t1教三门课程,在关系中就会有三个元组。如果他的地址变了,这三个元组中的地址都要改变。若有一个元组中的地址未更改,就会造成这个教师的地址不惟一,产生不一致现象。插入异常。如果一个教师刚调来,
4、尚未分派教学任务,那么要将教师的姓名和地址存储到关系中去时,在属性C#和CNAME上就没有值(空值)。在数据库技术中空值的语义是非常复杂的,对带空值元组的检索和操作也十分麻烦。删除异常。如果在图4.1中要取消教师t3的教学任务,那么就要把这个教师的元组删去,同时也把t3的地址信息从表中删去了。这是一种不合适的现象。4.1.2 关系模式的冗余和异常问题(三)TNAMEADDRESSTNAMEC#CNAMEt1a1t1c1n1t2a2t1c2n2t3a3t1c3n3 t2c4n4 t2c5n2 t3c6n44.2.1 函数依赖的定义(一)v定义4.1 设有关系模式R(U),X和Y是属性集U的子集,
5、函数依赖(functional dependency,简记为FD)是形为XY的一个命题,只要r是R的当前关系,对r中任意两个元组t和s,都有tX=sX蕴涵tY=sY,那么称FD XY在关系模式R(U)中成立。4.2.1 函数依赖的定义(二)v例4.2 A B C DA B C Da1b1c1d1a1b1c1d1a1b1c2d2a1b2c2d2a2b2c3d3a2b2c3d3a3b1c4d4a3b2c4d44.2.1 函数依赖的定义(三)例4.3 有一个关于学生选课、教师任课的关系模式:R(S#,SNAME,C#,GRADE,CNAME,TNAME,TAGE)属性分别表示学生学号、姓名、选修课程
6、的课程号、成绩、课程名、任课教师姓名和年龄等意义。如果规定,每个学号只能有一个学生姓名,每个课程号只能决定一门课程,那么可写成下列FD形式:S#SNAME C#CNAME每个学生每学一门课程,有一个成绩,那么可写出下列FD:(S#,C#)GRADE还可以写出其他一些FD:C#(CNAME,TNAME,TAGE)TNAMETAGE4.2.2 FD的逻辑蕴涵v定义4.2 设F是在关系模式R上成立的函数依赖的集合,XY是一个函数依赖。如果对于R的每个满足F的关系r也满足XY,那么称F逻辑蕴涵XY,记为F XY。v定义4.3 设F是函数依赖集,被F逻辑蕴涵的函数依赖全体构成的集合,称为函数依赖集F的闭
7、包(closure),记为F+。即 F+=XY|记为FXY。4.2.3 FD的推理规则(一)v设U是关系模式R的属性集,F是R上成立的只涉及到U中属性的函数依赖集。FD的推理规则有以下三条:vA1(自反性,reflexivity):若YXU,则XY在R上成立。vA2(增广性,augmentation):若XY在R上成立,且ZU,则XZYZ在R上成立。vA3(传递性,transitivity):若XY和YZ在R上成立,则XZ在R上成立。4.2.3 FD的推理规则(二)v定理定理4.1 FD推理规则推理规则A1、A2和和A3是正确的。也就是,如果是正确的。也就是,如果XY是从是从F用推理规则导出,
8、那么用推理规则导出,那么XY在在F+中。中。v定理定理4.2 FD的其他五条推理规则的其他五条推理规则:(1)A4(合并性,union):XY,XZ XYZ。(2)A5(分解性,decomposition):XY,ZY XZ。(3)A6(伪传递性):XY,WYZ WXZ。(4)A7(复合性,composition):XY,WZ XWYZ。(5)A8 XY,WZ X(WY)YZ。4.2.3 FD的推理规则(三)v例4.5 已知关系模式R(ABC),F=AB,BC,求F+。根据FD的推理规则,可推出F的F+有43个FD。譬如,据规则A1可推出A(表示空属性集),AA,。据已知的AB及规则A2可推出
9、ACBC,ABB,AAB,。据已知条件及规则A3可推出AC等。作为习题,读者可自行推出这43个FD。4.2.3 FD的推理规则(四)v定义4.4 对于FD XY,如果YX,那么称XY是一个“平凡的FD”,否则称为“非平凡的FD”。v定理4.3 如果A1An是关系模式R的属性集,那么XA1An成立的充分必要条件是XAi(i=1,n)成立。4.2.4 FD和关键码的联系v定义4.5 设关系模式R的属性集是U,X是U的一个子集。如果XU在R上成立,那么称X是R的一个超键。如果XU在R上成立,但对于X的任一真子集X1都有X1U不成立,那么称X是R上的一个候选键。本章的键都是指候选键。例4.6 在学生选
10、课、教师任课的关系模式中:R(S#,SNAME,C#,GRADE,CNAME,TNAME,TAGE)如果规定:每个学生每学一门课只有一个成绩;每个学生只有一个姓名;每个课程号只有一个课程名;每门课程只有一个任课教师。根据这些规则,可以知道(S#,C#)能函数决定R的全部属性,并且是一个候选键。虽然(S#,SNAME,C#,TNAME)也能函数决定R的全部属性,但相比之下,只能说是一个超键,而不能说是候选键,因为其中含有多余属性。4.2.5 属性集的闭包 v定义4.6 设F是属性集U上的FD集,X是U的子集,那么(相对于F)属性集X的闭包用X+表示,它是一个从F集使用FD推理规则推出的所有满足X
11、A的属性A的集合:X+=属性A|XA在F+中 v定理4.4 XY能用FD推理规则推出的充分必要条件是YX+。v例4.7 属性集U为ABCD,FD集为 AB,BC,DB。则用上述算法,可求出A+=ABC,(AD)+=ABCD,(BD)+=BCD,等等。4.2.5 FD推理规则的完备性v推理规则的正确性是指“从FD集F使用推理规则集推出的FD必定在F+中”,完备性是指“F+中的FD都能从F集使用推理规则集导出”。也就是正确性保证了推出的所有FD是正确的,完备性保证了可以推出所有被蕴涵的FD。这就保证了推导的有效性和可靠性。v定理4.5 FD推理规则A1,A2,A3是完备的。4.2.6 FD集的最小
12、依赖集(一)v定义4.7 如果关系模式R(U)上的两个函数依赖集F和G,有F+=G+,则称F和G是等价的函数依赖集。v定义4.8 设F是属性集U上的FD集。如果Fmin是F的一个最小依赖集,那么Fmin应满足下列四个条件:F+min=F+;每个FD的右边都是单属性;Fmin中没有冗余的FD(即F中不存在这样的函数依赖XY,使得F与F XY 等价);每个FD的左边没有冗余的属性(即F中不存在这样的函数依赖XY,X有真子集W使得F XY WY 与F等价)。4.2.6 FD集的最小依赖集(二)例4.8 设F是关系模式R(ABC)的FD集,F=ABC,BC,AB,ABC,试求Fmin。先把F中的FD写
13、成右边是单属性形式:F=AB,AC,BC,AB,ABC 显然多了一个AB,可删去。得F=AB,AC,BC,ABC F中AC可从AB和BC推出,因此AC是冗余的,可删去。得F=AB,BC,ABC F中ABC可从AB和BC推出,因此ABC也可删去。最后得F=AB,BC,即所求的Fmin。4.3.1 模式分解问题(一)v定义4.9 设有关系模式R(U),属性集为U,R1、Rk都是U的子集,并且有R1R2RkU。关系模式R1、Rk的集合用表示,=R1,Rk。用代替R的过程称为关系模式的分解。这里称为R的一个分解,也称为数据库模式。4.3.1 模式分解问题(二)4.3.2 无损分解(一)v例4.9 4.
14、3.2 无损分解(二)v定义4.10 设R是一个关系模式,F是R上的一个FD集。R分解成数据库模式=R1,Rk。如果对R中满足F的每一个关系r,都有vr=R1(r)R2(r)Rk(r)v那么称分解相对于F是“无损联接分解”(lossless join decomposition),简称为“无损分解”,否则称为“损失分解”(lossy decomposition)。4.3.2 无损分解(三)v定理4.6 设=R1,Rk 是关系模式R的一个分解,r是R的任一关系,ri=Ri(r)(1ik),那么有下列性质:rm(r);若s=m(r),则Ri(s)=ri;m(m(r)=m(r),这个性质称为幂等性(
15、idempotent)。4.3.2 无损分解(四)4.3.2 无损分解(五)4.3.2 无损分解(六)v例4.10 设关系模式R(ABC)分解成=AB,BC。(a)和(b)分别是模式AB和BC上的值r1和r2,(c)是r1r2的值。显然BC(r1r2)r2。这里r2中元组(b2c2)就是一个悬挂元组,由于它的存在,使得r1和r2不存在泛关系r。4.3.3 无损分解的测试方法(一)算法算法4.3 无损分解的测试无损分解的测试构造一张k行n列的表格,每列对应一个属性Aj(1jn),每行对应一个模式Ri(1ik)。如果Aj在Ri中,那么在表格的第i行第j列处填上符号aj,否则填上bij。把表格看成模
16、式R的一个关系,反复检查F中每个FD在表格中是否成立,若不成立,则修改表格中的值。修改方法如下:对于F中一个FD XY,如果表格中有两行在X值上相等,在Y值上不相等,那么把这两行在Y值上也改成相等的值。如果Y值中有一个是aj,那么另一个也改成aj;如果没有aj,那么用其中一个bij替换另一个值(尽量把下标ij改成较小的数)。一直到表格不能修改为止。(这个过程称为chase过程)若修改的最后一张表格中有一行是全a,即a1a2an,那么称相对于F是无损分解,否则称损失分解。4.3.3 无损分解的测试方法(二)4.3.3 无损分解的测试方法(三)v定理4.7 设=R1,R2 是关系模式R的一个分解,
17、F是R上成立的FD集,那么分解相对于F是无损分解的充分必要条件是(R1R2)(R1R2)或(R1R2)(R2R1)。v定理4.8 如果FD XY在模式R上成立,且XY=,那么R分解成=RY,XY 是无损分解。4.3.4 保持函数依赖的分解(一)v定义4.11 设F是属性集U上的FD集,Z是U的子集,F在Z上的投影用Z(F)表示,定义为Z(F)=XY|XYF+,且XYZ v定义4.12 设=R1,Rk 是R的一个分解,F是R上的FD集,如果有 Ri(F)F,那么称分解保持函数依赖集F。4.3.4 保持函数依赖的分解(二)WNOWSWNOWGWNOWSWGW18级W12000W18级2000W26
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 关系 数据库 规范化 设计
限制150内