关系数据库理论优秀PPT.ppt
《关系数据库理论优秀PPT.ppt》由会员分享,可在线阅读,更多相关《关系数据库理论优秀PPT.ppt(51页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关系数据库理论第1页,本讲稿共51页1、规范化问题的提出 1.1 规范化理论的主要内容规范化理论的主要内容在关系数据库系统中,关系模型包括一组关系模型,并且各个关系不是完全孤立的。关系数据库的规范化理论主要包括的内容:函数依赖,范式和模式设计。函数依赖起核心作用,是模式分解和模式设计的基础,范式是模式分解的标准。第2页,本讲稿共51页1、规范化问题的提出1.2 不合理的关系模式存在的存储异常问题不合理的关系模式存在的存储异常问题 由书上的例子知道:由书上的例子知道:.数据冗余数据冗余 .插入异常插入异常 .删除异常删除异常 .更新异常更新异常第3页,本讲稿共51页1、规范化问题的提出一个好的关
2、系模式应满足条件:.尽可能少的数据冗余.没有插入异常.没有删除异常.没有更新异常按照一定的规范设计关系模式,将结构复杂的关系分解成结构简单的关系,从而把不好的关系数据库模式转变为好的关系数据库模式,即关系的规范关系的规范化化。第4页,本讲稿共51页1.3 模式分解是关系规范化的主要方法模式分解是关系规范化的主要方法怎样才能得到一个好的关系模式呢?我们把关系模式SCD分解为下面三个结构简单的关系模式,如下图所示。学生关系S(SNO,SN,AGE,DEPT)选课关系SC(SNO,CNO,SCORE)系关系D(DEPT,MN)第5页,本讲稿共51页 AGE 赵亦 计算机钱尔 信息孙珊 信息李思 自动
3、化计算机刘伟信息王平DS1.3 模式分解是关系规范化的主要方法模式分解是关系规范化的主要方法第6页,本讲稿共51页S1C1S1C2S2C5S2C6S2C7S2C5S3C1S3C2S3C4SC1.3 模式分解是关系规范化的主要方法模式分解是关系规范化的主要方法第7页,本讲稿共51页在以上三个关系模式中,实现了信息的某种程度的分离,S中存储学生基本信息,与所选课程及系主任无关;D中存储系的有关信息,与学生无关;SC中存储学生选课的信息,而与所学生及系的有关信息无关。与SCD相比,分解为三个关系模式后,数据的冗余度明显降低。当新插入一个系时,只要在关系D中添加一条记录。当某个学生尚未选课,只要在关系
4、S中添加一条学生记录,而与选课关系无关,这就避免了插入异常。当一个系的学生全部毕业时,只需在S中删除该系的全部学生记录,而关系D中有关该系的信息仍然保留,从而不会引起删除异常。同时,由于数据冗余度的降低,数据没有重复存储,也不会引起更新异常。1.3 模式分解是关系规范化的主要方法模式分解是关系规范化的主要方法第8页,本讲稿共51页经过上述分析,我们说分解后的关系模式是一个好的关系数据库模式。从而得出结论,一个好的关系模式应该具备以下四个条件:1.尽可能少的数据冗余。2.没有插入异常。3.没有删除异常。4.没有更新异常。但要注意,一个好的关系模式并不是在任何情况下都是最优的,比如查询某个学生选修
5、课程名及所在系的系主任时,要通过连接,而连接所需要的系统开销非常大,因此要以实际设计的目标出发进行设计。1.3 模式分解是关系规范化的主要方法模式分解是关系规范化的主要方法第9页,本讲稿共51页2、函数依赖2.1 函数依赖的定义及性质函数依赖的定义及性质 数据依赖:关系模型中的各属性之间相互依赖、相互制约的联系。数据依赖分为:函数依赖、多值依赖和连接依赖。函数依赖是关系模型中属性之间的一种逻辑关系。第10页,本讲稿共51页2、函数依赖2.1.1 函数依赖的定义函数依赖的定义 概念:概念:设关系模式R(U,F),U是属性全集,F是U上的函数依赖集,X和Y是U的子集,如果对于R(U)的任意一个可能
6、的关系r,对于X的每一个具体值,Y都有惟一的具体值与之对应,则称X决定函数Y,或Y函数依赖于X,记作XY。其中为X决定因素,Y为依赖因素。当Y函数不依赖于X时,记作XY;当XY且YX时,记作XY第11页,本讲稿共51页2、函数依赖函数依赖的说明:函数依赖的说明:.平凡的函数依赖与非平凡的函数依赖!当属性集Y是属性集X的子集时,则必然存在函数依赖XY,这种类型的函数依赖称为平凡的函数依赖;!当属性集Y不是属性集X的子集时,则称XY为非平凡的函数依赖。第12页,本讲稿共51页2、函数依赖 .函数依赖是语义范畴的依赖函数依赖只能根据语义来确定,不能根据其形式化定义。.函数依赖与属性之间的联系类型有关
7、!在一个关系模型中,如果属性X与Y有1:1联系时,则存在函数依赖XY,YX,即XY。例如:成绩表中学号为主键,姓名无重复姓名:学号=1:1第13页,本讲稿共51页2、函数依赖!如属性X与Y有m:1的联系时,则只存在函数依赖XY例如:学生成绩表中学号(主键)与英语成绩学号:英语=m:1!如属性X和Y有m:n的联系是,则X与Y之间不存在函数依赖关系例如:一个学生可以选多门课,一门课可由多个学生选第14页,本讲稿共51页2、函数依赖 .函数依赖关系的存在和时间无关函数依赖是指关系中的所有元组应该满足的约束条件,而不是指关系中某个或某些元组所满足的约束条件;当关系中的元组增加、删除或更新后都不能被破坏
8、这种函数依赖。因此,必须根据语义来确定属性之间的函数依赖,而不能单凭某一时刻关系中的实际数据值来判断。第15页,本讲稿共51页2、函数依赖.函数依赖可以保证关系分解的无损连接性设R(X,Y,Z),X,Y,Z为不相交的属性集合,如果XY或XZ,则有R(X,Y,Z)=RX,Y*RX,Z,其中,RX,Y表示关系R在属性(X,Y)上的投影,即R等于其投影在X上的自然连接,这样便保证了关系R分解后不会丢失原有的信息,称为关系分解的无损连接性第16页,本讲稿共51页2、函数依赖2.1.2 函数依赖的基本性质函数依赖的基本性质a.投影性一组属性函数决定它的所有子集例如:在关系成绩表中,(姓名,学号)姓名(姓
9、名,学号)学号b.扩张性若XY且WZ,则(X,W)(Y,Z)C.合并性若XY且XZ则必有X(Y,Z)d.分解性若X(Y,Z),则XY且XZ第17页,本讲稿共51页2、函数依赖2.2 完全函数依赖和部分函数依赖完全函数依赖和部分函数依赖设有关系模式R(U),U是属性全集,X和Y是U的子集,如果XY,并且对于X的任何一个真子集X,都有XY,则称Y对X完全函数依赖(fullfunctionaldependency),记作XY。如果对X的某个真子集X,有XY,则称Y对X部分函数依赖(partialfunctionaldependency),记作XYfp第18页,本讲稿共51页2、函数依赖 例如:例如:
10、学生成绩表中学生成绩表中姓名不能推出年龄,学号不能推出年龄,但是姓名+学号能推出年龄,故完全依赖;学号能直接推出籍贯,故是部分依赖姓名学号年龄籍贯王一116河北王二215山东王三316北京王一416天津第19页,本讲稿共51页2、函数依赖2.3 传递函数依赖传递函数依赖设有关系模式R(U),U是属性全集,X,Y,Z是U的子集,若XY,但YX,而YZ(YX,ZY),则称Z对X传递函数依赖,记作:XZ。如果YX,则XY,称Z对X直接函数依赖 归纳:归纳:函数依赖分为:直接函数依赖、部分函数依赖和传递函数依赖t第20页,本讲稿共51页3、范式规范化的基本思想是:消除关系模式中的数据冗余,消除数据依赖
11、中的不合适的部分,解决数据插入、删除时发生的异常现象。范式:把关系数据库的规范化过程中为不同程度的规范化要求设立的不同标准。范式主要有(关系数据库规范):1NF、2NF、3NF、BCNF、4NF、5NF各范式的联系:5NF4NFBCNF3NF2NF1NF第21页,本讲稿共51页3、范式3.1 第一范式第一范式定义:如果关系模式R所有的属性均为简单属性,即每个属性都是不可再分的,则称R属性第一范式,记作R1NF。备注:一个关系模式不能仅仅属于第一范式,否则会有大量的数据冗余,具有插入异常、删除异常和更新异常等弊端。第22页,本讲稿共51页3、范式分析:在关系模式SCD中,即存在完全函数依赖又存在
12、部分函数依赖和传递函数依赖。但这种情况是不允许的,解决办法是用投影运算将关系分解,去掉过于复杂的函数依赖关系,向高一级范式转换。第23页,本讲稿共51页3、范式3.2 第二范式第二范式 1.定义定义如果关系模式R1NF,且每个非主属性都完全函数依赖于R的每个关系键,则称R属于第二范式,即2NF,记作R2NF 例题:例题:关系模式SCD中存在非主属性字段部分依赖主属性字段的情况,故SCD不是2NF;但SCD拆成S、D、SC后,所有非主属性字段都完全依赖于主属性字段,故S、D、SC为2NF第24页,本讲稿共51页3、范式结论:结论:!从1NF关系中消除了非主属性对关系键的部分函数依赖,则可得到2N
13、F关系;!如果R的关系为单属性,或R的全体属性均为主属性,则R2NF 2.2NF规范化规范化2NF规范化是指把1NF关系模式通过投影分解,转换成2NF关系模式的集合。分解遵循的基本原则是“一事一地”,让一个关系只描述一个实体或实体间的联系,如果多于一个实体或联系,则进行投影分解。第25页,本讲稿共51页3、范式对2NF规范化作形式化的描述:设有关系模式R(X、Y、Z),R1NF,但R2NF,其中,X是键属性,Y,Z是非主属性,且存在部分函数依赖,XY。设X可表示为X1,X2,其中X1Y。则R(X,Y,Z)可分解为RX1,Y和RX,Z。因为X1Y,所以R(X,Y,Z)=RX1,Y*RX1,X2,
14、Z=RX1,Y*RX,Z,即R等于其投影RX1,Y和X,Z在X1上的自然连接,R的分解具有无损失连接性。pf第26页,本讲稿共51页3、范式3.2NF的缺点.数据冗余:如每系的系主任名存储的次数与该系的学生的人数;.插入异常:如新系且未招生,则无法插入该系信息;.删除异常:如该系学生全部毕业且未招生,删除学生信息同时将删除该系信息;.更新异常:如更换系主任,则学生信息也更换。第27页,本讲稿共51页3、范式3.3 第三范式第三范式 1.定义定义 如果关系模式如果关系模式R 2NF,且每个非主属性不传递依赖,且每个非主属性不传递依赖于于R的每个关系键,则称的每个关系键,则称R属于第三范式,即属于
15、第三范式,即3NF,记作,记作R 3NF。第三范式的性质:第三范式的性质:a.如果如果R 3NF,则,则R也是也是R 2NF b.如果如果R 2NF,则,则R不一定是不一定是3NF第28页,本讲稿共51页3、范式2.3NF规范化规范化 3NF规范化是指把规范化是指把2NF的关系模式通过投影分解转的关系模式通过投影分解转换成换成3NF关系模式的集合。关系模式的集合。3NF规范化遵循的原则是让一个关系只描述一个规范化遵循的原则是让一个关系只描述一个实体或实体间的联系。实体或实体间的联系。例题:例题:书书P111第29页,本讲稿共51页3、范式3.3NF的特点的特点.数据冗余降低了;.不存在插入异常
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 关系 数据库 理论 优秀 PPT
限制150内