自考~04735数据库系统原理复习资料.doc
《自考~04735数据库系统原理复习资料.doc》由会员分享,可在线阅读,更多相关《自考~04735数据库系统原理复习资料.doc(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1数据库原理及应用复习重点第一章 数据库系统基本概念一、 数据管理技术的发展1 分为四个阶段:人工管理阶段、文件系统阶段、数据库阶段和高级数据库阶段。2 数据库阶段数据管理的特点:1) 采用数据模型表示复杂的数据结构。2) 有较高的数据独立性。3) 数据库系统为用户提供了方便的用户接口。4) 提供四方面的数据控制功能:数据库的恢复、数据库的并发控制、数据的完整性、数据安全性。5) 增加了系统的灵活性。3 数据库(DB):是长期存储在计算机内、有组织的、统一管理的相关数据的集合。4 数据库管理系统(DBMS):是位于用户与操作系统之间的一层数据管理软件,它为用户或应用程序提供访问 DB 的方法,
2、包括 DB 的建立、查询、更新及各种数据控制。5 数据库系统(DBS ):是实现有组织地、动态地存储大量关联数据、方便多用户访问的计算机硬件、软件和数据资源组成的系统,即它是采用数据库技术的计算机系统。二、 数据描述1 分为三个阶段:概念设计、逻辑设计和物理设计。2 概念设计中的术语:1) 实体:客观存在,可以相互区别的事物称为实体。2) 实体集:性质相同的同类实体的集合。3) 属性:实体有很多特性,每一个特性称为属性。4) 实体标识符(关键码或键):能惟一标识实体的属性或属性集。以上概念均有类型和值之分。3 逻辑设计中的术语:1) 字段(数据项):标记实体属性的命名单位称为字段或数据项。2)
3、 记录:字段的有序集合。3) 文件:同一类记录的集合。4) 关键码:能惟一标识文件中每个记录的字段或字段集。以上概念均有类型和值之分。4 概念设计和逻辑设计中术语的对应关系:概念设计 逻辑设计 实体 记录属性 字段(数据项)实体集 文件实体标识符 关键码5 实体之间联系的元数:与一个联系有关的实体集个数。常用二元联系。二元联系的类型有三种:一对一联系、一对多联系、多对多联系。6 一对一联系:如果实体集 E1 中每个实体至多和实体集 E2 中的一个实体有联系,反之亦然,那么实体集 E1 和 E2 的联系称为“一对一联系” ,记为“1:1” 。7 一对多联系:如果实体集 E1 中每个实体与实体集
4、E2 中任意个(零个或多个)实体间有联系,而 E2 中每个实体至多和 E1 中一个实体有联系,那么称 E1 对E2 的联系是“一对多联系” ,记为“1:N” 。8 多对多联系:如果实体集 E1 中每个实体可以与实体集 E2 中任意个(零个或多个)实体间有联系,反之亦然,那么称 E1 和 E2 的联系是“多对多联系” ,记为“M:N” 。三、 数据抽象的级别1 数据模型:描述数据库的结构和定义,对现实世界的数据进行抽象。2 从现实世界的信息到数据库存储的数据以及用户使用的数据是一个逐步抽象过程,根据数据抽象的级别定义了四种模型:概念模型、逻辑模型、外部模型和内部模型。3 概念模型:表达用户需求观
5、点的数据全局逻辑结构的模型。4 逻辑模型:表达计算机实现观点的 DB全局逻辑结构的模型。25 外部模型:表达用户使用观点的 DB 局部逻辑结构的模型。6 内部模型:表达 DB 物理结构的模型。7 数据抽象的过程、即数据库设计的过程具体步骤:1) 根据用户需求,设计数据库的概念模型;2) 根据转换规则,把概念模型转换成数据库的逻辑模型;3) 根据用户的业务特点,设计不同的外部模型,给程序员使用;4) 数据库实现时,要根据逻辑模型设计其内部模型。通常分为概念设计、逻辑设计(2 和 3步)和物理设计三个阶段。8 常用的概念模型是实体联系(ER)模型,ER 模型主要用 ER 图来表示。9 逻辑模型的分
6、类:层次模型、网状模型、关系模型等。10 层次模型:用树型(层次)结构表示实体及实体间联系的数据模型。11 1969 年,美国 IBM 公司的 IMS 系统是典型的层次模型系统。12 网状模型:用有向图结构表示实体及实体间联系的数据模型。13 1969 年,CODASYL 组织提出 DBTG报告中的数据模型是网状模型的主要代表。14 关系模型:是由若干个关系模式组成的集合。关系模式即记录类型,它的实例称为关系,每个关系实际上是一张二维表格。15 1970 年,美国 IBM 公司的 E.F.Codd 连续发表论文,提出关系模型,奠定了关系数据库的理论基础。关系数据库是目前的主流数据库。16 外部
7、模型中的模式称为视图。17 三级模式:从用户(或应用程序)到数据库之间,DB 的数据结构描述有三个层次:1)外模式:用户与数据库系统的接口,是用户用到的那部分数据的描述。外模式由若干个记录类型组成。2)逻辑模式:是数据库中全部数据的整体逻辑结构的描述。3)内模式:是数据库在物理存储方面的描述。注意:外模式是逻辑模式的子集。18 两级映像:1)外模式/逻辑模式映像:存在于外模式和逻辑模式之间,用于定义外模式和逻辑模式之间的对应性。2)逻辑模式/内模式映像:存在于逻辑模式和内模式之间,用于定义逻辑模式和内模式之间的对应性。19 数据库系统的三级模式、两级映像结构使数据库系统达到了高度的数据独立性。
8、20 数据独立性:是指应用程序与数据库的数据结构之间相互独立,在修改数据结构时,尽可能不修改应用程序。分为逻辑数据独立性和物理数据独立性。21 逻辑数据独立性:如果数据库的逻辑模式要修改,那么只要对外模式/逻辑模式映像作相应的修改,可以使外模式和应用程序尽可能保持不变。这样就认为数据库达到了逻辑数据独立性。22 物理数据独立性:如果数据库的内模式要修改,即数据库的物理结构有所变化,那么只要对逻辑模式/内模式映像作相应的修改,可以使逻辑模式尽可能保持不变。也就是对内模式的修改尽量不影响逻辑模式,当然对外模式和应用程序的影响更小,这样就认为数据库达到了物理数据独立性。四、 数据库管理系统(DBMS
9、)1DBMS 的主要功能:数据库的定义功能(DBMS 提供 DDL 定义数据库的三级模式、两级映像等) 、数据库的操纵功能(DBMS提供 DML 实现对数据的操作,基本的数据操作有检索和更新两类) 、数据库的保护功能、数据库的维护功能、数据字典。五、 数据库系统(DBS)1DBS 的组成:是数据库、硬件、软件和数据库管理员的集合体。2软件包括 DBMS、OS、各种主语言和应用开发支撑软件等程序。其中,DBMS3是 DBS 的核心软件,要在 OS 支持下才能工作。3数据库管理员(DBA):是控制数据整体结构的一组人员,负责 DBS 的正常运行,承担创建、监控和维护数据库结构的责任。第二章 数据库
10、设计和 ER 模型一、数据库系统生存期1数据库系统生存期:数据库应用系统从开始规划、设计、实现、维护到最后被新的系统取代而停止使用的整个期间。2数据库系统生存期分七个阶段:规划、需求分析、概念设计、逻辑设计、物理设计、实现、运行维护。3规划阶段三个步骤:系统调查、可行性分析、确定数据库系统总目标。4需求分析阶段:主要任务是系统分析员和用户双方共同收集数据库系统所需要的信息内容和用户对处理的需求,并以需求说明书的形式确定下来。5概念设计阶段:产生反映用户单位信息需求的概念模型。与硬件和 DBMS 无关。6逻辑设计阶段:将概念模型转换成 DBMS 能处理的逻辑模型。外模型也将在此阶段完成。7物理设
11、计阶段:对于给定的基本数据模型选取一个最适合应用环境的物理结构的过程。数据库的物理结构主要指数据库的存储记录格式、存储记录安排和存取方法。8数据库的实现:包括定义数据库结构、数据装载、编制与调试应用程序、数据库试运行。二、ER 模型的基本概念 ER 模型的基本元素是:实体、联系和属性。2 实体:是一个数据对象,指应用中可以区别的客观存在的事物。实体集:是指同一类实体构成的集合。实体类型:是对实体集中实体的定义。一般将实体、实体集、实体类型统称为实体。3 联系:表示一个或多个实体之间的关联关系。联系集:是指同一类联系构成的集合。联系类型:是对联系集中联系的定义。一般将联系、联系集、联系类型统称为
12、联系。4 同一个实体集内部实体之间的联系,称为一元联系;两个不同实体集实体之间的联系,称为二元联系,以此类推。5 属性:实体的某一特性称为属性。在一个实体中,能够惟一标识实体的属性或属性集称为实体标识符。6 ER 模型中,方框表示实体、菱形框表示联系、椭圆形框表示属性、实体与联系、实体与其属性、联系与其属性之间用直线连接。实体标识符下画横线。联系的类型要在直线上标注。注意:联系也有可能存在属性,但联系本身没有标识符。例:假设一个学生可选多门课程,而一门课程又有多个学生选修,一个教师可讲多门课程,一门课程至多只有一个教师讲授。ER 图如下:7 概念设计三个步骤:设计局部 ER 模型、设计全局 E
13、R 模型和全局 ER 模型的优化。三、关系模型的基本概念1关系模型的定义:用二维表格表示实体集,用关键码表示实体之间联系的数据模型。2在关系模型中,字段称为属性,字段值称为属性值,记录类型称为关系模式。记录称为元组,元组的集合称为关系或实例。有时习惯称关系为表或表格,元组为行,属性为列。关系中属性个数称为元数,元组个数称为基数。3关键码(简称键):由一个或多个属性组成。4超键:在关系中能惟一标识元组的属性集称为关系模式的超键。5候选键:不含有多余属性的超键。6主键:用户选作元组标识的候选键。一般如不加说明,键是指主键。7外键:如果模式 R 中属性集 K 是其他模式的主键,那么 K 在模式 R
14、中称为外键。8值域:关系中每一个属性都有一个取值范围,称为属性的值域。每一个属性对应一个值域,不同的属性可对应于同一值域。9关系的定义:关系是一个属性数目相同的元组的集合。10关系的性质:关系是一种规范化了的二维表格。1)关系中每一个属性值都是不可分解的;42)关系中不允许出现重复元组;3)关系没有行序;4)元组中的属性在理论上也是无序的,但使用时按习惯考虑列的顺序。11关系数据库中的数据与更新操作必须遵循三类完整性规则:实体完整性规则、参照完整性规则、用户定义的完整性规则。12实体完整性规则:要求关系中元组在组成主键的属性上不能有空值。13参照完整性规则:如果属性集 K 是关系模式R1 的主
15、键,K 也是关系模式 R2 的外键,那么在R2 关系中,K 的取值只允许两种可能,或者为空值,或者等于 R1 关系中某个主键值。这条规则的实质是“不允许引用不存在的实体” 。其中,R1称为参照关系;R2 称为依赖关系。注意:这条规则在具体使用时,有三点变通:1)外键和相应的主键可以不同名,只要定义在相同值域上即可;2)R1 和 R2 可以是同一个关系模式,此时表示了同一个关系中不同元组之间的联系;3)外键值是否允许空,应视具体问题而定。14用户定义的完整性规则:用户针对具体的数据约束,设置的完整性规则,由系统来检验实施。四、ER 模型到关系模型的转换1ER 图转换成关系模式集的算法:1)实体类
16、型的转换:将每个实体类型转换成一个关系模式,实体的属性即为关系模式的属性,实体标识符即为关系模式的键。2)联系类型的转换:主要掌握二元联系类型的转换。a) 若实体间联系是 1:1,可以在两个实体类型转换成的关系模式中任意一个关系模式的属性中加入另一个关系模式的键(作为外键)和联系类型的属性。b) 若实体间联系是 1:N,则在 N 端实体类型转换成的关系模式中加入 1 端实体类型的键(作为外键)和联系类型的属性。c) 若实体间联系是 M:N,则将联系类型也转换成关系模式,其属性为两端实体类型的键(作为外键)加上联系类型的属性,而键为两端实体键的组合。例:下面是教学管理的一个可能的 ER 图。图中
17、,有三个实体类型:系、教师和课程;有四个联系类型:主管、聘用、开设和任教。根据转换算法,把该图转换成关系模式集的步骤如下:第一步:把三个实体类型转换成三个关系模式(注意关系模式的表示方法):系(系编号,系名,电话)教师(教工号,姓名,性别,职称)课程(课程号,课程名,学分)第二步:对于 1:1 联系,可以在“系”模式中加入教工号(教工号为外键) 。对于 1:N 联系“聘用” ,可以在“教师”模式中加入系编号和聘期两个属性(系编号为外键) ;对于 1:N 联系“开设” ,可以在“课程”模式中加入系编号(系编号为外键) 。这样第一步得到的三个模式改变成如下形式(注意:外键通常使用波浪线表示):系(
18、系编号,系名,电话,主管人的教工号)教师(教工号,姓名,性别,职称,系编号,聘期)课程(课程号,课程名,学分,系编号)第三步:对于 M:N 联系“任教” ,则生成一个新的关系模式:任教(教工号,课程号,教材)这样,转换成的四个关系模式如下:系(系编号,系名,电话,主管人的教工号)教师(教工号,姓名,性别,职称,系编号,聘期)课程(课程号,课程名,学分,系编号)任教(教工号,课程号,教材)2采用 ER 模型的逻辑设计步骤1)导出初始关系模式集:把概念设计的结果(即全局 ER 模型)转换成初始关系模式集。2)规范化处理3)模式评价4)模式修正55)设计外模式第三章 关系模式设计理论一、关系模式的设
19、计准则1数据冗余:同一个数据在系统中多次重复出现。2关系模式设计不当引起的异常问题:数据冗余、操作异常(包括修改异常、插入异常和删除异常)3关系模式的非形式化设计准则1)关系模式的设计应尽可能只包含有直接联系的属性,不要包含有间接联系的属性。也就是,每个关系模式应只对应于一个实体类型或一个联系类型。2)关系模式的设计应尽可能使得相应关系中不出现插入异常、删除和修改等操作异常现象。3)关系模式的设计应尽可能使得相应关系中避免放置经常为空值的属性。4)关系模式的设计应尽可能使得关系的等值连接在主键和外键的属性上进行,并且保证以后不会生成额外的元组。4习惯使用的一些符号:1)英文字母表首部的大写字母
20、“A,B, C,” 表示单个的属性。2)英文字母表尾部的大写字母“,U,V,W ,X,Y,Z ”表示属性集。3)大写字母 R 表示关系模式,小写字母 r 表示其关系。4)关系模式的简化表示方法:R(A,B,C , )或 R(ABC)5)属性集 X 和 Y 的并集简写为 XY。二、函数依赖1函数依赖(FD)的定义:设有关系模式R(U) ,X 和 Y 是属性集 U 的子集,函数依赖是形成 XY 的一个命题,只要 r 是 R 的当前关系,对 r 中任意两个元组 t 和 s,都有 tX=sX蕴涵tY=sY,那么称 FD XY 在关系模式 R(U)中成立。说明: 1)tX表示元组 t 在属性集 X 上的
21、值,其余类同。2)XY 读作“X 函数决定 Y”或“Y 函数依赖于 X”。3)FD 是对关系模式 R 的一切可能的关系 r 定义的。对于当前关系 r 的任意两个元组,如果 X 值相同,则要求 Y 值也相同,即有一个 X值就有一个 Y 值与之对应,或者说 Y 值由 X 值决定。3FD 的逻辑蕴涵:设 F 是在关系模式 R 上成立的函数依赖的集合,XY 是一个函数依赖。如果对于 R 的每个满足 F 的关系 r 也满足 XY,那么称 F 逻辑蕴涵 X Y,记为 F|=XY。4设 F 是函数依赖集,被 F 逻辑蕴涵的函数依赖全体构成的集合,称为函数依赖集 F 的闭包,记为 F+。即 F+=XY | F
22、|=XY 5FD 的推理规则(Armstrong 公理)设 U 是关系模式 R 的属性集,F 是 R 上成立的只涉及到 U 中属性的函数依赖集。7对于 FD XY,如果 YX,那么称 XY 是一个“平凡的 FD”,否则称为 “非平凡的 FD”。通常研究非平凡 FD。例:XX,X, ,XYX 都是平凡函数依赖;XXY 则是非平凡函数依赖。9属性集的闭包10设 F 是属性集 U 上的 FD 集, X 上 U 的子集,那么(相对于)属性集 X 的闭包用 X+表示,它是一个从 F 集使用 FD 推理规则推出的所有满足XA 的属性 A 的集合:X +=属性 A | F|=XA11XY 能用 FD 推理规
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 自考 04735 数据库 系统 原理 复习资料
限制150内