《第八章 数据库设计2.ppt》由会员分享,可在线阅读,更多相关《第八章 数据库设计2.ppt(67页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第八章第八章 数据库设计数据库设计2本章学习要点本章学习要点:(1 1)掌握数据库设计的基本步骤。)掌握数据库设计的基本步骤。(2 2)熟悉需求分析过程。)熟悉需求分析过程。(3 3)掌握数据库设计的概念结构设计。)掌握数据库设计的概念结构设计。(4 4)掌握数据库设计的逻辑结构设计。)掌握数据库设计的逻辑结构设计。(5 5)了解数据库的物理设计。)了解数据库的物理设计。(6 6)掌握)掌握E-RE-R图设计、图设计、E-RE-R图向关系模式的图向关系模式的转换、及优化方法。转换、及优化方法。(7 7)掌握索引的概念、分类、基本方法。)掌握索引的概念、分类、基本方法。10.110.1数据库设计
2、概述数据库设计概述10.210.2需求分析需求分析10.310.3概念结构设计概念结构设计10.410.4逻辑结构设计逻辑结构设计10.510.5数据库的物理设计数据库的物理设计10.610.6数据库实施数据库实施10.710.7数据库运行与维护数据库运行与维护10.810.8小结小结内容提要内容提要:10.410.4逻辑结构设计(重点)逻辑结构设计(重点)v逻辑结构设计的任务逻辑结构设计的任务 基本基本E-R模型模型 数据模型数据模型 (概念设计阶段概念设计阶段)(DBMS)v关系数据库逻辑结构关系数据库逻辑结构设计的步骤设计的步骤(1)将将概念模型转换概念模型转换为为关系数据模型关系数据模
3、型。(2)将关系数据模型转换成特定将关系数据模型转换成特定DBMS支持下的支持下的关系数据模型。关系数据模型。(3)对关系数据模型对关系数据模型进行优化进行优化。转换转换关系模型的逻辑结构是一组关系模式关系模型的逻辑结构是一组关系模式的集合。的集合。目标:将实体、实体的属性和实体之目标:将实体、实体的属性和实体之间的联系转换为关系模式。间的联系转换为关系模式。10.4.1E-R模型向关系模型的转换模型向关系模型的转换1、转换原则及具体方法:、转换原则及具体方法:(1 1)一个)一个实体实体转换为一个转换为一个关系模式关系模式:关系的属性:实体的属性;关系的属性:实体的属性;关系的码:实体的码。
4、关系的码:实体的码。(2 2)联系的转换原则联系的转换原则 1 1)1:11:1联系联系 A A、转换为独立的关系模式:、转换为独立的关系模式:属性属性=两关联实体各自的主码两关联实体各自的主码+联系本身的属联系本身的属性性 码码=每个关联的实体主码的均是候选码。每个关联的实体主码的均是候选码。B B、与任一方关系模式合并:、与任一方关系模式合并:将将一方实体的码一方实体的码与与联系属性联系属性一并一并加入另一方加入另一方。主码:不变主码:不变。实例:部门与经理:实例:部门与经理:1 1:1 1联系联系各实体属性各实体属性部门:部门号、部门名称部门:部门号、部门名称经理:工号、姓名、性别、出生
5、年月。经理:工号、姓名、性别、出生年月。联系的属性:任期联系的属性:任期A A、联系转换为独立的关系模式:、联系转换为独立的关系模式:部门(部门(部门号部门号,部门名称),部门名称)经理(经理(工号工号、姓名、性别、出生年月)、姓名、性别、出生年月)负责(负责(部门号部门号,工号,任期),工号,任期)B B、与任一方关系模式合并:、与任一方关系模式合并:部门(部门(部门号部门号,部门名称,工号,任期),部门名称,工号,任期)经理(经理(工号工号、姓名、性别、出生年月)、姓名、性别、出生年月)部门经理负责112 2)1:m1:m联系联系:A A、转换为独立的关系模式、转换为独立的关系模式属性属性
6、=两关联实体各自的主码两关联实体各自的主码+联系本身的属性联系本身的属性 主码主码=“m”=“m”方实体主码的主码。方实体主码的主码。B B、将为、将为“1”“1”方的实体的主码(作为外码)与联方的实体的主码(作为外码)与联系属性一并加入系属性一并加入“m”“m”方实体。方实体。合并后,合并后,码不变。码不变。3 3)m:nm:n联系:须单独建立一个关系模式。联系:须单独建立一个关系模式。属性属性=两关联实体各自的主码两关联实体各自的主码+联系本身的属性联系本身的属性 主码主码=两关联实体主码的组合。两关联实体主码的组合。4 4)同一实体之间同一实体之间的的1:m1:m联系联系 在该实体对应的
7、关系模式中加入为在该实体对应的关系模式中加入为“1”“1”实实体的主码和联系的属性。体的主码和联系的属性。实例:实例:员工工号工号姓名姓名性别性别出生年月出生年月工资工资民意测试民意测试负责负责1m关系模式为:关系模式为:员工(员工(工号工号,姓名,性别,出生年月,姓名,性别,出生年月,经经理工号,民意测验理工号,民意测验)。)。5)两实体间的弱实体联系)两实体间的弱实体联系 将将被依赖实体的主码纳入弱实体被依赖实体的主码纳入弱实体中,中,作为弱实体的主码或主码中的一部分。作为弱实体的主码或主码中的一部分。员工亲属有有职工号职工号姓名姓名年龄年龄性别性别亲属关系亲属关系家属姓名家属姓名工种工种
8、 关系模式为:关系模式为:员工(员工(职工号职工号,姓名,年龄,性别,工种),姓名,年龄,性别,工种)亲属(亲属(职工号,家属姓名职工号,家属姓名,亲属关系),亲属关系)1m6)超类和子类的转换)超类和子类的转换 超类、子类实体可转换为一个关系,并超类、子类实体可转换为一个关系,并将超类实体的主码加到子类实体中。将超类实体的主码加到子类实体中。实例:实例:员工员工管理员管理员部门经理部门经理工程师工程师职工号性别出生年月参加工作时间姓名部门号学历岗位津贴级别职务职称学历专业职称该该E-RE-R模型模型转换为关系模式为转换为关系模式为:员工(员工(职工号职工号,姓名,性别,出生年月,参,姓名,性
9、别,出生年月,参加工作时间,部门号)加工作时间,部门号)部门经理(部门经理(职工号职工号,学历,级别,岗位津贴),学历,级别,岗位津贴)管理员(管理员(职工号职工号,职务,职称),职务,职称)工程师(工程师(职工号职工号,学历,专业职称),学历,专业职称)为方便查询,还可在超类实体中增加一为方便查询,还可在超类实体中增加一个指个指示属性示属性,根据指示的值直接查询子类实,根据指示的值直接查询子类实体表。体表。员工(员工(职工号职工号、姓名、性别、姓名、性别、出生年月,参出生年月,参加工作时间,部门号,加工作时间,部门号,员工类别员工类别)7)同一实体间同一实体间的的m:n联系联系须单独建立一个
10、关系模式。须单独建立一个关系模式。属性属性=两关联实体各自的主码两关联实体各自的主码+联系本身的属联系本身的属性性主码主码=两关联实体主码的组合。两关联实体主码的组合。注注:由于:由于“联系联系”仅涉及一个实体,加入的主仅涉及一个实体,加入的主码要取不同的名字。码要取不同的名字。实例实例:零件号零件号零件组装组装名称名称型号型号数量数量价格价格nm 关系模式为:关系模式为:零件(零件(零件号零件号,名称,型号,价格),名称,型号,价格)组装(组装(零件号,组装零件号零件号,组装零件号,数量),数量)9)三个或三个以上实体间的三个或三个以上实体间的m:n联系联系须单独建立一个关系模式。须单独建立
11、一个关系模式。属性属性=所联系的各实体的主码所联系的各实体的主码+联系本身的属联系本身的属性性主码主码=关联实体主码的组合。关联实体主码的组合。实例:实例:零件号零件号零件零件供应供应名称名称型号型号数量数量价格价格nm项目项目供应商供应商p项目号项目号工期工期项目名称项目名称地址地址供应商名供应商名供应商号供应商号该该E-R模型转换为关系模式为:模型转换为关系模式为:零件(零件(零件号零件号,名称,型号,价格),名称,型号,价格)项目(项目(项目号项目号,项目名称,工期),项目名称,工期)供应商(供应商(供应商号供应商号,供应商名,地址),供应商名,地址)供应(供应(零件号,项目号,供应商号
12、零件号,项目号,供应商号,数量)数量)综合实例综合实例:工厂工厂产品产品零件零件仓库仓库家属家属工人工人车间车间从属从属隶属隶属有有有有制造制造存放存放存放存放生产生产装配装配mmmmmmmnnmm1E-R模型模型各实体的属性为:各实体的属性为:车间:车间:车间号、车间主任姓名、地址和电话;车间号、车间主任姓名、地址和电话;工人:工人:职工号、姓名、年龄、性别、工种职工号、姓名、年龄、性别、工种;工厂:工厂名、厂长名;工厂:工厂名、厂长名;产品:产品号、产品名、型号、价格;产品:产品号、产品名、型号、价格;零件:零件号、零件名称、重量、价格;零件:零件号、零件名称、重量、价格;仓库:仓库号、仓
13、库主任姓名、电话;仓库:仓库号、仓库主任姓名、电话;家属:家属姓名、亲属关系。家属:家属姓名、亲属关系。将将E-RE-R模型转换为关系模式为:模型转换为关系模式为:工厂(工厂(工厂名工厂名、厂长名、厂长名););车间(车间(车间号车间号,车间主任姓名,地址,电话,车间主任姓名,地址,电话,工厂名工厂名);工人(工人(职工号职工号,姓名,年龄,性别,工种,姓名,年龄,性别,工种,车间号车间号););仓库(仓库(仓库号仓库号,仓库主任姓名,电话,仓库主任姓名,电话,工厂名工厂名)产品(产品(产品号产品号,产品名,型号,价格,产品名,型号,价格,车间号车间号,仓库仓库号号););零件(零件(零件号零
14、件号,零件名称,重量,价格,零件名称,重量,价格,仓库号仓库号););制造(制造(车间号,零件号车间号,零件号););装配(装配(零件号,产品号零件号,产品号););亲属(职工号,亲属(职工号,家属姓名,亲属关系家属姓名,亲属关系)10.4.2向特定的向特定的RDBMS的模型转换。(略)的模型转换。(略)10.4.3关系数据模型的关系数据模型的优化优化 根据应用需要适当地修改、调整数据模根据应用需要适当地修改、调整数据模型结构。型结构。1、应用关系、应用关系规范化理论规范化理论对关系模式进行优对关系模式进行优化,具体步骤如下:化,具体步骤如下:(1)确定数据依赖:确定每个关系模式内)确定数据依
15、赖:确定每个关系模式内部各个属性之间的数据依赖以及不同关系模部各个属性之间的数据依赖以及不同关系模式属性之间的数据依赖。式属性之间的数据依赖。(2)对各个关系模式之间的数据依赖进行)对各个关系模式之间的数据依赖进行极小化处理,消除冗余的联系。极小化处理,消除冗余的联系。(3)确定各关系模式为)确定各关系模式为第几范式第几范式。(4)按照按照需求分析阶段的需求分析阶段的需求需求,确定要对,确定要对哪些模式进行哪些模式进行合并或分解合并或分解。采用技术:反规范化采用技术:反规范化(5)对关系模式进行必要的)对关系模式进行必要的分解分解,提高数,提高数据据操作的效率和存储空间利用率操作的效率和存储空
16、间利用率。两种分解方法:水平分解两种分解方法:水平分解 垂直分解垂直分解2、反规范化、反规范化 (了解)(了解)一个完全规范化的设计并不总能生成最一个完全规范化的设计并不总能生成最优的性能,因此通常是先按照优的性能,因此通常是先按照3NF设计,如设计,如果有性能问题,再通过反规范来解决。果有性能问题,再通过反规范来解决。数据库中的数据规范化的优点是减少了数据库中的数据规范化的优点是减少了数据冗余,节约了存储空间,相应逻辑和物数据冗余,节约了存储空间,相应逻辑和物理的理的I/O次数减少,同时加快了增、删、改次数减少,同时加快了增、删、改的速度,但是对完全规范的数据库查询,通的速度,但是对完全规范
17、的数据库查询,通常需要更多的连接操作,从而影响查询的速常需要更多的连接操作,从而影响查询的速度。因此,有时为了度。因此,有时为了提高某些查询或应用的提高某些查询或应用的性能性能而破坏规范规则,即反规范。而破坏规范规则,即反规范。是否规范化的程度越高越好是否规范化的程度越高越好?这要根据需要来决定,因为这要根据需要来决定,因为“分离分离”越深,越深,产生的关系越多,关系过多,连接操作越频繁,产生的关系越多,关系过多,连接操作越频繁,而连接操作是最费时间的,特别对以查询为主而连接操作是最费时间的,特别对以查询为主的数据库应用来说,频繁的连接会影响查询速的数据库应用来说,频繁的连接会影响查询速度。所
18、以,关系有时故意保留成非规范化的,度。所以,关系有时故意保留成非规范化的,或者规范化以后又反规范了,这样做通常是为或者规范化以后又反规范了,这样做通常是为了改进性能。了改进性能。(了解)(了解)例如例如,某校成绩管理系统,学生基本信息表,某校成绩管理系统,学生基本信息表student(sno,sname,sex,birth,zgrade),其中,总成绩就违反规范,其中其中,总成绩就违反规范,其中的值可以通过下面的查询获得:的值可以通过下面的查询获得:select sno,sum(grade)from sc group by sno(了解)(了解)如果如果studentstudent中没有该列,
19、若想获得该生的姓中没有该列,若想获得该生的姓名和总成绩,则需要做连接操作:名和总成绩,则需要做连接操作:select sname,zgradefrom student,(select sno,sum(grade)as grade from sc group by sc.sno)s where s.sno=student.sno 如果经常做这种查询,则就有必要在如果经常做这种查询,则就有必要在studentstudent表中加入列表中加入列zgradezgrade,相应的代价则是必须在表,相应的代价则是必须在表studentstudent上创建增、删、改的触发器来维护上创建增、删、改的触发器来维
20、护studentstudent表上表上zgradezgrade列的值。类似的情况在决策支列的值。类似的情况在决策支持系统中经常发生。持系统中经常发生。(了解)(了解)反规范的反规范的优点优点是是降低连接操作的需求降低连接操作的需求、降、降低外码和索引的数目,还可能减少表的数目;低外码和索引的数目,还可能减少表的数目;加快了查询速度。加快了查询速度。缺点:缺点:可能出现数据的完整性问题;会降低可能出现数据的完整性问题;会降低修改速度。修改速度。因此决定做反规范时,一定要权衡利弊,因此决定做反规范时,一定要权衡利弊,仔细分析应用的数据存取需求和实际的性能仔细分析应用的数据存取需求和实际的性能特点,
21、好的索引和其它方法经常能够解决性特点,好的索引和其它方法经常能够解决性能问题,而不必采用反规范这种方法。能问题,而不必采用反规范这种方法。3、几种常用的反规范化方法:、几种常用的反规范化方法:在进行反规范操作之前,要充分考虑数在进行反规范操作之前,要充分考虑数据的存取需求、常用表的大小、一些特殊的据的存取需求、常用表的大小、一些特殊的计算列计算列(如合计如合计)、数据的物理存储位置等。、数据的物理存储位置等。常用的反规范技术有增加冗余列、增加常用的反规范技术有增加冗余列、增加派生列、重新组表和分割表。派生列、重新组表和分割表。(了解)(了解)(1)增加冗余列)增加冗余列 增加冗余列是指在多个表
22、中具有相同的列,增加冗余列是指在多个表中具有相同的列,它常用来在查询时避免连接操作。它常用来在查询时避免连接操作。例如,前面例子中,如果经常检索一门课的任课教例如,前面例子中,如果经常检索一门课的任课教师姓名,若课程表中仅有教师编号师姓名,若课程表中仅有教师编号teacherno 列,列,则需要做则需要做course和和teacher表的连接查询表的连接查询:select cname,tname from course,teacher where course.teacherno=teacher.teacherno(了解)(了解)由于要频繁的查询每门课程任课老师的姓名,由于要频繁的查询每门课程
23、任课老师的姓名,则就可以在则就可以在course表中增加一列表中增加一列tname,就不,就不需要做连接操作了。需要做连接操作了。增加冗长余列的增加冗长余列的优点优点:查询时可避免连接操作。查询时可避免连接操作。增加冗长余列的增加冗长余列的缺点缺点:需要更多的磁盘空间,同时增加表维护的需要更多的磁盘空间,同时增加表维护的工作量。工作量。(2)增加派生列)增加派生列 增加派生列指增加的列来自其它表中的增加派生列指增加的列来自其它表中的数据,由它们计算生成。数据,由它们计算生成。优点:在查询时减少连接操作,避免使优点:在查询时减少连接操作,避免使用集函数。用集函数。缺点:具有与冗余列。缺点:具有与
24、冗余列。例如,前例例如,前例student表中的表中的zgrade列就是派列就是派生列。生列。(了解)(了解)(3)重新组表)重新组表 重新组表指如果许多用户需要查看两个表重新组表指如果许多用户需要查看两个表连接出来的结果数据,则把这两个表重新组成连接出来的结果数据,则把这两个表重新组成一个表来减少连接而提高性能。一个表来减少连接而提高性能。例如,用户经常需要同时查看课程号,课程名例如,用户经常需要同时查看课程号,课程名称,任课教师号,任课教师姓名,则可把表称,任课教师号,任课教师姓名,则可把表course(cno,cname,tno)和和表表teacher(teacherno,tname)合
25、并成一个表合并成一个表:course(cno,cname,teacherno,tname)。这。这样可提高性能,但需要更多的磁盘空间,同时样可提高性能,但需要更多的磁盘空间,同时也损失了数据在概念上的独立性。也损失了数据在概念上的独立性。(了解)(了解)(4)(4)分割表分割表 有时对表做分割可以提高性能。表分割有时对表做分割可以提高性能。表分割有两种方式:有两种方式:1)1)水平分解:把(基本表)关系的元组分为水平分解:把(基本表)关系的元组分为若干子集合,定义每个子集合为一个子关系,若干子集合,定义每个子集合为一个子关系,以提高系统的效率。以提高系统的效率。水平分割通常在下面的情况下使用水
26、平分割通常在下面的情况下使用:A A、表很大,分割后可以降低在查询时需要读、表很大,分割后可以降低在查询时需要读的数据和索引的页数,同时也降低了索引的的数据和索引的页数,同时也降低了索引的层数,提高查询速度。层数,提高查询速度。(了解)(了解)B B、表中的数据本来就有独立性,例如表中分、表中的数据本来就有独立性,例如表中分别记录各个地区的数据或不同时期的数据,别记录各个地区的数据或不同时期的数据,特别是有些数据常用,而另外一些数据不常特别是有些数据常用,而另外一些数据不常用。用。C C、需要把数据存放到多个介质上。、需要把数据存放到多个介质上。分解原则:分解原则:80/2080/20原则原则
27、。例如例如、法规表法规表law就可以分成两个表就可以分成两个表active_law和和inactive_law。Activea_law表表中的内容是中的内容是正生效的法规正生效的法规,是经常使用的,是经常使用的;而而inactive_law表则是已经表则是已经作废的法规作废的法规,不常,不常被查询,但须保留的。被查询,但须保留的。(了解)(了解)水平分割的水平分割的缺点缺点:会给应用增加复杂度,它:会给应用增加复杂度,它通常在查询时需要多个表名,查询所有数据通常在查询时需要多个表名,查询所有数据需要需要unionunion操作。操作。在许多数据库应用中,这种复杂性会超在许多数据库应用中,这种复
28、杂性会超过它带来的优点,因为只要索引关键字不大,过它带来的优点,因为只要索引关键字不大,则在索引用于查询时,表中增加两到三倍数则在索引用于查询时,表中增加两到三倍数据量,查询时也就增加读一个索引层的磁盘据量,查询时也就增加读一个索引层的磁盘次数。次数。(了解)(了解)2 2)垂直分割垂直分割:把主码和一些列放到一个表,:把主码和一些列放到一个表,然后把主码和另外的列放到另一个表中。然后把主码和另外的列放到另一个表中。(即把关系模式(即把关系模式R R的属性分解为若干子集合。的属性分解为若干子集合。)如果一个表中某些列常用,而另外一如果一个表中某些列常用,而另外一些列不常用,则可以采用垂直分割,
29、另外些列不常用,则可以采用垂直分割,另外垂直分割可以使得数据行变小,一个数据垂直分割可以使得数据行变小,一个数据页就能存放更多的数据,在查询时就会减页就能存放更多的数据,在查询时就会减少少I/OI/O次数。其缺点是需要管理冗余列,查次数。其缺点是需要管理冗余列,查询所有数据需要询所有数据需要joinjoin操作。操作。注:注:要确保无损连接性和保持函数依赖。要确保无损连接性和保持函数依赖。(了解)(了解)4 4、反规范技术需要、反规范技术需要维护数据的完整性维护数据的完整性 无论使用何种反规范技术,都需要一定的管无论使用何种反规范技术,都需要一定的管理来维护数据的完整性。理来维护数据的完整性。
30、常用的常用的方法方法:批处理维护:批处理维护 应用逻辑应用逻辑 触发器触发器1 1)批处理维护是指对复制列或派生列的修改积)批处理维护是指对复制列或派生列的修改积累一定的时间后,运行一批处理作业或存储过程累一定的时间后,运行一批处理作业或存储过程对复制或派生列进行修改,这只能在对实时性要对复制或派生列进行修改,这只能在对实时性要求不高的情况下使用。求不高的情况下使用。(了解)(了解)2 2)用应用逻辑用应用逻辑:数据的完整性也可由应用逻辑:数据的完整性也可由应用逻辑来实现,这就要求必须在同一事务中对所有涉及来实现,这就要求必须在同一事务中对所有涉及的表进行增、删、改操作。的表进行增、删、改操作
31、。该方法实现数据的完整性风险较大,因为同该方法实现数据的完整性风险较大,因为同一逻辑必须在所有的应用中使用和维护,容易遗一逻辑必须在所有的应用中使用和维护,容易遗漏,特别是在需求变化时,不易于维护。漏,特别是在需求变化时,不易于维护。3 3)使用触发器使用触发器,对数据的任何修改立即触发对,对数据的任何修改立即触发对复制列或派生列的相应修改。触发器是实时的,复制列或派生列的相应修改。触发器是实时的,而且相应的处理逻辑只在一个地方出现,易于维而且相应的处理逻辑只在一个地方出现,易于维护。一般来说,是解决这类问题的最好的办法。护。一般来说,是解决这类问题的最好的办法。(了解)(了解)10.4.4设
32、计用户子模式设计用户子模式(创建视图创建视图)全局关系模型设计完成后,还应根据局全局关系模型设计完成后,还应根据局部应用的需求,结合具体部应用的需求,结合具体DBMS的特点,设的特点,设计用户的子模式。计用户的子模式。设计子模式时应注意考虑用户的习惯和设计子模式时应注意考虑用户的习惯和方便性,主要包括:方便性,主要包括:(1)使用更符合用户惯的别名)使用更符合用户惯的别名 如按不同部门的习惯给视图中的列取名。如按不同部门的习惯给视图中的列取名。(2)以不同级别的用户定义不同的视图,)以不同级别的用户定义不同的视图,以保证系统的安全性。以保证系统的安全性。例如、设有一关系模式:产品(产品编号,例
33、如、设有一关系模式:产品(产品编号,产品名称,型号,价格,生产车间,生产负产品名称,型号,价格,生产车间,生产负责人,产品成本,产品合格率,质量等级)责人,产品成本,产品合格率,质量等级)面向一般顾客的视图:面向一般顾客的视图:产品产品1 1(产品编号,产品名称,型号,价格,(产品编号,产品名称,型号,价格,质量等级)质量等级)面向质量监督部门的视图:面向质量监督部门的视图:产品格(产品编号,产品名称,型号,生产产品格(产品编号,产品名称,型号,生产车间,产品合格率,质量等级)车间,产品合格率,质量等级)(3 3)简化用户对系统的使用)简化用户对系统的使用 针对某些局部应用中经常使用某些十分针
34、对某些局部应用中经常使用某些十分复杂的查询复杂的查询情况,为方便用户,可先将这些情况,为方便用户,可先将这些复杂查询定义为视图,用户每次只需对复杂查询定义为视图,用户每次只需对定义定义好的视图好的视图进行查询,大大进行查询,大大简化了复杂度简化了复杂度。10.5数据库的物理设计数据库的物理设计(主考虑是否建立(主考虑是否建立相关索引)相关索引)v什么是数据库的物理设计什么是数据库的物理设计数据库在物理设备上的存储结构与存数据库在物理设备上的存储结构与存取方法称为数据库的物理结构,它依取方法称为数据库的物理结构,它依赖于给定的计算机系统。赖于给定的计算机系统。为一个给定的逻辑数据模型选取一个为一
35、个给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程,最适合应用环境的物理结构的过程,就是数据库的物理设计。就是数据库的物理设计。数据库物理设计数据库物理设计确定数确定数据库的据库的物理结物理结构构评价数据评价数据库的物理库的物理结构结构逻辑结逻辑结构设计构设计数据库数据库实施实施物理物理模型模型逻辑逻辑模型模型数据库物理设计的步骤:数据库物理设计的步骤:10.5.1 数据库的物理设计的内容和方法数据库的物理设计的内容和方法v设计物理数据库结构的准备工作设计物理数据库结构的准备工作v 1 1、充分了解应用环境,详细分析要运行的事、充分了解应用环境,详细分析要运行的事务,以获得选择物理数据
36、库设计所需参数。务,以获得选择物理数据库设计所需参数。v 2 2、充分了解所用、充分了解所用RDBMSRDBMS的内部特征,特别是的内部特征,特别是系统提供的存取方法和存储结构。系统提供的存取方法和存储结构。选择物理数据库设计所需参数选择物理数据库设计所需参数数据库数据库查询事务查询事务(1 1)查询的关系)查询的关系(2 2)查询条件所涉及的属性)查询条件所涉及的属性(3 3)连接条件所涉及的属性)连接条件所涉及的属性(4 4)查询的投影属性)查询的投影属性数据数据更新事务更新事务(1 1)被更新的关系。)被更新的关系。(2 2)每个关系上的更新操作条件所涉及)每个关系上的更新操作条件所涉及
37、的属性。的属性。(3 3)修改操作要改变的属性值。)修改操作要改变的属性值。(4 4)每个事务在各关系上运行的频率和)每个事务在各关系上运行的频率和性能要求。性能要求。关系数据库物理设计的关系数据库物理设计的主要内容主要内容1 1、为关系模式选择、为关系模式选择存取方法存取方法(建立存取路径建立存取路径)。2 2、设计关系、索引等数据库文件的、设计关系、索引等数据库文件的物理存物理存储结构。储结构。10.5.2 10.5.2 关系模式存取方法选择关系模式存取方法选择DBMSDBMS常用存取方法常用存取方法1 1、索引方法,目前主要是、索引方法,目前主要是B+B+树索引方法树索引方法2 2、聚簇
38、(、聚簇(ClusterCluster)方法)方法3 3、HASHHASH方法方法10.5.2.110.5.2.1索引方法索引方法 选择索引存取方法的主要内容:选择索引存取方法的主要内容:根据应用要求确定根据应用要求确定 对哪些属性列建立索引对哪些属性列建立索引 对哪些属性列建立组合索引对哪些属性列建立组合索引 对哪些索引要设计为唯一索引对哪些索引要设计为唯一索引10.5.2.210.5.2.2聚簇存取方法聚簇存取方法什么是聚簇什么是聚簇 为了提高某个属性(或属性组)的查询为了提高某个属性(或属性组)的查询速度,把这个或这些属性(称为速度,把这个或这些属性(称为聚簇码聚簇码/聚聚集键集键)上具
39、有相同值的元组集中存放在连续)上具有相同值的元组集中存放在连续的物理块称为的物理块称为聚簇聚簇/聚集聚集。许多关系型许多关系型DBMSDBMS都提供了聚簇功能。都提供了聚簇功能。聚簇存取的优点聚簇存取的优点1 1、大大提高按聚簇属性进行查询的效率、大大提高按聚簇属性进行查询的效率2 2、节省存储空间、节省存储空间v聚簇的局限性(了解)聚簇的局限性(了解)v1、聚簇只能提高某些特定应用的性能、聚簇只能提高某些特定应用的性能v2、建立与维护聚簇的开销相当大、建立与维护聚簇的开销相当大v对已有关系建立聚簇,将导致关系中元组移动其物对已有关系建立聚簇,将导致关系中元组移动其物理存储位置,并使此关系上原
40、有的索引无效,必须理存储位置,并使此关系上原有的索引无效,必须重建。重建。v当一个元组的聚簇码改变时,该元组的存储位置也当一个元组的聚簇码改变时,该元组的存储位置也要做相应移动。要做相应移动。10.5.2.3HASH10.5.2.3HASH存取方法存取方法当一个关系满足下列两个条件时,可以选择当一个关系满足下列两个条件时,可以选择HASHHASH存取方法:存取方法:1 1、该关系的属性主要出现在、该关系的属性主要出现在等值连接条件等值连接条件中中或主要出现在或主要出现在相等比较选择条件相等比较选择条件中。中。2 2、该关系的大小可预知,而且不变;、该关系的大小可预知,而且不变;3 3、该关系的
41、大小动态改变,但所选用的、该关系的大小动态改变,但所选用的DBMSDBMS提供了动态提供了动态HASHHASH存取方法。存取方法。10.5.3 10.5.3 确定数据库的存储结构(了解)确定数据库的存储结构(了解)确定数据库物理结构的内容:确定数据库物理结构的内容:1 1、确定数据的存放位置和存储结构:、确定数据的存放位置和存储结构:关系、索引、聚簇、日志、备份。关系、索引、聚簇、日志、备份。2 2、确定系统配置。、确定系统配置。影响数据存放位置和存储结构的因素:影响数据存放位置和存储结构的因素:(1 1)硬件环境)硬件环境(2 2)应用需求:存取时间、存储空间利用率、)应用需求:存取时间、存
42、储空间利用率、维护代价。维护代价。这三个方面常常是相互矛盾的。这三个方面常常是相互矛盾的。例如:消除一切冗余数据虽能够节约存储空间例如:消除一切冗余数据虽能够节约存储空间和减少维护代价,但往往会导致检索代价的增和减少维护代价,但往往会导致检索代价的增加。必须进行权衡,选择一个折中方案。加。必须进行权衡,选择一个折中方案。1 1、确定数据的存放位置:、确定数据的存放位置:(了解)(了解)v基本原则基本原则根据应用情况将根据应用情况将v易变易变部分与部分与稳定稳定部分;部分;v存取频率较高存取频率较高部分与部分与存取频率较低存取频率较低部分部分 分开存放分开存放,以提高系统性能。,以提高系统性能。
43、实例实例1 1:数据库数据:数据库数据备份、日志文件备份备份、日志文件备份等由等由于只在故障恢复时才使用,而且数据量很大,于只在故障恢复时才使用,而且数据量很大,可以考虑存放在磁带上。可以考虑存放在磁带上。2.2.确定系统配置确定系统配置(了解)(了解)vDBMS产品一般都提供了一些存储分配参数产品一般都提供了一些存储分配参数 同时使用数据库的用户数同时使用数据库的用户数 同时打开的数据库对象数同时打开的数据库对象数 使用的缓冲区长度、个数使用的缓冲区长度、个数 时间片大小时间片大小 数据库的大小数据库的大小 填充因子填充因子 锁的数目锁的数目 等等等等10.5.4 10.5.4 评价物理结构
44、评价物理结构(了解)(了解)v评价内容评价内容对数据库物理设计过程中产生的对数据库物理设计过程中产生的多种方案多种方案进行细致的评价进行细致的评价,从中选择一个较优的方,从中选择一个较优的方案作为数据库的物理结构。案作为数据库的物理结构。v评价方法评价方法定量估算各种方案定量估算各种方案v 存储空间存储空间v 存取时间存取时间v 维护代价维护代价对估算结果进行权衡、比较,选择出一对估算结果进行权衡、比较,选择出一个较优的合理的物理结构。个较优的合理的物理结构。如果该结构不符合用户需求,则需要修如果该结构不符合用户需求,则需要修改设计。改设计。10.6 数据库的实施v数据库实施的工作内容数据库实
45、施的工作内容用用DDLDDL定义数据库结构定义数据库结构组织数据入库组织数据入库编制与调试应用程序编制与调试应用程序数据库试运行数据库试运行数据库实施数据库实施定义数定义数据库结据库结构构数据数据装载装载 数据库数据库试运行试运行数据库物数据库物理设计理设计数据库运数据库运行和维护行和维护物理物理模型模型编制与编制与调试应调试应用程序用程序数据库数据库系统系统v在数据库运行阶段,对数据库经常性的维护在数据库运行阶段,对数据库经常性的维护工作主要是由工作主要是由DBADBA完成的,包括:完成的,包括:数据库的转储和恢复数据库的转储和恢复转储和恢复是系统正式运行后最重要的维转储和恢复是系统正式运行
46、后最重要的维护工作之一。护工作之一。DBADBA要针对不同的应用要求制定不同的转要针对不同的应用要求制定不同的转储计划,定期对数据库和日志文件进行备储计划,定期对数据库和日志文件进行备份。份。一旦发生介质故障,即利用数据库备份及一旦发生介质故障,即利用数据库备份及日志文件备份,尽快将数据库恢复到某种日志文件备份,尽快将数据库恢复到某种一致性状态。一致性状态。10.7 10.7 数据库运行与维护数据库运行与维护数据库的安全性、完整性控制数据库的安全性、完整性控制DBADBA必须根据用户的实际需要授予不同必须根据用户的实际需要授予不同的操作的操作权限权限。在数据库运行过程中,由于应用环境的在数据库
47、运行过程中,由于应用环境的变化,对安全性的要求也会发生变化,变化,对安全性的要求也会发生变化,DBADBA需要根据实际情况修改原有的安全性需要根据实际情况修改原有的安全性控制。控制。由于应用环境的变化,数据库的完整性由于应用环境的变化,数据库的完整性约束条件也会变化,也需要约束条件也会变化,也需要DBADBA不断修正,不断修正,以满足用户要求。以满足用户要求。数据库性能的监督、分析和改进数据库性能的监督、分析和改进在数据库运行过程中,在数据库运行过程中,DBA DBA必须监督系必须监督系统运行,对监测数据进行分析,找出改统运行,对监测数据进行分析,找出改进系统性能的方法。进系统性能的方法。v利
48、用监测工具获取系统运行过程中一利用监测工具获取系统运行过程中一系列性能参数的值。系列性能参数的值。v通过仔细分析这些数据,判断当前系通过仔细分析这些数据,判断当前系统是否处于最佳运行状态。统是否处于最佳运行状态。v如果不是,则需要通过调整某些参数如果不是,则需要通过调整某些参数来进一步改进数据库性能。来进一步改进数据库性能。数据库的重组织和重构造(目的:优化)数据库的重组织和重构造(目的:优化)1 1)数据库的重组织)数据库的重组织为什么要重组织数据库为什么要重组织数据库v数据库运行一段时间后,由于记录的不数据库运行一段时间后,由于记录的不断增、删、改,会使数据库的物理存储断增、删、改,会使数
49、据库的物理存储变坏,从而降低数据库存储空间的利用变坏,从而降低数据库存储空间的利用率和数据的存取效率,使数据库的性能率和数据的存取效率,使数据库的性能下降。下降。重组织的形式重组织的形式v全部重组织全部重组织v部分重组织部分重组织只对频繁增、删的表进行重组织只对频繁增、删的表进行重组织重组织的目标重组织的目标v提高系统性能提高系统性能重组织的工作重组织的工作v按原设计要求按原设计要求重新安排存储位置重新安排存储位置回收垃圾回收垃圾减少指针链减少指针链v数据库的重组织不会改变原设计的数据数据库的重组织不会改变原设计的数据逻辑结构和物理结构。逻辑结构和物理结构。vDBMSDBMS一般都提供了供重组织数据库使用一般都提供了供重组织数据库使用的实用程序,帮助的实用程序,帮助DBADBA重新组织数据库。重新组织数据库。10.8小结小结数据库系统设计的步骤:数据库系统设计的步骤:v需求分析需求分析v概念结构设计概念结构设计v逻辑结构设计逻辑结构设计v数据库的物理设计数据库的物理设计v数据库实施数据库实施v数据库运行与维护数据库运行与维护注:循环反复的过程注:循环反复的过程
限制150内