第6章 数据库设计.ppt
《第6章 数据库设计.ppt》由会员分享,可在线阅读,更多相关《第6章 数据库设计.ppt(84页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据库系统概论数据库系统概论An Introduction to Database System第六章第六章 数据库设计数据库设计(续续-1)-1)6.3 概念结构设计概念结构设计6.3.1 概念结构设计概述概念结构设计概述6.3.2 概念结构设计的方法与步骤概念结构设计的方法与步骤6.3.3 数据抽象与局部视图设计数据抽象与局部视图设计6.3.4 视图的集成视图的集成6.3.1 概念结构概念结构n什么是概念结构设计什么是概念结构设计n需求分析阶段描述的用户应用需求是现实世需求分析阶段描述的用户应用需求是现实世界的具体需求界的具体需求n将需求分析得到的用户需求抽象为信息结构将需求分析得到的用户
2、需求抽象为信息结构即概念模型的过程就是概念结构设计即概念模型的过程就是概念结构设计n概念结构是各种数据模型的共同基础,它比概念结构是各种数据模型的共同基础,它比数据模型更独立于机器、更抽象,从而更加数据模型更独立于机器、更抽象,从而更加稳定。稳定。n概念结构设计是整个数据库设计的关键概念结构设计是整个数据库设计的关键概念结构(续)概念结构(续)现实世界现实世界机器世界机器世界信息世界信息世界需求分析需求分析概念结构设计概念结构设计概念结构设计的特点概念结构设计的特点(1)能真实、充分地反映现实世界,包括事物)能真实、充分地反映现实世界,包括事物和事物之间的联系,能满足用户对数据的处理和事物之间
3、的联系,能满足用户对数据的处理要求。是对现实世界的一个真实模型。要求。是对现实世界的一个真实模型。(2)易于理解,从而可以用它和不熟悉计算机)易于理解,从而可以用它和不熟悉计算机的用户交换意见,用户的积极参与是数据库的的用户交换意见,用户的积极参与是数据库的设计成功的关键。设计成功的关键。(3)易于更改,当应用环境和应用要求改变时,)易于更改,当应用环境和应用要求改变时,容易对概念模型修改和扩充。容易对概念模型修改和扩充。(4)易于向关系、网状、层次等各种数据模型)易于向关系、网状、层次等各种数据模型转换。转换。描述概念模型的工具描述概念模型的工具nE-R模型模型6.3.2 概念结构设计的方法
4、与步骤概念结构设计的方法与步骤n设计概念结构的四类方法设计概念结构的四类方法n自顶向下自顶向下n 首先定义全局概念结构的框架,然后逐首先定义全局概念结构的框架,然后逐步细化步细化n自底向上自底向上n 首先定义各局部应用的概念结构,然后首先定义各局部应用的概念结构,然后将它们集成起来,得到全局概念结构将它们集成起来,得到全局概念结构n逐步扩张逐步扩张n 首先定义最重要的核心概念结构,然后首先定义最重要的核心概念结构,然后向外扩充,以滚雪球的方式逐步生成其他向外扩充,以滚雪球的方式逐步生成其他概念结构,直至总体概念结构概念结构,直至总体概念结构n混合策略混合策略n 将自顶向下和自底向上相结合,用自
5、顶将自顶向下和自底向上相结合,用自顶向下策略设计一个全局概念结构的框架,向下策略设计一个全局概念结构的框架,以它为骨架集成由自底向上策略中设计的以它为骨架集成由自底向上策略中设计的各局部概念结构。各局部概念结构。自顶向下策略自顶向下策略自底向上策略自底向上策略 逐步扩张逐步扩张 概念结构设计概念结构设计常用策略常用策略n自顶向下地进行需求分析自顶向下地进行需求分析n自底向上地设计概念结构自底向上地设计概念结构n自底向上设计概念结构的步骤自底向上设计概念结构的步骤n第第1步:抽象数据并设计局部视图步:抽象数据并设计局部视图n第第2步:集成局部视图,得到全局概念结构步:集成局部视图,得到全局概念结
6、构6.3.3 数据抽象与局部视图设计数据抽象与局部视图设计n数据抽象数据抽象n局部视图设计局部视图设计一、数据抽象一、数据抽象n概念结构是对现实世界的一种抽象概念结构是对现实世界的一种抽象n从实际的人、物、事和概念中抽取所关心的从实际的人、物、事和概念中抽取所关心的共同特性,忽略非本质的细节共同特性,忽略非本质的细节n把这些特性用各种概念精确地加以描述把这些特性用各种概念精确地加以描述n这些概念组成了某种模型这些概念组成了某种模型1.分类(分类(Classification)n定义某一类概念作为现实世界中一组对象的定义某一类概念作为现实世界中一组对象的类型类型n这些对象具有某些共同的特性和行为
7、这些对象具有某些共同的特性和行为n它抽象了对象它抽象了对象值和型值和型之间的之间的“is member of”的语义的语义n在在E-R模型中,模型中,实体型实体型就是这种抽象就是这种抽象2.聚集(聚集(Aggregation)n定义某一类型的组成成分定义某一类型的组成成分n它抽象了对象内部类型和成分之间它抽象了对象内部类型和成分之间“is part of”的语义的语义n在在E-R模型中模型中若干属性若干属性的聚集组成了实体型,的聚集组成了实体型,就是这种抽象就是这种抽象3.概括(概括(Generalization)n定义类型之间的一种子集联系定义类型之间的一种子集联系n它抽象了类型之间的它抽象
8、了类型之间的“is subset of”的语的语义义n概括有一个很重要的性质:继承性。子类继概括有一个很重要的性质:继承性。子类继承超类上定义的所有抽象。承超类上定义的所有抽象。数据抽象的用途数据抽象的用途n对需求分析阶段收集到的数据进行分类、组对需求分析阶段收集到的数据进行分类、组织(聚集),形成织(聚集),形成n实体实体n实体的属性,标识实体的码实体的属性,标识实体的码n确定实体之间的联系类型确定实体之间的联系类型(1:1,1:n,m:n)二、局部视图设计二、局部视图设计设计分设计分E-R图的步骤图的步骤:选择局部应用选择局部应用逐一设计分逐一设计分E-R图图 选择局部应用选择局部应用n需
9、求分析阶段,已用多层数据流图和数据字典需求分析阶段,已用多层数据流图和数据字典描述了整个系统。描述了整个系统。n设计分设计分E-R图首先需要根据系统的具体情况,图首先需要根据系统的具体情况,在多层的数据流图中在多层的数据流图中选择选择一个一个适当层次的数据适当层次的数据流图流图,让这组图中每一部分对应一个局部应用,让这组图中每一部分对应一个局部应用,然后以这一层次的数据流图为出发点,设计分然后以这一层次的数据流图为出发点,设计分E-R图。图。选择局部应用(续)选择局部应用(续)n通常以中层数据流图作为设计分通常以中层数据流图作为设计分E-R图的依据。原因:图的依据。原因:n高层数据流图只能反映
10、系统的概貌高层数据流图只能反映系统的概貌n中层数据流图能较好地反映系统中各局部应中层数据流图能较好地反映系统中各局部应用的子系统组成用的子系统组成n低层数据流图过细低层数据流图过细选择局部应用(续)选择局部应用(续)例:由于学籍管理、课程管理等都不太复例:由于学籍管理、课程管理等都不太复杂,因此可以它们入手设计学生管理子杂,因此可以它们入手设计学生管理子系统的分系统的分E-R图。如果局部应用比较复杂,图。如果局部应用比较复杂,则可以从更下层的数据流图入手。则可以从更下层的数据流图入手。逐一设计分逐一设计分E-R图图n任务任务n标定局部应用中的实体、属性、码,实体间标定局部应用中的实体、属性、码
11、,实体间的联系的联系n将各局部应用涉及的数据分别从数据字典将各局部应用涉及的数据分别从数据字典中抽取出来,参照数据流图,标定各局部中抽取出来,参照数据流图,标定各局部应用中的实体、实体的属性、标识实体的应用中的实体、实体的属性、标识实体的码,确定实体之间的联系及其类型(码,确定实体之间的联系及其类型(1:1,1:n,m:n)逐一设计分逐一设计分E-R图(续)图(续)n如何抽象实体和属性如何抽象实体和属性n实体实体:现实世界中一组具有某些共同特性和:现实世界中一组具有某些共同特性和行为的对象就可以抽象为一个实体。对象和行为的对象就可以抽象为一个实体。对象和实体之间是实体之间是“is member
12、 of的关系。的关系。例:在学校环境中,可把张三、李四等对象抽例:在学校环境中,可把张三、李四等对象抽象为学生实体。象为学生实体。属性属性n:对象类型的组成成分可以抽象为实体的属:对象类型的组成成分可以抽象为实体的属性。组成成分与对象类型之间是性。组成成分与对象类型之间是“is part of的关系。的关系。例:学号、姓名、专业、年级等可以抽象为学例:学号、姓名、专业、年级等可以抽象为学生实体的属性。其中学号为标识学生实体的码。生实体的属性。其中学号为标识学生实体的码。如何区分实体和属性如何区分实体和属性n实体与属性是相对而言的实体与属性是相对而言的。同一事物,在一种。同一事物,在一种应用环境
13、中作为应用环境中作为“属性属性”,在另一种应用环境,在另一种应用环境中就必须作为中就必须作为“实体实体”。例:学校中的系,在某种应用环境中,它只是例:学校中的系,在某种应用环境中,它只是作为作为“学生学生”实体的一个属性,表明一个学生实体的一个属性,表明一个学生属于哪个系;而在另一种环境中,由于需要考属于哪个系;而在另一种环境中,由于需要考虑一个系的系主任、教师人数、学生人数、办虑一个系的系主任、教师人数、学生人数、办公地点等,这时它就需要作为实体了。公地点等,这时它就需要作为实体了。设计分设计分E-R图一般原则图一般原则n属性不能再具有需要描述的性质。即属性必属性不能再具有需要描述的性质。即
14、属性必须是不可分的数据项。须是不可分的数据项。n属性不能与其他实体具有联系。联系只发生属性不能与其他实体具有联系。联系只发生在实体之间。在实体之间。n符合上述两条特性的事物一般作为属性对待。符合上述两条特性的事物一般作为属性对待。n为了简化为了简化E-R图的处置,现实世界中的事物凡图的处置,现实世界中的事物凡能够作为属性对待的,应尽量作为属性。能够作为属性对待的,应尽量作为属性。举例举例例例1:“学生学生”由学号、姓名等属性进一步描述,由学号、姓名等属性进一步描述,根据准则,根据准则,“学生学生”只能作为实体,不能作只能作为实体,不能作为属性。为属性。例例2:职称通常作为教师实体的属性,但在涉
15、及:职称通常作为教师实体的属性,但在涉及住房分配时,由于分房与职称有关,也就是说住房分配时,由于分房与职称有关,也就是说职称与住房实体之间有联系,根据准则,这职称与住房实体之间有联系,根据准则,这时把职称作为实体来处理会更合适些。时把职称作为实体来处理会更合适些。设计分设计分E-R图的步骤图的步骤n(1)以数据字典为出发点定义)以数据字典为出发点定义E-R图。图。n 数据字典中的数据字典中的“数据结构数据结构”、“数据流数据流”和和“数据存储数据存储”等已是若干属性的有意义等已是若干属性的有意义的聚合的聚合n(2)按上面给出的准则进行必要的调整。)按上面给出的准则进行必要的调整。例例例:学籍管
16、理局部应用中主要涉及的实体包括学生、宿舍、例:学籍管理局部应用中主要涉及的实体包括学生、宿舍、档案材料、班级、班主任。档案材料、班级、班主任。实体之间的联系:实体之间的联系:n由于一个宿舍可以住多个学生,而一个学生只能住在由于一个宿舍可以住多个学生,而一个学生只能住在某一个宿舍中,因此宿舍与学生之间是某一个宿舍中,因此宿舍与学生之间是1:n的联系。的联系。n由于一个班级往往有若干名学生,而一个学生只能属由于一个班级往往有若干名学生,而一个学生只能属于一个班级,因此班级与学生之间也是于一个班级,因此班级与学生之间也是1:n的联系的联系。n由于班主任同时还要教课,因此班主任与学生由于班主任同时还要
17、教课,因此班主任与学生之间存在指导联系,一个班主任要教多名学生,之间存在指导联系,一个班主任要教多名学生,而一个学生只对应一个班主任,因此班主任与而一个学生只对应一个班主任,因此班主任与学生之间也是学生之间也是1:n的联系。的联系。n而学生和他自己的档案材料之间,班级与班主而学生和他自己的档案材料之间,班级与班主任之间都是任之间都是1:1的联系。的联系。学籍管理局部应用的分学籍管理局部应用的分E-R图草图:教程图草图:教程195图图611 接下来需要进一步斟酌该接下来需要进一步斟酌该E-R图,做适当调整。图,做适当调整。n(1)在一般情况下,性别通常作为学生实体的属性,在一般情况下,性别通常作
18、为学生实体的属性,但在本局部应用中,由于宿舍分配与学生性别有但在本局部应用中,由于宿舍分配与学生性别有关,根据准则,应该把性别作为实体对待。关,根据准则,应该把性别作为实体对待。n(2)数据存储数据存储“学生登记表学生登记表”,由于是手工填写,由于是手工填写,供存档使用,其中有用的部分已转入学生档案材供存档使用,其中有用的部分已转入学生档案材料中,因此这里就不必作为实体了。料中,因此这里就不必作为实体了。最后得到学籍管理局部应用的分最后得到学籍管理局部应用的分E-R图:教程图:教程195如图如图6-12。该该E-R图中省略了各个实体的属性描述:图中省略了各个实体的属性描述:学生:学生:学号学号
19、,姓名,出生日期,姓名,出生日期性别:性别:性别性别档案材料:档案材料:档案号档案号,班级:班级:班级号班级号,学生人数,学生人数班主任:班主任:职工号职工号,姓名,性别,姓名,性别,是否为优秀班主任是否为优秀班主任 宿舍:宿舍:宿舍编号宿舍编号,地址,人数,地址,人数 其中有下划线的属性为实体的码。其中有下划线的属性为实体的码。同样方法可以得到课程管理局部应用的分同样方法可以得到课程管理局部应用的分E-R图,图,(图(图6-13)各实体的属性分别为:各实体的属性分别为:学生:姓名,学生:姓名,学号学号,性别,年龄,所在系,性别,年龄,所在系,年级,平均成绩年级,平均成绩课程:课程:课程号课程
20、号,课程名,学分,课程名,学分教师:教师:职工号职工号,姓名,性别,职称,姓名,性别,职称教科书:教科书:书号书号,书名,价钱,书名,价钱教室:教室:教室编号教室编号,地址,容量,地址,容量6.3.4 视图的集成视图的集成n各个局部视图即分各个局部视图即分E-R图建立好后,还需图建立好后,还需要对它们进行合并,集成为一个整体的要对它们进行合并,集成为一个整体的数据概念结构即总数据概念结构即总E-R图。图。视图集成的两种方式视图集成的两种方式n一次集成一次集成n一次集成多个分一次集成多个分E-R图图n通常用于局部视图比较简单时通常用于局部视图比较简单时n逐步累积式逐步累积式n首先集成两个局部视图
21、(通常是比较关键的两个首先集成两个局部视图(通常是比较关键的两个局部视图)局部视图)n以后每次将一个新的局部视图集成进来以后每次将一个新的局部视图集成进来集成局部集成局部E-R图的步骤图的步骤n1.合并合并2.修改与重构修改与重构视图的集成图示视图的集成图示一、合并分一、合并分E-R图,生成初步图,生成初步E-R图图n各分图存在冲突各分图存在冲突n各个局部应用所面向的问题不同各个局部应用所面向的问题不同由不同的设计人员进行设计由不同的设计人员进行设计各个分各个分E-R图之间必定会存在许多不一致的地方图之间必定会存在许多不一致的地方n合并分合并分E-R图的主要工作与关键所在:合理消除各图的主要工
22、作与关键所在:合理消除各分分E-R图的冲突图的冲突冲突的种类冲突的种类n属性冲突属性冲突n命名冲突命名冲突n结构冲突结构冲突 属性冲突属性冲突n两类属性冲突两类属性冲突n属性域冲突属性域冲突:属性值的类型、取值范围或取值:属性值的类型、取值范围或取值集合不同。集合不同。例例1,由于学号是数字,因此某些部门(即局部应由于学号是数字,因此某些部门(即局部应用)将学号定义为整数形式,而由于学号不用参用)将学号定义为整数形式,而由于学号不用参与运算,因此另一些部门(即局部应用)将学号与运算,因此另一些部门(即局部应用)将学号定义为字符型形式。定义为字符型形式。例例2,某些部门(即局部应用)以出生日期形
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第6章 数据库设计 数据库 设计
限制150内