数据库设计(需求分析、概念结构设计).ppt
数据库设计教学目的:本章主要讨论数据库设计的方法和步骤,通过实例,详细介绍了数据库设计各个阶段的目标、方法、应注意的事项。教学重点:1、需求分析的设计 2、概念结构的设计 3、逻辑结构的设计教学难点:1、DFD画法和数据字典设计2、E-R图画法及转化为关系模式 数据库设计的步骤什么是数据库设计w是指对于一个给定的应用环境,构造最优的数据库模式,建立数据库及其应用系统,使之能够有效地存储数据,满足各种用户的应用需求(信息需求和处理要求)w在数据库领域内,常常把使用数据库的各类系统统称为数据库应用系统。数据库是信息系统的核心和基础w数据库是信息系统的各个部分能否紧密地结合在一起以及如何结合的关键所在w数据库设计是信息系统开发和建设的重要组成部分按照应用的要求、工作环境要求,在DBMS支持下,对其结构(数据)设计和行为(处理)设计,从而设计出一个结构合理、使用方便、效率较高的数据库及其应用系统。数据库设计目标数据库设计的内容数据库结构设计(静态)w1)逻辑数据库设计局部逻辑结构全局逻辑结构w2)物理数据库设计存储结构数据库行为设计(动态)w1)数据的装载w2)应用程序设计参加设计的人员1.数据库分析设计人员w数据库设计的核心人员w自始至终参与数据库设计w其水平决定了数据库系统的质量2.用户w在数据库设计中也是举足轻重的w主要参加需求分析和数据库的运行维护w用户积极参与带来的好处加速数据库设计提高数据库设计的质量3.程序员w在系统实施阶段参与进来,负责编制程序4.操作员w在系统实施阶段参与进来,准备软硬件环境参加设计的人员(续)数据库分析设计人员应具备的知识计算机技术数据库技术软件工程知识应用领域的知识数据库设计的过程(六个阶段)需求分析阶段 概念结构设计阶段 逻辑结构设计阶段 数据库物理设计阶段 数据库实施阶段 数据库运行和维护阶段设计一个完善的数据库应用系统往往是上述六个阶段的不断反复。需求分析阶段w综合各个用户的应用需求,是整个设计过程的基础w需求分析做的不好,可能会导致整个数据库设计失败 概念结构设计阶段w是整个数据库设计的关键w通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型 逻辑结构设计阶段w将概念结构转换成具体的数据库产品支持的数据模型,并对其模型进行优化,形成数据库逻辑模式。w根据用户处理的要求、安全性考虑,在基本表上建立必要的视图,形成数据的外模式 数据库物理设计阶段w为逻辑数据模型选取合适的物理结构。根据DBMS特点和处理的需要,进行物理存储安排,建立索引,形成数据库内模式。数据库实施阶段w运用DBMS提供的数据语言、工具及宿主语言,根据逻辑设计和物理设计的结果建立数据库编制与调试应用程序组织数据入库并进行试运行 数据库运行和维护阶段w正式运行,并不断对其进行评价、调整和修改。分析系统需求设计概念结构设计逻辑结构优化数据模型决策评价决策评价设计物理结构决策评价实施数据库使用维护数据库6、数据库运行和维护阶段5、数据库实施阶段4、数据库物理结构设计阶段3、逻辑结构设计阶段1、系统需求分析阶段2、概念结构设计阶段数据库设计步骤设计设计阶段阶段设设 计计 描描 述述数数 据据处处 理理需求需求分析分析数据字典、全系统中数据项、数据字典、全系统中数据项、数据流、数据存储的描述数据流、数据存储的描述数据流图和判定表(判定树)、数据字典中处数据流图和判定表(判定树)、数据字典中处理过程的描述理过程的描述逻辑逻辑结构结构设计设计概念模型(概念模型(E-RE-R图)图)数据字典数据字典系统说明书包括:系统说明书包括:新系统要求、新系统要求、方案和概图方案和概图反映新系统信息反映新系统信息 流的数据流图流的数据流图概念概念结构结构设计设计某种数据模型某种数据模型 关系关系 非关系非关系系统结构图系统结构图(模块结构)(模块结构)物理物理设计设计存储安排存储安排方法选择方法选择存取路径建立存取路径建立模块设计模块设计IPOIPO表表实施实施阶段阶段编写模式编写模式装入数据装入数据数据库试运行数据库试运行程序编码、程序编码、编译联结、编译联结、测试测试运行运行维护维护性能监测、转储性能监测、转储/恢复恢复数据库重组和重构数据库重组和重构新旧系统转换、运行、维护(修正性、适应性、新旧系统转换、运行、维护(修正性、适应性、改善性维护)改善性维护)CreatLoadIPO表输入:输出:处理:分区1分区2Main()ifthenend4.2 需求分析需求分析就是分析用户的需要与要求w需求分析是设计数据库的起点w需求分析的结果是否准确地反映了用户的实际要求,将直接影响到后面各个阶段的设计,并影响到设计结果是否合理和实用 需求分析的任务 需求分析的任务 需求分析的重点 需求分析的难点 需求分析的任务通过详细调查现实世界要处理的对象(组织、部门、企业等),充分了解原系统(手工系统或计算机系统)工作概况,明确用户的各种需求在此基础上确定新系统的功能。新系统必须充分考虑今后可能的扩充和改变,不能仅仅按当前应用需求来设计数据库 需求分析的重点需求分析的重点是调查、收集与分析用户在数据管理中的信息要求、处理要求、安全性与完整性要求。信息要求w用户需要从数据库中获得信息的内容与性质w由信息要求可以导出数据要求,即在数据库中需存储哪些数据处理要求w对处理功能的要求w对处理的响应时间的要求w对处理方式的要求(批处理/联机处理)新系统的功能必须能够满足用户的信息要求、处理要求、安全性与完整性要求。需求分析的难点确定用户最终需求的难点w用户缺少计算机知识,开始时无法确定计算机究竟能为自己做什么,不能做什么,因此无法一下子准确地表达自己的需求,他们所提出的需求往往不断地变化。w设计人员缺少用户的专业知识,不易理解用户的真正需求,甚至误解用户的需求。w新的硬件、软件技术的出现也会使需求发生变化。需求分析的难点(续)解决方法w设计人员必须采用有效的方法,与用户不断深入地进行交流,才能逐步得以确定用户的实际需求需求分析的方法 调查清楚用户的实际需求并进行初步分析 与用户达成共识 进一步分析与表达这些需求1)调查组织机构情况w(1)该组织由哪些部门组成w(2)各部门的职责和任务2)调查各部门的业务活动情况w(1)各部门输入输出的数据和格式w(2)所需的表格和卡片w(3)如何加工处理这些数据w(4)输入输出的部门 调查与初步分析用户需求3)协助用户明确对新系统的各种需求w(1)信息要求w(2)处理要求w(3)安全性要求w(4)完整性要求4)确定新系统的边界w(1)哪些功能由计算机完成w(2)哪些活动由人工完成5)分析系统功能w(1)系统应具有哪些功能,完成哪些任务w(2)设计人员和用户协商、确定、备案w(3)尽量满足用户的要求w(4)不要随便承诺用户不合理或无法实现的要求w(5)注意功能与条件的谐调6)分析系统数据w(1)需要存储哪些数据1.实体集2.实体的属性集3.实体集间的联系w(2)数据是否有矛盾1.基本数据2.导出数据w(3)用户对数据的处理要求1.完成什么样的处理2.响应时间3.安全性要求4.完整性要求w(4)绘制数据流程图w(5)编制数据字典7)编写系统分析报告w(1)提交用户的决策部门审核w(2)报告内容1.系统概况2.系统功能说明3.设计阶段划分4.可行性分析5.系统软硬件环境要求(1)计算机配置;(2)操作系统;(3)汉字平台(4)数据库管理系统;(5)网络环境6.结构图表(1)组织机构图;(2)组织间联系图;(3)各机构功能业务图7.数据图表(1)数据流程图;(2)功能模块图;(3)数据字典8)后续工作w(1)组织专家评估报告w(2)项目双方签字w(3)签订协议书简单概括简单概括:需求分析的步需求分析的步骤骤有有四四步步 分析用分析用户户活活动动,产产生生用用户户活活动图动图(即用(即用户户的的业务业务流程流程图图);确定系确定系统统范范围围,产产生生系系统统范范围图围图(即确定即确定人机界面人机界面);分分析析用用户户活活动动所所涉涉及及的的数数据据,产产生生数数据据流流图图(数数据据的的流流向向及及加加工工);分析系分析系统统数据,数据,产产生生数据字典数据字典。需求分析阶段的输入和需求分析阶段的输入和输输出出 输入输入是是总总体信息需求和体信息需求和处处理需求。理需求。输输出出是需求是需求说说明明书书包括系包括系统统的数据流程和数据字典。的数据流程和数据字典。数据流数据流图图和数据字典和数据字典 数据流数据流图图DFDDFD有四个基本成分:有四个基本成分:用用箭箭头头表示数据流表示数据流、用用圆圆圈圈表示加工或表示加工或处处理,理,用用双双线线段段表示文件表示文件、用用方框方框表示外部表示外部实实体体。返回 进一步分析和表达用户需求结构化分析方法wSA方法,Structured Analysisw是从最上层的系统组织机构入手,采用自顶向下,逐层分解的方式分析系统,并用数据流图和数据字典描述系统。1首先把任何一个系统都抽象为:数据流数据流数据流数据流数据存储数据存储信息要求信息要求数据来源数据来源处理处理数据输出数据输出处理要求处理要求2分解处理功能和数据w(1)分解处理功能将处理功能的具体内容分解为若干子功能,再将每个子功能继续分解,直到把系统的工作过程表达清楚为止。w(2)分解数据在处理功能逐步分解的同时,其所用的数据也逐级分解,形成若干层次的数据流图 数据流图表达了数据和处理过程的关系w(3)表达方法 处理过程:用判定表或判定树来描述 数据:用数据字典来描述3将分析结果再次提交给用户,征得认可补充:数据流程图数据流图(DFD,Data Flow Diagram)w是描述数据在系统中流动和变换的过程,表达了数据和处理过程的关系w从数据传递和加工的角度,以图形的方式刻画数据流从输入到输出的移动变换过程w是系统分析人员与用户进行交流的手段和系统设计的主要依据之一数据流程图基本组成1)外部项(外部实体)w描述系统的数据来源和去向的各种实体或工作环节。2)数据处理逻辑w描述系统对信息进行处理的逻辑功能。3)数据存储w逻辑意义上的数据存储环节。4)数据流w是描述系统信息处理功能有关的各种信息的载体,是各个加工环节进行处理和输出的数据集合。数据流程图绘制方法数据流表示数据的流动情况;加工(进程)表示对数据的加工处理过程,它的名字应能简明扼要地表明所完成的是什么加工;数据存贮在数据流图中起着保存数据的作用,指向数据存贮的数据流可以理解为写数据,从数据存贮引出的数据流可以理解为读数据,双向数据流可以理解为修改数据;数据源点或终点,表示图中出现数据的始发点或终止点,它在图中的出现仅仅是一种符号,并不需要以软件的形式进行设计和实现。实例:开发一个学校管理系统1可行性分析和初步需求调查w抽象出该系统最高层数据流图,该系统由教师管理子系统、学生管理子系统、后勤管理子系统组成,每个子系统分别配备一个开发小组。2进一步细化各个子系统w其中学生管理子系统开发小组通过进行进一步的需求调查,明确了该子系统的主要功能是进行学籍管理和课程管理,包括学生报到、入学、毕业的管理,学生上课情况的管理。毕业登记表毕业登记表毕业证书毕业证书毕业登记表毕业登记表 学生基学生基 本情况本情况学生档案学生档案1.0报报到到2.0入学入学3.0毕业毕业班主任班主任学生学生招生招生办公室办公室 学管理数据流图:学管理数据流图:同意同意/不同意不同意接受接受核对通知书核对通知书体检结果体检结果毕业生名单毕业生名单离校手续离校手续日常管理日常管理录取通知录取通知报到证报到证新生名单新生名单体检表体检表宿舍描述宿舍描述 奖罚情况奖罚情况报到证学生学生1.1核对录核对录取通知取通知书书1.2核对体核对体检结果检结果1.3同意同意入学入学招生招生办公室办公室新生名单新生名单 体检表体检表录取通知已核对体检结果同意或不同意审核已核对录取通知同意或不同意接受同意/不同意选课成绩单成绩单 教室安排教室安排评定成绩评定成绩3.0考考 试试允许参加考试允许参加考试平平时时成成绩绩同意/不同意接受核对选课单2.0上上 课课选选 课课已已选选课课程程名名单单 选选课课名名单单1.0选选 课课学学 生生课程任任课课教教师师介介绍绍教师课课程程介介绍绍申请选课教教 师师选课单成成 绩绩教教 材材教教 室室选选用用教教材材教教室室安安排排教室安排教室安排考场安排考场安排评定考试成绩评定考试成绩考考 场场 试试 卷卷 成成 绩绩考考场场安安排排试试卷卷成成绩绩课程管理课程管理数据流图数据流图返回数据库原理与设计之数据库原理与设计之-数据流数据流图图数据库原理与设计之数据库原理与设计之-数据流图数据流图 “先全局后局部,先整体后细节,先抽象后具体”通常可将这种分层的DFD图,分为顶层、中间层、底层。具体步骤:1。先确定系统范围,画出顶层的DFD图。2。逐层分解顶层DFD图,获得若干中间层DFD图。3。画出底层的DFD图。画分层画分层DFDDFD图的方法图的方法 顶层图说明了系统的边界,即系统的输入和输出数据流,顶层图只有一张。底层图由一些不能再分解的加工组成,这些加工都已足够简单,称为基本加工。在顶层和底层之间的是中间层。中间层的数据流图描述了某个加工的分解,而它的组成部分又要进一步分解。画各层DFD图时,“由外向内”。数据库原理与设计之数据库原理与设计之-数据流数据流图图数据库原理与设计之数据库原理与设计之-数据流图数据流图 X1321.11.21.41.32.12.21.1.11.1.22.1.32.1.22.1.12.2.22.2.32.2.1顶层中 间 层底 层先全局后局部,先整体后细节,先抽象后具体.0图图1图图2图图1.1图图2.1图图2.2图图分层DFD图数据库原理与设计之数据库原理与设计之-数据流数据流图图数据库原理与设计之数据库原理与设计之-数据流图数据流图 经过初步的需求分析,得到系统功能要求:1、监视病员的病症(血压、体温、脉搏等)。2、定时更新病历。3、病员出现异常情况时报警。4、随机地产生某一病员的病情报告。实例:医院病房监护系统产生病情报告监视病情更新病历实例:医院病房监护系统实例:医院病房监护系统数据库原理与设计之数据库原理与设计之-数据流数据流图图数据库原理与设计之数据库原理与设计之-数据流图数据流图 系统功能要求:1、监视病员的病症(血压、体温、脉搏等)2、定时更新病历 3、病员出现异常情况时报警。4、随机地产生某一病员的病情报告。顶层:病员护士护士病员监护系统病员日志病症信号要求报告病症报告报警例例2 2 医院病房监护系统医院病房监护系统数据库原理与设计之数据库原理与设计之-数据流数据流图图数据库原理与设计之数据库原理与设计之-数据流图数据流图 第一层:病员护士护士中央监视病员日志病症信号要求报告病症报告报警局部监视生成报告病员极限更新日志病员数据格式化病员数据生理信号极限值1324日志数据日志数据医院病房监护系统顶层医院病房监护系统顶层DFDDFD图图数据库原理与设计之数据库原理与设计之-数据流数据流图图数据库原理与设计之数据库原理与设计之-数据流图数据流图 第二层:加工“中央监视”分解计算超过极限值否病员病员数数据超过超过极限值极限值报警报警开解信号产生报警信息病员极限格式化病员数据体温体温血压、体温血压、体温脉搏脉搏生理信号生理信号极限值极限值时间时间脉搏脉搏血压血压日期日期时钟格式化格式化病员数据病员数据3.13.23.33.4医院病房监护系统二层医院病房监护系统二层DFDDFD图图数据库原理与设计之数据库原理与设计之-数据流数据流图图数据库原理与设计之数据库原理与设计之-数据流图数据流图 计算超过极限值否病员病员数据数据超过超过极限值极限值报警报警开解信号产生报警信息病员极限格式化病员数据体温体温血压、体温、血压、体温、脉搏脉搏生理信号生理信号极限值极限值时间时间脉搏脉搏血压血压日期日期时钟格式化格式化病员数据病员数据3.13.23.33.4第二层:加工“中央监视”分解医院病房监护系统分层医院病房监护系统分层DFDDFD图图图图 2.15第一层格式化病员数据生理信号极限值病员护士护士中央监视病员日志病症信号要求报告病症报告报警局部监视生成报告病员极限更新日志病员数据1324日志数据图图 2.16数据库原理与设计之数据库原理与设计之-数据流数据流图图数据库原理与设计之数据库原理与设计之-数据流图数据流图 加工分解的原则自然性:概念上合理、清晰;均匀性:理想的分解是将一个问题分解成大小均匀的几个部分;分解度:一般每一个加工每次分解最多不要超过个子加工,分解应分解到基本加工为止。2.2.5 2.2.5 画分层画分层DFDDFD图的基本原则图的基本原则数据守恒与数据封闭原则 所谓数据守恒是指加工的输入输出数据流是否匹配,即每一个加工既有输入数据流又有输出数据流。或者说一个加工至少有一个输入数据流,一个输出数据流。数据封闭是对整个系统而言。数据库原理与设计之数据库原理与设计之-数据流数据流图图数据库原理与设计之数据库原理与设计之-数据流图数据流图 合理使用文件 当文件作为某些加工之间的交界面时,文件必须画出来,一旦文件作为数据流图中的一个独立成份画出来了,那么他同其他成份之间的联系也应同时表达出来。DFDDFD图不是流程图图不是流程图,不表示软件的控制流程。不表示软件的控制流程。画分层画分层DFDDFD图的基本原则图的基本原则子图与父图的“平衡”父图中某个加工的输入输出数据流应该同相应的子图的输入输出相同(相对应),分层数据流图的这种特点称为子图与父图“平衡”。数据库原理与设计之数据库原理与设计之-数据流数据流图图数据库原理与设计之数据库原理与设计之-数据流图数据流图 分层DFD图的改进 DFD图必须经过图必须经过反复修改反复修改,才能获得最终的目标系统的,才能获得最终的目标系统的逻辑模型(目标系统的逻辑模型(目标系统的DFD图)。可从以下方面考虑图)。可从以下方面考虑DFD图图的改进:的改进:1 1、检查数据流的正确性、检查数据流的正确性 数据数据守恒守恒 子图、父图的平衡子图、父图的平衡 文件使用是否合理。特别注意输入文件使用是否合理。特别注意输入/出文件的数据流。出文件的数据流。2 2、改进、改进DFDDFD图的易理解性图的易理解性 简化加工之间的联系(加工间的数据流越少,独立性越简化加工之间的联系(加工间的数据流越少,独立性越强,易理解性越好)。强,易理解性越好)。改进分解的均匀性。改进分解的均匀性。适当命名(各成分名称无二义性,准确、具体)。适当命名(各成分名称无二义性,准确、具体)。4.2.3 数据字典 数据字典的用途 数据字典的内容 数据字典的用途数据字典是各类数据描述的集合数据字典是进行详细的数据收集和数据分析所获得的主要结果数据字典在数据库设计中占有很重要的地位 数据字典的内容数据字典的内容w数据项w数据结构w数据流w数据存储w处理过程数据项是数据的最小组成单位若干个数据项可以组成一个数据结构数据字典通过对数据项和数据结构的定义来描述数据流、数据存储的逻辑内容。数据项数据项是不可再分的数据单位对数据项的描述数据项描述数据项名,数据项含义说明,别名,数据类型,长度,取值范围,取值含义,与其他数据项的逻辑关系w取值范围、与其他数据项的逻辑关系定义了数据的完整性约束条件 数据结构数据结构反映了数据之间的组合关系。一个数据结构可以由若干个数据项组成,也可以由若干个数据结构组成,或由若干个数据项和数据结构混合组成。对数据结构的描述数据结构描述数据结构名,含义说明,组成:数据项或数据结构 数据流数据流是数据结构在系统内传输的路径。对数据流的描述数据流描述数据流名,说明,数据流来源,数据流去向,组成:数据结构,平均流量,高峰期流量w数据流来源是说明该数据流来自哪个过程w数据流去向是说明该数据流将到哪个过程去w平均流量是指在单位时间里的传输次数w高峰期流量则是指在高峰时期的数据流量 数据存储数据存储是数据结构停留或保存的地方,也是数据流的来源和去向之一。对数据存储的描述:数据存储描述数据存储名,说明,编号,流入的数据流,流出的数据流,组成:数据结构,数据量,存取方式w流入的数据流:指出数据来源w流出的数据流:指出数据去向w数据量:每次存取多少数据,每天(或每小时、每周等)存取几次等信息w存取方法:批处理/联机处理;检索/更新;顺序检索/随机检索 处理过程处理过程的具体处理逻辑一般用判定表或判定树来描述。数据字典中只需要描述处理过程的说明性信息处理过程说明性信息的描述处理过程描述处理过程名,说明,输入:数据流,输出:数据流,处理:简要说明处理过程(续)简要说明:w主要说明该处理过程的功能及处理要求功能:该处理过程用来做什么处理要求:处理频度要求(如单位时间里处理多少事务,多少数据量);响应时间要求等w处理要求是后面物理设计的输入及性能评价的标准数据字典是关于数据库中数据的描述,即元数据,而不是数据本身。数据本身将存放在物理数据库中,由数据库管理系统管理。数据字典有助于这些数据的进一步管理和控制,为设计人员和数据库管理员在数据库设计、实现和运行阶段控制有关数据提供依据。小结例:数据项学生学籍管理子系统的数据字典。w数据项,以“学号”为例:数据项:学号含义说明:唯一标识每个学生别名:学生编号类型:字符型长度:8取值范围:00000000至99999999取值含义:前两位标别该学生所在年级,后六位按顺序编号与其他数据项的逻辑关系:例:数据结构以“学生”为例w“学生”是该系统中的一个核心数据结构:数据结构:学生含义说明:是学籍管理子系统的主体数据结构,定义了一个学生的有关信息组成:学号,姓名,性别,年龄,所在系,年级例:数据流数据流“体检结果”可如下描述:数据流:体检结果说明:学生参加体格检查的最终结果数据流来源:体检数据流去向:批准组成:平均流量:高峰期流量:例:数据存储数据存储“学生登记表”可如下描述数据存储:学生登记表说明:记录学生的基本情况流入数据流:流出数据流:组成:数据量:每年3000张存取方式:随机存取例:处理过程处理过程“分配宿舍”可如下描述处理过程:分配宿舍说明:为所有新生分配学生宿舍输入:学生,宿舍,输出:宿舍安排处理:在新生报到后,为所有新生分配学生宿舍。要求同一间宿舍只能安排同一性别的学生,同一个学生只能安排在一个宿舍中。每个学生的居住面积不小于3平方米。安排新生宿舍其处理时间应不超过15分钟。需求分析阶段小结把需求收集和分析作为数据库设计的第一阶段是十分重要的。w这一阶段收集到的基础数据(用数据字典来表达)和一组数据流程图是下一步进行概念设计的基础。特别强调:w收集将来应用所涉及的数据,设计者应充分考虑到可能的扩充和改变,使设计易于更改,系统易于扩充。w强调用户的参与,这是数据库应用系统设计的特点。概念概念设计设计阶段阶段需求分析阶段需求分析阶段熟悉业务活动明确用户需求确定系统边界分析系统功能分析系统数据编写分析报告调查机构情况数据数据字典字典DD数据数据流程图流程图DFD数据库数据库设计人员设计人员用户用户4.3 概念结构设计什么是概念结构设计w需求分析阶段描述的用户应用需求是现实世界的具体需求w将需求分析得到的用户需求抽象为信息结构即概念模型的过程就是概念结构设计w概念结构是各种数据模型的共同基础,它比数据模型更独立于机器、更抽象,从而更加稳定。w概念结构设计是整个数据库设计的关键现实世界现实世界机器世界机器世界信息世界信息世界需求分析需求分析概念结构设计概念结构设计描述概念模型的工具:E-R模型概念结构设计的特点w(1)能真实、充分地反映现实世界,包括事物和事物之间的联系,能满足用户对数据的处理要求。是对现实世界的一个真实模型。w(2)易于理解,从而可以用它和不熟悉计算机的用户交换意见,用户的积极参与是数据库的设计成功的关键。w(3)易于更改,当应用环境和应用要求改变时,容易对概念模型修改和扩充。w(4)易于向关系、网状、层次等各种数据模型转换。4.3.1 概念结构设计的方法与步骤设计概念结构的四类方法w自顶向下首先定义全局概念结构的框架,然后逐步细化w自底向上首先定义各局部应用的概念结构,然后将它们集成起来,得到全局概念结构w逐步扩张首先定义最重要的核心概念结构,然后向外扩充,以滚雪球的方式逐步生成其他概念结构,直至总体概念结构w混合策略将自顶向下和自底向上相结合,用自顶向下策略设计一个全局概念结构的框架,以它为骨架集成由自底向上策略中设计的各局部概念结构。常用策略w自顶向下地进行需求分析w自底向上地设计概念结构自底向上设计概念结构的步骤w第1步:抽象数据并设计局部视图w第2步:集成局部视图,得到全局概念结构逻辑逻辑设计设计阶段阶段概念设计阶段概念设计阶段合并取消冲突修改重构消除冗余数据数据字典字典DD数据数据流程图流程图DFD需求需求分析分析阶段阶段抽象数据设计局部视图局部局部E-R图图初步初步E-R图图总总E-R图图4.3.2 数据抽象与局部视图设计 数据抽象 局部视图设计 数据抽象概念结构是对现实世界的一种抽象w从实际的人、物、事和概念中抽取所关心的共同特性,忽略非本质的细节w把这些特性用各种概念精确地加以描述w这些概念组成了某种模型三种常用抽象1.分类(Classification)w定义某一类概念作为现实世界中一组对象的类型w这些对象具有某些共同的特性和行为w它抽象了对象值和型之间的“is member of”的语义w在E-R模型中,实体型就是这种抽象张英王平刘勇赵斌学 生“is member of”2.聚集(Aggregation)w定义某一类型的组成成分w它抽象了对象内部类型和成分之间“is part of”的语义w在E-R模型中若干属性的聚集组成了实体型,就是这种抽象学 生姓名学号班级专业实体型属性“is a part of”仓库号面积主任姓名年龄性别工资仓库更复杂的聚集聚集3.概括(Generalization)w定义类型之间的一种子集联系w它抽象了类型之间的“is subset of”的语义w概括有一个很重要的性质:继承性。子类继承超类上定义的所有抽象。学生本科生研究生超类子类“is subset of”概括注:原E-R模型不具有概括,现对E-R模型作了扩充,允许定义超类实体型和子类实体型。w用双竖边的矩形框表示子类w用直线加小圆圈表示超类-子类的联系数据抽象的用途对需求分析阶段收集到的数据进行分类、组织(聚集),形成:w实体w实体的属性,标识实体的码w确定实体之间的联系类型(1:1,1:n,m:n)局部视图设计设计分E-R图的步骤:w 选择局部应用根据系统具体情况,利用需求分析阶段得到的数据流图,在多层数据流图中选择一个适当层次的数据流图,让这组图中每一部分对应一个局部应用,即可以这一层的数据流图为出发点设计分E-R图w 逐一设计分E-R图将局部应用中所用的数据从数据字典中抽取出来,参照数据流图,标定局部应用中的实体、实体的属性、标识实体的码,确定实体之间的联系及其类型。并对其进行必要的调整。选择局部应用依据w多层数据流图w数据字典步骤w选择一个适当层次的数据流图w让这组图中每一部分对应一个局部应用w以此为出发点,设计分E-R图。通常以中层数据流图作为设计分E-R图的依据w高层数据流图只能反映系统的概貌w中层数据流图能较好地反映系统中各局部应用的子系统组成w低层数据流图过细例:w由于学籍管理、课程管理等都不太复杂,因此可以它们入手设计学生管理子系统的分E-R图。如果局部应用比较复杂,则可以从更下层的数据流图入手。逐一设计分E-R图任务:标定局部应用中的实体、属性、码,实体间的联系w将各局部应用涉及的数据从数据字典中抽取出来w参照数据流图,标定各局部应用中的实体、实体的属性、标识实体的码w确定实体之间的联系及其类型(1:1,1:n,m:n)如何抽象实体和属性实体:w现实世界中一组具有某些共同特性和行为的对象就可以抽象为一个实体。对象和实体之间是“is member of的关系。例:在学校环境中,可把张三、李四等对象抽象为学生实体。属性:w对象类型的组成成分可以抽象为实体的属性。组成成分与对象类型之间是“is part of的关系。例:学号、姓名、专业、年级等可以抽象为学生实体的属性。其中学号为标识学生实体的码。如何区分实体和属性实体与属性是相对而言的。w同一事物,在一种应用环境中作为“属性”,在另一种应用环境中就必须作为“实体”。例:w学校中的系,在某种应用环境中,它只是作为“学生”实体的一个属性,表明一个学生属于哪个系;而在另一种环境中,由于需要考虑一个系的系主任、教师人数、学生人数、办公地点等,这时它就需要作为实体了。一般原则w属性不能再具有需要描述的性质。即属性必须是不可分的数据项,不能再由另一些属性组成。w属性不能与其他实体具有联系。联系只发生在实体之间。符合上述两条特性的事物一般作为属性对待。w现实世界中的事物凡能够作为属性对待的,应尽量作为属性。例1:w“学生”由学号、姓名等属性进一步描述,根据准则,“学生”只能作为实体,不能作为属性。例2:w职称通常作为教师实体的属性,但在涉及住房分配时,由于分房与职称有关,也就是说职称与住房实体之间有联系,根据准则,这时把职称作为实体来处理会更合适些。设计分E-R图的步骤(1)以数据字典为出发点定义E-R图。w 数据字典中的“数据结构”、“数据流”和“数据存储”等已是若干属性的有意义的聚合(2)按上面给出的实体、属性准则进行必要的调整。例:w学籍管理局部应用中主要涉及的实体包括学生、宿舍、档案材料、班级、班主任。实体之间的联系:w由于一个宿舍可以住多个学生,而一个学生只能住在某一个宿舍中,因此宿舍与学生之间是1:n的联系。w由于一个班级往往有若干名学生,而一个学生只能属于一个班级,因此班级与学生之间也是1:n的联系。w班主任与学生之间存在指导联系,一个班主任要教多名学生,而一个学生只对应一个班主任,因此班主任与学生之间也是1:n的联系。w而学生和他自己的档案材料之间,班级与班主任之间都是1:1的联系。学籍管理局部应用的分E-R图草图适当调整E-R图(1)在一般情况下,性别通常作为学生实体的属性,但在本局部应用中,由于宿舍分配与学生性别有关,根据准则,应该把性别作为实体对待。(2)数据存储“学生登记表”,由于是手工填写,供存档使用,其中有用的部分已转入学生档案材料中,因此这里就不必作为实体了。学籍管理局部应用的分E-R图学籍管理局部E-R图实体属性上图中省略了各个实体的属性描述:w学生:学号,姓名,出生日期w性别:性别w档案材料:档案号,w班级:班级号,学生人数w班主任:职工号,姓名,性别,是否为优秀班主任w宿舍:宿舍编号,地址,人数其中有下划线的属性为实体的码。课程管理局部应用的分E-R图同样方法可以得到课程管理局部应用的分E-R图课程管理局部应用的分E-R图各实体的属性分别为:w学生:姓名,学号,性别,年龄,所在系,年级,平均成绩w课程:课程号,课程名,学分w教师:职工号,姓名,性别,职称w教科书:书号,书名,价钱w教室:教室编号,地址,容量4.3.3 视图的集成视图集成w将各个局部视图进行合并,集成为总E-R图视图集成的两种方式w一次集成一次集成多个分E-R图通常用于局部视图比较简单时w逐步累积式首先集成两个局部视图(通常是比较关键的两个局部视图)以后每次将一个新的局部视图集成进来集成局部E-R图的步骤w 合并 修改与重构 验证整体概念结构逻辑逻辑设计设计阶段阶段概念设计阶段概念设计阶段合并取消冲突修改重构消除冗余抽象数据设计局部视图局部局部E-R图图初步初步E-R图图基本基本E-R图图 合并分E-R图,生成初步E-R图合并而不是简单拼凑的原因:w各分E-R图存在冲突合并分E-R图的主要工作与关键所在:w合理消除各分E-R图的冲突各个局部应用所面向的问题不同;由不同的设计人员进行设计各个分E-R图之间必定会存在许多不一致的地方冲突的种类1、属性冲突2、命名冲突3、结构冲突1、属性冲突两类属性冲突w属性域冲突:属性值的类型、取值范围或取值集合不同。w属性取值单位冲突属性冲突的解决方法w通常用讨论、协商等行政手段加以解决例1:w由于学号是数字,因此某些部门(即局部应用)将学号定义为整数形式,而由于学号不用参与运算,因此另一些部门(即局部应用)将学号定义为字符型形式。(属性域冲突)例2:w某些部门(即局部应用)以出生日期形式表示学生的年龄,而另一些部门(即局部应用)用整数形式表示学生的年龄。(属性域冲突)例3:w学生的身高,有的以米为单位,有的以厘米为单位,有的以尺为单位。(属性取值单位冲突)2、命名冲突两类命名冲突w同名异义:不同意义的对象在不同的局部应用中具有相同的名字w异名同义(一义多名):同一意义的对象在不同的局部应用中具有不同的名字发生的位置w命名冲突可能发生在属性级、实体级、联系级上。其中属性的命名冲突更为常见。命名冲突的解决方法w通过讨论、协商等行政手段加以解决例1:w局部应用A中将教室称为房间w局部应用B中将学生宿舍称为房间同名异义例2:w有的部门把教科书称为课本w有的部门则把教科书称为教材异名同义(一义多名)3、结构冲突(三类)1)同一对象在不同应用中具有不同的抽象w解决方法:通常是把属性变换为实体或把实体变换为属性,使同一对象具有相同的抽象。变换时要遵循前面讲过的两个准则。例:w“课程”在某一局部应用中被当作实体w在另一局部应用中则被当作属性2)同一实体在不同局部视图中所包含的属性不完全相同,或者属性的排列次序不完全相同。w产生原因:不同的局部应用关心的是该实体的不同侧面。w解决方法:使该实体的属性取各分E-R图中属性的并集,再适当设计属性的次序。在应用A中w学生(学号,姓名,性别,平均成绩)在应用B中w学生(姓名,学号,出生日期,所在系,年级)在应用C中w学生(姓名,政治面貌,学号)合并后w学生(学号,姓名,出生日期,政治面貌,所在系,年级,性别,平均成绩)3)实体之间的联系在不同局部视图中呈现不同的类型w解决方法:根据应用语义对实体联系的类型进行综合或调整。例1:w实体E1与E2在局部应用A中是多对多联系,而在局部应用B中是一对多联系例2:w在局部应用X中E1与E2发生联系,而在局部应用Y中E1、E2、E3三者之间有联系。(E-R)1(E-R)2(E-R)12合合并并两两个个分分 E-R 图图时时的的综综合合合并分E-R图,生成初步E-R图实例例:w合并学籍管理局部视图,课程管理局部视图w这两个分E-R图存在着多方面的冲突(1)班主任实际上也属于教师w学籍管理中的班主任实体与课程管理中的教师实体在一定程度上属于异名同义,可以应将学籍管理中的班主任实体与课程管理中的教师实体统一称为教师。w统一后教师实体的属性构成为:教师:职工号,姓名,性别,职称,是否为优秀班主任(2)合并教师与学生间的两种联系w将班主任改为教师后,教师与学生之间的联系在两个局部视图中呈现两种不同的类型:一种是学籍管理中教师与学生之间的指导联系一种是课程管理中教师与学生之间的教学联系w可以将这两种联系综合为教学联系。指导联系实际上可以包含在教学联系之中。(3)合并性别在两个局部应用中的不同抽象w性别在两个局部应用中具有不同的抽象,它在学籍管理中为实体,在课程管理中为属性,按照前面提到的两个原则,在合并后的E-R图中性别只能作为实体,否则它无法与宿舍实体发生联系。(4)调整学生属性次序w在两个局部E-R图中,学生实体属性组成及次序都存在差异,应将所有属性综合,并重新调整次序。w假设调整结果为:学生:学号,姓名,出生日期,年龄,所在系,年级,平均成绩解决上述冲突后,学籍管理分E-R图与课程管理分E-R图合并为下图所示形式:学生管理子系统的初步E-R图 修改与重构消除冗余的数据与冗余的实体间联系设计生成基本E-R图逻辑逻辑设计设计阶段阶段概念设计阶段概念设计阶段合并取消冲突修改重构消除冗余抽象数据设计局部视图局部局部E-R图图初步初步E-R图图基本基本E-R图图1、冗余冗余的数据w是指可由基本数据导出的数据。冗余的联系w是指可由其他联系导出的联系。消除冗余要把握好度w冗余数据和冗余联系容易破坏数据库