《第9章数据库的设计.ppt》由会员分享,可在线阅读,更多相关《第9章数据库的设计.ppt(21页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1本章目标本章目标 了解设计数据库的步骤了解设计数据库的步骤 掌握掌握数据库设计模型数据库设计模型ER模型模型 掌握使用范式规范化数据库掌握使用范式规范化数据库2为什么需要设计数据库为什么需要设计数据库 给宠物盖个小窝需要设计吗?给宠物盖个小窝需要设计吗? 修建一座大厦需要设计吗?修建一座大厦需要设计吗?3什么是数据库什么是数据库设计设计? 什么是数据库设计什么是数据库设计?l 数据库设计就是规划和结构化数据库中的数据对象数据库设计就是规划和结构化数据库中的数据对象以及这些数据对象之间关系的过程。以及这些数据对象之间关系的过程。4数据库数据库设计设计的重要性的重要性 良好的数据库设计良好的数据
2、库设计l 节省数据的存储空间节省数据的存储空间l 能够保证数据的完整性能够保证数据的完整性l 方便进行数据库应用系统的开发方便进行数据库应用系统的开发 糟糕的数据库设计:糟糕的数据库设计:l 数据冗余、存储空间浪费数据冗余、存储空间浪费l 内存空间浪费内存空间浪费l 数据更新和插入的异常数据更新和插入的异常5设计数据库的方法和步骤设计数据库的方法和步骤一。需求分析:一。需求分析:收集数据库所需要的信息内容和用户对处理收集数据库所需要的信息内容和用户对处理的要求,加以规格化和分析,以书面形式确定下来的要求,加以规格化和分析,以书面形式确定下来二。概念设计:二。概念设计:逻辑结构设计是将概念结构转
3、换为某个逻辑结构设计是将概念结构转换为某个DBMS所支持的数据模型,并对其进行优化所支持的数据模型,并对其进行优化。三。逻辑结构:三。逻辑结构:将概念结构转换为某个将概念结构转换为某个DBMS所支持的数据所支持的数据模型,并对其进行优化。模型,并对其进行优化。四。物理设计:四。物理设计:一个完整的能实现的数据库结构一个完整的能实现的数据库结构。五。数据库的实施:五。数据库的实施:根据物理设计的结果产生一个具体的数根据物理设计的结果产生一个具体的数据库和它的应用程序,并把原始数据装入数据库。据库和它的应用程序,并把原始数据装入数据库。六。数据库的运行和维护:六。数据库的运行和维护:数据库应用系统
4、经过试运行后即数据库应用系统经过试运行后即可投入正式运行可投入正式运行6E-R模型模型在需求分析阶段根据用户的需求分析出用户真正需要存储的在需求分析阶段根据用户的需求分析出用户真正需要存储的相关数据,以及数据之间的关系。能够标识数据以及关系相关数据,以及数据之间的关系。能够标识数据以及关系的方法即的方法即ER模型。模型。 实体实体(Entity)即客观存在的事物以及一些抽象的概念。而即客观存在的事物以及一些抽象的概念。而实体往往是一些名词实体往往是一些名词。比如学生,老师等。比如学生,老师等 属性属性(Attribute)用于描述实体的特征,比如可以用学号,用于描述实体的特征,比如可以用学号,
5、姓名,年龄等属性描述学生实体的特性。姓名,年龄等属性描述学生实体的特性。 关系关系(Relation)即实体和实体之间的联系。即实体和实体之间的联系。比如一个老师比如一个老师教多个学生。教多个学生。7绘制绘制E-R图图 E-R(EntityRelationship)实体关系图)实体关系图 符合符合含义含义实体,一般是名词实体,一般是名词属性,一般是名词属性,一般是名词关系,一般是动词关系,一般是动词8绘制绘制E-R图图学习学习 学生学生姓名姓名学号学号课程号课程号课程名课程名课时课时课程课程9绘制绘制E-R图图 映射基数映射基数一对一一对一(人:身份证)人:身份证)X X X X Y Y Y
6、Y X X X X Y Y Y Y 一对多(部门:员工)一对多(部门:员工)X X X X Y Y Y 多对一(学生:课程)多对一(学生:课程)X X X X Y Y Y Y 多对多(读者:图书)多对多(读者:图书)10E-R图图学生管理学生管理系统系统E-R图图 11将将E-R图转换为表图转换为表u所有的实体转换为表,实体的属性就是表的字段所有的实体转换为表,实体的属性就是表的字段u一对一关系的两个实体最终变为一张表,因为两个实一对一关系的两个实体最终变为一张表,因为两个实体的记录是一一对应的。体的记录是一一对应的。u一对多关系中,在一对多关系中,在“多多”的一端添加的一端添加“一一”的一端
7、的的一端的主键字段作为主键字段作为“多多”端表的一个属性并给该字段添加约端表的一个属性并给该字段添加约束为外键。束为外键。u多对多关系中,创建一个中间表(由关系生成的表)多对多关系中,创建一个中间表(由关系生成的表),该表除了取关系本身的属性做字段外,将关系的,该表除了取关系本身的属性做字段外,将关系的“多多”端的所有的实体的主键字段组合起来作为该表的主键端的所有的实体的主键字段组合起来作为该表的主键12将将E-R图转化为数据表图转化为数据表学生管理学生管理系统表结构系统表结构13非规范化数据库非规范化数据库编号姓名年龄籍贯职务基本工资津贴加班时间实际工资E001王军华35辽宁沈阳工程师300
8、0500154250E002李艳45江苏常州总工程师5000150057250E003和晓33甘肃兰州高工400080055200E004张忠国27湖南长沙助工2500200203100E005马国明30甘肃武威高工4000800105600非规范化数据库存在以下问题:非规范化数据库存在以下问题:u数据冗余数据冗余u更新异常更新异常u删除异常删除异常u插入异常插入异常工资表容纳了所有数据,存在什么问题?工资表容纳了所有数据,存在什么问题?14数据规范化数据规范化 仅有好的仅有好的RDBMS并不足以避免数据冗余,必须在数据并不足以避免数据冗余,必须在数据库的设计中创建好表的结构库的设计中创建好表
9、的结构 Dr E.F.codd 最初定义了规范化的三个级别,范式是具最初定义了规范化的三个级别,范式是具有最小冗余的表结构。这些范式是:有最小冗余的表结构。这些范式是:l 第一范式第一范式(1st NF First Normal Form)l 第二范式第二范式(2nd NFSecond Normal Form)l 第三范式第三范式(3rd NF Third Normal Form)15第一范式第一范式 (1st NF) 第一范式的目标是确保每列的原子性第一范式的目标是确保每列的原子性 如果每列都是不可再分的最小数据单元(也称为最小的原如果每列都是不可再分的最小数据单元(也称为最小的原子单元),
10、则满足第一范式(子单元),则满足第一范式(1NF)籍贯籍贯辽宁沈阳江苏常州甘肃兰州湖南长沙甘肃武威省份省份城市城市辽宁沈阳江苏常州甘肃兰州湖南长沙甘肃武威16第二范式第二范式 (2nd NF) 如果一个关系满足如果一个关系满足1NF,并且除了主键以外的其他列,都依,并且除了主键以外的其他列,都依赖与该主键,则满足第二范式(赖与该主键,则满足第二范式(2NF) 第二范式要求每个表只描述一件事情第二范式要求每个表只描述一件事情职务编号职务名称1工程师2总工程师3高工4助工职务表: 编号加班时间实际工资E001154250E00257250E00355200E004203100E005105600编
11、号姓名年龄省份城市职务编号基本工资E001王军华35辽宁沈阳13000E002李艳45江苏常州25000.职务表职务表工资表工资表员工表员工表17第三范式第三范式 (3rd NF) 如果一个关系满足如果一个关系满足2NF,并且除了主键以外的其他列,并且除了主键以外的其他列都不传递依赖于主键列,则满足第三范式(都不传递依赖于主键列,则满足第三范式(3NF) 编号姓名年龄省份城市职务编号E001王军华 35辽宁沈阳1E002李艳45江苏常州2职务编号职务名称基本工资津贴1工程师30005002总工程师50001500.职务表职务表职务表职务表18规范化和性能的关系规范化和性能的关系 为满足某种商业
12、目标,数据库性能比规范化数据库更重要为满足某种商业目标,数据库性能比规范化数据库更重要l 通过在给定的表中添加额外的字段,以大量减少需要从中搜索信通过在给定的表中添加额外的字段,以大量减少需要从中搜索信息所需的时间息所需的时间 进行规范化的同时,还需要综合考虑数据库的性能进行规范化的同时,还需要综合考虑数据库的性能l 规范化级别越高,数据冗余越少,插入异常,删除异常,更新规范化级别越高,数据冗余越少,插入异常,删除异常,更新异常也越少,但是查询性能低异常也越少,但是查询性能低19总结总结 在需求分析阶段,设计数据库的一般步骤为:在需求分析阶段,设计数据库的一般步骤为:l 收集信息收集信息l 标
13、识对象标识对象l 标识每个对象的属性标识每个对象的属性l 标识对象之间的关系标识对象之间的关系 在概要设计阶段和详细设计阶段,设计数据库的步骤为:在概要设计阶段和详细设计阶段,设计数据库的步骤为:l 绘制绘制E-R图图l 将将E-R图转换为表格图转换为表格l 应用三大范式规范化表格应用三大范式规范化表格20总结总结 为了设计结构良好的数据库,需要遵守一些专门的规则,为了设计结构良好的数据库,需要遵守一些专门的规则,称为数据库的设计范式。称为数据库的设计范式。l 第一范式(第一范式(1NF)的目标:确保每列的原子性。)的目标:确保每列的原子性。l 第二范式(第二范式(2NF)的目标:确保表中的每列,都和主键相关)的目标:确保表中的每列,都和主键相关 。l 第三范式(第三范式(3NF)的目标:确保每列都和主键列直接相关,而不)的目标:确保每列都和主键列直接相关,而不是间接相关是间接相关 。
限制150内