《现代企业数据库技术与数据库设计研讨.pptx》由会员分享,可在线阅读,更多相关《现代企业数据库技术与数据库设计研讨.pptx(60页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据的组织与管理数据库技术数据库设计8.7 数据库技术与数据库设计数据库技术与数据库设计第一节第一节 数据的组织与管理数据的组织与管理 在管理信息系统中,大量的数据以一定在管理信息系统中,大量的数据以一定的形式存放在各种存储介质中,数据的组织的形式存放在各种存储介质中,数据的组织方式以及内在联系的表示方法直接决定着数方式以及内在联系的表示方法直接决定着数据处理的效率。据处理的效率。数据库数据库Database文件文件1文件文件2文件文件n文件文件n-1记录记录1记录记录2记录记录n-1记录记录n数据项数据项1数据项数据项2数据项数据项n-1数据项数据项n.姓名、性别等姓名、性别等若干学生若干学
2、生学生文件学生文件学生数据库学生数据库一、数据组织的层次一、数据组织的层次数据项数据项多个字符组成一个词或者一个完整的数字不能再分成有意义的单位。记录记录与某个特殊对象或活动有关的所有数据项组成文件文件与某个特定主题相关的数据记录的集合。数据库数据库(Database)综合的、相关的文件集合数据库中包括了数据数据,它们之间的联系联系本资料来源本资料来源示例:学生数据库的数据层次示例:学生数据库的数据层次数据的层次数据的层次举例举例文件文件数据项数据项纪录纪录数据库数据库刘汉云刘汉云 数据库系统数据库系统 4 89包含:学生姓名、所选课程、学分及成绩的记录刘汉云刘汉云(名字字段)学生数据库课程文
3、件课程文件简历文件简历文件财务文件财务文件课程文件刘汉云刘汉云 数据库系统数据库系统 4 89李卓宇李卓宇 数据库系统数据库系统 4 85张昕阳张昕阳 数据库系统数据库系统 4 85图 1 数据的层次本资料来源本资料来源二、数据管理的内容二、数据管理的内容 企业建立和维护其信息资源的全部工作称为信息资源管理 数据是一种资源,对它进行管理的过程称为数据管理。 包括: 数据收集 存储 维护 加工处理 安全保证 组织 检索第二节第二节 数据库技术数据库技术应用程序1数据文件1应用程序2应用程序3数据文件2数据文件3 存在问题:存在问题:1、数据冗余与数据不一致性2、数据联系弱3、缺少数据字典,缺乏灵
4、活性用户用户用户一、数据处理的发展一、数据处理的发展传统文件处理系统传统文件处理系统数据库处理系统数据库处理系统 特点:应用程序1应用程序2应用程序3DBMS数据库中央数据库用户用户用户1、完善的数据字典和数据模型2、数据独立性3、方便的接口4、完整的数据控制功能5、提高了系统的灵活性对比方面对比方面文件系统文件系统 数据库系统数据库系统 特点数据的管理者文件系统数据库管理系统数据面向的对象某一应用程序整个应用系统数据的共享程度共享性差,冗余度大共享性高,冗余度小数据的独立性独立性差高度的物理独立性和逻辑独立性数据的结构化记录内有结构整体结构化,用数据模型描述数据控制能力应用程序自己控制由数据
5、库管理系统提供数据安全性、完整性、并发控制和恢复能力两种数据管理方式的对比银行数据库处理系统银行数据库处理系统客客 户户 交交 易易 处处 理理数数 据据 库库 管管 理理 系系 统统核对帐核对帐户程序户程序存款帐存款帐目程序目程序分期贷分期贷款程序款程序客户数据库客户数据库.银行文件处理系统银行文件处理系统客户财务客户财务报表报表分期贷分期贷款程序款程序帐户核对帐户核对处理处理存款处理存款处理分期贷款分期贷款处理处理贷款分析贷款分析报告报告客户票据客户票据存款文存款文件修改件修改文件修文件修改核对改核对帐户核帐户核对程序对程序分期贷款分期贷款文件修改文件修改存款存款程序程序客户交易客户交易数
6、据库系统的诞生(数据库系统的诞生(20世纪世纪60年代末和年代末和70年代初)年代初)1、数据库管理系统IMS(Information Management System) 1968年研制成功、1969年形成产品的。 IBM(International Business Machine)数据库是统一管理的相关数据的集合。二、数据库系统的产生与构成二、数据库系统的产生与构成2、DBTG报告 美国数据系统语言协会(Conference On Data System Language)下属的数据库任务组(Database Task Group)发表了若干个报告,奠定了数据库的很多概念、方法和技术。3
7、、1970年,IBM公司的研究员E.F.Codd发表了论文“大型共享数据库的关系模型”,为关系数据库的发展奠定了理论基础。 数据库系统数据库系统是由计算机系统、数据、数据库管理系统和有关人员组成的具有高度组织的总体。 1、计算机系统(支持数据库系统的硬件和软件环境)2、数据库(Database)3、数据库管理系统 (DBMS)4、人员 数据库管理员系统程序员用户数据库强调数据库强调数据库管理系统是数据库管理系统是数据库系统强调的是数据库系统强调的是数据库系统的构成数据库系统的构成数据模型数据模型 数据库不仅存放数据,而且还要存放数据和数据之间的联系。 表示数据和数据之间的联系的方法称为。(1)
8、表示数据(2)数据之间的关系层次模型层次模型 (Hierarchical Model)用树形结构表示客观事物之间联系的模型。ABCDEF 仓库号仓库号 城市城市 面积面积 仓库仓库仓库号仓库号 器件号器件号 数量数量库存库存仓库号仓库号 职工号职工号 工资工资职工职工职工号职工号 供应商号供应商号 订购单号订购单号 订购日期订购日期订购单订购单网状模型网状模型 (Network Model)用网络结构表示客观事物之间联系的数据模型。关系模型关系模型 (Relational Model)用二维表表示实体与实体之间联系的模型。仓库号城市面积WH1北京370WH2上海500WH3广州200仓库器件号
9、器件名称P1显示卡P2声卡P3解压卡P4散热风扇器件器件器件仓库仓库仓库号城市面积WH1北京370WH2上海500WH3广州200仓库器件号器件名称P1显示卡P2声卡P3解压卡P4散热风扇仓库号仓库号器件号器件号数量数量WH1P2675WH1P3250WH1P4340WH2P1280WH2P2200WH2P4270WH3P2500WH3P1330器件器件器件仓库仓库 美国IBM公司的E.F.Codd,从1970年起连续发表了多篇论文,提出关系模型,奠定了关系数据库的理沦基础。仓库号器件号数量WH1P2675WH1P3250WH1P4340WH2P1280WH2P2200WH2P4270WH3P
10、2500WH3P1330库存器件器件仓库仓库三、关系数据模型三、关系数据模型(Relational Model)2 2、。表中一行称为一个元组。表中一行称为一个元组。3 3、。表中一列称为一个属性。给每列起一个名即。表中一列称为一个属性。给每列起一个名即为属性名。为属性名。4 4、 ( (Primary KeyPrimary Key,也称主关键字也称主关键字) )。1 1、。一个关系对应于一张二维表。一个关系对应于一张二维表。5 5、域。属性的取值范围。、域。属性的取值范围。 6 6、分量。元组中的一个属性值。、分量。元组中的一个属性值。7 7、关系模式。对关系的描述,用关系名、关系模式。对关
11、系的描述,用关系名 ( (属性属性1 1,属,属性性2 2,属性属性n)n)来表示。来表示。 eg.eg.库存(仓库号,器件号,数量)库存(仓库号,器件号,数量)仓库(仓库号,城市,面积)仓库(仓库号,城市,面积) 第三节第三节 数据库的设计数据库的设计 3.1 数据库设计概述数据库设计概述 3.2 概念结构设计(概念结构设计(ER图)图) 3.3 逻辑结构设计(关系模式)逻辑结构设计(关系模式) 3.4 物理结构设计物理结构设计一、数据库设计的主要内容一、数据库设计的主要内容现实世界现实世界观念世界观念世界数据世界数据世界人们头脑之外的客观世界,它包含客观事物及其相互联系人们头脑之外的客观世
12、界,它包含客观事物及其相互联系信息世界,是现实世界在人们头脑中的反映信息世界,是现实世界在人们头脑中的反映现实世界中的事物及其联系,在数据世界中用数据模型描现实世界中的事物及其联系,在数据世界中用数据模型描现实世界观念世界数据世界用户需求分析概念结构设计逻辑结构设计物理结构设计E-R图图数据模型数据模型客观 事物类:事物 相关性质集合人实体 实体集合及 实体联系 相关属性集合 加工、转换数 文件据 记录库 相关数据项集合加工转换存储 二进制数据集合结构计算机世界计算机世界DBMS数据世界数据世界DBMS的数据模型信息世界信息世界认识选择描述认识选择描述现实世界现实世界E-R模型 3.1 数据库
13、设计概述数据库设计概述 3.2 概念结构设计(概念结构设计(ER图)图) 3.3 逻辑结构设计(关系模式)逻辑结构设计(关系模式) 3.4 物理结构设计物理结构设计二、实体联系模型(E-R模型) 实体联系模型反映的是现实世界中的事物及其相互联系。图书作者写作出版社类别页数ISBN*书名姓名出生地身份证号*定稿时间价格1、实体(Entity) 描述客观事物的概念实体名称实体名称表示方法:表示方法:2、属性 属性指实体具有的某种特性。表示方法:属性实体名称属性1属性2属性n3、联系 现实世界的事物总是存在着这样或那样的联系表示方法:表示方法:联系的类型联系的类型设A,B为两个包含若干个体的总体,1
14、、一对一联系、一对一联系 如果对于A中的一个实体,B中至多有一个实体与其发生联系,反之,B中的每一实体至多对应A中一个实体,则称A与B是一对一联系。 系系主任任职11病区科室主任任职112、一对多联系、一对多联系 如果对于A中的每一实体,实体B中有一个以上实体与之发生联系,反之,B中的每一实体至多只能对应于A中的一个实体,则称A与B是一对多联系。 AB联系1n教研室教研室教师教师联系联系1n3、多对多联系、多对多联系 如果A中至少有一实体对应于B中一个以上实体,反之,B中也至少有一个实体对应于A中一个以上实体,则称A与B为多对多联系。 AB联系mn教师教师学生学生教学教学mn实体及其联系实体及
15、其联系概念模型概念模型ER图图出版社类别页数ISBN*书名姓名出生地身份证号*定稿时间价格1、利用分类、聚集、概括等方法抽象出实体,并一一命名。2、描述实体之间的联系3、实体属性和联系属性的说明1 1、注意标识实体属性中的、注意标识实体属性中的关键字关键字;2 2、如果所处理的对象是一个比较大的系统,则应该先、如果所处理的对象是一个比较大的系统,则应该先画出各个部门的子画出各个部门的子E-RE-R图,然后再合并同类实体,消除图,然后再合并同类实体,消除冗余。冗余。3 3、对于一个特定的应用处理对象,所构造的、对于一个特定的应用处理对象,所构造的E-RE-R模型模型可能不是唯一的。可能不是唯一的
16、。 3.1 数据库设计概述数据库设计概述 3.2 概念结构设计(概念结构设计(ER图)图) 3.3 逻辑结构设计(关系模式)逻辑结构设计(关系模式) 3.4 物理结构设计物理结构设计三、三、ER图向关系数据模型的转换图向关系数据模型的转换回顾实体 实体集合及 实体联系 相关属性集合 加工、转换数 文件据 记录库 相关数据项集合数据世界DBMS的数据模型信息世界E-R模型eg. 库存(库存(仓库号仓库号,器件号器件号,数量),数量) 仓库(仓库(仓库号仓库号,城市,面积),城市,面积) 关系模式关系模式 对关系的描述,用关系名 (属性1,属性2,属性n)来表示。 E-R图关系模型1 1 、实体、
17、实体 相应转换为一个关系,实体名称作为关系名称,该关系包括对应实体的全部属性,并确定出该关系的关键字。转换方法和原则2 2、联系、联系 a.联系具有属性联系具有属性: 联系名作为关系名,发生联系的实体的主关键字 作为联系的主关键字。 b.联系不具有属性联系不具有属性: 不带有属性的联系可以去掉。转换举例一转换举例一厂长号*姓名年龄厂长厂号*厂名地点工厂管理11厂长(厂长号,姓名,年龄)厂长(厂长号,姓名,年龄)工厂(厂号,厂名,地点)工厂(厂号,厂名,地点)管理(厂号,厂长号)管理(厂号,厂长号)转换举例二转换举例二仓库号*地点面积仓库货号*品名价格产品存放1n仓库(仓库号,地点,面积)仓库(
18、仓库号,地点,面积)产品(货号,品名,价格)产品(货号,品名,价格)数量存放(仓库号,货号,数量)存放(仓库号,货号,数量)转换举例三转换举例三学号*姓名年龄学生课程号*课程名学时数课程学习mn学生(学生(学号学号,姓名,年龄),姓名,年龄)课程(课程号,课程名,学时数)课程(课程号,课程名,学时数)成绩学习(学号,课程号,成绩)学习(学号,课程号,成绩) 3.1 数据库设计概述数据库设计概述 3.2 概念结构设计(概念结构设计(ER图)图) 3.3 逻辑结构设计(关系模式)逻辑结构设计(关系模式) 3.4 物理结构设计物理结构设计 物理结构设计是为数据模型在设备上选定合物理结构设计是为数据模
19、型在设备上选定合适的存储结构和存取方法,以获得数据库的最佳适的存储结构和存取方法,以获得数据库的最佳存取效率。数据库的物理结构设计就是对一个给存取效率。数据库的物理结构设计就是对一个给定的逻辑结构选取一个最适合应用环境的物理结定的逻辑结构选取一个最适合应用环境的物理结构的过程。构的过程。四、数据库的物理结构设计四、数据库的物理结构设计 1 1、确定库文件的组织形式、确定库文件的组织形式 如选用顺序文件组织形式、索引文件组织形式等。2 2、存取路径的选择、存取路径的选择 对同一个数据提供多条存取路径。物理设计要确定应该建立哪些存取路径。3 3、确定数据存放位置、确定数据存放位置 为了提高系统性能
20、,数据应该根据应用情况将易变部分和稳定部分、经常存取部分和存取频率较低的部分分开存放。例如将易变的、存取频繁的数据存放在高速存储器上;稳定的、存取频度小的数据存放在低速存储器上。 测试题测试题1、有关信息的说法,正确的是( ) A、信息是关于主观愿望、不可通讯的知识 B、信息是人类思维活动的结果 C、信息是可以通讯的 D、信息可以分为战术信息、管理信息和数字信息 C2、信息与数据的关系是( ) A、信息是数据的载体 B、数据决定于信息 C、信息与数据的含义是相同的 D、数据是信息的表达形式 D3、管理信息系统是( ) A、计算机系统 B、数据处理系统 C、办公自动化系统 D、人机交互系统 D4
21、、决策问题的类型包括( ) A、结构化决策和半结构化决策 B、优化决策和结构化决策 C、组织结构和非组织结构 D、结构化决策、非结构化决策和半结构化决策 D5在数据库设计中,根据用户要求,一般先建立能反映不同实体间存在的各种联系,即ER图。如果一个教师可指导多名研究生,且一名研究生可由多位教师指导,那么指导教师与研究生间的这种指导联系便是( ) A自联系 B一对一(1:1) C一对多(1:N) D多对多(M:N) D6信息中包含信息量的大小是由( )决定的A消除不确定程度B消除不精确程度C消除不可靠程度D消除不真实程度 A6数据组织的层次由高到低的顺序是( ) A数据项、记录、文件、数据库 B数据库、文件、数据项、记录 C数据项、文件、记录、数据库 D数据库、文件、记录、数据项 D7有一“职工基本情况”的数据库文件,其记录由“职工号”、“姓名”、“性别”、“年龄”、“籍贯”等数据项组成,其中主键为( )A年龄B性别C姓名D职工号 D 解释下列解释下列ERER模型图中各图形和线条代表的含义,并模型图中各图形和线条代表的含义,并将其转化为关系模式将其转化为关系模式nm学学 生生课课 程程选课选课学分学分课程号课程号*课程名课程名年龄年龄姓名姓名性别性别学号学号*
限制150内