《(本科)第2章信息与数据模型ppt课件.pptx》由会员分享,可在线阅读,更多相关《(本科)第2章信息与数据模型ppt课件.pptx(59页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、课程主讲人:(本科)第2章-信息与数据模型ppt课件中国农业大学 李辉p信息的三种世界及描述p数据模型p概念模型p逻辑模型p概念模型向逻辑模型的转换p知识点小结p本章实验p数据库系统的核心核心是数据模型。要为一个数据库建立数据模型,需要经过以下过程:1.要深入到现实世界中进行系统需求分析。2.用概念模型真实地、全面地描述现实世界中的管理对象及联系。3.通过一定的方法将概念模型转换为数据模型。p本章主要介绍信息的三种世界信息的三种世界以及彼此之间的联系;概念模型概念模型及相关概念;概念模型转化为逻辑模型规则概念模型转化为逻辑模型规则;数据模型数据模型及作用、要素、优缺点。p信息的三种世界及描述信
2、息的三种世界及描述p数据模型p概念模型p逻辑模型p概念模型向逻辑模型的转换p知识点小结p本章实验p信息的三种世界1. 现实世界。2. 信息世界。3. 计算机世界(数据世界)。p 转化流程:现实世界现实世界存在的客观事物及其联系,经过人们大脑的认识、分析和抽象后,用物理符号、图形等表述出来,即得到信息世界信息世界的信息,再将信息世界的信息进一步 具体描述、规范并转换为计算机所能接受的形式,则成为机器世界机器世界的数据表示。p现实世界、信息世界和计算机世界这3个领域是由客观到认识、由认识到使用管理的3个不同层次,后一领域是前一领域的抽象描述。p 对应关系:p 现实世界的事物及联系,通过需求分析转换
3、成为信息世界的概念模型(数据库设计人员);p 然后再把概念模型转换为计算机上某个DBMS所支持的逻辑模型(数据库设计人员和数据库设计工具DBMS);p 最后逻辑模型再转换为最底层的物理模型,从而进行最终实现( DBMS)。将客观对象抽象为数据模型的完整过程p信息的三种世界及描述p数据模型数据模型p概念模型p逻辑模型p概念模型向逻辑模型的转换p知识点小结p本章实验p 定义:数据模型(Data Model)也是一种模型,它是对现实世界中数据特征数据特征及数据之间联系数据之间联系的抽象。p 是实现数据抽象数据抽象的主要工具,也是数据库系统中用于信信息表示息表示和提供操作手段提供操作手段的形式化工具。
4、p 是数据库系统的核心核心和基础基础。p 数据模型满足的三个要求: 能比较真实地模拟真实地模拟现实世界 容易理解理解 便于在计算机上实现实现p 一种数据模型要很好地满足上述提到的三个方面的要求在目前尚很困难,在数据库系统中针对不同的使用对象和应用目的,通常采用逐步抽象逐步抽象的方法,在不同层次采用不同的数据模型。p 一般可分为概念层、逻辑层、物理层。 概念层 逻辑层 物理层p 定义:数据抽象级别的最高层,其目的是按用户的观点来对现实世界建模。p 概念层的数据模型称为概念数据模型,简称概念模型概念模型。p 概念模型独立于独立于任何DBMS,但容易向DBMS所支持的逻辑模型转换。p 常用的概念模型
5、有实体-联系模型(Entity-Relationship Model,简称E-R模型模型)。p 定义:是数据抽象的中间层,描述数据库数据整体的逻辑结构。p 逻辑层的数据抽象称为逻辑数据模型,简称数据模型数据模型。p 它是用户通过DBMS看到的现实世界,是基于计算机系统的观点来对数据进行建模和表示。p 常见的数据模型有:层次模型(Hierarchical Model)、网状模型(Network Model)、关系模型关系模型(Relation Model)和面向对象模型(Object Oriented Model)。p 定义:物理层是数据抽象的最底层,用来描述数据物理存物理存储结构储结构和存储方
6、法存储方法。p 这一层的数据抽象称为物理数据模型,它不但由DBMS的设计决定,而且与操作系统、计算机硬件密切相关。p 物理数据结构一般都向用户屏蔽,用户不必了解其细节。p 数据模型是严格定义的一组概念的集合。p 这些概念精确地描述了系统的静态特征静态特征、动态特征动态特征和完整完整性约束条件性约束条件。p 因此数据模型通常由数据结构数据结构、数据操作数据操作和完整性约束完整性约束三部分组成。p 数据结构 定义:描述数据库的组成对象组成对象,以及对象之间的联系联系 描述的内容 与数据类型、内容、性质有关的对象 与数据之间联系有关的对象 数据结构是对系统静态特性静态特性的描述p 数据操作 定义:对
7、数据库中各种对象(型)的实例(值)允许执行的操作及有关的操作规则操作规则。 类型:检索检索和更新更新(包括插入、删除、修改)。 对操作的定义:这些操作的确切含义、操作符号、操作规则(如优先级)以及实现操作的语言。 数据操作是对系统动态特性动态特性的描述。p 完整性约束条件 完整性约束条件的定义:是一组完整性规则。完整性规则主要描述数据结构中的数据之间的语义联系语义联系、数据之间的制制约约和依存关系依存关系,以及数据动态变化规则。数据约束主要用于保证数据的完整性完整性、有效性有效性和相容性相容性。 数据模型对完整性约束条件的定义数据模型应该反映和规定本数据模型必须遵守的基本的通用的必须遵守的基本
8、的通用的完整性约束条件。提供定义完整性约束条件完整性约束条件的机制,以反映具体应用所涉及的数据必须遵守的特定的语义约束条件。p 主要区别: 数据模型是描述现实世界数据的手段和工具。 数据模式是利用这个手段和工具对相互间的关系所进行的描述,是关于型的描述。它与DBMS和OS硬件无关。数据模型和数据模式都分了三个层次,其对应对关系如下::概念模式:是用逻辑数据模型对一个单位的数据一个单位的数据的描述。外模式:外模式也称子模式或用户模式,是与应用程序对应的数据库视图,是数据库的一个子集,是用逻辑模型对用户所用到的那部分数据部分数据的描述。内模式:是数据物理结构数据物理结构和存储方式存储方式的描述,是
9、数据的数据库内部表示方式。内模式也称存储模式。p信息的三种世界及描述p数据模型p概念模型概念模型p逻辑模型p概念模型向逻辑模型的转换p知识点小结p本章实验p 概念模型用于信息世界的建模,是现实世界到信息世界的第一层抽象第一层抽象。p 是数据库设计人员进行数据库设计数据库设计的有力工具。p 是数据库设计人员数据库设计人员和用户用户之间进行交流的语言: 概念模型一方面应该具有较强的语义表达语义表达能力,能够方便、直接地表达应用中的各种语义知识。 另一方面它还应该简单、清晰、易于用户理解。(1) 实体(Entity) 客观存在并可相互区别的事物称为实体。 可以是具体的人、事、物或抽象的概念。(2)
10、属性(Attribute) 实体所具有的某一特性特性称为属性。 一个实体可以由若干个若干个属性来刻画。(3) 码(Key):唯一唯一标识实体的属性集称为码。(4) 域(Domain):属性的取值范围取值范围称为该属性的域。(5)实体型(Entity Type):用实体名实体名及其属性名属性名集合来抽象和刻画同类实体称为实体型。(6) 实体集(Entity Set):同一类型实体的集合集合称为实体集。(7) 联系(Relationship) 现实世界中事物内部以及事物之间的联系在信息世界中反映为实体内部的联系实体内部的联系和实体之间的联系实体之间的联系。 实体内部的联系通常是指组成实体的各属性之
11、间各属性之间的联系。 实体之间的联系通常是指不同实体集之间不同实体集之间的联系。p 常用的概念层数据模型有实体-联系(Entity-Relationship,E-R)模型、语义对象模型。p E-R图由实体实体、属性属性和联系联系三个要素构成。 实体 客观存在并可相互区别的事物称为实体。 E-R图中的实体用于表示现实世界具有相同属性描述的事物的集合,它不是某一个具体事物,而是某一种类别所有事物的统称。 表示:矩形框矩形框,把实体名写在框内。 每个实体由实体名唯一标记由实体名唯一标记。 每个实体对应于数据库中的一张数据库表数据库表,每个实体的具体取值对应于数据库表中的一条记录记录。 属性 用于表示
12、实体的某种特征或者表示实体间关系的特征 用一个实体通常包含多个属性,每个属性由属性名唯一标记,画在椭圆椭圆内 。 E-R图中实体的属性对应于数据库表的字段字段。 在E-R图中,属性是一个不可再分不可再分的最小单元。 如果属性能够再分,则可以考虑将该属性进行细分,或者可以考虑将该属性“升格”为另一个实体。 联系 数据之间的关联集合,是客观存在的应用语义链。 实体内部的联系通常是指组成实体的各属性之间的联系;。 实体之间的联系通常是指不同实体集之间的联系。 在E-R图中联系用菱形表示,框内写上联系名,并用连线将联系框与它所关联的实体连接起来。 基数:表示一个实体到另一个实体之间关联的数目。 从基数
13、的角度将关系分为一对一一对一(1:1)、一对多(一对多(1:n)、多对多多对多(m:n)关系关系。实体之间三类联系的图形表示:1:1联系1:n联系m:n联系p 定义:如果实体集A中的每个实体,在实体集B中至多有一个至多有一个(也可以没有)(也可以没有)实体与之联系,反之亦然,则称实体集A与实体集B有一对一联系,记为1:1。p 实例:学校里一个系和正系主任(假设一个系只有一个正主任,一个人只能担任一个系的正系主任),则系和正系主任是一对一联系。p 定义:如果对于实体集A中的每一个实体,实体集B中有n个实体(n0)与之联系,反之,对于实体集B中的每一个实体,实体集A中至多至多只有一个实体与之联系,
14、则称实体集A与实体集B有一对多的联系,记为1:n。p 实例:一个系有多名教师。而每个教师只能在一个系工作,则系和教师之间是一对多联系。p 定义:如果对于实体集A中的每一个实体,实体集B中有n个实体(n0)与之联系,反之,对于实体集B中的每一个实体,实体集A中有m个实体(m0)与之联系,则称实体集A与实体集B有多对多的联系,记为m:n。p 实例:一门课程同时有若干个学生选修,而一个学生可以同时选修多门课程,则课程与学生之间具有多对多联系。p ER模型设计原则: 属性应该存在于且只存在于某一个地方(实体或者关联)。避免数据冗余数据冗余。 实体是一个单独的个体,不能存在于另一个实体中成为其属性。避免
15、“表中套表表中套表”。 同一个实体在同一个E-R图内仅出现一次仅出现一次。p E-R模型设计步骤:划分和确定实体实体。划分和确定联系联系。确定属性属性。作为属性的“事物”与实体之间的联系,必须是一对多的关系,作为属性的“事物”不能再有需要描述的性质或与其他事物具有联系。画出E-R模型模型。重复过程,以找出所有实体集、关系集、属性和属值集,然后绘制E-R图。设计E-R分图,即用户视图的设计,在此基础上综合各E-R分图,形成形成E-R总图总图。优化优化E-R模型。利用数据流程图数据流程图,对E-R总图进行优化,消除数据实体间冗余冗余的联系及属性,形成基本的E-R模型。p信息的三种世界及描述p数据模
16、型p概念模型p逻辑模型逻辑模型p概念模型向逻辑模型的转换p知识点小结p本章实验p 数据模型是按其数据结构数据结构而命名的,根本区别在于数据之间联系的表示方式不同,即数据记录之间的联系方式联系方式不同。p 最常用的逻辑数据模型及其数据结构:数据模型数据模型对应的数据结构对应的数据结构层次模型树结构网状模型图结构关系模型关系模型二维表(关系)二维表(关系)面向对象模型引用类型p 层次数据模型是数据库系统中最早出现的数据模型,它用树形结构树形结构表示各类实体以及实体间的联系。p 实例:p 层次模型对父子实体集间具有一对多一对多的层次关系的描述非常自然、直观、容易理解。p 突出问题: 在层次模型中具有
17、一定的存取路径存取路径,需按路径查看给定记录的值。 层次模型比较适合于表示数据记录类型之间的一对多联系,而对于多对多多对多的联系难以直接表示,需进行转换,将其分解分解成若干个一对多联系。p 主要优缺点:数据结构较简单简单;查询效率高效率高。提供良好的完整性支持完整性支持。不易不易表示多对多的联系。数据操作限制多限制多、独立性较差独立性较差。p 网状模型是一个图结构图结构,它是由字段(属性)、记录类型(实体型)和系(set)等对象组成的网状结构的模型。p 是一个不加任何条件的有向图有向图。p 实例:p 网状模型是用图结构来表示各类实体集以及实体集间的系。p 网状模型与层次模型的根本区别是:一个子
18、结点可以有多个多个父结点;在两个结点之间可以有多种多种联系。p 同样,网状模型对于多对多的联系难以直接表示,需进行转换,将其分解成若干个一对多联系。p 主要优缺点:较为直接地描述现实世界。存取效率较高存取效率较高。结构较复杂复杂、不易不易使用。数据独立性较差数据独立性较差。p 关系就是一张二维表二维表,它由行和列组成。关系模型将数据模型组织成表格的形式,这种表格在数学上称为关系。表中存放数据。在关系模型中实体以及实体之间的联系都用关系也就是二维表来表示。p 是最重要也是应用最广泛的一种基本模型。p 实例:p 主要优缺点: 有坚实的理论基础理论基础; 结构简单简单、易用易用; 数据独立性独立性及
19、安全性安全性; 查询效率较低较低。p 它是用面向对象的观点来描述现实世界中的事物(对象)的逻辑结构和对象间的联系等的数据模型。p 对象:是对现实世界中的事物的高度抽象,每个对象是状态状态和行为行为的封装。 对象的状态是属性的集合。 行为是在该对象上操作方法的集合。p 不仅可以处理各种复杂多样的数据结构,而且具有数据数据和行为相结合和行为相结合的特点。p 优点:适合处理各种各样的数据类型。面向对象程序设计面向对象程序设计与数据库技术相结合。提高开发效率。改善数据访问。p 缺点:没有准确的定义。维护困难。不适合所有的应用。p信息的三种世界及描述p数据模型p概念模型p逻辑模型p概念模型向逻辑模型的转
20、换概念模型向逻辑模型的转换p知识点小结p本章实验p 要解决的问题: 如何将实体型和实体间的联系联系转换为关系模式。 如何确定这些关系模式的属性属性和码码。p E-R图转换为关系模型转换的实质: 将实体、实体的属性和实体之间的联系转换为关系模式。p 原则: 一个实体对应一个关系模型 实体的名称即是关系模型的名称 实体的属性就是关系模型的属性 实体的码就是关系模型的码p 注意的问题: 属性域属性域的问题。 非原子属性非原子属性的问题。p 1:1联系转换 方法一:将1:1联系转换为一个独立的独立的关系模式,与该联系相连相连的各实体的码码以及联系本身的属性联系本身的属性均转换为关系模式的属性,每个实体
21、的码均是该关系模式的码每个实体的码均是该关系模式的码。 实例:它描述的是实体学生和校园卡之间的联系,这里假设:一个学生只能办理一张校园卡,一张校园卡只能属于一个学生,因此,联系的类型是1:1。转换情况为:实体转换:学生(学号,姓名),校园卡(卡号,余额);联系办卡的转换:办卡(学号,卡号,办卡日期)。 方法二:与任意一端任意一端对应的关系模式合并。合并时,需要在该关系模式的属性中加入另一个另一个关系模式的码码和联系本身的属性联系本身的属性。 转换情况为:学生(学号,卡号,姓名,办卡日期)校园卡(卡号,学号,余额,办卡日期)p 1:n联系转换 方法一:转换为一个独立的独立的关系模式,与该联系相连
22、的各实体的码以及联系本身的属性均转换为关系模式的属性,而关系模式的码为关系模式的码为n端实体的码端实体的码。 实例:它描述的是实体学生和班级之间的联系,这里假设:一个学生只能在一个班级学习,一个班级包含多个学生。因此,联系的类型是1:n。转换情况为:实体转换:学生(学号,性别,姓名),班级(班号,班名);联系组成的转换:组成(学号,班号)。 方法二:与n端端对应的关系模式合并,在该关系模式中加入1端端实体的码和联系本身的属性. 转换情况为:实体转换:学生(学号,性别,姓名),班级(班号,班名)。联系与学生一端合并,则关系模型学生变为:学生(学号,班号,性别,姓名)。p m:n联系转换 m:n联
23、系不能由一个实体的码唯一标识,必须由所关联实体的码共同标识共同标识。 需要将联系单独转换为一个独立的独立的关系模式,与该联系相连的各实体的码各实体的码以及联系本身的属性联系本身的属性均转换为关系模式的属性,每个实体的码组成关系模式的码或关系模式的码的一部分。 实例:它描述的是实体学生和课程之间的联系,这里假设:一个学生可以选修多门课程,一门课程可以由多个学生选修。因此,联系的类型是m:n。 转换情况为:实体转换:学生(学号,性别,姓名)和课程(课程号,课程名);联系选修的转换:选修(学号,性别,课程号,成绩)。p信息的三种世界及描述p数据模型p概念模型p逻辑模型p概念模型向逻辑模型的转换p知识点小结知识点小结p本章实验本章知识小结:p 数据模型及其三要素p 概念层模型p 关系层数据库模型(逻辑模型)p E-R模型p E-R模型向关系模型的转换p信息的三种世界及描述p数据模型p概念模型p逻辑模型p概念模型向逻辑模型的转换p知识点小结p本章实验本章实验p 实验内容:见教材“2.8 概念模型(E-R图)画法与逻辑模式转换实验”谢谢!中国农业大学 李辉 Email:
限制150内