《数据库与数据仓库35986.docx》由会员分享,可在线阅读,更多相关《数据库与数据仓库35986.docx(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章 数据库与数据仓库第一节 数据库技术数据处理是指从某些已知的数据出发,推导加工出一些新的数据。在数据处理中,通常计算比较简单,而数据管理比较复杂。数据管理是指数据的收集、整理、组织、存储、维护、检索、传送等操作。这部分操作是数据处理业务的基本环节,而且也是任何数据处理业务中必不可少的共有部分。数据处理的目的是从大量的数据中,按照应用的需要,根据数据自身的规律及其相互联系,通过分析、归纳、推理等科学方法,利用计算机技术,提取有效的信息资源,为进一步分析、管理、决策提供依据。一、数据管理技术及其发展数据管理技术经历了人工管理、文件系统和数据库系统三个阶段。(一)人工管理阶段该阶段处在20世纪
2、50年代中期以前,当时计算机主要用于科学计算,其他工作还没有展开。当时的硬件状况是,外存只有纸带、卡片、磁带,没有磁盘等直接存取的存储设备。软件状况是,没有操作系统,没有管理数据的软件。数据处理的方式基本上是批处理。这时期的数据管理呈以下特点:1、数据不保存。2、数据由应用程序管理。3、数据不共享。4、数据不具独立性。(二)文件系统阶段20世纪50年代后期到60年代中期,随着数据量的增加,数据的存储、检索和维护等成为迫切需要解决的问题,数据结构和数据管理技术迅速发展起来。此时,计算机硬件方面有了磁盘、磁鼓等直接存取的外部存储设备;而软件中出现了操作系统和高级语言。操作系统中有了专门进行数据管理
3、的软件,称为文件系统。处理方式上不仅有了批处理,而且能够联机实时处理。在文件管理阶段,文件系统为应用程序和数据之间提供了一个公共接口,使应用程序采用统一的存取方法来操作数据,应用程序和数据之间不再是直接的对应关系。这一时期的数据管理的特点是:1、数据可以长期保存。数据以“文件”的形式可以长期保存在外部存储设备中。2、数据由文件系统管理。文件系统把数据组织成相互独立的数据文件,利用按文件名访问、按记录进行存取的管理技术,可以对文件进行修改、插入和删除的操作。3、数据具有一定的独立性。程序与数据之间具有“设备独立性”,即程序只需用文件名就可以访问数据,不必关心数据的物理位置,由文件系统提供存取方式
4、。(三)数据库系统阶段20世纪60年代以来,计算机用于管理的规模越来越大,应用越来越广泛,数据量急剧增大,对数据共享的要求越来越迫切;同时,大容量磁盘已经出现,联机实时处理业务增多;软件价格在系统中的比重日益上升,硬件价格大幅下降,编制和维护应用软件所需成本相对增加。在这种情况下,为了解决多用户、多应用共享数据的需求,使数据为尽可能多的应用程序服务,数据库技术应运而生,出现了统一管理数据的专门软件系统数据库管理系统(DBMS,DataBase Management System)。数据库技术的出现主要是为了克服文件管理系统在管理数据上的诸多缺陷,满足人们对数据管理的需求。与文件系统相比,应用程
5、序不再直接访问数据文件,而是通过数据库管理系统来访问数据;数据文件也不再被应用程序管理,而由数据库管理系统统一管理。数据库阶段的数据管理特点是:1、数据结构化。数据结构化是数据库与文件系统的根本区别。在文件系统中,相互独立的文件的内部(即记录的结构)是有结构的,但从整个系统来说,数据在整体上是没有结构的。即记录内部有了结构,但记录间没有联系。在数据库系统中实现了整体数据的结构化,数据不再是针对某个应用,而是面向全组织,在整体上服从一定的结构形式。同时在数据库系统中存取数据的方式也很灵活,可以存取数据库中某个数据项、一组数据项、一个记录或一组记录,而在文件系统中数据存取的最小单位是记录。2、较高
6、的数据独立性。用户能以简单的逻辑结构操作数据而无需考虑数据的物理结构。数据库的结构分成用户的局部逻辑结构、数据库的整体逻辑结构和物理结构三级。用户(应用程序或终端用户)的数据和外存中的数据之间转换由数据库管理系统实现。3、数据共享。在数据库系统中,数据不再仅仅服务于某个程序或用户,而成为若干程序或用户的共享资源,由数据库管理系统统一管理与控制。在数据库中,由DBMS完成诸如打开、关闭、读、写等文件的低级操作,应用程序不必关心数据存储和其他实现的细节,可以在更高的抽象级别上访问数据。文件结构由DBMS修改,从而减少应用程序的维护工作量,提高数据的独立性。4、方便的用户接口。用户可以使用查询语句或
7、终端命令操作数据库,也可以用程序方式(如用Delphi、VC、VB、Java等高级语言和数据库语言联合编制的程序)操作数据库。5、较强的数据控制能力。并发控制能力,对程序的并发操作加以控制,防止数据库被破坏;恢复能力,系统有能力在数据库被破坏或数据不可靠时,把数据库恢复到最近某个正确的状态;完整性能力,保证数据库中数据完整;安全性能力,保证数据库中数据安全。(四)数据库发展新技术 数据库技术发展之快、应用之广是计算机科学其他领域的技术无可比拟的。随着数据库应用领域的不断扩大和信息量的急剧增长,占主导地位的关系数据库系统已不能满足新的应用领域的需求,如CAD(计算机辅助设计)/CAM(计算机辅助
8、制造)、CIMS(计算机集成制造系统)、G1S(地理信息系统)、MIS(管理信息系统)、KBS(知识库系统)等,都需要数据库新技术的支持。这些新应用领域的特点是:存储和处理的对象复杂,对象间的联系具有复杂的语义信息;需要复杂的数据类型支持;需要常驻内存的对象管理以及支持对大量对象的存取和计算。这些需求是传统关系数据库系统难以满足的。 自20世纪60年代中期以来,数据库技术与具他领域的技术相结合,出现了数据库的许多新的分支,如:与网络技术相结合出现了网络数据库;与分布处理技术相结合出现了分布式数据库;与面向对象技术相结合出现了面向对象数据库;与人工智能技术相结合出现了知识库;与并行处理技术相结合
9、出现了并行数据库;与多媒体技术相结合出现了多媒体数据库。1、分布式数据库技术 分布式数据库系统(Distributed DataBase System,DDBS)是在集中式数据库基础上发展起来的,分布式数据库系统是地理上分布在计算机网络的不同节点,逻辑上属于同一系统的数据库系统,分布式数据库系统不仅能支持局部应用,存取本地节点或另一个节点的数据,而且能支持全局应用,同时存取两个或两个以上节点的数据。 2、面向对象数据库技术面向对象数据库系统(Object-Oriented DataBase System,OODBS)是将面向对象的模型、方法和机制,与先进的数据库技术有机地结合而形成的新型数据库
10、系统。它从关系模型中脱离出来,强调在数据库框架中发展类型、数据抽象、继承和持久性。它的基本设计思想是:一方面把面向对象语言向数据库方向扩展,使应用程序能够存取并处理对象;另一方面扩展数据库系统,使其具有面向对象的特征,提供一种综合的语义数据建模概念集,以便对现实世界中复杂应用的实体和联系建模。因此,面向对象数据库系统首先是一个数据库系统,具备数据库系统的基本功能,其次是一个面向对象的系统,针对面向对象程序设计语言的永久性对象存储管理而设计的,充分支持面向对象的概念和机制。 3、多媒体数据库 多媒体数据库系统(Multi-media Database System,MDBS)是数据库技术与多媒体
11、技术相结合的产物。在许多数据库应用领域中,都涉及到大量的文字、图形、图像、声音等多媒体数据,这些与传统的数字、字符等格式化数据有很大的不同,都是一些结构复杂的对象。这主要体现为如下几点: (1)数据量大。格式化数据的数据量小,而多媒体数据量一般都很大,1分钟视频和音频数据就需要几十兆空间。 (2)结构复杂。传统的数据以记录为单位,一个记录由若干个字段组成,结构简单,而多媒体数据种类繁多、结构复杂,大多是非结构化数据,来源于不同的媒体且具有不同的形式和格式。(3)数据传输的连续性。多媒体数据,如声音或视频数据的传输必须是连续的、稳定的,不能间断,否则出现失真而影响效果。多媒体数据的这些特点,使系
12、统不能像格式化数据一样去管理和处理多媒体数据,也不能简单地通过扩充传统数据库来满足多媒体应用的需求,因此,多媒体数据库需要有特殊的数据结构、存储技术、查询和处理方式。 4、数据仓库 随着数据库应用规模、范围和深度的不断扩大,般的事务处理已不能满足应用的需要,企业界需要在大量信息数据基础上的决策支持(Decision Support,DS)。数据仓库(Data Warehousing,DW)技术的兴起满足了这一需求。数据仓库技术是目前数据处理中发展十分迅速的一个分支。所谓“数据仓库”,就是一种长期数据存储,这些数据来自于多个异种数据源。通过数据仓库提供的联机分析处理(OLAP)工具,实现各种粒度
13、的多维数据分析,以便向管理决策提供支持。数据仓库系统允许将各种应用系统集成在一起,为统一的历史数据分析提供坚实的平台,对信息处理进行支持。数据仓库可以提供对企业数据的方便访问和强大的分析工具,从企业数据中获得有价值的信息,发掘企业的竞争优势,提高企业的运营效率,指导企、业决策。数据仓库作为决策支持系统(Decision Support System,DSS)的有效解决方案,涉及3方面的技术内容:数据仓库技术、联机分析处理(On-Line Analysis Processing,OLAP)技术和数据挖掘(Data Mining,DM)技术。二、数据库系统的组成数据库系统是由支持数据库运行的硬件、
14、数据库、数据库管理系统、应用软件、数据库管理员和用户组成。如图6-1所示。图6-1 数据库系统(一)数据库数据库是长期存储在计算机存贮介质上,有一定组织形式、可共享的数据集合。针对应用的所需要进行收集并抽取大量数据,经过加工处理后保存在数据库中。数据库中的数据按一定的数据模型组织、描述和存储,具有较小的冗余度、较高的数据独立性和易扩展性,并为各种用户共享。数据库中的数据由数据库管理系统进行统一管理和控制,用户对数据库进行的各种操作都是通过数据库管理系统实现的。(二)支持数据库运行的硬件硬件是数据库赖以存在的物理设备,包括CPU、存储器和其他外部设备等。数据库系统要求要有较大的内存,用以存放系统
15、程序、应用程序和开辟用户工作区及系统缓冲区;而对外部存储器更有特殊要求,一般应配备高速度、大容量的直接存取存储设备(磁盘、光盘等)。(三)数据库管理系统数据库管理系统(DBMS)是介于用户和操作系统之间的一层数据管理软件,属于系统软件。它由计算机软件生产厂家按商品软件出版。如ORACLE公司的Oracle系统、SYBASE公司的Sybase系统、Microsoft公司的SQL Server系统以及MySQL等。数据库管理系统为数据库的建立、运行和维护提供了统一的管理和控制。用户通过数据库管理系统定义数据和操纵数据,由它保证数据的安全性、完整性、并发使用及发生故障后的系统恢复。数据库管理系统是数
16、据库系统的核心,其功能的强弱是衡量数据库系统性能优劣的主要指标。(四)应用程序一个数据库应用可分为客户端应用程序和服务端应用程序两类。服务端应用程序运行在数据库服务器上,是真正存储和操纵数据的,它接受用户程序的请求,对数据进行不同的操作。客户端应用程序运行在客户端计算机上,实现用户的业务逻辑,通过客户端应用程序界面,用户可以发出不同的请求给服务器端,由服务端程序完成各种各样的操作。一般情况下,客户端和服务器端的程序通过标准SQL语言通信。数据库应用程序主要完成用户的业务逻辑,被安装在用户的计算机上。应用程序和数据库管理系统一起完成用户的业务处理。在这个应用中,数据库管理系统负责数据的管理,提供
17、数据共享功能,因此多个应用程序可以同时使用同一个数据库。应用程序使用数据库是通过DBMS实现的。(五)数据库管理员(DataBase Administrator,DBA)数据库的建立、使用和维护工作等只靠一个DBMS远远不够,还要有专门的人员来完成。大型数据库通常由专业人员设计,还要配上专职数据库管理员(DBA)。DBA是控制数据整体结构的一组人员,负责数据库系统(DBS,DataBase System)的正常运行,承担创建、监控和维护数据库结构的责任。(六)用户按照应用数据库系统的方式不同,可以分为数据库开发人员和终端用户。数据库开发人员包括系统分析员、数据库设计人员和应用程序员。三、数据库
18、系统的体系结构为了有效地组织和管理数据,提高数据库的逻辑独立性和物理独立性,美国ANSI/SPARC(美国国家标准化组织/标准规划与需求委员会)数据库管理系统研究小组于1975年、1978年提出了标准化的建议,将数据库体系结构分为三级:面向用户或应用程序员的用户级(外部级)、面向建立和维护数据库人员的概念级和面向系统程序员的物理级(内部级)。用户级对应外模式,概念级对应模式,物理级对应内模式,使不同级别的用户对数据库形成不同的视图。所谓视图是指观察、认识和理解数据的范围、角度和方法,即视图就是数据库在用户“眼中”的反映。显然不同层次(级别)用户所“看到”的数据库是不相同的。数据库系统的体系结构
19、如图6-2所示。用户视图用户级应用A应用B应用E应用D应用C外模式1外模式2外模式3外模式到概念模式的映射概念模式概念模式到内模式的映射内模式数据库全局视图概念级存储视图物理级DBMSOS图6-2 数据库系统的体系结构(一)模式模式又称概念模式或逻辑模式,对应于概念级。它是由数据库设计者综合所有用户的数据,按照统一的观点构造的全局逻辑结构,是对数据库中全部数据的逻辑结构和特征的总体描述,是所有用户的全局视图。模式是数据库系统结构的中间层,既不涉及数据的物理存储细节和硬件环境,也与具体的应用程序无关。一个数据库只有一个模式。定义模式时不仅要定义数据的逻辑结构,例如数据记录由哪些数据项构成,数据项
20、的名称、类型等,还要定义数据之间的联系。数据库管理系统提供数据模式描述语言(模式DDL)来描述、定义模式,反映了数据库系统的整体观。(二)外模式外模式又称子模式或用户模式,对应于用户级。它是数据库用户(包括程序员和终端用户)所看到和使用的局部数据的逻辑结构和特征的描述,是数据库的用户视图。外模式是从模式中导出的一个子集,一个数据库可以有多个外模式。针对不同用户需求,其外模式可以是不同的。用户可以通过外模式描述语言(外模式DDL)来描述、定义对应于用户的数据记录(外模式),也可以利用数据操纵语言(DML)对这些数据记录进行操作。外模式反映了数据库的用户观。(三)内模式 内模式又称存储模式,对应于
21、物理级。它是数据库中全体数据的内部表示或底层描述,是数据库最低一级的逻辑描述,它描述了数据在存储介质上的存储方式和物理结构,对应着实际存储在外存储介质上的数据库,例如,记录的存储方式是顺序存储还是按照B树结构存储;数据是否压缩存储,是否加密等。一个数据库只有一个内模式。内模式由内模式描述语言(内模式DDL)来描述、定义,它反映了数据库的存储观。(四)二级映射数据库系统的三级模式是数据在三个级别上的抽象,使用户能够逻辑地、抽象地处理数据而不必关心数据在计算机中的物理表示和存储。实际上,对于一个数据库系统而言,只有物理级数据库是客观存在的,概念级数据库只是物理数据库的一种逻辑的、抽象的描述(即模式
22、),用户级数据库则是用户与数据库的接口,它是概念级数据库的一个子集(外模式)。为了能够在内部实现这三个抽象层次的联系和转换,数据库管理系统在这三级模式之间提供了两层映射:外模式模式映射,模式内模式映射。1.外模式模式映射外模式模式映射定义了该外模式与模式之间的对应关系。这些映射定义通常包含在各自外模式的描述中。当模式改变时(例如增加新的属性、改变属性的数据类型时),只要改变其映射,就可以使外模式保持不变,对应的应用程序也可保持不变(因为应用程序是依据外模式编写的),从而保证了数据与应用程序的逻辑独立性。2.模式内模式映射模式内模式映射定义了数据库全局逻辑结构与存储结构之间的对应关系。例如说明记
23、录和字段在内部是如何表示的。该映射定义通常包含在模式描述中。当数据的存储结构发生变化时,只需改变模式内模式映射,就能保持模式不变,因此应用程序也可以保持不变,从而保证了数据与应用程序的物理独立性。正是通过这两级映射,将用户对数据库的逻辑操作最终转换成对数据库的物理操作。在这一过程中,用户不必关心数据库全局,更不必关心物理数据库,用户面对的只是外模式,因此,换来了用户操作和使用数据库的方便。这两种映射转换是由数据库管理系统实现的,它将用户对数据库的操作从用户级转换到物理级去执行。同时也正是通过这两级映射,大大提高了数据与应用程序之间的独立性,使得数据的定义和描述可以从应用程序中分离出来,简化了程
24、序的编制,减少程序的维护和修改。四、概念模型模型是现实世界特征的模拟和抽象,例如一架飞机模型使人一眼望去就能联想到真实的飞机。数据模型(Date Model)也是一种模型,它是用来抽象、表示和处理现实世界的数据和信息的工具。概念模型用于对信息世界建模,是现实世界到信息世界的第一层抽象。在数据库系统的开发过程中,概念模型作为与用户进行交流的语言,成为数据库设计人员进行数据库设计的有力工具。因此概念模型具有较强的语义表达能力,能够方便、直接地表达应用中的各种语义知识,便于用户理解。(一)基本概念1、实体现实世界中的客观事物在信息世界中称为实体(Entity)。实体可以是具体的人、事、物,也可以是抽
25、象的概念或联系,例如一个教师、一个学生、一门课、学生的一次选课、教师与系的工作关系等都是实体。关于实体的其它概念还有:(1)属性(Attribute)实体所具有的某一特性称为属性。一个实体可以由若干个属性来刻画。例如学生实体可以由学号、姓名、性别、出生年月、所在院系等属性组成。例如,(20061202304,张勇,男,1988/7,工商系),这些属性组合起来表征了一个学生。属性有型和值之分。属性型就是属性名及其取值类型,属性值就是属性在其值域中所取的具体值。学生实体中姓名属性,“姓名”和取值字符类型就是其型,而“张勇”则是其值。(2)实体标识符(Identifier)能够唯一标识一个实体的属性
26、集称为实体标识符,也称为关键码,简称码或键。例如学号是学生实体的码。(3)域(Domain)属性的取值范围称为该属性的域。例如,学号的域为11位整数,姓名的域为字符串集合,性别的域为男,女等。(4)实体型(Entity Type)具有相同属性的实体必然具有共同的特征和性质。用实体名及其属性名集合来抽象和刻画同类实体,即实体的结构描述,称为实体型。例如,学生(学号,姓名,性别,出生年份,所在院系)就是一个实体型。(5)实体集(Entity Set)同型实体的集合称为实体集。例如,某个班的全体学生就是一个实体集。2、实体联系 在现实世界中,事物是相互联系的,这种联系必然要在数据库中有所反映。建立概
27、念模型的一个主要任务就是要确定实体之间的联系。所谓联系(Relationship)就是实体之间的相互关系,包括实体内部的联系和实体之间的联系。实体内部的联系通常指的是组成实体的各属性之间的联系。实体之间的联系通常是指不同实体集之间的联系。常见的实体联系可以有三种,如图6-3所示:图6-3 两个实体型之间的三类联系(1)一对一联系(1:1)如果对于实体集A中的每一个实体,实体集B中至多有一个(也可以没有)实体与之联系;反之亦然,则称实体集A与实体集B具有一对一联系,记为1:1。例如,学校里面,一个班级只有一个班长,而一个班长只在一个班中任职,则班级与班长之间具有一对一联系。(2)一对多联系(1:
28、N) 如果对于实体集A中的每一个实体,实体集B中有N个实体(N0)与之联系;反之,对于实体集B中的每一个实体,实体集A中至多只有一个实体与之联系,则称实体集A与实体集B有一对多联系,记为1:N。例如,一个班级中有若干名学生,而每个学生只在一个班级中学习,则班级与学生之间具有一对多联系。(3)多对多联系(M:N) 如果对于实体集A中的每一个实体,实体集B中有N个实体(N0)与之联系;反之,对于实体集B中的每一个实体,实体集A中有M个实体(M0)与之联系,则称实体集A与实体集B具有多对多联系,记为M:N。例如,一门课程同时有若干个学生选修,而一个学生可以同时选修多门课程,则课程与学生之间具有多对多
29、联系。实际上,一对一联系是一对多联系的特例,而一对多联系又是多对多联系的特例。(二)概念模型的表示方法概念模型是对信息世界建模,所以概念模型应该能够方便、准确地表示出上述信息世界中的常用概念。概念模型的表示方法很多,其中最为著名和常用的是P.P.S.Chen于1976年提出的实体联系方法(Entity-Relationship Approach)。该方法用E-R图来描述现实世界的概念模型,E-R方法也称为E-R模型。E-R图提供了表示实体型、属性和联系的方法:(1)实体型:用矩形表示,矩形框内写明实体名。(2)属性:用椭圆形表示,并用无向边将其与相应的实体连接起来。(3)联系:用菱形表示,菱形
30、框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型(1:1,1:N或M:N)。需要注意的是,如果一个联系具有属性,则这些属性也要用无向边与这个联系连接起来。例6-1 某工厂物资入库管理的概念模型。物资管理涉及的实体有:l 供方单位:属性有单位号、单位名、地址、联系人、邮政编码l 物资:属性有物资代码、名称、规格、备注l 库存:属性有入库号、日期、货位、数量l 合同:属性有合同号、数量、金额、备注l 结算:属性有结算编号、用途、金额、经手人这些实体间的联系包括:l 入库:一种物资可以分多次入库,所以是1:N联系l 验收:一份合同订购的物资可以分多次验收,所以是1:N联
31、系l 购进:一次购进的物资可以经多次结算,而一次结算可以承办多次购进的物资,所以是多对多的联系。其属性为:数量、金额。l 付款:也是多对多的联系。其属性是:数量、金额。l 订货:这是一个数量超过两个的不同类型实体之间的联系。在订货业务中,一种物资可由多家供应,产生多笔合同。反之,一个供应单位可以供应多种物资,产生多笔合同,所以,在图中用M:N:L的结构来表示。其属性为:数量、单价。该工厂的物资入库管理E-R图如图6-4,6-5 所示。 图6-4 实体和联系的E-R图1MNNLNMMN物资库存入库订货验收购进供方单位合同付款结算1N图6-5 工厂物资入库管理E-R图五、数据模型数据模型是直接面向
32、数据库的逻辑结构,是对现实世界的第二层抽象。数据库系统均是基于某种数据模型的,数据模型是数据库系统的核心和基础。因此,了解数据模型的概念是学习数据库的基础。(一)数据模型概述由于计算机不能直接处理现实世界中的具体事物,所以人们必须事先把具体事物转换成计算机能够处理的数据。在数据库中用数据模型这个工具来抽象、表示和处理现实世界中的数据和信息。数据模型应满足三方面要求:一是能比较真实地模拟现实世界;二是容易为人所理解;三是便于在计算机上实现。一种数据模型要很好地满足这些方面的要求是很困难的。在数据库系统中针对不同的使用对象和应用目的,应采用不同的数据模型。数据模型由三个基本的要素组成:数据的结构、
33、数据的操作、数据的约束条件。其中数据的结构最具代表性。从文件系统中,可以看到一个简单数据模型的基本框架。其数据的结构包括了文件、记录、字段等概念;其数据的操作包括打开、关闭、读、写等文件操作;其约束条件表现在字段有类型和长度的定义。当然这个简单的数据模型没有描述数据间的联系。数据模型从概念上描述了系统的静态特征、动态特征和约束条件。静态特征是指数据的基本结构、数据间的联系;动态特征是指定义在数据上的操作;约束条件主要是完整性约束。1、数据结构数据结构是所研究的对象类型的集合。这些对象是数据库的组成成分,它们包括两类,一类是与数据类型、内容、性质有关的对象;另一类是与数据之间联系有关的对象。数据
34、结构是刻画一个数据模型性质最重要的方面,它是对系统静态特性的描述。在数据库系统中,人们通常按照其数据结构的类型来命名数据模型。例如层次结构、网状结构和关系结构的数据模型分别命名为层次模型、网状模型和关系模型。2、数据操作数据操作是指对数据库中各种对象的实例允许执行的操作的集合,包括操作及有关的操作规则。数据库主要有检索和更新(包括插入、删除、修改)两大类操作。数据模型必须定义这些操作的确切含义、操作符号、操作规则以及实现操作的语言。数据操作是对系统动态特性的描述。3、数据的约束条件数据的约束条件是一组完整性规则的集合。完整性规则是给定的数据模型中数据及其联系所具有的制约和依存规则,用以限定符合
35、数据模型的数据库状态以及状态的变化,以保证数据的正确、有效、相容。数据模型应该反映和规定本数据模型必须遵守的基本的通用的完整性约束条件。此外,数据模型还应该提供定义完整性约束条件的机制,以反映具体应用所涉及的数据必须遵守的特定的语义约束条件。例如,年龄不能取负值,学生累计成绩不得有三门以上不及格等。(二)关系模型关系模型是目前最重要的一种数据模型。关系数据库系统采用关系模型作为数据的组织方式。1、关系模型的数据结构关系模型与以往的模型不同,其数据结构单一,它是建立在严格的数学概念基础上的。在关系模型中,实体以及实体之间的各种联系都用关系来表示。在用户观点下,关系模型中数据的逻辑结构是一张二维表
36、,它由行和列组成。现在以教工登记表(如表6-1所示)为例,介绍关系模型中的一些术语。表6-1 关系模型的数据结构职工号姓名出生日期性别学院电话100001章文1968.10男管理学院88231234100022王芳1954.2女外语学院85661233100030宋晖1973.4男文学院82234567 关系:一个关系对应通常说的一张表。如表6-1中的这张学生登记表。 元组:表中的一行即为一个元组。 属性:表中的一列即为一个属性,给每一个属性起一个名称即属性名。如上表有6列,对应6个属性(职工号,姓名,出生日期,性别,学院,电话)。主键(码):表中的某个属性组,它可以唯一确定一个元组。如表6-
37、1中的职工号,可以唯一确定一个教职工,也就成为此关系的主键(码)。 域:属性的取值范围。如人的出生日期应在公历日期规定的范围内,性别的域是(男,女),学院的域是一个学校所有院系名的集合。 分量:元组中的一个属性值。 关系模式:对关系的描述成为关系模式,一般表示为:关系名(属性1,属性2,属性n)例如上面的关系可描述为:教职工(职工号,姓名,出生日期,性别,学院,电话)在关系模型中,实体以及实体间的联系都是用关系来表示的。例如教师、课程、教师与课程之间的多对多联系在关系模型中可以如下表示:教职工(职工号,姓名,出生日期,性别,学院,电话)课程(课程号,课程名,学分)教授课程(职工号,课程号)关系模型要求关系必须是规范化的,即要求关系必须满足一定的规范条件,这些规范条件中最基本的一条就是:关系的每一个分量必须是一个不可再分的数据项,也就是说,不允许表中还有表。表6-2中工资和扣除是可再分的数据项,工资又分为基本工资、工龄工资和职务工资,扣除又分为房租和水电。因此,表6-2中的表就不符合关系模型的要求。表6-2 不符合关系模型的表示例职工号姓名职称工资扣除实发基本工龄职务房租水电
限制150内