第一章数据库基本知识精选PPT.ppt
第一章数据库基本知识第1页,本讲稿共46页课程介绍总学时总学时64学时(理论教学学时(理论教学44+课内上机课内上机20)要求自主安排课外上机要求自主安排课外上机20学时以上。学时以上。学分学分4.0考核方式考核方式全校统考全校统考全校统考全校统考(闭卷闭卷闭卷闭卷),),试卷密封后试卷密封后试卷密封后试卷密封后,流水化形式阅卷流水化形式阅卷流水化形式阅卷流水化形式阅卷;卷面成绩卷面成绩卷面成绩卷面成绩x80%+x80%+上机、作业、考勤成绩上机、作业、考勤成绩上机、作业、考勤成绩上机、作业、考勤成绩x20%x20%第2页,本讲稿共46页各章学时分配各章学时分配第第1章:章:2学时学时第第2章:章:2学时学时第第3章:章:6学时学时第第4章:章:6学时学时第第5章:章:7学时学时第第6章:章:1学时学时第第7章:章:5学时学时第第8章:章:7学时学时第第9章:章:6学时学时第第10、11章简介,总复习:章简介,总复习:2学时学时第3页,本讲稿共46页课程要求课前请做好预习课前请做好预习保持课堂安静,头脑清醒,思维活跃保持课堂安静,头脑清醒,思维活跃,上课注上课注意听讲,尽可能做一些课堂笔记。意听讲,尽可能做一些课堂笔记。认真、独立、按时完成并提交作业认真、独立、按时完成并提交作业本课程实践性强,许多问题必须注意在上机本课程实践性强,许多问题必须注意在上机操作中验证和理解。操作中验证和理解。第4页,本讲稿共46页第一章第一章数据库基本知识数据库基本知识 本章重点:掌握本章重点:掌握实体实体和和属性属性的概念、的概念、数据模数据模型型概念、概念、E-R图图及及E-R图转换为关系数据模型图转换为关系数据模型的方法、的方法、关系关系的几个术语和关系的性质、专的几个术语和关系的性质、专门的门的关系运算关系运算(选择、投影、联接)(选择、投影、联接)第5页,本讲稿共46页1.1数据处理和数据管理技术数据处理和数据管理技术 1.数据数据数据是指表达信息的某种数据是指表达信息的某种符号符号,是信息的量,是信息的量化表示。化表示。2.信息信息信息是数据的信息是数据的内涵内涵,是数据(声音、文字、,是数据(声音、文字、图像、符号等)所表征的某一特定事物的消图像、符号等)所表征的某一特定事物的消息、情报或知识,是对客观事物状态的反映。息、情报或知识,是对客观事物状态的反映。第6页,本讲稿共46页3.数据处理数据处理数据处理或信息处理:数据处理或信息处理:对原始数据进行收集、存储、维护加工和传输等一系列活动的总称。4.数据管理技术数据管理技术经历了三个发展阶段:人工管理、文件管理、经历了三个发展阶段:人工管理、文件管理、数据库管理数据库管理第7页,本讲稿共46页1.2数据库及其组织结构数据库及其组织结构1.2.1什么是数据库什么是数据库通常的说法:数据库是以一定的组织方式存通常的说法:数据库是以一定的组织方式存储在一起的、能为多个用户所储在一起的、能为多个用户所共享共享的、与应的、与应用程序用程序彼此独立彼此独立的的相互关联的数据集合相互关联的数据集合。数据库是指数据库是指自描述的完整记录的集合自描述的完整记录的集合。第8页,本讲稿共46页数据库比文件管理方式的主要优点:数据库比文件管理方式的主要优点:1.数据的共享性好数据的共享性好2.数据的独立性好数据的独立性好3.数据的完整性好数据的完整性好4.数据库中冗余数据少数据库中冗余数据少第9页,本讲稿共46页1.2.2数据库的三级结构数据库的三级结构 与数据库打交道的人员分三类:与数据库打交道的人员分三类:用户、数据库管理员用户、数据库管理员(DBA)和系统程序员。和系统程序员。不同的人员对数据库的认识、理解和接触的不同的人员对数据库的认识、理解和接触的范围不同,形成了各自的数据库视图范围不同,形成了各自的数据库视图,即用户即用户的的外部视图外部视图、DBA的的概念视图概念视图和系统程序员和系统程序员的的内部视图内部视图,又称为,又称为用户级数据库、概念级用户级数据库、概念级数据库、物理数据库数据库、物理数据库。第10页,本讲稿共46页第11页,本讲稿共46页1.2.3数据库系统数据库系统数据库系统数据库系统(DBS)是指计算机系统中引进)是指计算机系统中引进数据库技术后的整个系统构成数据库技术后的整个系统构成第12页,本讲稿共46页1.2.4 数据库管理系统 数据库管理系统的基本功能数据库管理系统的基本功能数据库管理系统数据库管理系统(DBMS:DataBaseManagementSystem)的基本功能就是要)的基本功能就是要有效地有效地实现数据库三级之间的转换实现数据库三级之间的转换。第13页,本讲稿共46页1.3数据模型数据模型(重要概念)(重要概念)1.3.1实体及其属性的概念实体及其属性的概念1.实体实体实体是指实体是指客观存在客观存在的并的并可互相区别可互相区别的任何事的任何事物物。2.属性属性实体的属性是指实体所具有的实体的属性是指实体所具有的特征特征。第14页,本讲稿共46页3.型与值型与值型型是指是指结构结构,值值是指在结构约束下的是指在结构约束下的具体取具体取值值。实体及其属性均有型与值之分。实体及其属性均有型与值之分。实体的型与值实体的型与值:第15页,本讲稿共46页1.3.2数据模型数据模型数据模型数据模型是指是指反映实体及其实体间联系的数反映实体及其实体间联系的数据的据的组织结构和形式组织结构和形式,是对数据库组织的一,是对数据库组织的一种模型化表示。数据模型不仅种模型化表示。数据模型不仅包括实体本身包括实体本身的信息的信息,还要包括,还要包括实体与实体之间的联系实体与实体之间的联系。实体之间的联系分为三种类型:一对一、一实体之间的联系分为三种类型:一对一、一对多、多对多的联系。对多、多对多的联系。第16页,本讲稿共46页2.数据模型的三种基本类型数据模型的三种基本类型(1).层次模型层次模型层次模型是以记录型为结点构成的层次模型是以记录型为结点构成的树树。层次模型只能反映实体间的一对多的联系层次模型只能反映实体间的一对多的联系.第17页,本讲稿共46页(2)网状模型网状模型 网状模型是以记录型为结点的网状模型是以记录型为结点的网络网络。网状模型特点:网状模型特点:(1)有一个以上结点无双亲;有一个以上结点无双亲;(2)一个双亲允许有多个子女。一个双亲允许有多个子女。(3)允许且至少有一个结点有多于一个双亲;允许且至少有一个结点有多于一个双亲;网状模型能反映实体间的三种联系网状模型能反映实体间的三种联系。第18页,本讲稿共46页(3)关系模型关系模型 关系模型是一张关系模型是一张二维表格二维表格,是用表格来描述,是用表格来描述实体间的联系。实体间的联系。表格的栏目称为关系框架,也称为关系模式表格的栏目称为关系框架,也称为关系模式,相当于记录型。每一栏目称为属性,又称为相当于记录型。每一栏目称为属性,又称为字段名,表格中填满的全部数据称为关系。字段名,表格中填满的全部数据称为关系。第19页,本讲稿共46页1.3.3数据库种类数据库种类数据模型有数据模型有层次模型、网状模型和关系模型层次模型、网状模型和关系模型对应地:对应地:数据库分为数据库分为层次数据库、网状数层次数据库、网状数据库和关系数据库据库和关系数据库关系数据库是用得最普遍的数据库关系数据库是用得最普遍的数据库。目前广。目前广泛使用和流行的关系数据库管理系统泛使用和流行的关系数据库管理系统(RDBMS)有)有Informix、Oracle、Sybase等。在微机上流行的关系数据库管理系统有等。在微机上流行的关系数据库管理系统有VisualFoxPro、Access、SQL-Server等。等。第20页,本讲稿共46页1.4 E-R方法(重要的概念和技术、方法)E-R:EntityRelationshipApproach,译为,译为实体实体-联系方法。联系方法。E-R方法方法通过通过“E-R图图”来表示实体及其联系来表示实体及其联系,再经过适当加工,从而再经过适当加工,从而构造出数据模型构造出数据模型。因。因此此E-R方法是方法是将现实世界的信息模型转化到数将现实世界的信息模型转化到数据模型的一个据模型的一个中间工具中间工具。第21页,本讲稿共46页1.4.1E-R图的基本图素图的基本图素E-R图中包括实体、属性、联系和连线四种基图中包括实体、属性、联系和连线四种基本图素。本图素。第22页,本讲稿共46页第23页,本讲稿共46页1.4.2设计设计E-R图的方法图的方法1.实体间联系的几种基本形式实体间联系的几种基本形式第24页,本讲稿共46页2.设计设计E-R图的一般步骤和原则图的一般步骤和原则(1)画出反映该用户视图的局部画出反映该用户视图的局部E-R图。图。(2)综合各用户的局部综合各用户的局部E-R图,得出反映数据图,得出反映数据库整个概念的总体库整个概念的总体E-R图。图。(3)保持整体概念的一致性,不能产生相互保持整体概念的一致性,不能产生相互矛盾。矛盾。第25页,本讲稿共46页1.4.3 将E-R图转换为关系数据模型 将将E-R图转换为等效的关系数据模型,就是要图转换为等效的关系数据模型,就是要将总体将总体E-R图中的每个实体及其属性用一个关图中的每个实体及其属性用一个关系框架或关系模式来表示。系框架或关系模式来表示。对于实体之间的联系是否也用一个关系模式对于实体之间的联系是否也用一个关系模式来表示,要视具体情况而定,这也是转换问来表示,要视具体情况而定,这也是转换问题的关键。题的关键。每一个关系模式格式为每一个关系模式格式为:关系名(属性名关系名(属性名1,属性名,属性名2,属性名,属性名3,属性名,属性名n)第26页,本讲稿共46页转换的具体方法和原则如下转换的具体方法和原则如下:若两实体存在若两实体存在1:1的联系,而且联系无属性,的联系,而且联系无属性,转换时只需将一方的关键字作为属性项加入转换时只需将一方的关键字作为属性项加入另一方即可。另一方即可。第27页,本讲稿共46页方方案案一一:厂厂长长(厂厂长长号号,厂厂号号,姓姓名名,年年龄龄)工厂工厂(厂号厂号,厂名,地址,厂名,地址)方案二方案二:厂厂长长(厂厂长长号号,姓名,年,姓名,年龄龄)工厂工厂(厂号厂号,厂厂长长号号,厂名,地址,厂名,地址)第28页,本讲稿共46页若两实体间存在若两实体间存在1:n联系联系,则将一方关键字纳则将一方关键字纳入入“n”方实体对应的关系中作为外部关键字,方实体对应的关系中作为外部关键字,同时将联系的属性也一并纳入同时将联系的属性也一并纳入“n”方对应的方对应的关系中。关系中。第29页,本讲稿共46页仓库仓库(仓库仓库号号,仓库仓库名,地址名,地址)产产品品(产产品号品号,产产品名,品名,单单价,价,仓库仓库号号,数量,数量)第30页,本讲稿共46页若两实体间是若两实体间是m:n的联系,除每个实体要建的联系,除每个实体要建立一个关系之外,还应对联系单独建立一个立一个关系之外,还应对联系单独建立一个关系,用来联系双方实体,该关系的属性中关系,用来联系双方实体,该关系的属性中至少应包括被它所联系的双方实体的关键字,至少应包括被它所联系的双方实体的关键字,并且如果联系有属性,应把该属性归入这个并且如果联系有属性,应把该属性归入这个关系中。(实际形成两个一对多关系)关系中。(实际形成两个一对多关系)第31页,本讲稿共46页学生学生(学号学号,姓名,性,姓名,性别别,专业专业)课课程程(课课程号程号,课课程名,学分程名,学分)选选修修(学号学号,课课程号程号,成,成绩绩)第32页,本讲稿共46页若同一实体集内部存在若同一实体集内部存在m:n联系,除对实体联系,除对实体集建立一个关系之外,一般也要为联系单独集建立一个关系之外,一般也要为联系单独建立一个关系建立一个关系,该关系中应包括被它联系的双该关系中应包括被它联系的双方个体的关键字方个体的关键字,如果联系有属性如果联系有属性,也要归入也要归入这个关系中。这个关系中。第33页,本讲稿共46页零部件零部件(代号代号,名称名称,单单价价)组组装装(代号代号,组组件代号件代号,数量数量)第34页,本讲稿共46页1.5关系的几个术语和关系的性质(重要关系的几个术语和关系的性质(重要概念)概念)1.6.1关系的几个术语关系的几个术语1.关系关系一个关系就是指一张二维表格。一个关系就是指一张二维表格。有如下关系模式:有如下关系模式:产品产品(产品号产品号,产品名,牌号,单价,产品名,牌号,单价,仓库号仓库号,数量数量)第35页,本讲稿共46页2.元组元组二维表格或关系中的每一行称为一个元组。每一个元组对二维表格或关系中的每一行称为一个元组。每一个元组对应着应着.DBF表文件中的一个记录。表文件中的一个记录。3.属性属性关系中的列称为属性,每一列有一个属性名,也就是关系中的列称为属性,每一列有一个属性名,也就是表的栏目名,相当于实体的属性。表的栏目名,相当于实体的属性。4.域域所谓域(所谓域(FIELD)是指具有相同属性的值的集合,是关系)是指具有相同属性的值的集合,是关系中一个属性或一个列的值取值的范围。域一般以实体的属中一个属性或一个列的值取值的范围。域一般以实体的属性来命名。性来命名。第36页,本讲稿共46页5.关键字关键字关键字是属性或属性的组合,该属性或属性组合的值能唯关键字是属性或属性的组合,该属性或属性组合的值能唯一地确定(或标识)其他属性的值,即能标定一个元组或一地确定(或标识)其他属性的值,即能标定一个元组或记录。记录。如果用两个或多个属性可以唯一地确定(或标识)其他属如果用两个或多个属性可以唯一地确定(或标识)其他属性的值,则这样的属性组合称为性的值,则这样的属性组合称为联合关键字。联合关键字。例如上表例如上表中产品名和牌号联合可以唯一地标识一个元组,因此中产品名和牌号联合可以唯一地标识一个元组,因此产品名和牌号可以作为联合关键字。产品名和牌号可以作为联合关键字。可以作为关键字的属性或属性组合称为可以作为关键字的属性或属性组合称为侯选关键字侯选关键字,作为现行关键字使用的关键字称为作为现行关键字使用的关键字称为主关键字主关键字。第37页,本讲稿共46页1.5.2关系的性质关系的性质1.关系可以为空关系。关系可以为空关系。2.不同的属性可以来自同一个域,同一列中不同的属性可以来自同一个域,同一列中的分量只能来自同一个域,是同类型的数据。的分量只能来自同一个域,是同类型的数据。3.同一个关系中不允许出现相同的属性名,同一个关系中不允许出现相同的属性名,但列的次序可以任意交换。但列的次序可以任意交换。4.关系中元组的顺序无关紧要,但在同一关关系中元组的顺序无关紧要,但在同一关系中不允许有完全相同的元组系中不允许有完全相同的元组(记录记录)。第38页,本讲稿共46页5.关系必须规范化。关系必须规范化。6.关系随时会发生变化。关系随时会发生变化。7.若两个关系的差别只是关系名不同、属性若两个关系的差别只是关系名不同、属性次序不同或元组顺序不同,那么就称这二个次序不同或元组顺序不同,那么就称这二个关系相等。关系相等。第39页,本讲稿共46页1.6关系运算关系运算1.6.1传统的集合运算传统的集合运算并、差、交并、差、交(了解概念)(了解概念)并、差、交三种运算用于关系时,要求参与运算的两并、差、交三种运算用于关系时,要求参与运算的两个关系模式相同个关系模式相同.1.并并:记记为为RS。其其结结果果是是把把两两个个关关系系的的所所有有元元组组合合并并在一起在一起,消去重复元消去重复元组组所得到的集合所得到的集合。2.差差:记记作作R-S。其其结结果果是是属属于于R而而不不属属于于S的的所所有有元元组组的集合的集合。3.交:交:交交记记作作RS。其。其结结果是果是同同时时属于属于R和和S的元的元组组组组成的集合成的集合。第40页,本讲稿共46页1.7.2专门的关系运算专门的关系运算选择、投影、选择、投影、联接联接(要理解概念要理解概念)选择选择运算运算选选择择运运算算是是对对单单个个关关系系施施加加的的运运算算,其其目目的的是是在在关关系系R上上,把把满满足足条条件件的的元元组组抽抽出出来来构构成成新新的的关关系系,这这个个新新关关系系是是原原关关系系R上上的的一一个个子子集集,其关系模式不其关系模式不变变。在在 VFP中中,利利 用用 任任 选选 短短 语语 FOR、WHILE和和设设置置记记录录过过滤滤器器筛筛选选记记录录来来实现选择实现选择运算。运算。第41页,本讲稿共46页2投影运算投影运算从从关关系系中中选选择择所所需需要要的的属属性性重重新新排排列列,组组成成一个新关系属于投影。一个新关系属于投影。投投影影运运算算也也是是对对单单个个关关系系施施加加的的运运算算,它它是是一种垂直方向一种垂直方向(即列的方向即列的方向)上的运算。上的运算。VFP中中,投投影影运运算算用用任任选选短短语语FIELDS和设置字段过滤器筛选字段来实现。第42页,本讲稿共46页3联接运算联接运算从两个关系模式中抽取全部或部分属性拼接从两个关系模式中抽取全部或部分属性拼接起来,形成新的关系称为联接运算。起来,形成新的关系称为联接运算。联接运算是对两个关系施加的运算。联接运算是对两个关系施加的运算。1)条件)条件联联接接条条件件联联接接是是把把两两个个关关系系以以一一切切可可能能的的组组合合方方式式拼拼接接起起来来,并并选选择择满满足足联联接接条条件件的的元元组组形形成一个新的关系。成一个新的关系。第43页,本讲稿共46页2)自然)自然联联接接自自然然联联接接是是在在条条件件连连接接的的基基础础上上去去掉掉重重复复属属性,得到一个新的关系。性,得到一个新的关系。联联接接前前提提:联联接接运运算算要要求求参参与与联联接接的的两两个个关关系必系必须须有公共属性,或者是可以比有公共属性,或者是可以比较较的属性。的属性。VFP中,中,联联接运算可以用接运算可以用JOIN命令命令实现实现第44页,本讲稿共46页1.7关系模型的实例关系模型的实例1.数据需求分析数据需求分析需求分析的目需求分析的目标标,是要在是要在详细调查详细调查了解用了解用户户要求的基要求的基础础上,确定上,确定应应用系用系统统的功能,收集支持系的功能,收集支持系统统目目标标的信的信息。息。2.概念设计概念设计通常通常采用采用E-R图图作作为为概念模型的描述工具概念模型的描述工具。3.逻辑设计逻辑设计逻辑设计逻辑设计的目的是要将的目的是要将E-R图转换图转换成某一个特定的成某一个特定的DBMS系系统统能接受的数据能接受的数据库逻辑结库逻辑结构。构。4.物理物理设计设计第45页,本讲稿共46页作业作业思考思考题题1、2、3、4、5、7 7、8 8、9;9;书书面作面作业业:习题习题 6、1010、1111第46页,本讲稿共46页