数据库技术-课件.ppt
《数据库技术-课件.ppt》由会员分享,可在线阅读,更多相关《数据库技术-课件.ppt(70页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第 2 2 章章 数据库技术数据库技术2.1 2.1 数据库技术的三个阶段数据库技术的三个阶段人工管理阶段人工管理阶段人工管理阶段人工管理阶段 文件系统阶段文件系统阶段文件系统阶段文件系统阶段 数据库系统阶段数据库系统阶段数据库系统阶段数据库系统阶段时间时间时间时间50505050年代中期以前年代中期以前年代中期以前年代中期以前50505050年代后期年代后期年代后期年代后期60606060年代中期年代中期年代中期年代中期60606060年代后期年代后期年代后期年代后期应用背景应用背景应用背景应用背景科学计算科学计算科学计算科学计算科学计算、管理科学计算、管理科学计算、管理科学计算、管理大规
2、模管理大规模管理大规模管理大规模管理硬件背景硬件背景硬件背景硬件背景无直接存取存储无直接存取存储无直接存取存储无直接存取存储设备设备设备设备磁盘、磁鼓磁盘、磁鼓磁盘、磁鼓磁盘、磁鼓大容量磁盘大容量磁盘大容量磁盘大容量磁盘软件背景软件背景软件背景软件背景没有操作系统没有操作系统没有操作系统没有操作系统有操作系统有操作系统有操作系统有操作系统(文件系统)(文件系统)(文件系统)(文件系统)有有有有DBMSDBMSDBMSDBMS处理方式处理方式处理方式处理方式批处理批处理批处理批处理批处理批处理批处理批处理联机实时处理联机实时处理联机实时处理联机实时处理批处理批处理批处理批处理联机实时处理联机实时
3、处理联机实时处理联机实时处理分布处理分布处理分布处理分布处理2.2 2.2 数据库概述数据库概述一、一、一、一、基本概念基本概念基本概念基本概念 1.1.1.1.数据数据数据数据 记录现实世界各种事物的物理符号序列。有多种表现记录现实世界各种事物的物理符号序列。有多种表现记录现实世界各种事物的物理符号序列。有多种表现记录现实世界各种事物的物理符号序列。有多种表现形式:数字、文字、图形、图像、声音等。形式:数字、文字、图形、图像、声音等。形式:数字、文字、图形、图像、声音等。形式:数字、文字、图形、图像、声音等。2.2.2.2.信息信息信息信息 信息是从数据中提取出的有用的东西,作为行为和决信息
4、是从数据中提取出的有用的东西,作为行为和决信息是从数据中提取出的有用的东西,作为行为和决信息是从数据中提取出的有用的东西,作为行为和决策的依据。策的依据。策的依据。策的依据。3.3.3.3.数据与信息的关系数据与信息的关系数据与信息的关系数据与信息的关系 数据是信息的载体。数据随媒体而变化。数据是信息的载体。数据随媒体而变化。数据是信息的载体。数据随媒体而变化。数据是信息的载体。数据随媒体而变化。信息是对数据的解释。信息不随媒体而变化。信息是对数据的解释。信息不随媒体而变化。信息是对数据的解释。信息不随媒体而变化。信息是对数据的解释。信息不随媒体而变化。4.4.数据处理数据处理 对数据进行采集
5、、整理、编码、输入、存储、加工对数据进行采集、整理、编码、输入、存储、加工/计算、计算、分类、检索、传输、输出等工作的过程。又称为信息处理。分类、检索、传输、输出等工作的过程。又称为信息处理。5.5.数据库数据库(DB database)(DB database)具有一定的组织方式、存储在计算机外部存储器中的、具有一定的组织方式、存储在计算机外部存储器中的、相互关联的、可共享的数据集合。相互关联的、可共享的数据集合。6.6.数据库管理系统数据库管理系统(DBMS database management system)(DBMS database management system)用于建立、操
6、纵、运行管理、维护和控制管理数据库的用于建立、操纵、运行管理、维护和控制管理数据库的程序集合。程序集合。通常为用户提供数据定义语言(通常为用户提供数据定义语言(DDLDDL)、数据操纵语言)、数据操纵语言(DMLDML)和数据控制语言()和数据控制语言(DCLDCL)等。)等。数据库系统的构成数据库系统的构成数据库数据库DBDBMS数据库管理数据库管理系统系统DBA完成某一功能的应用程序完成某一功能的应用程序1 1应用程序应用程序2 2应用程序应用程序n nDBAP 1DBAP 2DBAP n计计 算算 机机 系系 统统二、二、数据库系统的三级模式结构数据库系统的三级模式结构应用A应用B应用C
7、应用D外模式外模式1 1外模式外模式2 2外模式外模式3 3概念模式概念模式内模式内模式数据库外模式外模式/概念模式映象概念模式映象概念模式概念模式/内模式映象内模式映象DBMSDBMSOSOS19781978年由美国年由美国ANSI/SPARCANSI/SPARC数据库管理系统研究组提出数据库管理系统研究组提出1.1.三级模式三级模式l外模式:又称子模式或用户模式,是数据库用户看到的数外模式:又称子模式或用户模式,是数据库用户看到的数据视图。既描述用户视图中记录的组成、相互联系等。据视图。既描述用户视图中记录的组成、相互联系等。l概念模式:又称模式或逻辑模式,是数据库中全体数据的概念模式:又
8、称模式或逻辑模式,是数据库中全体数据的逻辑结构和特征的描述。逻辑结构和特征的描述。l内模式:又称存储模式,使数据在数据库系统内部的表示,内模式:又称存储模式,使数据在数据库系统内部的表示,即为数据的物理结构和存储方式的描述。即为数据的物理结构和存储方式的描述。2.2.两级映像两级映像 外模式外模式/概念模式映像;概念模式概念模式映像;概念模式/内模式映像内模式映像3.3.两级独立性两级独立性l逻辑独立性:当数据的全局逻辑结构发生变化时,应用程逻辑独立性:当数据的全局逻辑结构发生变化时,应用程序不变。序不变。l物理独立性:当数据的存储结构发生变化时,应用程序不物理独立性:当数据的存储结构发生变化
9、时,应用程序不变。变。现实世界客观事物的抽象过程现实世界客观事物的抽象过程 现实世界信息世界:概念模型机器世界:具体DBMS支持的数据模型转换人的认识抽象三、实体三、实体-联系模型(联系模型(E-RE-R模型)模型)1.1.实体实体 客观存在并相互区别的事物。客观存在并相互区别的事物。如:具体的人、事、物;抽象的学生、选课等。如:具体的人、事、物;抽象的学生、选课等。2.2.实体集实体集 性质相同的同类实体的集合。性质相同的同类实体的集合。如:所有的学生、所有的课程。如:所有的学生、所有的课程。3.3.属性属性 实体所具有的某一特性。实体所具有的某一特性。包含:属性的型:学生的姓名,系别包含:
10、属性的型:学生的姓名,系别 属性的值:张三,计算机系属性的值:张三,计算机系4.4.实体型实体型 用实体名及其属性名集合来抽象和刻画同类实体。用实体名及其属性名集合来抽象和刻画同类实体。例如:学生(学号、姓名、系别例如:学生(学号、姓名、系别)四、结构数据模型四、结构数据模型 根据描述数据库的根据描述数据库的模式模式所使用的数据模型,可分为层次所使用的数据模型,可分为层次型、网状型、关系型和面向对象型四种型、网状型、关系型和面向对象型四种基本类型基本类型 。1.1.层次型层次型 代表系统:代表系统:IBMIBM的的IMS 20IMS 20世纪世纪6060年代年代 数据结构:树型结构数据结构:树
11、型结构 优点:数据模型简单,能描述优点:数据模型简单,能描述1 1:1 1、1 1:n n联系、存取效联系、存取效率高。率高。缺点:不能描述缺点:不能描述m m:n n联系,必须事先确定存取路径,难联系,必须事先确定存取路径,难以改变实体集间的关系。以改变实体集间的关系。2.2.网状型网状型 代表系统:代表系统:CODASYL CODASYL的的DBTGDBTG 数据结构:图结构数据结构:图结构 优点:能描述优点:能描述m m:n n联系,存取效率高。联系,存取效率高。缺点:必须事先确定存取路径,难以改变实体缺点:必须事先确定存取路径,难以改变实体集间的关系集间的关系 ,难学难用。,难学难用。
12、网状数据模型网状数据模型关系数据模型关系数据模型学号学号学号学号姓名姓名姓名姓名性别性别性别性别年龄年龄年龄年龄籍贯籍贯籍贯籍贯0101010101010101李勇李勇李勇李勇男男男男20202020江苏江苏江苏江苏0102010201020102刘晨刘晨刘晨刘晨女女女女19191919山东山东山东山东0103010301030103王明王明王明王明女女女女20202020北京北京北京北京0199019901990199张立张立张立张立男男男男18181818陕西陕西陕西陕西学生情况简表学生情况简表学生情况简表学生情况简表3.3.具有较高的数据独立性具有较高的数据独立性 物理数据独立性:内模式
13、改变时,不影响模式、物理数据独立性:内模式改变时,不影响模式、外模式和应用程序。外模式和应用程序。逻辑数据独立性:模式改变时,不影响外模式逻辑数据独立性:模式改变时,不影响外模式和应用程序。和应用程序。四、数据库的基本特征四、数据库的基本特征 与文件系统相比较,数据库有以下基本特征:与文件系统相比较,数据库有以下基本特征:1.1.数据是结构化的:描述数据与数据间的联系,将数据是结构化的:描述数据与数据间的联系,将整个组织的数据结构化成一个数据整体。整个组织的数据结构化成一个数据整体。2.2.数据共享,具有较小的数据冗余度,容易扩充。数据共享,具有较小的数据冗余度,容易扩充。4.4.统一的数据控
14、制和数据恢复功能统一的数据控制和数据恢复功能 数据完整性控制、数据安全性控制、数据并发数据完整性控制、数据安全性控制、数据并发性控制、数据恢复性控制、数据恢复2.2 2.2 关系数据库关系数据库一、基本概念一、基本概念1.1.关系定义关系定义 设有属性设有属性设有属性设有属性A A A A1 1 1 1、A A A A2 2 2 2、A A A An n n n分别在域分别在域分别在域分别在域D D D D1 1 1 1、D D D D2 2 2 2、D D D Dn n n n中取值,则笛卡儿积中取值,则笛卡儿积中取值,则笛卡儿积中取值,则笛卡儿积D D D D1 1 1 1D D D D2
15、 2 2 2 D D D Dn n n n的一个子集,的一个子集,的一个子集,的一个子集,称为域称为域称为域称为域D D D D1 1 1 1、D D D D2 2 2 2、D D D Dn n n n上的一个关系。记为上的一个关系。记为上的一个关系。记为上的一个关系。记为R R R R。例如:例如:姓名姓名张三张三李四李四王五王五性别性别男男女女=张三张三 男男张三张三 女女李四李四 男男李四李四 女女王五王五 男男王五王五 女女关系关系2.2.元组元组 关系中的一个元素。关系中的一个元素。3.3.元数元数 一个关系中的所含属性的个数。一个关系中的所含属性的个数。4.4.关键字关键字 一个关
16、系中能唯一标识每个元组的属性集合。也称为码。一个关系中能唯一标识每个元组的属性集合。也称为码。主关键字:被选中的关键字。候选关键字:未被选中的关键字。主关键字:被选中的关键字。候选关键字:未被选中的关键字。5.5.关系模式关系模式 关系中的所含属性的集合。记为关系中的所含属性的集合。记为R(R(A1,A2,AnA1,A2,An)。如:如:关系模式:学生(学号、姓名、性别、年龄、籍贯)关系模式:学生(学号、姓名、性别、年龄、籍贯)6.6.关系数据库关系数据库 关系模式及其各关系当前值的集合。关系模式及其各关系当前值的集合。7.7.关系的基本性质关系的基本性质1)1)关系中的属性是同质的,一属性的
17、值同类型关系中的属性是同质的,一属性的值同类型2)2)一个关系中的属性名是唯一的一个关系中的属性名是唯一的3)3)属性的次序可任意调换属性的次序可任意调换4)4)关系中的属性是不可再分的数据项关系中的属性是不可再分的数据项5)5)元组的次序可任意调换元组的次序可任意调换6)6)同一关系中无重复元组同一关系中无重复元组,即唯一性即唯一性二、关系模型的完整性二、关系模型的完整性1.1.域完整性域完整性属性值应是域中值或为空。属性值应是域中值或为空。如:职工年龄在如:职工年龄在18601860之间,月份在之间,月份在112112之间之间2.2.实体完整性实体完整性 关系表中的所有的表都必须有主码,而
18、且表中不允关系表中的所有的表都必须有主码,而且表中不允许存在如下的记录:许存在如下的记录:无主码值的记录;无主码值的记录;主码值相同的记录主码值相同的记录 如:职工关系中的职工编号如:职工关系中的职工编号3.3.用户定义的完整性用户定义的完整性如:规定职工奖金不得超过该部门平均工资的如:规定职工奖金不得超过该部门平均工资的30%30%二、关系模型的完整性二、关系模型的完整性4.4.参照完整性约束参照完整性约束 外码:取作本表属性之一的外表主码(主码值先在其主表中生成,后在其他表中引用)外码的取值只能是参照表中主码的有效值或空值。外码的取值只能是参照表中主码的有效值或空值。如:职工关系中的部门编
19、号或为空,或一正确值如:职工关系中的部门编号或为空,或一正确值 n 1职工部门(ENO,DNO,ENAME)(DNO,DNAME)三、关系运算三、关系运算1.1.传统的集合运算传统的集合运算1)1)并运算并运算:RS:RS 同类关系同类关系R R、S S的所有元组合并,删去重复的元组的所有元组合并,删去重复的元组c c4 4b bd d4 4a ac c2 2a aC CB BA Ac c4 4b bd d6 6a ad d4 4a aC CB BA Ac c4 4b bc c2 2a ad d6 6a ad d4 4a aC CB BA ARSRSc c4 4b bd d4 4a ac c2
20、 2a aC CB BA Ac c4 4b bd d6 6a ad d4 4a aC CB BA Ac c4 4b bd d4 4a aC CB BA ARSRS3)3)交运算:交运算:RS RS 同类关系同类关系R R与与S S的交由既属于的交由既属于R R又属于又属于S S的元组组成的集合构的元组组成的集合构成成RS=R-RS=R-(R-SR-S)c c4 4b bd d4 4a ac c2 2a aC CB BA Ac c4 4b bd d6 6a ad d4 4a aD DC CB BRSRS4)4)笛卡儿积:笛卡儿积:RS RS 关系关系R R、S S不要求同类不要求同类c c4 4
21、b bd d4 4a ad d6 6a ad d4 4a ad d4 4a ad d4 4a ad d4 4a ac c4 4b bc c4 4b bc c4 4b bd d6 6a ac c4 4b bc c4 4b bc c2 2a ac cc c2 22 2a aa ad d6 6a ad d4 4a aR.CR.CR.BR.BR.AR.AS.DS.DS.CS.CS.BS.B2 2)投影运算)投影运算CSCSM M2222F FS6S6MAMAF F2020E ES5S5CICIF F1919D DS4S4MAMAM M1919C CS3S3CSCSF F2121B BS2S2CSCSM
22、 M2020A AS1S1DEPDEPSEXSEXAGEAGESNSNS#S#CSCSF FMAMAE ECICID DMAMAC CCSCSB BCSCSA ADEPDEPSNSNCICIMAMACSCSDEPDEPS?对学生姓名和所在系属性取投影?对学生姓名和所在系属性取投影 SN,DEP(S)?查询学生关系中都有哪些系?查询学生关系中都有哪些系 DEP(S)Attr(S)其中:其中:AttrAttr是关系是关系S S的一个属性子集的一个属性子集3 3)连接运算)连接运算c c4 4a3a3d d4 4a2a2c c2 2a1a1C CB BA A1010e e4 4d dE ED D10
23、10e ec c4 4a3a31010e ed d4 4a2a21010e ec c2 2a1a14 4d dc c2 2a1a1E ED DC CB BA ARS4 4d dc c4 4a3a34 4d dd d4 4a2a21010e ec c4 4a3a31010e ed d4 4a2a21010e ec c2 2a1a14 4d dc c2 2a1a1E ED DC CB BA ARS 其中:其中:F F是一个条件表达式(逻辑表达式或布尔表达式)是一个条件表达式(逻辑表达式或布尔表达式)RFS=F(RS)RB20(S)S#(C#=C2(SC)1.求年龄超过求年龄超过20岁学生的姓名和性
24、别岁学生的姓名和性别2.求选修求选修C2课程的学生学号课程的学生学号3.求选修求选修C2课程的学生学号、姓名课程的学生学号、姓名 S#,SN()SS.S#=SC.S#and C#=C2 SC S#,SN()SS.S#=SC.S#(S#,C#(SC)C#(C)4.求选修了全部课程的学生学号和姓名求选修了全部课程的学生学号和姓名2.3 SQL2.3 SQL语言语言一、一、一、一、SQLSQLSQLSQL概述概述概述概述 SQL-Structured Query Language SQL-Structured Query Language SQL-Structured Query Language
25、SQL-Structured Query Language 1974 1979 1974 1979 1974 1979 1974 1979年,在年,在年,在年,在IBMIBMIBMIBM的的的的System RSystem RSystem RSystem R上实现。上实现。上实现。上实现。1986.10 1986.10 1986.10 1986.10批准为美国标准。不久被接受为国际标准。批准为美国标准。不久被接受为国际标准。批准为美国标准。不久被接受为国际标准。批准为美国标准。不久被接受为国际标准。1989 1989 1989 1989年公布年公布年公布年公布SQL89SQL89SQL89SQ
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据库技术 课件
限制150内