2022年数据库系统概论重点定义整理 .pdf
数据:描述事物的符号记录,是数据库中的基本对象数据库:是长期储存在计算机内、有组织的、可共享的大量数据的集合数据库数据3 大基本特点:永久存储、有组织、可共享数据库管理系统(DBMS):是位于用户与操作系统之间的一层数据管理软件数据库管理系统主要功能:1.数据定义功能;2.数据组织、存储和管理;3.数据操纵功能;4.数据库的事务管理和运行管理;6.其他功能数据库系统(DBS、简称数据库):指在计算机系统中引入数据库后的系统,由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员构成人工管理阶段特点:1.数据不保存;2.应用程序管理数据;3.数据不共享;4.数据不具有独立性文件系统阶段特点:1.数据可长期保存;2.由文件系统管理数据文件系统缺点:1.数据共享性差,冗余度大;2.数据独立性差数据库系统特点:1.数据结构化(与文件系统的本质区别);2.数据的共享性高,冗余度低,易扩充;3.数据独立性高;4.数据由 DBMS 统一管理和控制数据结构化:所谓“整体”结构化是指在数据库中的数据不再仅仅针对某一个应用,而是面向全组织;不仅数据内部结构化,而且整体是结构化的,数据之间具有联系。在每个文件系统中每个文件内不是有结构的,即文件由记录构成,每个记录由若干属性组成数据独立性包括:数据的物理独立性和数据的逻辑独立性物理独立性:指用户的应用程序与存储在磁盘上的数据库中的数据是相互独立的逻辑独立性:指用户的应用程序与数据库的逻辑结构是相互独立的,即数据的逻辑结构改变了,用户程序也可以不变DBMS提供的数据控制功能:1.数据的安全性保护;2.数据的完整性检查;3.并发控制;4.数据库恢复数据模型应满足三方面要求:一是能比较真实的模拟现实世界;二是容易为人所理解;三是便于在计算机上实现数据模型是数据库系统的核心和基础第一类是 概念模型,也成信息模型,它是按用户的观点来对数据和信息建模,主要用于数据库设计第二类的 逻辑模型主要包括层次模型、网状模型、关系模型、面向对象模型和对象关系模型,它是按计算机系统的观点对数据建模,主要用于DBMS 的实践第二类中的 物理模型 是对数据最底层的抽象,它描述数据在系统内部的表示方式和存取方式,在磁盘和磁带上的存储方式和存取方式,是面向计算机系统的数据模型的组成要素:1.数据结构;2.数据操作;3.数据的完整性约束条件概念模型用途:用于信息世界的建模,是现实世界到信息世界的第一层抽象,是数据库设计人员进行数据库设计的有力工具,也是数据库设计人员和用户之间进行交流的语言对概念模型的基本要求:一方面应该具有较强的语义表达能力,能够方面、直接地表达应用中的各种语义知识;另一方面应该简单、清晰、易于用户理解实体:客观存在并可相互区别的事物属性:实体所具有的某一特性码:唯一标识实体的属性集域:属性的取值范围实体型:具有相同属性的实体必然具有的特征和性质。用实体名及其属性名集合来抽象和刻画同类实体,成为实体型实体集:同一类型实体的集合名师资料总结-精品资料欢迎下载-名师精心整理-第 1 页,共 4 页 -联系:实体内部的联系通常是指组成实体的各属性之间的联系;实体之间的联系通常是指不同实体集之间的联系两个实体型之间的联系分为三种:一对一联系、一对多联系、多对多联系关系模型:1.关系数据模型的数据结构;2.,操纵和完整性约束;3.,存储结构关系:一个关系对应通常说的一张表元组:表中的一行即为一个元组属性:表中的一列即为一个属性码(码键):表中的某个属性组,它可以唯一确定一个元组域:属性的取值范围分量:元组中的一个属性值关系的完整性约束条件包括:实体完整性、参照完整性、用户定义的完整性关系的两个不变性:实体完整性和参照完整性的关系模型必须满足的完整性约束条件数据库系统的三级模式结构指数据库系统是由外模式、模式和内模式三级构成模式(逻辑模式):是数据库全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。它是数据库系统模式结构的中间层,既不涉及数据的物理存储细节和硬件环境,也与具体的应用程序、所使用的开发工具及高级程序设计语言无关。一个数据库只有一个 模式外模式(子模式、用户模式):是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。通常是模式的子集,一个数据库可以有多个 外模式。外模式是保证数据库安全性的一个有力措施内模式(存储模式):一个数据库只能有一个 内模式,是数据物理结构和存储方式的描述,是数据在数据库内部的表示方式外模式/模式映射、模式/内模式映射 保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性候选码:若关系中的某一属性组的值能唯一的标识一个元组主码:若一个关系中有多个候选码,则选定其中一个为主码候选码的诸称为主属性。不包含在任何候选码中的属性称为非主属性 或非码属性全码:在最极端的情况下,关系模式中的所有属性是这个关系模式的候选码关系的三种类型:基本关系(又称基本表、基表)、查询表、视图表基本表 是实际存在的表,它是实际存储数据的逻辑表示查询表 是查询结果对应的表视图表 是基本表或其他视图表导出的表,是虚表,不对应实际存储的数据关系模式:关系的表述关系模型基本操作:1.查询操作;2.插入、删除、修改操作查询操作分为:选择、投影、连接、除、并、差、交、笛卡尔积(5 种基本操作)关系操作特点:集合操作方式,即操作的对象和结果都是集合,也称一次一集合的方式。非关系数据模型的数据操作方式则是一次一记录的方式关系数据语言分类:1.关系代数语言(ISBL);2.关系演算语言(元组关系演算语言APLHA、QUEL,域关系演算语言QBE)3.具有关系代数和关系演算双重特点的语言(SQL)等值连接和自然连接的区别和联系:1.连接运算符是“=”的连接运算成为等值连接,他是从关系 R和 S的广义笛卡尔积中选取A、B属性值相等的那些元组;2.自然连接是一种特殊的等值连接,他要求两个关系中进行比较的分量必须是相同的属性组,并且结果中把重复的属性列去掉SQL集数据查询、数据定义(CREATE、DROP、ALTER)、数据操纵(INSERT、UPDATE、DELETE)和数据控制(GRANT、REVOKE)功能于一体名师资料总结-精品资料欢迎下载-名师精心整理-第 2 页,共 4 页 -SQL两种使用方法:交互式、嵌入式SQL主要特征包括:1.综合统一;2.高度非过程化;3.面向集合的操作方式;4.以同一种语法结构提供多种使用方式;5.语言简洁,易学易用计算机系统的三类安全性问题:技术安全类、管理安全类和政策法律类TCSEC/TDI从以下四个方面来描述安全性级别划分的标准:安全策略、责任、保证和文档GRANT 语句向用户授予权限,REVOKE 语句收回授予的权限数据库完整性是指数据的正确定和相容性数据库的完整性和安全性的区别和联系:数据库的完整性是为了防止数据库存在不符合语义的数据,也就是防止数据库中存在不正确的数据。数据的安全性是保护数据库防止恶意的破坏和非法的存取。因此,完整性检查和控制的防范对象是不合语义的、不正确的数据,防止它们进入数据库。安全性控制的防范对象是非法用户和非法操作,防止他们对数据库数据的非法存取为维护数据库的完整性,DBMS 必须能够:1.提供定义完整性约束条件的机制;2.提供完整性检查的方法;3.违约处理实体完整性规则:若属性(指一个或一组属性)A 是基本关系R 的主属性,则A 不能取空值参照完整性规则:若属性(或属性组)F 是基本关系R 的外码,它与基本关系S 的主码 Ks相对应(基本关系R 和 S不一定是不同的关系),则对于R 中每个元组在F 上的值必须为:1.或者取空值(F 的每个属性值均为空值);2.或者等于S中某个元组的主码值关系模型的实体完整性在CREATE TABLE中用 PRIMARY KEY定义。对单属性构成的码有两种说明方法,一种是列级约束条件,另一种是第一位表级约束条件。对多属性构成的码只有一种说明方法,即定义为表级约束条件关系模式存在的问题:1.数据容易太大;2.更新异常;3.插入异常;4.删除异常函数依赖:设 R(U)是属性集U 上的关系模式。X,Y 是 U 的自己。若对于 R(U)的任意一个可能的关系r,r 中不可能存在两个元组在X 上的属性值相等,而在Y 上的属性值不相等,则称 X 函数确定 Y 或 Y 函数依赖于X,记作 XY 规范化:一个低一级范式的关系模式,通过模式分解可以转换为若干个高一级范式的关系模式的集合,这种过程就叫做规范化第一范式:每一个分量必须是不可分的数据项,满足了这个最低要求的关系模式就属于1NF 2NF:若 R1NF,且每一个非主属性完全函数依赖于码,则R2NF 3NF:关系模式R中若不存在这样的码X,属性组Y及非主属性Z(Z 不是 Y的真子集)使得 X Y,YZ 成立,Z,则称 R3NFBCNF:关系模式 R1NF.若 XY 且 Y 不是 X 真子集时X 必含有码,则 RBCNF一个关系模式R 不属于 2NF,就会产生以下问题:1.插入异常;2.删除异常;3.修改异常模式分解的3 个定义:分解具有“无损连接性”;分解要“保持函数依赖”;分解既要“保持函数依赖”,优雅具有“无损连接性”数据库设计的一般定义:对于一个给定的应用环境,构造(设计)优化的数据库逻辑模式和物理结构,并据此建立数据库及应用系统,使之能够有效的存储和管理数据,满足各种用户的应用需求,包括信息管理要求和数据操作要求信息管理要求:在数据库中应该存储和管理哪些数据对象数据操作要求:对数据对象需要进行哪些操作,如查询、增、删、改、统计等操作数据库设计目标:为用户和各种应用系统提供一个信息基础设施和高效率的运行环境高效率的运行环境包括:数据库数据的存取效率、数据库存储空间的利用率、数据库系统运行管理的效率等都是高的名师资料总结-精品资料欢迎下载-名师精心整理-第 3 页,共 4 页 -数据可设计的特点:1.数据库设计的基本规律:“三分技术,七分管理,十二分基础数据”;2.结构(数据)设计和行为(处理)设计相结合概念结构的主要特点:1.能真实、充分地反映现实世界,包括事物和事物之间的联系,能满足用户对数据的粗粒要求,是实现世界的一个真实模型;2.易于理解,从而可以用它和不熟悉计算机的用户交换意见,用户积极的参与是数据库设计成功的关键;3.易于更改,当应用环境和应用要求改变时,容易对概念模型修改和扩充;4.易于向关系、网状、层次等各种数据模型转换设计概念结构的四种方法:自顶向下、自底向上、逐步扩张、混合策略最经常采用的策略是自底向上方法,即自顶向下的进行需求分析,然后自底向上的设计概念结构三种抽象:分类、聚集、概括游标 是系统为用户开设的一个数据缓冲区,存放SQL 语句的执行结果,每个游标区都有一个名字查询优化的优点不仅在于用户不必考虑如何最好的表达查询以获得较好的效率,而且在于系统可以比用户程序的“优化”做得更好查询优化的总目标:选择有效的策略,求得给定关系表达式的值,使得查询代价最小(实际上是较小)代数优化 策略是通过对关系代数表达式的等价变化来提高查询效率物理优化 就是要选择高效合理的操作算法或存取路径,求得优化的查询计划,达到查询优化的目标事务 是用户定义的一个数据库操作序列,这些操作要么全做要么全部做,是一个不可分割的工作单位事务通常以BEGIN TRANSACTION 开始,以COMMIT或 ROLLBACK结束。COMMIT 表示提交,即提交事务的所有操作ROLLBACK 表示回滚,即在事务运行过程中发生了某种故障,事务不能继续执行,系统将事务中对数据库的所有已完成的操作全部撤销,回滚到事务开始时的状态事务的四个特性(ACID特性):原子性、一致性、隔离性、持续性原子性:事务是数据库的逻辑工作单位,事务中包括的诸操作要么都做,要么都不做一致性:事务执行的结果必须是使数据库从一个一致性状态变换到另一个一致性状态隔离性:对并发执行而言,一个事务的执行不能被其他事务干扰持续性:一个事务一旦提交,它对数据库中数据的改变就应该是永久性的故障的种类:1.事务内部的故障;2.系统故障(软故障);3.介质故障(硬故障);4.计算机病毒建立冗余数据最常用的技术:数据转储、登记日志文件并发操作带来的数据的不一致问题:丢失修改、不可重复读、读“脏”数据避免死锁 的简单方法是采用先来先服务的策略名师资料总结-精品资料欢迎下载-名师精心整理-第 4 页,共 4 页 -