2022年数据库简答 .pdf
1、文件系统阶段的数据管理有些什么缺陷?试举例说明 . 答:主要有3 个缺陷:数据冗余;数据不一致性;数据联系弱。例如学校里教务处、财务处、保健处建立的文件中都有学生详细资料,如联系电话,家庭住址等。这就是“数据”冗余;如果某个家庭搬家,就要修改3 个部门文件中的数据,否则会引起同一数据在3 个部门中不一致;产生上述问题的原因是这3 个部门的文件中数据没有联系。2、简述概念模式在数据结构中的重要地位。概念模型也称信息模型,它是对信息世界的管理对象、属性及联系等信息的描述形式。概念模型不依赖计算机及DBMS ,它是现实世界的真实而全面的反映。概念模型通过系统需求分析得到,对概念模型数据化处理后就得到了数据库的数据模型/概念数据模型,主要在系统开发的数据库设计阶段使用,是按照用户的观点来对数据和信息进行建模 ,利用实体关系图来实现.它描述系统中的各个实体以及相关实体之间的关系,是系统特性和静态描述 .数据字典也将是系统进一步开发的基础。3、数据独立性和数据联系这两个概念有什么区别?数据独立性是指应用程序与数据之间相互独立,不受影响。数据联系是指同一记录内部各字段间的联系,以及记录之间的联系。4、简述 DBMS 的主要功能。数据定义功能;数据操纵功能;数据库的运行管理;数据库的建立和维护功能。/( 1) 数据库的定义功能:DBMS 提供数据定义语言(DDL )定义数据库的三级结构及其相互之间的映象、完整性、安全控制等约束。(2) 数据库的操纵功能:DBMS 提供数据操纵语言( DML )实现对数据库中数据的操作。(3) 数据库的保护功能:DBMS 对数据库的保护主要通过数据库的恢复、数据库的并发控制、数据库的完整性控制、数据库的安全性控制等四个方面实现。(4) 数据库的存储管理:DBMS 的存储管理子系统提供了数据库中数据和应用程序的一个界面,其职责是把各种DML语句转换成低层的文件系统命令,起到数据的存储、检索和更新的作用。(5) 数据库的维护功能:DBMS 中实现数据库维护功能的实用程序主要有数据装载程序、备份程序、文件重组织程序、性能监控程序。(6) 数据字典( DD) :数据库系统中存放三级结构定义的数据库称为数据字典,对数据库的操作都要通过访问DD 才能实现。5、简述 DBMS 对数据库的保护功能。数据库的保护功能:DBMS 对数据库的保护主要通过数据库的恢复、数据库的并发控制、数据库的完整性控制、数据库的安全性控制等四个方面实现。6、从模块结构看, DBMS 由哪些部分组成?:从模块结构看,DBMS 由两大部分组成:查询处理器和存储管理器(1)查询处理器有四个主要成分: DDL 编译器, DML 编译器, 嵌入型 DML 的预编译器, 查询运行核心程序(2)存储管理器有四个主要成分:授权和完整性管理器,事务管理器,文件管理器,缓冲区管理器7、DBS 由哪几个部分组成?名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 9 页 - - - - - - - - - DBS 是一个实际可运行的,按照数据库方法存储、维护和向应用系统提供数据支持的系统,它是数据库、硬件、软件、数据库管理员(DBA )的集合体。(1) 数据库( DB):是与一个特定组织各项应用有关的全部数据的集合,由应用数据的集合(物理数据库) 、关于各级数据结构的描述(描述数据库)两部分组成。(2) 硬件:包括中央处理机、内存、输入输出设备、数据通道等硬件设备。(3) 软件:包括DBMS 、OS、各种宿主语言和应用开发支持软件等程序。(4) DBA 、DBA 是控制数据整体结构的人,负责DBS 的正常运行8、什么样的人是DBA?DBA 应具有什么素质? DBA 的职责是什么?答: DBA 是控制数据整体结构的人,负责DBS 的正常运行。DBA 可以是一个人,在大型系统中也可以是由几个人组成的小组。DBA应具有下列素质:(1)熟悉企业全部数据的性质和用途;(2)对用户的需求有充分的了解;(3)对系统的性能非常熟悉。DBA的主要职责有五点:(1)概念模式定义(2)内模式定义(3)根据要求修改数据库的概念模式和内模式(4)对数据库访问的授权(5)完整性约束的说明。9、DBS 中有哪些系统软件?包括 DBMS 、OS、各种主语言和应用开发支撑软件等系统软件。10、为什么关系中的元组没有先后顺序?因为关系是一个元组的集合,而元组在集合中的顺序无关紧要。因此不考虑元组间的顺序,即没有顺序。11、为什么关系中不允许有重复的元组?因为关系是一个元组的集合,而集合中的元素不允许重复出现,因此在关系模型中对关系作了限制,关系中的元组不能重复,可以用键来标识唯一的元组。12、关系与普通的表格、文件有什么区别?关系是一种规范化了的二维表格,在关系模型中,对关系作了下列规范性限制:1)关系中每一个属性值都是不可分解的。2)关系中不允许出现相同的元组(没有重复元组 )。3)由于关系是一个集合,因此不考虑元组间的顺序,即没有行序。4)元组中,属性在理论上也是无序的,但在使用时按习惯考虑列的顺序。13、解释实体完整性和参照完整性。实体完整性 : 要求关系中元组在组成主键的属性上不能有空值。如果出现空值,那么主键值就起不了唯一标识元组的作用。参照完整性:如果属性集K 是关系模式R1 的主键, K 也是关系模式R2 的外键,那么R2 的关系中,K 的取值只允许有两种可能,或者为空值, 或者等于 R1 关系中某个主键值。这条规则在使用时有三点应注意:1)外键和相应的主键可以不同名,只要定义在相同值域上即可。2)R1和 R2 也可以是同一个关系模式,表示了属性之间的联系。3)外键值是否允许空应视具体问题而定。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 9 页 - - - - - - - - - 14、函数依赖的概念。定义:设有一关系模式R(A1,A2, ,An),X 和 Y 均为( A1,A2, ,An)的子集,对于R 的值 r 来说,当其中任意两个元组u,v 中对应于X 的那些属性分量的值均相等时,则有u,v 中对应于Y的那些属性分量的值也相等,称X 函数决定Y,或 Y 依赖于 X,记为 X-Y 。15、推理规则的内容。16、码的概念及如何确定一个关系的侯选码。码就是能唯一标识实体的属性,他是整个实体集的性质,而不是单个实体的性质。包括超码,候选码,主码。17、范式的概念及规范化的步骤和方法。第一范式 (1NF) :强调的是列的原子性,即列不能够再分成其他几列。考虑这样一个表: 【联系人】 (姓名,性别,电话)如果在实际场景中,一个联系人有家庭电话和公司电话,那么这种表结构设计就没有达到1NF。要符合1NF 我们只需把列(电话)拆分,即:【联系人】(姓名,性别,家庭电话,公司电话)。1NF 很好辨别, 但是2NF 和 3NF 就容易搞混淆。 第二范式( 2NF) :首先是1NF,另外包含两部分内容,一是表必须有一个主键;二是没有包含在主键中的列必须完全依赖于主键,而不能只依赖于主键的一部分。考虑一个订单明细表:【OrderDetail 】 (OrderID ,ProductID ,UnitPrice ,Discount ,Quantity ,ProductName) 。因为我们知道在一个订单中可以订购多种产品,所以单单一个OrderID 是不足以成为主键的,主键应该是( OrderID ,ProductID ) 。显而易见Discount(折扣),Quantity(数量)完全依赖(取决)于主键(OderID , ProductID) , 而 UnitPrice , ProductName 只依赖于ProductID。 所以OrderDetail 表不符合2NF。不符合2NF 的设计容易产生冗余数据。可以把【 OrderDetail 】表拆分为【OrderDetail 】 (OrderID ,ProductID ,Discount,Quantity )和【 Product】 (ProductID ,UnitPrice ,ProductName)来消除原订单表中UnitPrice ,ProductName 多次重复的情况。 第三范式(3NF) :首先是2NF,另外非主键列必须直接依赖于主键,不能存在传递依赖。即不能存在:非主键列A 依赖于非主键列B,非主键列B 依赖于主键的情况。考虑一个订单表【Order】(OrderID , OrderDate, CustomerID, CustomerName,CustomerAddr ,CustomerCity )主键是(OrderID ) 。其中 OrderDate,CustomerID,CustomerName,CustomerAddr,CustomerCity 等非主键列都完全依赖于主键(OrderID ) ,所以符合2NF。不过问题是CustomerName,CustomerAddr ,CustomerCity 直接依赖的是CustomerID(非主键列),而不是直接依赖于主键,它是通过传递才依赖于主键,所以不符合3NF。通过拆分【 Order】为【 Order】 (OrderID ,OrderDate , CustomerID ) 和 【 Customer】 ( CustomerID , CustomerName, CustomerAddr ,CustomerCity )从而达到3NF。第二范式( 2NF)和第三范式(3NF)的概念很容易混淆,区名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 9 页 - - - - - - - - - 分它们的关键点在于,2NF:非主键列是否完全依赖于主键,还是依赖于主键的一部分;3NF:非主键列是直接依赖于主键,还是直接依赖于非主键列18、简述事务的概念及特性,并解释每一个性质对DBS 有什么益处。答:事务是用户定义的一组操作序列的集合,数据恢复和并发控制的基本单位。数据库系统在执行事务时,要么执行事务中全部操作,要么一个操作都不执行。事务具有四个特性,即原子性、一致性、隔离性和持续性,又常简称为ACID特性。 原子性 (Atomicity) :一个事务是不可分割的数据库逻辑工作单位,事务中包括的所有操作要么都做,要么都不做。 一致性(Consistency):事务的执行结果必须使数据库从一个一致性状态变到另一个一致性状态。 隔离性 (Isolation) :一个事务的执行不能被其它事务干扰。 持续性 (Durability) ,也称持久性(Permanence):指一个事务一旦提交,它对数据库中数据的改变应该是永久性的,其它操作或故障不对其产生任何影响。、 、 、答: 1)事务的原子性是指一个事务对DB 的所以操作,是一个不可分割的工作单位。原子性是由 DBMS 的事务管理子系统实现的。事务的原子性保证了DBS 的完整性。2)事务的一致性是指数据不会因事务的执行而遭受破坏。事务的一致性是由DBMS 的完整性子系统实现的。事务的一致性保证数据库的完整性。3)事务的隔离性是指事务的并发执行与这些事务单独执行时结果一样。事务的隔离性是由DBMS 的并发控制子系统实现的。隔离性使并发执行的事务不必关心其他事务,如同在单用户环境下执行一样。4)事务的持久性,是指事务对DB 的更新应永久地反映在DB 中。持久性是由DBMS 的恢复管理子系统实现的。持久性能保证DB 具有可恢复性。19、事务的 COMMIT操作和 ROLLBACK 操作各做什么事情。答: COMMIT 语句表示事务执行成功地接结束(提交),此时告诉系统, DB 要进入一个新的正确状态, 该事务对DB 的所有更新都已交付实施(写入磁盘)。 ROLLBACK语句表示事务执行不成功地结束(应该“回退”)此时告诉系统,已发生错误,DB 可能处在不正确的状态,该事务对 DB 的所有更新必须被撤消,DB 应恢复该事务到初始状态。20、DBS 中有哪些类型的故障?事务故障、系统故障、介质故障21、什么是“运行记录优先原则”?其作用是什么?1写入2END TRANSACTION”处理。在数据库系统名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 9 页 - - - - - - - - - 采用“运行记录优先原则”12END TRANSACTION”处理。22、数据库的并发操作会带来哪些问题?如何解决?答:丢失更新问题;读脏数据;不可重复读问题。解决的方法是用封锁机制解决的方法。23、简述“串行调度”和“可串行化调度”的区别。串行调度的含义是如果有几个事务依次串行执行时,有N 种不同的有效调节调度方法。而可串行调度执行的结果等价时,该并发调度才能称之为可串行调度,所以可串行调度不是串行调度,而是指并发调度。24、简述 SQL 中的完整性约束机制。SQL 中的完整性约束规则有主键约束、外键约束、属性值约束和全局约束等多种形式。主键约束。它是数据中最重要的一种约束。在关系中主键值不允许空也不允许出现重复,主键可用主键子句或主键短语进行定义。外键约束。根据参照完整性规则,依赖关系中外键或者为空值,或者是基本关系(参照关系)中的该键的某个值。外键用外键关系子句定义。属性值约束。当要求某个属性的值不允许空值时,那么可以在属性定义后加上关键字:NOT NULL ,这是非空值约束。还可以用CHECK 子句对一个属性值加以限制以及使用域约束子句CREATDOMAIN 定义新域并加以属性值检查。全局约束。在关系定义时,可以说明一些比较复杂的完整性约束,这些约束涉及到多个属性间的联系或不同关系间的联系,称为全局约束。主要有基于元组的检查子句和断言。前者是对单个关系的元组值加以约束,后者则可对多个关系或聚合操作有关的完整性约束进行定义。25、SQL 语言中的视图机制有哪些优点?数据安全性、数据独立性和操作简便性26、软件生存期有哪几个阶段?答:软件生存期分为:软件定义时期、软件开发时期、软件维护时期。27、 数据库系统的生成期分成哪几个阶段?数据库结构的设计在生存期中的地位如何?答:分成七个阶段:规划、需求分析、概念设计、逻辑设计、物理设计、实现、运行和维护。(p184) 数据库结构的设计在生存期中的地位很重要,数据库结构的设计包括逻辑设计、物理名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 9 页 - - - - - - - - - 设计, 逻辑设计把概念模式转化为与选用的具体机器上的DBMS 所支持的数据模型相符合的逻辑结构,而物理设计主要是设计DB 在物理设备上的存储结构与存取方法等28、数据库设计过程的输入和输出有哪些内容?答:数据库设计过程的输入包括四部分内容:1、总体信息需求;2、处理需求; 3、DBMS 的特征;4、硬件和 OS(操作系统 )特征数据库设计过程的输出包括两部分:1、完整的数据库结构,其中包括逻辑结构和物理结构;2、基于数据库结构和处理需求的应用程序的设计原则。这些输出一般以说明书的形式出现29、基于数据库系统生存期的数据库设计分成哪几个阶段?答:分为5 个阶段 :简记为 (规需概逻物 ):规划、需求分析、概念设计、逻辑设计和物理设计五个阶段。30、 什么是比较好的数据库设计方法学?数据库设计方法学应包括哪些内容?答:一个好的数据库设计方法应该能在合理的期限内,以合理的工作量产生一个有实用价值的数据库结构。一种实用的数据库设计方法应包括以下内容:设计过程、设计技术、评价准则、信息需求、描述机制。31、数据库设计的规划阶段应做哪些事情?答:数据库设计中的规划阶段的主要任务是进行建立数据库的必要性及可行性分析,确定数据库系统在组织中和信息系统中的地位,以及各个数据库之间的联系32、数据库存设计的需求分析阶段是如何实现的?目标是什么?答:数据库设计的需求分析通过三步来完成:即需求信息的收集、分析整理和评审。其目的在于对系统的应用情况作全面详细的调查,确定企业组织的目标,收集支持系统总的设计目标的基础数据和对这些数据的要求,确定用户的需求,并把这些要求写成用户和数据设计者都能够接受的文档33、 评审在数据库设计中有什么重要作用?为什么允许在设计过程有多次的回溯和反复?答:评审的作用在于确认某一阶段的任务是否全部完成,通过评审可以及早发现系统设计中的错误,并在生存期的早期阶段给予纠正,以减少系统研制的成本。如果在数据库已经实现时再发现设计中的错误,那么代价比较大。因此应该允许设计过程的回溯与反复。设计过程需要根据评审意见修改所提交的阶段设计成果,有时修改甚至要回溯到前面的某一阶段,进行部分乃至全部重新设计。34、数据字典的内容和作用是什么?答:数据字典的内容一般包括:数据项、数据结构、数据流、数据存储和加工过程。其作用是对系统中数据做出详尽的描述,提供对数据库数据的集中管理名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 9 页 - - - - - - - - - 35、对概念模型有些什么要求?答:对概念模型一般有以下要求:(1)概念模型是对现实世界的抽象和概括,它应真实、充分地反映现实世界中事物和事物之间的联系,具有丰富的语义表达能力,能表达用户的各种需求,包括描述现实世界中各种对象及其复杂联系、用户对数据对象的处理要求和手段。(2)概念模型应简洁、明晰,独立于机器、容易理解、方便数据库设计人员与应用人员交换意见,使用户能积极参与数据库的设计工作。(3)概念模型应易于变动。当应用环境和应用要求改变时,容易对概念模型修改和补充。(4)概念模型应很容易向关系、层次或网状等各种数据模型转换,易于从概念模式导出也DBMS 有关的逻辑模式。36、概念设计的具体步骤是什么?答:概念设计的主要步骤为:(1)进行数据抽象、设计局部概念模式;(2)将局部概念模式综合成全局概念模式;(3)评审37、 什么是数据抽象?主要有哪两种形式的抽象?数据抽象在数据库设计过程中起什么作用?答:数据抽象是对人、物、事或概念的人为处理,它抽取人们关心的共同特性,忽略非本质的细节,并把这些特性用各种概念精确地加以描述,这些概念组成了某种模型。数据抽象有两种形式:( 1)系统状态的抽象,即抽象对象;( 2)系统转换的抽象,即抽象运算。数据抽象是概念设计中非常重要的一步。通过数据抽象,可以将现实世界中的客观对象首先抽象为不依赖任何具体机器的信息结构。38、什么是 ER 图?构成 ER 图的基本要素是什么?答:ER 图是用来表示数据库概念设计ER 模型的工具, 它提供了表示实体、属性和联系的方法。构成 ER 图的基本要素是实体、属性和联系。39、简述采用 ER 方法的数据库设计的过程。答:利用 ER 方法进行数据库的概念设计,可分成三步进行:首先设计局部ER 模式,然后把各局部 ER 模式综合成一个全局ER 模式,最后对全局ER 模式进行优化,得到最终的ER 模式,即概念模式。40、逻辑设计的目是什么?简述逻辑设计过程的输入和输出环境。答:逻辑设计的目的是把概念设计阶段设计好的基本ER 图转换为与选用的具体机器上的DBMS 所支持的数据模型相符合的逻辑结构(包括数据库模式和外模式)。逻辑设计过程中的输入信息有:(1)独立于 DBMS 的概念模式,即概念设计阶段产生的所有局部和全局概念模式;(2)处理需求 ,即需求分析阶段产生的业务活动分析结果;名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 9 页 - - - - - - - - - (3)约束条件,即完整性、一致性、安全性要求及响应时间要求等;(4)DBMS特性,即特定的DBMS 特性,即特定的DBMS 所支持的模式、子模式和程序语法的形式规则。逻辑设计过程输出的信息有:(1)DBMS 可处理的模式;(2)子模式;(3)应用程序设计指南;(4)物理设计指南。41、简述逻辑设计阶段的主要步骤及内容。答:逻辑设计主要是把概念模式转换成DBMS 能处理的模式。转换过程中要对模式进行评价和性能测试,以便获得较好的模式设计。42、规范化理论对数据库设计有什么指导意义?答:在概念设计阶段,已经把关系规范化的某些思想用作构造实体类型和联系类型的标准,在逻辑设计阶段,仍然要使用关系规范化的理论来设计模式和评价模式。规范化的目的是减少乃至消除关系模式中存在的各种异常,改善完整性,一致性和存储效率。43、什么是数据库结构的物理设计?简述其具体步骤。答:数据库结构的物理设计是指对一个给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程,所谓数据库的物理结构主要指数据库在物理设备上的存储结构和存取方法。物理设计的步骤为:(1)设计存储记录结构,包括记录的组成、数据项的类型和长度,以及逻辑记录到存储记录的映射;(2)确定数据存储安排;(3)设计访问方法,为存储在物理设备上的数据提供存储和检索的能力;(4)进行完整性和安全性的分析、设计;(5)程序设计。44、数据库实现阶段主要做哪几件事情?答:数据库实现阶段的主要工作有以下几点:(1)建立实际数据库结构(2)试运行(3)装入数据(具体解释参见教材p150) 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 8 页,共 9 页 - - - - - - - - - 45、什么是数据库的再组织设计?简述其重要性。答:对数据的概念模式、逻辑结构或物理结构的改变称作数据再组织。数据再组织,通常是由于环境,需求的变化或性能原因而进行的,如信息定义的改变,增加新的数据类型,对原有的数据提出了新的使用要求,改用具有不同物理特征的新存储设备以及数据库性能下降等都要求进行数据库的重新组织。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 9 页,共 9 页 - - - - - - - - -