自学考试专题:07163高级数据库技术复习资料.doc
《自学考试专题:07163高级数据库技术复习资料.doc》由会员分享,可在线阅读,更多相关《自学考试专题:07163高级数据库技术复习资料.doc(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、07163高级数据库技术复习资料1. 信息具有时效性、有用性和知识性,它是客观世界的反映。2. 信息具有4个基本特征:(1)信息的内容是关于客观事物或思想方面的知识(2)信息是有用的(3)信息能够在空间和时间上被传递(4)信息需要一定的形式表示。3. 在空间上传递信息称为信息通信,在时间上传递信息称为信息存储。4. 信息对于人类社会发展的重要意义:它可以提高人们对事物的认识,减少人们活动的盲目性;信息是社会机体进行活动的纽带,社会的各个组织通过信息网相互了解并协同工作,使整个社会协调发展;社会越发展,信息的作用就越突出;信息又是管理活动的核心,要想对事物管理好,需要掌握更多的信息,并利用信息进
2、行工作。5. 数据(Data)是用于承载信息的物理符号。6. 数据具有4个特征:(1)数据有“型”和“值”之分(2)数据受数据类型和取值范围的约束(3)数据有定性表示和定量表示之分(4)数据应具有载体和多种表现形式。7. 常见的数据类型有数值型、字符串型、日期型和逻辑型。8. 数据库中的数据具有整体性和共享性。9. 数据处理是指对数据的收集、组织、整理、加工、存储和传播等工作。10. 数据处理工作分为3类:(1)数据管理(2)数据加工(3)数据传播。11. 在数据处理中,最基本的工作是数据管理工作。12. 数据管理包括3项内容:(1)组织和保存数据(2)进行数据维护(3)提供数据查询和数据统计
3、功能。13. 数据库方法与文件方法相比,具有两个进步特征:(1)数据库中的数据具有数据整体性(2)数据库中的数据具有数据共享性。14. 数据库的数据共享性表现在两个方面:(1)不同的用户可以按各自的用法使用数据库中的数据(2)多个用户可以同时共享数据库中的数据资源,即不同的用户可以同时存取数据库中的同一个数据。15. 在数据库管理系统的操作功能中:数据定义功能是指为说明库中的数据情况而进行的建立数据库结构的操作,通过数据定义可以建立起数据库的框架;数据库建立功能是指将大批数据录入到数据库的操作,它使得库中含有需要保存的数据记录;数据库维护功能是指对数据的插入、删除和修改操作,其操作性能满足库中
4、信息变化或更新的需求;数据查询和统计功能是指通过对数据库的访问,为实际应用提供需要的数据。16. 数据管理技术经历了手工管理、文件管理和数据库技术三个发展阶段;数据库技术是20世纪60年代发展起来的数据管理技术。17. 数据管理在手工管理阶段具有4个特点:(1)手工管理阶段不保存大量的数据(2)手工管理阶段没有软件系统对数据进行管理(3)手工管理阶段基本上没有“文件”概念(4)手工管理阶段是一组数据对应一个程序。18. 文件管理阶段的数据管理具有4个特点:(1)管理的数据以文件的形式长久地被保存在计算机的外存中(2)文件系统有专门的数据管理软件提供有关数据存取、查询及维护功能(3)文件系统中的
5、数据文件已经具有多样化(4)文件系统的数据存取是以记录为单位的。19. 文件系统在数据管理上的缺点:(1)文件系统的数据冗余度大(2)文件系统中缺乏数据域程序独立性(文件系统中的数据文件是为某一特定应用服务的,数据文件的可重复利用率非常低当数据的逻辑结构改变时,必须修改它的应用程序,同时也要修改文件结构的定义应用程序的改变,如应用程序所使用的高级语言的变化等,也将影响到文件结构的变化)。20. 进入20世纪70年代后,数据库技术又有很大发展的表现:(1)出现了许多商品化的数据库管理系统(2)数据库技术为实现和优化信息系统的基本技术(3)关系方法的理论研究和软件系统的研制取得了很大成果。21.
6、数据库学科的研究内容:(1)数据库管理系统软件的研制(2)数据库设计技术的开发(3)数据库理论的研究。22. 数据库系统和文件系统相比具有的特点:(1)数据库设计时面向数据模型对象(2)数据库系统的数据冗余度小,数据共享度高(3)数据库系统的数据和程序之间具有较高的独立性(4)数据库管理系统通过DBMS进行数据安全性和完整性的控制(5)数据库数据的最小存取单位是数据项。23. 减少冗余数据的优点:(1)数据量小可以节约存储空间,是数据的存储、管理和查询都容易实现(2)数据冗余小可以使数据统一,避免产生数据的不一致问题(3)数据冗余小便于数据维护,避免数据统计错误。24. 数据共享度高的优点:(
7、1)系统现有用户或程序可以共同享用数据库中的数据(2)当系统需要扩充时,在开发的新用户或新程序还可以共享原有的数据资源(3)多用户或程序可以在同一时刻共同使用同一数据。25. 在文件系统中,数据的最小存取单位是记录;在数据库系统中,数据最小存取单位是数据项26. 在进行数据库硬件配置时,应注意的问题:(1)计算机内存要尽量大(2)计算机外存也要尽量大(3)计算机的数据传输速度要快。27. 数据库系统的软件中包括操作系统(OS)、数据库管理系统(DBMS)、主语言系统、数据库应用开发系统及工具、数据库应用系统和数据库28. 数据库系统的人员由软件开发人员、软件使用人员及软件管理人员组成;软件开发
8、人员包括系统分析员、系统设计员及系统程序设计员。29. 数据库管理员(DBA)的职责:(1)数据库管理员应参与数据库和应用系统的设计(2)数据库管理员应参与决定数据库的存储结构和存取策略的工作(3)数据库管理员要负责定义数据的安全性要求和完整性条件(4)数据库管理员负责监视和控制数据库系统的运行,负责系统的维护和数据恢复工作(5)数据库管理员负责数据库的改进和重组。30. 数据库中的数据独立性分为:(1)数据的物理独立性(2)数据的逻辑独立性。31. 在日常工作中,数据库管理员要负责记录数据库使用的“日志文件”,通过日志文件了解数据库的被使用和更改的情况。32. 数据库管理系统提供的主要功能:
9、(1)数据定义功能(2)数据操纵功能(3)数据库的建立和维护功能(4)数据库的运行管理功能。33. DML的两种形式:(1)宿主型DML(2)自主型DML。34. DML的语言处理有两种方法:(1)预编译方法(2)增强编译方法。35. 数据库的三级模式是指逻辑模式(模式)、外模式(子模式)、内模式(存储模式或物理模式)。36. 使用子模式的优点:(1)由于使用子模式,用户不必考虑那些与自己无关的数据,也无需了解数据的存储结构,使用户使用数据的工作和程序设计的工作都得到了简化(2)由于用户使用的是子模式,使得用户只能对自己需要的数据进行操作,数据库的其他数据与用户是隔离的,这样有利于数据的安全和
10、保密(3)由于用户可以使用子模式,而同一模式又可派生出多个子模式,所以有利于数据的独立性和共享性。37. 用户数据库、概念数据库和物理数据库三者的关系是:概念数据库是物理数据库的逻辑抽象形式;物理逻辑库是概念数据库的具体实现;用户数据库是概念数据的子集,也是物理数据库子集的逻辑描述。38. 信息的三种世界是指现实世界、信息世界和计算机世界(也称数据世界或机器世界)。39. 数据项是对象属性的数据表示;记录是实例的数据表示;文件是对象的数据表示,是同类记录的集合;记录结构及其记录联系的数据化的结果就是数据模型。40. 现实世界、信息世界和计算机世界的联系:现实世界、信息世界和计算机世界这三个领域
11、是由客观到认识、由认识到使用管理的三个不同层次,后一领域是前一领域的抽象描述;现实世界的事物及联系,通过系统分析称为信息世界的信息模型,而信息模型经过数据化处理转化为数据模型。41. 数据库的概念模型也称信息模型。42. 数据库系统中最常用使用的数据模型是层次模型、网状模型和关系模型;层次模型和网状模型统称为非关系模型。43. 数据模型的三要素:数据结构、数据操作和完整性约束条件。44. 多对多的联系分解成一对多的联系的分解方法:冗余结点法和虚拟结点法。优缺点:冗余结点法的优点是结构清晰,允许结点改变存储位置;缺点是占用存储空间大,有潜在的不一致性。虚拟结点法的优点是占用存储空间小,能够避免潜
12、在的不一致性问题;缺点是结点改变存储位置时可能引起虚拟结点指针的改变。45. 层次模型的数据存储一般使用邻接存储法和链接存储法(子女-兄弟链接法和层次序列链接法)实现。46. 层次模型的数据操作主要是数据的查询、插入、删除、修改。47. 层次模型的完整性约束条件:(1)在进行插入记录值操作时,如果没有指明相应的双亲记录值,则不能插入子女记录值(2)进行删除记录操作时,如果删除双亲记录值,则相应的子女不结点值也同时被删除(3)进行修改记录操作时,应修改所有相应记录,以保证数据的一致性。48. 网状数据模型常用的存储方法是链接法,它包括单向链接、双向链接、环状链接、向首链接等。此外,网状数据模型还
13、用其他的存储方法,如指引元阵列法、二进制阵列法、索引法等。49. 网状数据和层次数据比较,双方各有优缺点:(1)层次模型的的主要优缺点。层次模型的主要优点是:数据模型本身比较简单;系统性能优于关系模型和网状;能够提供良好的完整性支持层次模型的主要缺点是:在表示非层次性的联系时,只能通过冗余数据或创建非自然的数据组织来解决;对插入和删除操作的限制比较多;查询子女结点必须通过双亲结点;由于结构严密,层次命令趋于程序化(2)网状数据模型的主要优点有:能够更直接地描述现实世界,一个结点可以有多个双亲,允许符合链,具有良好的性能,存取效率比较高层次模型的主要缺点是结构比较复杂,而且随着应用环境的扩大,数
14、据库的结构就变得越来越复杂,不利用用户掌握;DDL和DML语言复杂,用户不容易使用;由于记录之间联系是通过存取路径实现的,应用程序在访问数据库时必须适当的存取路径,因此,用户必须了解系统结构的细节后才能实现其数据存取,程序员要为访问数据设置存取路径,加重了编写应用程序的负担。50. 关系,一个关系对应通常所说的一张二维表;元组,表中的一行称为一个元组,许多系统中把元组称为关系;属性,表中的一列称为一个属性;码,表中的某个属性或属性组,它们的值可以唯一地确定一个元组,且属性组中不含多余的属性,这样的属性或属性组称为关系的码;域,属性的取值范围;分量,元组中的一个属性值称为分量;关系模式,关系的型
15、称为关系模式,关系模式是对关系的描述。51. 关系的完整性约束条件:实体完整性、参照完整性和用户定义的完整性。52. 在关系数据库的物理组织中,关系以文件形式存储。53. 与非关系数据模型相比,关系数据模型的特点:(1)关系数据模型建立在严格的数据基础之上(2)关系数据模型的概念单一,容易理解(3)关系数据模型的存取路径对用户隐藏(4)关系模型中的数据联系是靠数据冗余实现的。54. 数据库系统的设计包括数据库设计和数据应用系统设计两方面的内容。55. 概念结构的特点:(1)概念模型是现实世界的一个真实模型(2)概念模型应当易于理解(3)概念模型应当易于更改(4)概念模型应易于向数据模型转换。5
16、6. 数据库系统设计的内容主要有:数据库的结构特性设计,数据库的行为特性设计,数据库的物理模式设计。57. 进行数据库系统设计时,应注意的问题:(1)进行数据库系统设计时应考虑计算机硬件、软件和干件的实际情况(2)数据库系统设计时应使结构特性设计和行为特性设计紧密结合。58. 新奥尔良(New Orleans)方法将数据库设计分为4个阶段:需求分析、概念设计、逻辑设计和物理设计。其后,许多科学家进行了改进,认为数据库设计应分6个阶段进行:需求分析、概念结构设计、逻辑结构设计、物理结构设计、数据库实施和数据库运行和维护。在数据库设计不同阶段上,实现的具体方法有基于E-R模型的数据库设计方法、基于
17、3NF(第3范式)的设计方法、基于抽象语法规范的设计方法等。59. 需求分析的主要任务是:详细调查现实世界要处理的对象(组织、部门、企业等);充分了解系统的概况和发展前景;明确用户的各种需求;收集支持系统目标的基础数据及其处理方法;确定新系统的功能和边界。60. 在系统需求调查过程中,常用的调查方法:(1)跟班作业(2)开调查会(3)请专人介绍(4)查询(5)请用户填写设计调查表(6)查阅数据记录。调查中还需要查阅与原系统有关的数据记录,包括账本、档案或文献等。61. 数据字典通常包括以下5个部分:(1)数据项(数据项是不可再分的数据单位)(2)数据结构(3)数据流(4)数据存储(5)处理过程
18、。62. 概念结构设计的方法有4种:(1)自顶向下的设计方法(2)自底向上的设计方法(3)逐步扩张的设计方法(4)混合策略设计的方法。63. 数据抽象的三种基本方法是分类、聚集和概括。64. 设计分E-R图的具体做法是:(1)选择局部应用(2)设计分E-R图。65. 为了简化E-R图,在调整中应当遵循的一条原则:现实世界的事物能作为属性对待的尽量作为属性对待。在解决这个问题时应当遵循两条基本准则:(1)“属性”不能在具有需要描述的性质(2)“属性”不能与其他实体具有联系。66. 视图的集成可以有两种方法:一种方法是多个分E-R图一次集成;另一种方法是逐步集成,用累加的方法一次集成两个分E-R图
19、。无论采用哪种方法,在每次集成局部E-R时,都要分两步进行:(1)合并E-R图(2)修改和重建初步E-R图。67. 分E-R图之间的冲突主要有3类:属性冲突、命名冲突和结构冲突。68. 属性冲突主要有以下两种情况:(1)属性域冲突(2)属性取值单位冲突。69. 命名冲突主要有以下两种:(1)同名异义冲突(2)异名同义冲突。70. 结构冲突有以下3中情况:(1)同一对象在不同的应用中具有不同的抽象(2)同一实体在不同分E-R图中的属性组成不一致(3)实体之间的联系在不同的分E-R图中呈现不同的类型。71. 消除了冗余的初步E-R图就称为基本E-R图。72. 分析方法是消除冗余的主要方法。分析方法
20、消除冗余是以数据字典和数据流程图为依据,根据数据字典中关于数据项之间逻辑关系的说明来消除冗余的。73. 通常把概念模型向逻辑模型转换的过程分为3步进行:(1)把概念模型转换成一般的数据模型(2)将一般的数据模型转换成特定的DBMS所支持的数据模型(3)通过优化方法将其转化为优化的数据模型。74. 1:1联系的转换方法:(1)单独转换为一张表(2)在任一端进行合并;1:n联系的转换方法:(1)产生一张表的关系(2)与n方实体进行合并;m:n联系的转换方法:(1)产生一张表。75. 用户子模式也称外模式。用户子模式设计时应注意以下问题:(1)使用更符合用户习惯的别名(2)对不同级别的用户可以定义不
21、同的子模式(3)简化用户对系统的使用。76. 关系数据库常用的存取方法有索引方法、聚簇方法和HASH方法等。77. 选择索引方法的基本原则是:(1)如果一个属性经常出现在查询条件中出现,则考虑在这个属性上建立索引;如果一组属性经常在查询条件中出现,则考虑在这组属性上建立组合索引(2)如果一个属性经常作为最大值和最小值等聚集函数的参数,则考虑在这个属性上建立索引(3)如果一个属性经常在连接操作的连接条件中出现,则考虑在这个属性上建立索引(4)关系上定义的索引数要适当,并不是越多越好,因为系统为维护索引付出代价,查找索引也要付出代价。78. 为了提高某个属性或属性组的查询速度,把这个属性或属性组上
22、具有相同值的元组集中存放在 连续的物理块上的处理称为聚簇,这个属性或属性组称为聚簇码。79. 设计候选聚簇的原则是:(1)对经常在一起进行连接操作的关系可以建立聚簇(2)如果一个关系的一组属性经常出现在相等、比较条件中,则该单个关系可建立聚簇(3)如果一个关系的一个(或一组)属性上的值重复率很高,则此单个关系可建立聚簇(4)如果关的主要应用是通过聚簇码进行访问或连接,而其他属性访问关系的操作很少时,可以使用聚簇。80. 检查候选聚簇,取消其中不必要关系的方法是:(1)从聚簇中删除经常进行全表扫描的关系(2)从聚簇中删除更新操作远多于连接操作的关系(3)不同的聚簇中可能包含相同的关系,一个关系可
23、以在某一个聚簇中,但不能同时加入多个聚簇。81. 建立聚簇应注意的问题:(1)聚簇虽然提高了某些应用的性能,但是建立与维护聚簇的开销是相当大的(2)对已有的关系建立聚簇,将导致关系中的元组移动其物理存储位置,这样会使关系上原有的索引无效,要想使用原索引就必须重建原有索引(3)当一个元组的聚簇码值改变时,该元组的存储位置也要做相应移动,所以聚簇码值应当相对稳定,以减少修改聚簇码值所引起的维护开销。82. 确定数据的存放位置和存储结构要综合考虑存取时间、存储控件利用率和维护代价三方面的因素。83. 有多个磁盘的计算机,可以采用下面几种存取位置的分配方案:(1)将表和索引放在不同的磁盘上,这样在查询
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 自学考试 专题 07163 高级 数据库技术 复习资料
限制150内