四级数据库工程师重难点.pdf
《四级数据库工程师重难点.pdf》由会员分享,可在线阅读,更多相关《四级数据库工程师重难点.pdf(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、四级数据库工程师重难点第 1 章引 言1.数据是描述现实世界事物的符号记录,是用物理符号记录下来的可以识别的信息。数据是信息的符号表示,是载体;信息是数据的语义解释,是内涵。2.数据模型是对现实世界数据特征的抽象,是数据库系统的形式框架,用来描述数据的一组概念和定义,包括描述数据、数据联系、数据操作、数据语义以及数据致性的概念工具。满足三条件:比较真实地模拟现实世界:易于人们理解;易于计算机实现三个组成要素:数据结构(静态,数据对象本身结构及之间的联系)、数据操作(对数据对象操作及操作规则的集合)和完整性约束(语义约束:数据模型、数据内部及之间联系)3.模式是对数据库中全体数据的逻辑结构和特征
2、的描述,是所有用户的公共数据视图,也称为逻辑模式或概念模式。外模式是对数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,是与某应用有关的数据的逻辑表示,也称为子模式、用户模式或用户视图。内模式是对数据库中数据的物理结构和存储方式的描述,也称为物理模式或存储模式。当数据库模式发生变化时,通过调整外模式/模式间的映像关系,使得应用程序不必随之修改,从而保证数据与应用程序间的逻辑独立性,简称数据的逻辑独立性。当数据库数据的物理存储结构改变时,通过调整模式/内模式映像关系,保持数据库模式不变,使数据库系统的外模式和应用程序不随之改变,保证数据与应用程序间的物理独立性,简称数据的物理独立性。4.
3、数据库是存储在计算机内的共享数据集合,数据库管理系统是种数据管理系统软件“数据库系统则是在计算机系统中引入数据库后的软硬件系统构成,包括了数据库、数据库管理系统和数据库应用程序。5.DBMS的主要功能有数据定义、数据操纵、数据库运行管理与控制、数据库建立与维护。DBMS包括查询处理器和存储管理器。查询处理器实现面向用户的查询分析处理和优化功能。存储管理器为用户和应用程序提供了访问存储在数据库文件中的应用数据的接口。6.关系模型用二维表表示实体及实体之间的联系,现实世界中的每个客观对象对应表中的一行叫做一条记录,表中的每个列(属性)描述对象类的某一特征,列 的 值(属性的取值)刻画和描述客观对象
4、的某一具体的特征。优缺点:建立在“集合”“关系”上,严格成熟的理念基础;用关系表示实体及之间联系,简单易憧;存储路径透明,较好的数据独立性和安全保密性;查询效率低于非关系模型。第 2 章数据库应用系统生命周期2.1 软件生命周期是指软件产品从考虑其概念开始,到该产品不再使用的整个时期。一般包括概念阶段、需求阶段、设计阶段、实现阶段、测试阶段、安装部署及交付阶段、运行阶段与维护阶段.数据库应用系统需求是指用户对数据库应用系统在功能、性能、行为、设计约束等方面的期望和要求:数据及数据处理、业务、性能、其他存储安全备份与恢复等。2.2 数据库应用系统生命周期模型1.瀑布模型原理,项目规划、需求分析、
5、系统设计、实现与部署、运行管理与维护五部分2.快速原型模型和增量模型原理,允许渐进、迭代地开发DBAS。3.根据DBAS的软件组成和各自功能,细 化 DBAS需求分析和设计阶段,引入了数据组织与存储设计、数据访问与处理设计、应用设计三条设计主线,分别用于设计DBAS中的数据库、数据库事务和应用程序。4.设计阶段细分为概念设计、逻辑设计、物理设计三个步骤,每一步涵盖三条设计主线。第 3 章需求分析及功能建模方法3.1 数据元素(列)是数据处理中的最小单位。3.2 DFD图:数 据 流(标有名字的箭头)、处理、数据存储(横圆柱)、数据源/终点(棱形)3.3 IDEFO图:更好地理解需求;ICOM(
6、输入、控制、输出、机制)码;至少一个控制和输出箭头。A-0;A0(顶层图);A1;A113.4 DFD与 IDEFO的比较:结构化分析思想:自顶而下逐级细化1.DFD图用箭头也叫数据流来描述数据移动的方向、数据处理之间的数据依赖关系,IDEFO图也用箭头表示数据流,但不强调流或顺序,强调数据约束,箭头语义更丰富。2.DFD模型有四种元素,IDEFO图只有两种:箭头和活动3.IDEFO图更加规范。其概念、建模方法、画图规则等均有说明和规定4.IDEFO模型结构更清楚,便于理解和沟通3.5 结构化分析及建模方法的优点:1)不过早陷入具体的细节,从整体或宏观入手分析问题,如业务系统的总体结构,系统及
7、子系统的关系.2)通过图形化的模型对象直观地表示系统完成什么功能,方便系统分析员理解和描述系统。3)模型对象不涉及太多技术术语,便于用户理解模型。第4章数据库概念设计与数据建模4.1 概念设计的目的和任务:面向现实世界,理解和描述应用领域中的数据需求,分析确定系统需要存储和处理什么数据。过程:确定实体集:确定联系和联系类型:建立由信息模型去示的业务模型;确定实体集属性;优化信息模型。4.2 实体集描述具有相同属性特征和性质的事物集合;属性描述实体集具有的某一特征或性质4.3IDEF1X:标定型(子依父实例才标定)(确定型);非标定型(确定型);分类;不确定第5章关系数据库逻辑设计5.1 关系数
8、据库:按照二维表格组织和存储的相互关联的关系(表)的集合。关系数据库采用关系模型在计算机中组织、存储、处理和管理数据。5.2 主码约束:惟 性;最小性,不能取空值,并且取值要唯一外码约束:如果两个关系R和S,X是R的属性或属性组,且X不是R的码,但X是S的码,则称X是R的外码。或者取空值,或者等于S中某个元组的主码的值。5.3 逻辑设计的内容:定义和描述数据库的全局逻辑结构,数据之间的关系,数据的完整性等目的:得到实际数据库管理系统可以处理的数据库模式。步聚:ER图转化关系模式:优化关系模式;数据完整性设计;外模式设计5.4 关系模式描述关系的静态结构,由模式名、属性、完整性约束组成,关系是个
9、表中记录的集合,关注和强调的是值(模式实例)的集合,也是关系模式在某一时刻状态的反映。5.5 关系的完整性(完整性约束):对关系所满足条件的定义。作用:限定和检查数据库所含实例的合法性和正确性。静态:主码、外码、域(用户定义);动态:基于业务规则5.6 伪传递规则:X-Y,Y W-Z,则X W-Z成立。5.7 规范化设计理论的主要内容是范式,即关系模式满足的条件,它是数据库逻辑设计的指南,也是衡量关系模式设计优劣的标准。目的:消除数据冗余及避免操作异常,基本过程:对关系进行分解。一个低级范式的关系模式通过分解(投影)方法可转换成多个高一级范式的关系模式的集合,这个过程叫规范化.5.8 1NF:
10、R的每一属性均不可再分:2NF:是1NF且每个非主属性完全依赖于主码。在1上消除非主属性对主码的部分函数依赖;3NF:是1NF且每个非主属性只依赖了主码。在2上消除非主属对主码的传递函数依赖。5.9 E R模型转换关系模型:实体集转为同名关系;联系转为一个关系,各实体集的码及联系的属性转为关系的属性(1:1均可、1:n取n、m:n W);合并具仃相同码的关系。第6章存储技术与数据库物理设计6.1 物理设计是在具体的硬件环境、OS、DBMS约束下,基于逻辑设计,设计具体数据存储结构和存取方式。目的:占用空间少、访问效率高、维护代价低。主要步骤有数据库逻辑模式调整、文件组织与存取设计、数据分布设计
11、、安全模式设计、确定系统配置、物理模式评估。6.2 索引技术(Indexing)是种快速文件访问技术,它将文件记录在某个或某些域(或称为属性)上的取值与该记录的物理地址直接联系起来,提供了 一种根据记录域的取值快速访问文件记录的机制.索引文件是一 种 利 用索引技术支持快速文件访问的文件组织和存取方法。索引加快了查询记录却减慢了数据更新速度,本身还占用一定的存储空间。6.3 文件组织:如何将关系数据库中的关系映射为操作系统中的数据库文件,及管理文件-文件结构:如何将D B文件中的逻辑记录映射到物理文件的中磁盘块。文件存取:针对某种结构的DB文件,如何查、添删改其中的逻辑记录6.4 数据字典:数
12、据库各类对象的描述信息、数据库管理系统的控制信息。包括关系模式信息、与视图描述有关的信息、关系的存储结构和存取方法信息、完整性约束、安全性有关的信息、数据库运行统计信息。作用:DBA用来监视DBMS的使用情况并协助完成管理工作;般用户可用于查阅部分数据库结构信息;DBS运行时各子系统频繁使用以完成相应的存储和查询处理功能。6.5 DBMS的三种完整性控制机制:CHECK子句、断言、触发器断言语句:Create assertion断言约束名check(.)6.6 堆文件:数据量少且操作频繁;批量加载数据(先选为堆文件再调整文件结构)顺序文件:查询条件定义在查找码上;快速的二分查找散列文件:基于散
13、列域值的等值匹配,特别是访问顺序是随机的。非精确杳询;非散列域B一树和B+一树:大数据量基本表;聚焦文件:多表连接操作6.7 有序索引技术利用索引文件实现杳找码取值到记录物理地址间的映射关系。索引文件由索引记录组成,每个记录中的索引项记录了某个特定的查找码值和具有该值的数据文件记录的物理地址。当需要访问数据文件中某个数据记录时,先根据查找码值查阅索引文件,找到对应的索引项,然后从索引项中找出数据记录在数据文件中的物理地址.根据这个地址访问数据记录。6.8 散列技术是一种快速文件访问技术,它利用散列函数实现文件记录域取值到记录物理地址间的直接映射关系。当需要访问数据文件中查找码值为s i的某个或
14、某些文件记录时,将s i作为散列函数h的输入计算得出的散列函数输出值h(si)就是文件记录在数据文件中的物理地址。6.9 权限:允许用户对 给定的数据库对象可执行的操作(查询、添删改、新建、备份等)。第7章数据库应用系统功能设计7.1 软件体系结构:软件架构=构件,连接件,约束7.2 软件设计包括系统的总体结构设计、系统的过程设计、系统的数据设计三方面内容(+人机界面设计),从工程管理的角度,分为概要设计、详细设计7.3 应用软件分为数据库事务和应用程序。后者一方面可以与数据库事务协调合作,另一方面还可实现与数据库访问无关的功能,如通信、人机交互。7.4 事务:具有逻辑独立功能的一系列操作的集
15、合,实现了某些特定的业务规则。7.5 事务概要设计的核心是辨识和设计事务自身的事务处理逻辑,采用面向数据流的程序设计方法设计事务内部的数据处理流程和结构o7.6 C/S结构特点:数据管理和数据处理被分在客户端和服务器上;服务器可支持多个客户端;客户端也可访问多个服务器:客户端=人机交互+数据处理B/S结构特点:表示层,WEB浏览器;功能层,WEB应用服务器;数据层,DBMS服务优点:实现人面交互、应用业务逻辑处理、数据管理三层分离,提高了系统的可维护性;用WEB浏览器可访问多个异构应用平台,解决了跨平台数据管理问题。第8章SQL8.1 SQL=Structured Query Language
16、,结构化杳询语言8.2 二进制字符串是用十六进制表示的,Ox前缀8.3 创建表:CREATE TABLE Table_Card(CardID varchar(8)NOT NULL,StartDate datetime NOT NULL.EndDate datetime NOT NULL,Score int NOT NULL CHECK(Score=0)DEFAULT 0,State char(1)NOT NULL CHECK(State in(0,1,2),Sex char(1)CHECK(Sex in(男 ,女),Age int CHECK(Age between16,85),Custome
17、rlD varchar(8),CHECK(EndDate StartDate),PRIMARY KEY(CardID),FOR曰GN KEY(CustomerlD)REFERENCES Table_Customer(CustomerlD)AH除表:DROP TABLE Table_Card修改表:ALTER TABLE Table_Card ADD CardType char(4)NULLALTER TABLE Table_Card ALTER COLUMN CardType char(8)ALTER TABLE Table_Card DROP COLUMN CardType8.4 SELEC
18、T Cname FROM Tablb_Customer WHEREAddress IN(海淀区朝阳区)ANDage BETWEEN 40 AND 50 ANDCname LIKE 王张李%,(王 _ _ )ORDER BY StartDate ASC,EndDate DESC8.5 除COUNT(*)不忽略空值外,其他函数COUNT(DISTINCT列名)、SUM 0、AVG0、MAX 0、MIN()均忽略空值。均返回单值。SELECT SUM(Score),MAX(Age),MIN(Age),AVG(Age),COUNT(DISTINCT,.)FROMTable8.6 分 组(GROUP B
19、 Y)依据列不能是text,ntext,image和 bit类型的列。先分组后计算统计每种类别商品的商品数,只列出商品数大于4 个的商品类别编号和商品数:SELECT GoodClassID as 商品类别编号,COUNT(*)as 商品数 FROM Table_GoodsGROUP BY GoodClassID HAVING COUNT(*)48.7 自连接:茂询与王晓在同一个区的顾客的姓名及地址:SELECT T2.Name,T2.Address FROM Table_Customer as T1 JION Table_Customer asT2ON T1.Address=T2.Addre
20、ss WHERE TI.Name=王晓 AND T2.Name!=:E晓 子查询:一个SELECT语句嵌套在一个SELECT、UPDATE、INSERT或 DELETE语句中SELECT Name,Address FROM Table_Customer WHERE Address IN(SELECT Address FROM Table_Customer WHERE Name=王晓)AND Name!王晓8.8外连接:LEFT OUTER JOIN左外连接(右衣全输出)RIGHT OUTER JOIN右外连接8.9 子查询:NOT IN C 集合 不相关子查询,先内后外WHERE列=/()比较
21、 不相关子查询,先内后外NOT EXIST(SELECT*)存在相关子查询,先外后内8.10 修改数据:INSERT INTO便 名 列名表 VALUES(值列表)UPDATE表 名 SET歹峪=表达式WHERE子句/DELETE FROM表 名 WHERE子句 分情况修改:UPDATE Table_GoodsSET SalePrice=CASE GoodsClassNameWHEN 家用电器 THEN SalePrice-SalePrice*0.05WHEN 服装THEN SalePrice+SalePrice*0.06ELSE SalePriceENDFROM Table_Goods a
22、JION Table_GoodsClass b ON a.ClasslD=b.ClasslD8.11 创建索弓I:CREATE UNIQUECLUSTEREDNONCLUSTERED INDEX 索引名O N 表名(列名 顺序(ASC/DESC)8.12 视图:由从数据库基本表中选取出来的数据组成的逻辑窗口,是一个虚表,数据库只存放视图的定义而不存放视图包括的数据。对视图的操作最终都会转换为对基本表的操作。CREATE VIEW 视图名 视图列名表ASSELECT语句WITH CHECK OPTION作用:简化数据杏询语句;使用户从多角度观察同一数据;提高了数据安全性(屏蔽掉敏感数据);提供一
23、定程度的逻辑独立性8.13 定点数:numeric(p,q)或 decimal(p,q),p为精度(数字位个数),不大于38,q 为小数位个数;bit类型:只存储1 和0,不多于8 个bit列则只用1 个字节存储8.14 Char(n)代表的是普通字符编码按定长存储的字符串,“n”的含义是字符的个数,固定占用 n 个字节的空间。varchar(n)代表的是普通字符编码按不定长存储的字符串,“n”的含义也是字符的个数,按字符的实际长度占用空间。第 9 章事务高度与并发控制9.1调度:定义在多个事务上的调度是这些事务的所有操作的一个执行序列,代表了这些操作的执行顺序;冲突操作:事务T i的操作li
24、与事务T j的操作lj是冲突的,当且仅当l i 和 lj访问数据库中同一个数据项Q,并且l i 和 lj中至少有一个是写操作write(Q):冲突可串行:个并发调度冲突等价于某个串行调度(判断一 个 并行调度是否正确)死锁是指数据库系统中部分或全部事务由于无法获得对需要访问的数据项的控制权而处于等待状态,并且将直等待下去的种系统状态。9.2 ACID:Atomicity 原子性;Consistency 一致性;Isolation 隔离性:Durability 持久性9.3 1 级加锁协议要求事务T 在修改数据项Q 之前必须先对Q 加 X 锁,直到事务结束才释放该锁。,拓务结束包括正常结束(co
25、mmit)和非正常结束(rollback)。但事务如果是只读Q而不对其进行修改,是不需要对Q 加锁的。2 级加锁协议是在1 级加锁协议基础上,要求事务T 在读取数据项Q 之前必须先对其加S锁,读完Q 后可以立即释放S 锁。3 级加锁协议则是在1 级加锁协议基础上,要求事务T 在读取数据项Q 之前必须先对其加S锁,但是需要等到事务结束时才释放该S 锁。9.4 2 阶段锁协议将每个事务的执行过程分为加锁阶段和解锁阶段。在加锁阶段,事务可以申请获得数据项上的任何类型的锁,但不允许释放任何锁。在解锁阶段,事务可以释放任何数据项上的任何类型的锁,但不能再申请任何锁。每个事务开始执行后就进入了加锁阶段。当
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 级数 工程师 难点
限制150内