数据库总结(简答题).pdf
数据的定义 :描述事物的符号记录数据库的定义:数据库(Database,简称 DB)是长期储存在电脑内、有组织的、可共享的大量数据集合DBMS 的定义:数据库管理系统DatabaseManagement System,简称 DBMS :位于用户与操作系统之间的一层数据管理软件系统软件 。DBMS 的用途:1科学地组织和存储数据2高效地获取和维护数据DBMS 的主要功能:1数据定义功能:提供数据定义语言(DDL)定义数据库中的数据对象2数据操纵功能:提供数据操纵语言(DML) ,实现对数据库的基本操作(查询、插入、删除和修改)。3数据库的运行管理:在数据库建立、运用和维护时对数据库进行统 一控制,以保证数据的完整性、安全性、并在多用户同时使用数据库时进行并发控制, 且在数据库系统发生故障后对系统进行恢复。4数据库的建立和维护功能(实用程序):数据库数据批量装载、数据库转储、恢复、数据库的重组织、性能监视等5数据库系统Database System,简称 DBS :指在电脑系统中引入数据库后的系统在不引起混淆的情况下常常把数据库系统简称为数据库数据库系统的构成1数据库2数据库管理系统及其开发工具应用系统数据库管理员DBA)和用户数据管理是指对数据的组织、分类、编码、存储、检索和维护。数据管理技术的发展过程人工管理阶段特点:(1) 数据不保存(2) 系统没有专用的软件对数据进行管理(3) 数据不共享(4) 数据不具有独立性文件系统阶段特点:1数据以文件形式长期保存2数据由文件系统统一管理3应用程序直接访问数据文件4数据的存取基本上以记录为单位缺点:(1) 数据冗余度大(2) 数据独立性低(2) 数据一致性差数据库系统阶段特点:(1) 数据共享性高、冗余少(2) 数据结构化(3) 数据独立性高(4) 由 DBMS 进行统一的数据控制功能A) 数据的安全性security控制B) 数据的完整性(integrity)控制C) 并发concurrency控制D) 数据恢复recovery数据模型分成两个不同的层次:1概念模型概念层数据模型,也称信息模型 :它是按用户的观点来 对数据和信息建模。2数据模型组织层数据模型 :它是按电脑系统的观点对数据建模,主要用于 DBMS的实现。抽象过程-两步抽象1现实世界中的客观对象抽象为概念模型;2把概念模型转换为某一DBMS 支持的数据模型。数据模型通常由数据结构、数据操作和数据的约束条件三个要素组成(7) 联系Relationship实体内部的联系:组成实体的各属性之间的联系。实体之间的联系:不同实体集之间的联系。1一对一 2一对多3多对多目前最常用的数据模型有层次模型Hierarchical Model网状模型Network Model关系模型Relational Model面向对象的数据模型(5)关系模型的优缺点优点:1建立在严格的数学概念的基础上2) 数据结构简单、清晰,用户易懂易用实体和各类联系都用关系来表示。3) 关系模型的存取路径对用户透明具有更高的数据独立性,更好的安全保密性简化了程序员的工作和数据库开发建立的工作缺点1) 存取路径对用户透明, 导致查询效率往往不如非关系数据模型2)为提高性能,必须对用户的查询请求进行优化三级模式结构:外模式:是数据库中全体数据的逻辑结构和特征的描述概念模式:是数据库用户使用的局部数据的逻辑结构和特征的描述内模式:是数据物理结构和存储方式的描述二级映象(1) 外模式模式映象:定义外模式与模式之间的对应关系用途: 保证数据的逻辑独立性(2) 模式内模式映象:模式内模式映象定义了数据全局逻辑结构与存储结构之间的对应关系。用途:保证数据的物理独立性关系数据库的标准化理论主要包括三个方面的内容:函数信赖范式Normal Form模式设计和模式分解进行数据库的操作时,会出现以下几方面的问题:1. 数据冗余2. 插入异常3. 删除异常4. 更新异常一个好的关系模式应该具备以下四个条件:1. 尽可能少的数据冗余2. 没有插入异常3. 没有删除异常4. 没有更新异常1第一范式第一范式First Normal Form是最基本的标准形式,即关系中每个属性都是不可再分的简单项。2第二范式定义:如果关系模式 R1NF,并且 R 中的每个非主属性都完全函数依赖于主码,则 R2NF。存在问题:1数据冗余2插入异常3删除异常4更新异常之所以存在这些问题,是由于在S-L 表中存在着非主属性对主码的传递依赖。3第三范式定义:如果 R(U,F) 2NF,并且所有非主属性都不传递依赖于主码,则 R(U,F) 3NF。关系模式 S-L 由 2NF 分解为 3NF 后,既没有非主属性对主码的部分依赖,也没有非主属性对主码的传递依赖,解决了2NF 中存在的四个问题。1数据冗余降低2不存在插入异常3不存在删除异常4不存在更新异常值4BC 范式(BCNF)定义:假设关系模式 R1NF,对于关系 R 的每个函数依赖 XY 且 YX,X 必含有候选码,则 RBCNF。即每个决定属性集都包含候选码。关系标准化的目的:解决关系模式中存在的插入、删除、更新操作异常,数据冗余问题.关系标准化的方法:围绕函数依赖的主线,对一个关系模式进行分解, 使关系从较低级范式变换到较高级范式。模式分解的准则:1无损连接性2保持函数依赖SQL 语言特点(1)高度非过程化的语言(2)面向集合的语言(3)能以多种方式使用(4)具有查询、操作、定义和控制四种语言一体化的特点(5)语言简洁、易学易用SQL 按其功能可分为四大部分:数据定义功能、数据控制功能、数据查询功能和数据操纵功能。(1)数据定义功能用于定义、删除和修改数据库中的对象;(2)数据查询功能用于实现查询数据的功能;(3)数据操纵功能用于实现对数据库数据的增加、删除和修改;(4)数据控制功能用于实现控制用户对数据库的操作权限索引:记录的关键字与其相应地址的对应表。视图(view): 是从一个或者多个表或视图中导出的表。它与基本表不同的是:(1)基本表base table):独立存在的表, 基本表中的数据是存在数据库中。(2)视图是一个虚表。即视图所对应的数据不实际存放在数据库中(3)在数据库中只存放视图的定义,不存放视图包含的数据,这些数据仍存放在原来的基本表中。(4)基表中的数据发生变化,从视图中查询出的数据也随之改变。视图作用(1)简化数据查询语句(2)使用户能从多角度看到同一数据(3)提高了数据的安全性(4)提供了一定程度的逻辑独立性一、SQL 嵌入到主语言要解决的问题如何识别 SQL数据传递解决 SQL 一次一集合的操作与主语言一次一记录操作的矛盾.用游标解决。四、使用游标的步骤1、说明游标格式:exec SQL declear cursorfor 2、打开游标格式:exec SQL open 3、推进游标格式:exec SQL fetch into,4、关闭游标格式:exec SQL close 1. 什么是数据库设计数据库设计是指对于一个给定的应用环境, 构造最优的数据库模式, 建立数据库及其应用系统,使之能够有效地存储、管理数据,满足各种用户的应用需求信息要求和处理要求2 ,数据库设计的内容数据库设计包括数据库的结构设计和数据库的行为设计两方面的内容。一、需求分析的任务1.详细调查现实世界要处理的对象组织、部门、企业等充分了解原系统工作概况手工系统或电脑系统 ,明确用户的各种需求2. 确定新系统的功能。新系统必须充分考虑今后可能的扩充和改变,不能仅仅按当前应用需求来设计数据库3. 编写需求分析说明书(1)信息要求(2)处理要求(3)安全性与完整性要求需求分析的方法自顶向下的结构化分析方法简称SA 方法该方法从最上层的系统组织机构入手, 采用逐层分解的方式分析系统, 并用数据流图和数据字典描述系统。数据流图Data Flow Diagram,DFD):是一种最常用的结构化分析工具,它从数据传递和加工角度,以图形的方式描述数据在系统中流动和处理的过程。数据字典 (Data Dictionary,简称 DD)的用途数据字典是系统中各类数据的详细描述的集合进行详细的数据收集和数据分析所获得的主要结果数据字典的内容(1)数据结构 (2)数据流(3)数据存储(4)处理过程概念结构设计:通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS 的概念模型 (E-R 图)逻辑结构设计:将概念结构转换为某个DBMS 所支持的数据模型,如关系模型, 形成数据库逻辑模式与外模式。物理结构设计:设计数据的存取方法和存储结构,是形成 数据库的内模式,如数据库文件或目录、索引等2. 概念结构设计的特点(1)有丰富的语义表达能力。(2)易于交流和理解。(3)易于更改(4)易于向各种数据模型转换3.概念结构设计的策略(1)自低向上(2)自顶向下(3)由里向外(4)混合策略4. 采用 E-R 模型方法的概念结构设计1)设计局部 E-R 模型。2)设计全局 E-R 模型。3)优化全局 E-R 模型。将现实世界中的事物进行数据抽象三种常用抽象方法:1分类2概括3聚集1)设计局部 E-R 模型利用抽象机制对需求分析阶段收集的数据进行分析,标定局部应用中的实体、属性、码, 实体间的联系,设计局部 E-R 图(2)设计全局 E-R 模型1一次集成2逐步累积式关键:合理消除各局部E-R 图合并时产生的的冲突1属性2命名3结构(3)优化全局 E-R 模型1实体个数尽可能少;2实体所包含的属性尽可能少;3实体间联系无冗余。1. E-R 模型向关系模型的转换(1)一个实体转换为一个关系模式(2)一个 1:1 联系可以转换为一个独立的关系模式,也可以与任意一端所对应的关系模式合并。(3)一个 1:n 联系可以转换为一个独立的关系模式,也可以与任意n 端所对应的关系模式合并。(4)一个 m:n 联系转换为一个独立的关系模式,(5)三个或三个以上实体间的一个多元联系转换为一个关系模式。2. 数据模型的优化通常的两种分解方法:水平分解和垂直分解。数据库的物理设计的步骤:1确定数据库的物理结构1)确定存取方法索引方法,聚簇Cluster方法,HASH 方法2)确定数据的存放位置基本原则:根据应用情况将易变部分与稳定部分分开存放存取频率较高部分与存取频率较低部分分开存放。2对物理结构进行评价,评价的重点是时间和空间效率数据库实施的工作内容:1用 DDL 定义数据库结构2组织数据入库3编制与调试应用程序4数据库试运行DBMS 对数据库的安全保护:1即安全性控制2完整性控制3并发性控制4数据库恢复。数据库的安全性是指保护数据库,以防止非法使用所造成数据的泄露、更改或破坏。安全性控制的一般方法(1)对有意的非法活动可采用加密存、取数据的方法控制;(2)对有意的非法操作可使用用户身份验证、限制操作权来控制;(3)对无意的损坏可采用提高系统的可靠性和数据备份等方法来控制。二.完整性规则的组成具体地说,完整性规则主要由以下三部分构成:1 触发条件:规定系统什么时候使用规则检查数据;2 约束条件:规定系统检查用户发出的操作请求违背了什么样的完整性约束条件;3 违约响应:规定系统如果发现用户的操作请求违背了完整性约束条件, 应该采取一定的动作来保证数据的完整性,即违约时要做的事情。关系模型的完整性:实体完整性,参照完整性和用户定义完整性。三.完整性约束条件的作用对象完整性约束条件的作用对象可以是表、元组和列。1.列级约束:即对数据类型、数据格式、取值范围等进行规定。2.元组约束3.关系约束1. 事务的定义事务是用户定义的数据操作系列,这些操作作为一个完整的工作单元事务的特征原子性Atomic一致性Consistency隔离性Isolation持久性Durability(1)丧失修改(2)污读(3)不可重读(4)产生“幽灵”数据并发控制的主要方式是封锁机制,即加锁Locking 。排它锁和共享锁在同时处于等待状态的两个或多个事务中, 其中的每一个在它能够进行之前, 都等待着某个数据、而这个数据已被它们中的某个事务所封锁,这种状态称为死锁。(1)一次封锁法(2)顺序封锁法数据库备份指定期或不定期地对数据库数据进行复制, 可以将数据复制到本地机器上, 也可以复制到其它机器上,备份的介质可以是磁带也可以是磁盘。事务故障、系统故障和介质故障。四.恢复技术1利用备份技术2利用事务日志3利用镜像技术QL Server 2000常用工具简介1.企业管理器2.查询分析器(Query Analyaer)3.服务管理器 Service Manager4.分布式事务处理协调器DTC)5.性能监视器Performance Monitor6.导入和导出数据Imput and Export Data7.事件探查器SQL Server的数据库由两种文件组成:数据文件和日志文件。SQL Server的用户有两种类型:Windows授权用户,SQL 授权用户一、 SQL Server的安全控制Windows身份验证模式混合验证模式2. 权限管理授予权限收回权限拒绝访问SQL Server 2000四种备份方式完全备份差异备份事务日志备份文件和文件组备份