分布式数据库系统完整版课件全套ppt教学教程最全整套电子讲义幻灯片(最新).ppt
《分布式数据库系统完整版课件全套ppt教学教程最全整套电子讲义幻灯片(最新).ppt》由会员分享,可在线阅读,更多相关《分布式数据库系统完整版课件全套ppt教学教程最全整套电子讲义幻灯片(最新).ppt(678页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、分布式数据库系统及其应用,分布式数据库系统的起源和发展 分布式数据库系统的定义和分类 分布式数据库系统的体系结构 分布式数据库系统与客户机/服务器模式 分布式数据库管理系统 其他非集中式数据库系统 分布式数据库目录系统的主要内容和逻辑结构 分布式数据库系统的主要技术 分布式数据库系统的主要应用 分布式数据库系统的优点和存在的技术问题,分布式数据库系统概述,第1章,计算机平台环境的改变 卫星通信 蜂窝通信 局域网 广域网 Intranet Internet 信息系统应用需求 地域上分散、管理集中的企业越来越多 既要求实现本地数据管理,就要求存取异地的数据 既要有各部门的局部控制和分散管理;又要有
2、整个组织的全局控制和高层次的协同管理,分布式数据库发展阶段 20世纪70年代末期产生 20世纪80年代成长阶段 20世纪90年代商品化应用阶段 21世纪大规模应用阶段 分布式数据库系统的12条规则 本地自治性 不依赖于中心节点 可连续操作性 位置独立性 数据分片独立性 数据复制独立性,分布式查询处理 分布式事务处理 硬件独立性 操作系统独立性 网络独立性 数据库管理系统独立性,分布式数据库定义:物理上分散而逻辑上集中的系统,它使用计算机网络将地理位置分散而管理和控制又需要不同程度集中的多个逻辑单位(通常是集中式数据库系统)连接起来,共同组成一个统一的数据库系统。分布式数据库系统可以看成是计算机
3、网络和数据库系统的有机结合。 分布式数据库系统的特点 物理分布性:数据不是存放在一个站点上 逻辑整体性:是与分散式数据库系统的区别 站点自治性:是与多处理机系统的区别 数据分布透明性 集中与自治相结合 存在适当的数据冗余度 事务管理的分布性,分布式数据库系统示意图,按局部DBMS的数据模型分类 同构型DDBS 同构同质型 同构异质型 异构型DDBS 按DDBS的全局控制类型分类 全局控制集中型DDBS:全局控制机制和全局数据词典位于中心站点 全局控制分散型DDBS:全局控制机制和全局数据词典分散在网络的各个站点上。 全局控制可变型DDBS:也称主从型DDBS。分成两组站点,一组包含全局控制机制
4、和全局控制词典,另外一组不包含。,分布式数据库系统的体系结构,基于客户机服务器模式的系统可以看作是真正意义上的分布式系统的一某些站点是客户机站点,而另一些站点是服务器站点; 所有的数据都驻留在服务器站点; 所有的应用都在客户机站点运行; 应用请求是通过客户机请求和服务器响应的协作方式来完成的; 一般不提供完全的位置透明性,即“存在接缝”。,分布式数据库系统是在集中式数据库系统基础上发展起来的,但不是简单地把集中式数据库系统分散地实现, 负责负责实现分布式数据库的建立、查询、更新、复制和维护等功能,同时还包括提供分布透明性,查询优化、协调全局事务的执行,协调各局部DBMS共同完成全局应用,保证数
5、据库的全局一致性,执行并发控制,实现更新同步和全局恢复等功能。它 除此之外,还具有自己的性质和特征。 数据跟踪 分布式查询处理 分布式事务管理 复制数据的管理 安全性 分布式目录管理,P2P模型是一种新型的体系结构模型,面向大范围的多数据资源节点的松散耦合。 每个对等计算机地位相同,可直接互连实现各种资源的共享,不需要依赖集中式服务器支持。 典型的P2P系统主要有以下三种结构:纯粹分布式P2P系统结构、集中目录P2P系统结构以及混合式P2P系统结构 P2P系统的主要特点有: 每个节点均可贡献数据,系统资源具有丰富性、多样性; 可直接访问数据源中的数据资源,即时得到最新鲜的数据,不同于集中的数据
6、资源库,如数据仓库等; 采用自组织原则,具有健壮性; 每个节点可随时加入和退出,系统具有分散性、可扩展性; 通常以Web上的资源为节点,系统部署简单,不需要复杂的框架部署实现。,(a)纯粹分布式P2P系统结构 (b)集中目录分布式P2P系统结构 (c)混合式分布式P2P系统结构,(a),(b),(c),多数据库系统(Multi-Database Systems,MDBS)是多个已存在的、自治的、异构的数据库系统的联合。 参与构成多数据库系统的数据库系统称为局部或成员数据库系统(Local Database System,LDBS)。多 数据库系统是在己经存在的数据库系统之上为用户提供一个统一的
7、存取数据的环境。,分布式数据库的目录系统(Catalog System)是存放与分布式数据库系统有关的对象和各种控制信息的场所。 主要功能包括:,全局模式描述 分片模式描述 分布模式描述 局部名映射 存取方法描述 数据库的统计信息,一致性错误 状态信息 数据表述 数据命令 系统描述,分布式数据库目录系统可与分布式数据库系统协同工作,将用户对数据的高级查询转化为相应存储对象的低级操作,而且满足数据独立性要求。 验证用户对数据的访问权限,保证合法用户能正确而有效地访问数据库中的数据。主要功能包括: 设计应用 翻译应用 优化处理 运行监督 系统维护,分布式数据库目录系统的组织方式通常有以下三种: 独
8、立式 利用操作系统提供的文件管理功能来建立和维护目录信息,这时目录系统具有独立的数据定义、装入、查询、修改和报告生成功能。 分离式 利用DBMS建立和维护目录信息,但它的用户界面与功能均独立于DBMS。 嵌入式 DBMS与目录系统一体化,即目录系统作为DBMS的子集而存在,在分布式数据库系统中通常采用这种方法。,分布式数据库目录系统的组织方式通常有以下三种: 独立式 利用操作系统提供的文件管理功能来建立和维护目录信息,这时目录系统具有独立的数据定义、装入、查询、修改和报告生成功能。 分离式 利用DBMS建立和维护目录信息,但它的用户界面与功能均独立于DBMS。 嵌入式 DBMS与目录系统一体化
9、,即目录系统作为DBMS的子集而存在,在分布式数据库系统中通常采用这种方法。,分布式数据库目录由目录系统进行管理。 目录系统在网络操作系统和分布式数据库管理系统的支持下实现对数据目录进行自动管理,并保持其在动态变化过程中数据目录的一致性和有效性。 目录系统有以下功能模块组成: 目录定义:描述目录信息的逻辑结构和模式表示。 目录装入:负责目录信息的装入与存储。 目录查询:负责解释用户对目录信息的查询请求,处理各种查询要求。 目录更新:用于更新目录信息。 目录维护:用于在不破坏目录模式定义的前提下,对目录信息进行分类、归并、重构与链接。 报告生成:将目录信息以文本格式输出。,集中式目录:全局系统目
10、录采用集中式存放方式 全复制式目录:在每个站点上都存放一个完整的全局目录,但目录的更新必须传播到每一个站点。 局部式目录:每个站点只为存放在本站点的数据保留一份目录(局部目录),系统的整体目录是所有这些不相交的局部目录的集合。 混合式目录 :混合式目录是上述三种方式的混合使用,是折中的目录分布方案,包括: 集中式目录与局部式目录相混合。 全复制式目录与局部式目录相混合。,分布式数据库设计方法主要有两种: 自顶向下方法 自底向上方法 前者从头开始设计分布式数据库,而后者则通过集成现有数据库来设计分布式数据库。,分布式环境下影响查询效率的因素有很多 除了集中式查询下的CPU和I/O代价外,数据在网
11、络站点之间的传输、数据的冗余和分布都会对查询的效率产生很大的影响。 分布式查询优化的准则是使通信费用最低和响应时间最短,即以最小的总代价、在最短的响应时间内获得需要的数据。最基本的查询优化方法是基于关系代数等价变换的查询优化方法。 此外,考虑局部代价和传输代价的不同情况,还有多种查询优化方法: 基于半连接算法的查询优化处理方法 基于直接连接算法的查询优化处理方法 分布式INGRES算法 R*算法和SDD-1算法等,分布式DBMS系统中的分布式事务管理程序必须即保证本地事务的ACID特性又保证分布式事务的ACID特性 事务管理程序的本地事务管理程序负责保证本地事务的ACID特性,而分布式事务的A
12、CID特性则由两阶段提交协议来保证。 当发生故障时,要使得分布式数据库恢复到一个正确的、一致的状态。恢复的基本原理是数据冗余,即利用冗余存储在别处的信息和数据,部分或全部重建数据库。,分布式数据库中的并发控制是以集中式数据库中的并发控制技术为基础的,主要解决多个分布式事务对数据并发执行的正确性。 分布式数据库系统并发控制的主要内容包括: 分布式数据库系统并发控制的封锁技术 分布式数据库系统中的死锁处理 分布式数据库系统并发控制的时标技术 分布式数据库系统并发控制的多版本技术 分布式数据库系统并发控制的乐观方法等,分布式数据库的可靠性是指分布式数据库在一个给定的时间间隔内不产生任何失败的概率。
13、它强调分布式数据库的正确性,要求分布式数据库在符合某种要求情况下正确地运行。一 个可靠性高的系统要求故障少、容易修复或者修复得快。 分布式数据库失败的主要原因有错误的设计、不稳定或临界的组件、不稳定的外部环境和操作者的过失等。 分布式数据库的可靠性协议可以保证在分布式数据库上执行的分布式事务的原子性和持久性。,分布式数据库面临的安全问题主要有: 单站点故障、 网络故障、 各类管理制度的不完善、 人为攻击(黑客攻击)、 内部人员泄露密码数据、 程序内嵌的不安全因素等引起的安全问题等。 分布式数据库的安全性的的内容主要包括:保证数据库安全的措施主要有建立安全数据模型、设定有效的访问控制机制、建立多
14、级安全数据库、数据加密等。,移动分布式数据库系统 连锁超市分布式数据库系统 火车订票分布式数据库系统 GSP药品管理分布式数据库系统 银行管理分布式数据库系统,良好的可靠性和可用性 提高系统效率,降低通信费用 较大的灵活性和可伸缩性 经济性和保护投资 适应组织的分布式管理和控制 数据分布具有透明性和站点具有较好的自治性,最重要的问题是通信网络速度问题 如何控制数据的分片、分布与冗余度 如何实现异构数据库的互联 如何优化分布式数据库的查询处理 如何更好地实现分布式数据库的更新处理 如何实现分布式数据库的并发控制机制 如何实现分布式数据库的恢复控制机制 如何实现目录管理,总 结结,分布式数据库系统
15、概论 分布式数据库系统的定义与分类 分布式数据库系统的体系结构 分布式数据库系统与客户机/服务器模式 分布式数据库管理系统 其他非集中数据库系统 分布式数据库目录系统的主要内容和逻辑结构 分布式数据库系统的主要技术 分布式数据库系统的主要应用 分布式数据库系统的优点和存在的技术问题,分布式数据库系统及其应用,数据库技术回顾 计算机网络技术回顾,基础知识回顾,第2章,数据库系统知识回顾,数据库 (DB:DataBase),长期储存在计算机内的有组织的、可共享的相关数据的集合。,数据库技术,数据库系统软硬件层次关系,1,1 数据库系统知识回顾,数据库系统的模式结构,视图抽象外模式 概念抽象概念模式
16、 物理抽象内模式,概念模式,内模式,现实世界,视图抽象,概念抽象,物理抽象,外模式,视图2,视图1,视图3,数据库系统知识回顾,关系数据模型(Data Model),1,1.3, 数据结构 数据操作 完整性约束,用于描述系统的静态特性;是所研究的对象类型(Object type) 的集合,包括:数据的类型、内容和性质的对象(事物);数据之间 联系的对象(联系)。,数据模型的三要素,1. 数据结构:,是一组完整性规则(条件)的集合。给出数据及其联系所具有 的制约、依赖和存储规则,用于限定数据库的状态和状态变化,保 证数据库中的数据的正确、有效、完全和相容。,3. 完整性约束(Integrity
17、Constraint):,用于描述系统的动态特性,是对数据库中的各种对象的实例(值) 允许执行的操作的集合。主要有查询和更新(插入、删除、修改)两 类操作。,2. 数据操作(Data Manipulation) :,1. 数据库系统知识回顾,实体联系模型,一对一的联系,记为 11 一对多的联系,记为 1n 多对多的联系,记为 mn,实体联系类型,实体内部联系 实体之间的联系 同一实体型的实体之间的联系 不同实体型的实体之间的联系,1. 数据库系统知识回顾,SQL语言,SQL是结构化查询语言(Structured Query Language)的英文缩写,它起源于IBM公司San Jose研究中
18、心为其关系数据库管理系统System R开发的一种查询语言SQUARE语言。 SQL语言之所以成为国际标准,被广大用户接收和使用,是因为它是一个综合的、功能强大的、简单易学的语言。它主要有以下几个特点: 综合统一 高度非过程化 面向集合的操作方式 灵活的使用方式 语言简洁,易学易用,功能强大,1. 数据库系统知识回顾,SQL语言基本组成,数据定义语言,1. 数据库系统知识回顾,SQL语言基本组成,数据定义语言(续),1. 数据库系统知识回顾,SQL语言基本组成,2. 数据操作语言,1. 数据库系统知识回顾,SQL语言基本组成,2. 数据操作语言(续),1. 数据库系统知识回顾,SQL语言基本组
19、成,3. 数据控制语言,1. 数据库系统知识回顾,关系代数与关系数据库的查询优化,关系代数语言是非过程化的语言,即:存取数据不必给出路径,存取多个记录不必借助于循环或递归来实现。 关系代数操作符主要有传统的集合操作符、专门的关系操作符、比较操作符和逻辑操作符四大类,如下图所示,传统的集合操作符:, 专门的关系操作符:, , 比较操作符:, 逻辑操作符:,,传统的集合运算,1.6.2 关系代数,并运算 差运算 交运算 广义笛卡尔积,RS,R-S,R x S,数据库系统知识回顾,1,选择运算是从关系中选取使公式为真的元组。这是从行的角度进行的运算。,在关系R中选择满足给定条件的元组,记做: F (
20、R) = r | r R F(r)=真 F是一个公式,表示形式为由逻辑运算符(,)连接各算术表达式组成。 算术表达式的基本形式为:XY. =, , ,=, . X,Y是属性名或常量或简单函数。,例1 求计算机科学系CS的学生, SD=CS (S), SD=CS (S),选择运算,投影运算,这是从列的角度进行的运算。,例2 SN,SD (S) 即求得学生关系S在学生姓名和所在系这两个属性上的投影结果。,SN,SD (S),关系R上的投影是从R中选择若干属性组A组成新的关系。记做: A (R) = rA | r R 投影之后不仅取消了某些列,还可能取消某些元组。,SA (S),连接运算是从两个关系
21、的笛卡尔积中选取属性间满足一定条件的元组。 记做: R S. 其中,F是条件表达式,它涉及到对两个关系中的属性的比较。 如果F仅仅是一个相等条件,即等值连接。,连接运算, F,例3 设关系R、S如下图:,1,数据库系统知识回顾,6.3 关系数据库的查询优化,1.,1,数据库系统知识回顾,7 关系数据库的设计理论,1.,关系数据库设计理论主要包括数据依赖、模式分解和规范化理论三个方面。 三者之间的关系是:以数据依赖为核心,指导/评价模式设计,包括消除更新、删除和插入异常,并根据实际需求的需要,保持合理的冗余。 数据依赖:对属性之间值的相关性约束 函数依赖 多值依赖 连接依赖 模式分解:模式分解的
22、样式是多种多样的,但是要遵循等价原则 等价性的含义有三种不同的定义 分解具有无损连接性 分解要保持函数依赖 分解既要保持函数依赖,又要具有无损连接性,1,数据库系统知识回顾,7 关系数据库的设计理论,1.,规范化(Normalization)过程是指通过对关系模式进行一系列的检验,以“验证”一个关系模式是否满足某些特定的范式(Normalization Form,NF)。 这个过程按照各范式的相应标准对每个关系模式进行评估,并根据需要分解原有的关系模式。 规范化过程被认为是基于分析的关系设计。,规范化过程,数据库系统知识回顾,数据库建设是硬件、软件和干件(技术与管理的界面称为干件)的结合。“三
23、分技术,七分管理,十二分基础数据”是数据库建设的基本规律 结构(数据)设计应该和行为(处理)设计密切结合,也就是说,整个设计过程中要把数据库结构设计和对数据的处理设计(应用系统功能设计)密切结合起来。,1,1.8 数据库设计,数据库系统知识回顾,1,1.8.1 数据库设计方法,数据库系统知识回顾,1,1.8.2 数据库设计步骤,数据库系统知识回顾,1,1.8.3 数据库建模工具,数据库系统知识回顾,1,1.9.1 数据库管理系统,DBMS的基本功能,数据库系统知识回顾,1,1.9.2 数据库管理系统,DBMS的数据库访问过程,数据库系统知识回顾,1,1.9.2 数据库管理系统,DBMS产品的发
24、展过程,数据库系统知识回顾,1,1.9.2 数据库管理系统,典型的数据库管理系统,数据库系统知识回顾,1,1.10 数据库的安全性及其实现方法,数据库的安全性是指数据库具有防范不合法的访问所造成对数据库数据的泄露、更改或破坏的能力,并能对数据库变化作跟踪记录,以防止否认对数据库的安全责任。 数据库安全性包括: 1)物理安全性,包括自然灾害、偷盗、物理环境破坏等。 2)逻辑安全性,这里主要指政府规定的政策法规、管理制度等。 3)技术安全性,这里主要指在计算机系统中采用一定安全性的网络硬件、通信设备、DBMS和操作系统来实现对计算机系统及其存储数据的安全保护,数据库系统知识回顾,1,1.10.1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分布式 数据库 系统 完整版 课件 全套 ppt 教学 教程 整套 电子 讲义 幻灯片 最新
限制150内