分布式数据库课程设计报告-.pdf
《分布式数据库课程设计报告-.pdf》由会员分享,可在线阅读,更多相关《分布式数据库课程设计报告-.pdf(23页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、.可编辑文本分布式数据库在学生信息管理系统中的应用班级:姓名:设计时间:指导教师:评语:_评阅成绩:评阅教师:目录.可编辑文本摘要.3第一章 绪论.411 课题研究的意义.412 分布式数据库技术国外发展现状.413 分布式数据库技术国内发展现状.514 分布式数据库技术发展动向.5第二章 分布式数据库理论.621 分布式数据库理论.62 11 分布式数据库系统的有关概念.62 12 分布式数据库系统的特点.62 13 分布式数据库数据分片.72 14 分布式数据库数据分布.72 15 数据分布设计策略.8第三章 系统总体设计 .103.1 系统功能设计 .103.2 系统结构设计 .103.
2、3 系统概念设计 .114.4 系统逻辑设计 .114.5 系统物理设计(表设计).11第四章 系统实现 .154.1 POWERBUILDER开发工具简介.154.2 POWERBUILDER 9 应用程序开发的基本步骤.164.3 编码规范.164.4 应用程序对象APP_MAPBEX.164.5 具体窗口的实现.17第五章 课程设计总结 .23第六章 参考文献 .23.可编辑文本摘要社会在飞速的发展,计算机的应用正深入到人们生活的每一个角落。我们作为当代的大学生,更应该推动和实践计算机信息系统在生活在的应用,为将来的工作和学习打好基础。本系统为简易的分布式学生信息管理系统,实现学生的基本
3、信息管理和学生成绩管理。本系统采用了Power Builder9 SQL2000的结构来开发程序。Power Bulider(以下简称pb)做为应用程序开发工具和程序界面开发工具,pb 具有功能强大,集成性好的优点,很适合小型系统的应用开发和界面开发。后台数据库使用SQL 2000系统,Microsoft SQL Server 2000 是美国微软公司推出的使用相当广泛的数据库管理系统,包含一套图形工具,如服务器管理(用于启动和关闭数据库服务)、企业管理器(用于创建和修改数据库及备份数据库等)和查询分析器(用于交互执行Transact-SQL 语句和过程并提供图形查询分析功能)等。本报告说明了
4、整个系统从分析到设计再到实现的具体步骤和过程,从中我学到了很多知识和技能。关键词:分布式信息管理系统PB+SQL2000.可编辑文本第一章绪论11 课题研究的意义随着信息技术的飞速发展,社会经济结构、生产方式和消费结构已经发生了重大变化,这些变化深刻地影响着人民生活的方方面面。尤其是近十年来人们对计算机的依赖性越来越强,同时也对计算机提出了更高的要求。随着计算机网络技术的日趋成熟,传统的集中式的关系型数据库系统越来越不能满足人们处理数据的要求,因此分布式数据库系统应运而生,并且得到迅速发展。在社会各个领域,对分布式数据库系统的要求更加迫切。随着社会的发展,许多关系着国民经济发展的行业,例如水利
5、、电力、交通、金融等行业的作用越来越重要。但是这些行业所管辖的部门或企业往往在地域上比较分散,而在行政和业务管理上,既要求各部门具有独立的局部控制、分散管理的能力,同时,又要在整个行业内实现对所有部门或所属企业进行全局控制,统一管理。这种协同管理要求各部门或企业之间的信息和数据既能灵活交流和共享,又能统一管理和使用。正是这种需求的不断扩大和要求的不断提高,促使分布式数据库不断发展,功能不断加强。分布式数据库的出现,实现了数据通过网络连接共享。分布式数据库将地理位置上分布于不同地点的数据通过网络连接起来,并通过应用统一的数据库管理系统对不同位置的数据进行统一管理,使得数据在地理位置上分布,而在逻
6、辑上又是一个整体。随着数据库在各个行业中的不断发展,各行业也对数据库提出了更高的要求,数据量也急剧增加,对于管理这些数据的复杂度也随之增加。同时各行业部门或企业所使用的软硬件之间的差异,这给开发企业管理数据库管理软件带来了巨大的工作量,如果能够有效解决这个问题,即使用同一模块管理操作不同的数据表格,对不同的数据表格进行查询、插入、删除、修改等操作,也即对企业简单的应用实现即插即用的功能,那么就能大大地减少软件开发的维护和更新费用,缩短软件的开发周期。分布式数据库系统的开发,降低了企业开发的成本,提高了软件使用的回报率。当今社会已进入了信息时代,人们将越来越多的信息存储在网络中的计算机上。如何更
7、有效地存储、管理、共享和提取信息,越来越引起人们的关注。集中式数据库已经不能满足人们的需求,分布式数据库走入了当今的舞台。分布式数据库系统的出现,有效地利用企业现有资源和网络资源。分布式数据库系统是一个面向地理上分布而在管理上需要不同程度集中的处理系统,主要解决在计算机网络上如何进行数据的分布和处理。由于分布式数据库有许多突出的优点,因此,分布式数据库系统可以广泛地应用于大企业,多种行业及军事国防等领域,这对建立集约型社会,加快社会主义现代化建设,将具有重要的现实意义。12 分布式数据库技术国外发展现状分布式数据库系统(Distributed Database system,简称 DDBS)已
8、有 20多年的发展历史,经历了一个从产生到发展的过程,取得了长足的进步。许多技术问题被提出并得到了解决。20世纪 90年代起,DDBS己进入商品化应用阶段,当前,分布式数据库技术已经成熟并得到广.可编辑文本泛应用。一些数据库厂商在不断推出和改进自己的分布式数据库产品,以适应多种需要和扩大市场的占有份额。但是,实现和建立分布式数据库系统绝对不是数据库技术与网络技术的简单结合,而是在这两种技术相互渗透和有机融合后的技术升华,它又产生了很多新的技术。而且,分布式数据库系统虽然基于集中式数据库系统,但分布式数据库系统却有它自己的特色和理论基础。由于数据的分布环境形成了很大的固有的技术难度,使得分布式数
9、据库系统的应用被推迟。至今完全遵循分布式数据库系统规则,特别是实现完全分布透明性的商用系统还很难见到。13 分布式数据库技术国内发展现状我国对分布式数据库系统的研究约在20世纪 80年代初期开始,一些科研单位和高校先后建立和实现了几个各具特色的分布式数据库系统。如由中国科学院数学研究所设计,由该所与上海科学技术大学、华东师范大学合作实现的CPOREL,武汉大学研制的WDDBS 和WOODDBS,东北大学研制的DMD FO系统等,尤其值得一提的是华中科技大学达梦数据库多媒体研究所开发的DMZ 多媒体数据库,它解决了异构数据库系统实现数据的共享和透明访问的难度。他们的工作对我国分布式数据库技术的理
10、论研究和应用开发起到了积极的推动作用。14 分布式数据库技术发展动向分布式数据库系统可看成是由分布在各场地的一组数据库系统(称为局部数据库系统)组成的统一的数据库系统。后者被称为全局数据库系统。局部数据库系统间耦合程度不同,或是很紧的耦合(对场地高度透明),或是很松的耦合(高度自治)。由于通用操作系统对数据库管理系统性能的限制,以及硬件价格的下降和高速网的发展,用专用数据库服务器己变得越来越合理了。专用数据库服务器的操作系统是面向数据库的,因此可以减少许多不必要的开销,可以支持大量的实时事务处理。为了提高服务器的性能,可以采用磁盘组和大规模进行处理技术多个数据库服务器联网,也可以构成分布式数据
11、库系统。随着计算机网络技术的飞速发展和广泛应用,特别是 internet的普及,使得对分布式数据库系统的研究和开发变得更加活跃。但是在实际应用时,特别是复杂情况下的效率、可用性、安全性、一致性等问题并不容易解决。internet是当前高速发展的全球性互联网络,internet应用开发的新方案几乎全部都是基于web的。web应用已经从传统的静态HTML 页面,向动态的开放的方向发展。针对这样的市场需求和web平台的基本技术,各个浏览器和web服务器提供商,如 Microsoft 公司、Netscape 公司和主流的数据库厂商,如Sybase 公司、oracle公司纷纷推出 web服务器和浏览器上
12、的扩展技术,形成以web服务器厂商的扩展技术为基础,数据库厂商提供解决数据库访问的应用服务器。这样,Web应用就从传统的“客户机R务器 两层体系结构演变为“Web服务器十应用服务器+数据库服务器”三层体系结构。用户的开发方向己经从构造单一的Clientserver应用转变为集 Browseserver应用、internet应用甚至数据仓库应用为一体的综合应用。从而形成Web技术与数据库技术相结合的数据库系统模型。实现和建立分布式数据库系统绝对不是数据库技术与网络技术、Web技术、计算机技术等的简单结合,而是在这些技术相互间渗透和有机结合后的技术升华。分布式数据库系统有它自己的特色和理论基础,由
13、于数据的分布环境形成了很大的固有的技术难度,使得分布式数据库系统的应用被推迟。至今完全遵循分布式数据库系统规则,特别是实现完全分布透明性的商用系统还很难见到。因此,在很长一段时间分布式数据库都有很大的发展空间。.可编辑文本第二章分布式数据库理论21分布式数据库理论211分布式数据库系统的有关概念分布式数据库系统使用计算机网络将地理位置分散而在管理和控制又需要不同程度集中的多个逻辑单位(通常是集中式数据库系统)联结起来,共同组成一个统一的数据库系统。因此,分布式数据库系统可以看成是:计算机网络与数据库系统的有机结合。在分布式数据库系统中,被计算机网络联结的每个逻辑单位,称为站点(site)或节点
14、(Node)。所谓地理位置上分散是指各个站点分散在不同的地方,大可为不同的国家,小可为同一建筑中的不同位置。所谓逻辑上集中是指各个站点之间不是互不相关的,它们是一个逻辑整体,并由一个统一的数据库管理系统进行管理这个数据库管理系统称为分布式数据库管理系(Distributed DatabaseManagement System,简称 DDBMS)。一个用户如果只访问他注册的那个站点上的数据称为本地(或局部)用户或本地应用;如果访问涉及两个或两个以上的站点中的数据,称为全局用户或全局应用。分布式数据库系统中有全局数据库(GDB)和局部数据库(LDB)的概念。全局数据库由全局数据库管理系统进行管理,
15、所谓全局是从整个系统角度出发研究问题。局部数据库由局部数据库管理系统(LDBMS)进行管理,所谓局部是从各个站点的角度出发研究问题。212分布式数据库系统的特点1.物理分布性:分布式数据库系统中的数据不是存储在一个站点上,而是分散存储在由计算机网络联结起来的多个站点上。2.逻辑整体性:分布式数据库系统中的数据物理上是分散在各个站点中的,但这些分散的数据逻辑上却是一个整体,它们被分布式数据库系统的所有用户(全局用户)共享,并由一个分布式数据库管理系统统一管理。3.站点自治性:站点自治性也称场地自治性,各站点上的数据由本地DBMS(database Management System:数据库管理系
16、统)管理,具有自治处理能力,完成本站点的应用(局部应用)。4.数据独立性:分布式数据库系统中,数据独立性不但指数据的逻辑独立性与物理独立性,还包括数据分布独立性亦称分布透明性。分布透明性使用户不必关心数据的.可编辑文本逻辑分片,不必关心数据是否被复制及复制副本的个数(冗余数据),也不必关心数据物理及其片段位置的分布细节,同时也不关心局部场地上数据库支持哪种数据模型。5.集中与自治相结合的控制机制:在分布式数据库系统中,数据的共享有两个层次:一是局部共享,即同一站点上的用户可共享本站点上局部数据库中的数据,以完成局部应用;二是全局共享,即分布式数据库系统上的用户都可共享在分布式数据库系统的各个站
17、点上存储的数据,以完成全局应用。因而,分布式数据库系统常常采用集中和自治相结合的控制机制。各局部的DBMS可以分散地管理局部数据库,具有自治的功能。同时,系统又设有集中控制机制,协调各局部DBMS的工作,执行全局管理功能。6.适当增加数据冗余性:在集中式数据库系统中,尽量减少冗余是系统的目标之一。其原因是,冗余数据不仅浪费存储空间,而且容易造成各数据副本之间的不一致性,为了保证数据的一致性,系统要付出一定的维护代价。而在分布式数据库系统中却通过冗余数据提高系统的可靠性、可用性和改善系统性能,因为当某一个站点出现故障时,系统可以对另一站点上的相同副本进行操作,不会因某一处故障而造成整个系统的瘫痪
18、。另外,系统可以选择用户最近的数据副本进行操作,减少通信代价,改善整个系统的性能。7.事务管理的分布性:数据的分布性必然造成事务执行和管理的分布性。213分布式数据库数据分片数据分片(Data Fragmentation)也称数据分割,是分布式数据库的特征之一。在一个分布式数据库中,全局数据库是各个站点上局部数据库的逻辑整体,而各个局部数据库中的数据是由全局数据库的某种逻辑分割而来。这样减少网络通信量,从而提高效率。数据分片有三种基本方法,分别如下:1水平分片:按特定条件把全局关系的所有元组分成若干个互不相交的子集,每一个子集为全局关系的一个逻辑片断,简称为片段。它们通过对全局关系施加选择运算
19、得到,并可通过对这些片段的合并操作来恢复该全局关系。2垂直分片:将全局关系(表或视图)的属性集(字段集)中的若干属性作投影运算,即得到全局关系的一个垂直分片。要求全局关系的每一个属性至少映射到一个垂直片段中,且每一个垂直分段都包含该全局关系的键。这样可以通过对这些片段执行连接操作来恢复该全局关系。3混合分片:水平分片和垂直分片的混合。无论哪种分片方法都必须满足数据完备性的要求,即必须遵守以下几条准则:完备性:全局关系的所有数据都要分配到相应的分片中,否则会丢失数据。不相交性:在各水平分片的关系子集中不能出现相同元组。可重构性:由全局关系分割得到的分片能通过关系运算还原成全局关系。214分布式数
20、据库数据分布数据分布(Data Distribution)是指分布式数据库中的数据不是存储在一个站点的计算机存储设备上,而是根据需要将数据划分成逻辑片段,按某种策略将这些片段分散地存储在各个站点上。数据分布的策略有:l分割式:所有数据只有一个备份,它被分割成若干个逻辑片段,每个逻辑片段被指派在某个特定的站点上。这种分布策略可充分利用各个站点上的存储设备,数据的存储量大。.可编辑文本在存放数据的各个站点上可自治的检索和修改数据,发挥系统的并发操作能力。同时,由于数据是分布在多个站点上,当某部分站点出现故障时,系统仍能运行,提高了系统的可靠性。对于全局查询和修改,所需的时间会长一些,因为数据不在同
21、一场地上,需要进行通讯。2复制式:全局数据有多个副本,每个站点上都有一个完整的数据副本。采用这种策略的系统可靠性高,响应速度快,数据库的恢复比较容易,可从任意场地得到数据副本。但是要保持各个站点上数据的同步修改,将要付出高昂的代价。另外,整个系统的冗余很大,系统的数据容量也只是一个站点上数据库的容量。3混合式:全部数据被分为若干个子集,每个子集安置在不同的站点上,但任意站点都没有保存全部的数据,根据数据的重要性决定各个子集的副本的多少,这种分布策略,兼顾分割式和复制式的做法,也获得了二者的优点,它灵活性好,能提高系统的效率,但同时也包括 T-者的复杂性。215数据分布设计策略数据分布的方式有许
22、多种,一般来说,可按整个数据库是集中存放在一个场地还是分割开来散布到多个场地以及是否有数据副本存在等情况,可组合成四种数据分布方式,它们是:l集中式。即整个数据库存放在一个场地上,且没有数据副本存在。严格说来,这不能算作是分布式数据库,因为数据库集中存放在一个场地上,其它场地都从该场地获得数据。存放数据库的那个场地相当于一个数据库服务器,其它场地相当于该数据库服务器的远程终端,它们对数据库的访问是通过远程登录访问来实现的。因此这种方案属于客户服务器结构的集中式数据库。集中式最主要的优点是简单,容易实现,所有的存取操作都在单一场地进行,这样数据一致性维护和并发控制都比较容易实现。但这种策略有很多
23、缺点,首先数据库的可能大小受限于中心场地的硬盘空间可用性的大小。其次,所有操作都在中心场地执行,其它场地都要通过网络访问中心场地,因此都有通信代价与时间延迟,系统的并行处理也受限于中心场地的处理能力与速度,进而中心场地就会成为“瓶颈”,这就进一步限制了系统的反应速度,而且中心场地也容易崩溃,系统的有效性与可用性不高。例如,如通信系统失效,则数据库对任何远程场地都无效:而当中心场地出现故障时,则整个数据库系统失效。2重复式。即有多个数据库副本存在,每个场地上都有一个完全的数据副本存在。这种方式的可用性、健壮性及效率相当高。这种可靠性高不仅体现在当一个或多个场地发生故障时数据库仍能有效运转,而且还
24、表现在很容易恢复一个破坏了的数据库副本,这只需简单的从另一个正常场地完全拷贝一个数据库即可。由于每个场地都有一个完全的数据库副本,用户的请求大都可以在本场地完成,这有助于提高响应速度,减少通信代价,使通信分布比较均匀。在只有读操作时,由于不需要维护数据一致性,因此不需要场地间的同步通信,系统的可用性是很高的。但是系统需要花费相当大的开销去维护数据库的一致性和运行并发控制。由于一致性和并法控制的复杂性,这种策略不适合单请求并行处理,但在各个场地,不同请求可以异步的处理。如何保持数据的一致性,依系统的不同而差别很大,而且所承受的开销取决于所提供的数据的一致性的级别。当网络的一部分由于某种原因而失效
25、时,需要限制修改操作的执行以维护数据的一致性。因为,若允许两个修改操作在不能实现同步的情况各自在不同的场地进行,则当系统恢复正常以后,可能出现数据的不一致性。另外,如同集中式策略一样,数据库的大小受限于每个场地上硬盘空间可用性的大小。一般来说,这种策略比较适合于要求可靠性高、数据库小、修改频率低的场合。3分割式。全局逻辑数据库被分割成许多片段,并且被分配到各个场地上,但这些片段只有一个拷贝。在对数据进行分割时,需要尽量按应用的要求进行分割,一般来说,应以减少表间的联系为目的。同样进行数据分割时,也应尽量将某一个场地经常存取的数据存放在相应的场地,这样可以减少网络开销。分割式策略与集中式策略相比
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分布式 数据库 课程设计 报告
限制150内