数据库与数据仓库44580.docx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《数据库与数据仓库44580.docx》由会员分享,可在线阅读,更多相关《数据库与数据仓库44580.docx(24页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章 数据库与数据仓库第一节 数据库技术数据处理是指从某些已知的数据出发,推导加工出一些新的数据。在数据处理中,通常计算比较简单,而数据管理比较复杂。数据管理是指数据的收集、整理、组织、存储、维护、检索、传送等操作。这部分操作是数据处理业务的基本环节,而且也是任何数据处理业务中必不可少的共有部分。数据处理的目的是从大量的数据中,按照应用的需要,根据数据自身的规律及其相互联系,通过分析、归纳、推理等科学方法,利用计算机技术,提取有效的信息资源,为进一步分析、管理、决策提供依据。一、数据管理技技术及其发展展数据管理技术经经历了人工管管理、文件系系统和数据库库系统三个阶阶段。(一)人工管理理阶段该
2、阶段处在200世纪50年年代中期以前前,当时计算算机主要用于于科学计算,其其他工作还没没有展开。当当时的硬件状状况是,外存存只有纸带、卡卡片、磁带,没没有磁盘等直直接存取的存存储设备。软软件状况是,没没有操作系统统,没有管理理数据的软件件。数据处理理的方式基本本上是批处理理。这时期的的数据管理呈呈以下特点:1、数据不保存存。2、数据由应用用程序管理。3、数据不共享享。4、数据不具独独立性。(二)文件系统统阶段20世纪50年年代后期到660年代中期期,随着数据据量的增加,数数据的存储、检检索和维护等等成为迫切需需要解决的问问题,数据结结构和数据管管理技术迅速速发展起来。此此时,计算机机硬件方面有
3、有了磁盘、磁磁鼓等直接存存取的外部存存储设备;而而软件中出现现了操作系统统和高级语言言。操作系统统中有了专门门进行数据管管理的软件,称称为文件系统统。处理方式式上不仅有了了批处理,而而且能够联机机实时处理。在文件管理阶段段,文件系统统为应用程序序和数据之间间提供了一个个公共接口,使使应用程序采采用统一的存存取方法来操操作数据,应应用程序和数数据之间不再再是直接的对对应关系。这这一时期的数数据管理的特特点是:1、数据可以长长期保存。数数据以“文件件”的形式可可以长期保存存在外部存储储设备中。2、数据由文件件系统管理。文文件系统把数数据组织成相相互独立的数数据文件,利利用按文件名名访问、按记记录进
4、行存取取的管理技术术,可以对文文件进行修改改、插入和删删除的操作。3、数据具有一一定的独立性性。程序与数数据之间具有有“设备独立立性”,即程程序只需用文文件名就可以以访问数据,不不必关心数据据的物理位置置,由文件系系统提供存取取方式。(三)数据库系系统阶段20世纪60年年代以来,计计算机用于管管理的规模越越来越大,应应用越来越广广泛,数据量量急剧增大,对对数据共享的的要求越来越越迫切;同时时,大容量磁磁盘已经出现现,联机实时时处理业务增增多;软件价价格在系统中中的比重日益益上升,硬件件价格大幅下下降,编制和和维护应用软软件所需成本本相对增加。在在这种情况下下,为了解决决多用户、多多应用共享数数
5、据的需求,使使数据为尽可可能多的应用用程序服务,数数据库技术应应运而生,出出现了统一管管理数据的专专门软件系统统数据库管管理系统(DDBMS,DDataBaase Maanagemment SSystemm)。数据库技术的出出现主要是为为了克服文件件管理系统在在管理数据上上的诸多缺陷陷,满足人们们对数据管理理的需求。与与文件系统相相比,应用程程序不再直接接访问数据文文件,而是通通过数据库管管理系统来访访问数据;数数据文件也不不再被应用程程序管理,而而由数据库管管理系统统一一管理。数据库阶段的数数据管理特点点是:1、数据结构化化。数据结构构化是数据库库与文件系统统的根本区别别。在文件系系统中,相
6、互互独立的文件件的内部(即即记录的结构构)是有结构构的,但从整整个系统来说说,数据在整整体上是没有有结构的。即即记录内部有有了结构,但但记录间没有有联系。在数数据库系统中中实现了整体体数据的结构构化,数据不不再是针对某某个应用,而而是面向全组组织,在整体体上服从一定定的结构形式式。同时在数数据库系统中中存取数据的的方式也很灵灵活,可以存存取数据库中中某个数据项项、一组数据据项、一个记记录或一组记记录,而在文文件系统中数数据存取的最最小单位是记记录。2、较高的数据据独立性。用用户能以简单单的逻辑结构构操作数据而而无需考虑数数据的物理结结构。数据库库的结构分成成用户的局部部逻辑结构、数数据库的整体
7、体逻辑结构和和物理结构三三级。用户(应用程序或或终端用户)的数据和外外存中的数据据之间转换由由数据库管理理系统实现。3、数据共享。在在数据库系统统中,数据不不再仅仅服务务于某个程序序或用户,而而成为若干程程序或用户的的共享资源,由由数据库管理理系统统一管管理与控制。在在数据库中,由由DBMS完完成诸如打开开、关闭、读读、写等文件件的低级操作作,应用程序序不必关心数数据存储和其其他实现的细细节,可以在在更高的抽象象级别上访问问数据。文件件结构由DBBMS修改,从从而减少应用用程序的维护护工作量,提提高数据的独独立性。4、方便的用户户接口。用户户可以使用查查询语句或终终端命令操作作数据库,也也可以
8、用程序序方式(如用用Delphhi、VC、VVB、Javva等高级语语言和数据库库语言联合编编制的程序)操作数据库库。5、较强的数据据控制能力。并并发控制能力力,对程序的的并发操作加加以控制,防防止数据库被被破坏;恢复复能力,系统统有能力在数数据库被破坏坏或数据不可可靠时,把数数据库恢复到到最近某个正正确的状态;完整性能力力,保证数据据库中数据完完整;安全性性能力,保证证数据库中数数据安全。(四)数据库发发展新技术 数据库技术发展展之快、应用用之广是计算算机科学其他他领域的技术术无可比拟的的。随着数据据库应用领域域的不断扩大大和信息量的的急剧增长,占占主导地位的的关系数据库库系统已不能能满足新
9、的应应用领域的需需求,如CAAD(计算机机辅助设计)/CAM(计算机辅助助制造)、CCIMS(计计算机集成制制造系统)、GG1S(地理理信息系统)、MIS(管理信息系系统)、KBBS(知识库库系统)等,都都需要数据库库新技术的支支持。这些新应用领域域的特点是:存储和处理理的对象复杂杂,对象间的的联系具有复复杂的语义信信息;需要复复杂的数据类类型支持;需需要常驻内存存的对象管理理以及支持对对大量对象的的存取和计算算。这些需求求是传统关系系数据库系统统难以满足的的。 自200世纪60年年代中期以来来,数据库技技术与具他领领域的技术相相结合,出现现了数据库的的许多新的分分支,如:与与网络技术相相结合
10、出现了了网络数据库库;与分布处处理技术相结结合出现了分分布式数据库库;与面向对对象技术相结结合出现了面面向对象数据据库;与人工工智能技术相相结合出现了了知识库;与与并行处理技技术相结合出出现了并行数数据库;与多多媒体技术相相结合出现了了多媒体数据据库。1、分布式数据据库技术 分布式式数据库系统统(Disttributted DaataBasse Sysstem,DDDBS)是是在集中式数数据库基础上上发展起来的的,分布式数数据库系统是是地理上分布布在计算机网网络的不同节节点,逻辑上上属于同一系系统的数据库库系统,分布布式数据库系系统不仅能支支持局部应用用,存取本地地节点或另一一个节点的数数据,
11、而且能能支持全局应应用,同时存存取两个或两两个以上节点点的数据。 2、面面向对象数据据库技术面向对象数据库库系统(Obbject-Oriennted DDataBaase Syystem,OOODBS)是将面向对对象的模型、方方法和机制,与与先进的数据据库技术有机机地结合而形形成的新型数数据库系统。它它从关系模型型中脱离出来来,强调在数数据库框架中中发展类型、数数据抽象、继继承和持久性性。它的基本本设计思想是是:一方面把把面向对象语语言向数据库库方向扩展,使使应用程序能能够存取并处处理对象;另另一方面扩展展数据库系统统,使其具有有面向对象的的特征,提供供一种综合的的语义数据建建模概念集,以以便
12、对现实世世界中复杂应应用的实体和和联系建模。因因此,面向对对象数据库系系统首先是一一个数据库系系统,具备数数据库系统的的基本功能,其其次是一个面面向对象的系系统,针对面面向对象程序序设计语言的的永久性对象象存储管理而而设计的,充充分支持面向向对象的概念念和机制。 3、多媒媒体数据库 多媒体数据据库系统(MMulti-mediaa Dataabase Systeem,MDBBS)是数据据库技术与多多媒体技术相相结合的产物物。在许多数数据库应用领领域中,都涉涉及到大量的的文字、图形形、图像、声声音等多媒体体数据,这些些与传统的数数字、字符等等格式化数据据有很大的不不同,都是一一些结构复杂杂的对象。
13、这这主要体现为为如下几点: (1)数数据量大。格格式化数据的的数据量小,而而多媒体数据据量一般都很很大,1分钟钟视频和音频频数据就需要要几十兆空间间。 (2)结结构复杂。传传统的数据以以记录为单位位,一个记录录由若干个字字段组成,结结构简单,而而多媒体数据据种类繁多、结结构复杂,大大多是非结构构化数据,来来源于不同的的媒体且具有有不同的形式式和格式。(3)数据传输输的连续性。多多媒体数据,如如声音或视频频数据的传输输必须是连续续的、稳定的的,不能间断断,否则出现现失真而影响响效果。多媒体数据的这这些特点,使使系统不能像像格式化数据据一样去管理理和处理多媒媒体数据,也也不能简单地地通过扩充传传统
14、数据库来来满足多媒体体应用的需求求,因此,多多媒体数据库库需要有特殊殊的数据结构构、存储技术术、查询和处处理方式。 4、数数据仓库 随着数数据库应用规规模、范围和和深度的不断断扩大,般般的事务处理理已不能满足足应用的需要要,企业界需需要在大量信信息数据基础础上的决策支支持(Deccisionn Suppport,DDS)。数据据仓库(Daata Waarehouusing,DDW)技术的的兴起满足了了这一需求。数据仓库技术是是目前数据处处理中发展十十分迅速的一一个分支。所所谓“数据仓仓库”,就是是一种长期数数据存储,这这些数据来自自于多个异种种数据源。通通过数据仓库库提供的联机机分析处理(OL
15、AP)工具,实现现各种粒度的的多维数据分分析,以便向向管理决策提提供支持。数数据仓库系统统允许将各种种应用系统集集成在一起,为为统一的历史史数据分析提提供坚实的平平台,对信息息处理进行支支持。数据仓库可以提提供对企业数数据的方便访访问和强大的的分析工具,从从企业数据中中获得有价值值的信息,发发掘企业的竞竞争优势,提提高企业的运运营效率,指指导企、业决决策。数据仓仓库作为决策策支持系统(Decission SSupporrt Sysstem,DDSS)的有有效解决方案案,涉及3方方面的技术内内容:数据仓仓库技术、联联机分析处理理(On-LLine AAnalyssis Prrocesssing,
16、OOLAP)技技术和数据挖挖掘(Datta Minning,DDM)技术。二、数据库系统统的组成数据库系统是由由支持数据库库运行的硬件件、数据库、数数据库管理系系统、应用软软件、数据库库管理员和用用户组成。如如图6-1所所示。图6-1 数据据库系统(一)数据库数据库是长期存存储在计算机机存贮介质上上,有一定组组织形式、可可共享的数据据集合。针对对应用的所需需要进行收集集并抽取大量量数据,经过过加工处理后后保存在数据据库中。数据据库中的数据据按一定的数数据模型组织织、描述和存存储,具有较较小的冗余度度、较高的数数据独立性和和易扩展性,并并为各种用户户共享。数据据库中的数据据由数据库管管理系统进行
17、行统一管理和和控制,用户户对数据库进进行的各种操操作都是通过过数据库管理理系统实现的的。(二)支持数据据库运行的硬硬件硬件是数据库赖赖以存在的物物理设备,包包括CPU、存存储器和其他他外部设备等等。数据库系系统要求要有有较大的内存存,用以存放放系统程序、应应用程序和开开辟用户工作作区及系统缓缓冲区;而对对外部存储器器更有特殊要要求,一般应应配备高速度度、大容量的的直接存取存存储设备(磁磁盘、光盘等等)。(三)数据库管管理系统数据库管理系统统(DBMSS)是介于用用户和操作系系统之间的一一层数据管理理软件,属于于系统软件。它它由计算机软软件生产厂家家按商品软件件出版。如OORACLEE公司的Or
18、racle系系统、SYBBASE公司司的Sybaase系统、MMicrossoft公司司的SQL Serveer系统以及及MySQLL等。数据库管理系统统为数据库的的建立、运行行和维护提供供了统一的管管理和控制。用用户通过数据据库管理系统统定义数据和和操纵数据,由由它保证数据据的安全性、完完整性、并发发使用及发生生故障后的系系统恢复。数数据库管理系系统是数据库库系统的核心心,其功能的的强弱是衡量量数据库系统统性能优劣的的主要指标。(四)应用程序序一个数据库应用用可分为客户户端应用程序序和服务端应应用程序两类类。服务端应应用程序运行行在数据库服服务器上,是是真正存储和和操纵数据的的,它接受用用户
19、程序的请请求,对数据据进行不同的的操作。客户户端应用程序序运行在客户户端计算机上上,实现用户户的业务逻辑辑,通过客户户端应用程序序界面,用户户可以发出不不同的请求给给服务器端,由由服务端程序序完成各种各各样的操作。一一般情况下,客客户端和服务务器端的程序序通过标准SSQL语言通通信。数据库应用程序序主要完成用用户的业务逻逻辑,被安装装在用户的计计算机上。应应用程序和数数据库管理系系统一起完成成用户的业务务处理。在这这个应用中,数数据库管理系系统负责数据据的管理,提提供数据共享享功能,因此此多个应用程程序可以同时时使用同一个个数据库。应应用程序使用用数据库是通通过DBMSS实现的。(五)数据库管
20、管理员(DaataBasse Admministtratorr,DBA)数据库的建立、使使用和维护工工作等只靠一一个DBMSS远远不够,还还要有专门的的人员来完成成。大型数据据库通常由专专业人员设计计,还要配上上专职数据库库管理员(DDBA)。DDBA是控制制数据整体结结构的一组人人员,负责数数据库系统(DBS,DDataBaase Syystem)的正常运行行,承担创建建、监控和维维护数据库结结构的责任。(六)用户按照应用数据库库系统的方式式不同,可以以分为数据库库开发人员和和终端用户。数数据库开发人人员包括系统统分析员、数数据库设计人人员和应用程程序员。三、数据库系统统的体系结构构为了有效
21、地组织织和管理数据据,提高数据据库的逻辑独独立性和物理理独立性,美美国ANSII/SPARRC(美国国国家标准化组组织/标准规规划与需求委委员会)数据据库管理系统统研究小组于于1975年年、19788年提出了标标准化的建议议,将数据库库体系结构分分为三级:面面向用户或应应用程序员的的用户级(外外部级)、面面向建立和维维护数据库人人员的概念级级和面向系统统程序员的物物理级(内部部级)。用户户级对应外模模式,概念级级对应模式,物物理级对应内内模式,使不不同级别的用用户对数据库库形成不同的的视图。所谓谓视图是指观观察、认识和和理解数据的的范围、角度度和方法,即即视图就是数数据库在用户户“眼中”的的反
22、映。显然然不同层次(级别)用户户所“看到”的的数据库是不不相同的。数数据库系统的的体系结构如如图6-2所所示。用户视图用户级应用A应用B应用E应用D应用C外模式1外模式2外模式3外模式到概念模式的映射概念模式概念模式到内模式的映射内模式数据库全局视图概念级存储视图物理级DBMSOS图6-2 数据库系统统的体系结构构(一)模式模式又称概念模模式或逻辑模模式,对应于于概念级。它它是由数据库库设计者综合合所有用户的的数据,按照照统一的观点点构造的全局局逻辑结构,是是对数据库中中全部数据的的逻辑结构和和特征的总体体描述,是所所有用户的全全局视图。模式是数据库系系统结构的中中间层,既不不涉及数据的的物理
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据库 数据仓库 44580
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内