空间数据仓库与数据挖掘优秀PPT.ppt
《空间数据仓库与数据挖掘优秀PPT.ppt》由会员分享,可在线阅读,更多相关《空间数据仓库与数据挖掘优秀PPT.ppt(83页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、空间数据仓库与数据挖掘现在学习的是第1页,共83页第十章第十章空间数据仓库空间数据仓库和数据挖掘和数据挖掘现在学习的是第2页,共83页 数据仓库和空间数据仓库数据仓库和空间数据仓库 空间信息基础设施空间信息基础设施 数据挖掘和空间数据挖掘数据挖掘和空间数据挖掘 主要内容:现在学习的是第3页,共83页10.1 10.1 数据仓库与空数据仓库与空间数据仓库间数据仓库 数据仓库数据仓库 空间数据仓库空间数据仓库现在学习的是第4页,共83页10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库 随随着着市市场场竞竞争争的的加加剧剧和和信信息息社社会会需需求求的的发发展展,出出现现了了数数据据
2、集集中中化化、业业务务综综合合化化、决决策策科科学学化化的的趋趋势势。伴伴随随这这种种数数据据信信息息化化的的趋趋势势,从从大大量量数数据据中中提提取取(检检索索、查查询询等等)制制定定市市场场策策略略的的信信息息就就显显得得越越来来越越重重要要了了。这这种种需需求求既既要要求求联联机机服服务务,又又涉涉及及大大量量用用于于决决策策的的数数据据,而而传传统统的的数据库系统已无法满足这种需求。数据库系统已无法满足这种需求。一、数据仓库一、数据仓库现在学习的是第5页,共83页历史数据量很大;历史数据量很大;辅助决策信息涉及许多部门的数据,而不同系统的数据辅助决策信息涉及许多部门的数据,而不同系统的
3、数据难以集成;难以集成;由于访问数据的能力不足,它对大量数据的访问性由于访问数据的能力不足,它对大量数据的访问性能明显下降。能明显下降。10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库一、数据仓库一、数据仓库无法满足的需求具体体现在三个方面:无法满足的需求具体体现在三个方面:现在学习的是第6页,共83页 随随着着C/SC/S技技术术的的成成熟熟和和并并行行数数据据库库的的发发展展,信信息息处处理理技技术术的的发发展展趋趋势势是是从从大大量量的的事事务务数数据据库库中中抽抽取取数数据据,并并将将其其清清理理、转转换换为为新新的的存存储储格格式式,即即为为决决策策目目标标把把数数据
4、据聚聚合合在在一一种种特特殊殊的的格格式式中中。随随着着此此过过程程的的发发展展和和完完善善,这这种种支支持持决决策策的的、特特殊殊的的数数据据存存储储即即被被称称为为数数据据仓仓库库(Data Warehouse(Data Warehouse,DW)DW)。v 数据仓库产生趋势数据仓库产生趋势10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第7页,共83页数数据据仓仓库库(Data(Data Warehouse,Warehouse,简简称称DW)DW)是是支支持持管管理理决决策策过过程程的的、面面向向主主题题的的、集集成成的的、稳稳定定的的、不不同同时时间间的的数
5、据集合。数据集合。主主题题是是数数据据归归类类的的标标准准,每每个个主主题题对对应应一一个个客客观观分分析析领领域域,如如客客户户、商商店店等等,它它可可为为辅辅助助决决策策集集成多个部门不同系统的大量数据。成多个部门不同系统的大量数据。数数据据仓仓库库包包含含了了大大量量历历史史数数据据,经经集集成成后后进进入入数数据据仓仓库库的的数数据据是是极极少少更更新新的的。数数据据仓仓库库内内的的数数据据时时限限为为5 5至至1010年年,主要用于进行时间趋势分析。主要用于进行时间趋势分析。v 数据仓库定义数据仓库定义10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第8页
6、,共83页数数据据仓仓库库的的数数据据量量很很大大,一一般般为为10GB10GB左左右右。它它是是一一般般数数据库据库(100MB)(100MB)数据量的数据量的100100倍,大型数据仓库达到倍,大型数据仓库达到TBTB级。级。v 数据仓库定义数据仓库定义10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库 数数据据仓仓库库是是一一种种分分析析型型环环境境,它它与与一一般般的的DBMSDBMS的的操操作型环境是不同的,两者的比较有利于对数据仓库的理解作型环境是不同的,两者的比较有利于对数据仓库的理解。现在学习的是第9页,共83页10.1 10.1 数据仓库与空间数据仓库数据仓库与
7、空间数据仓库数据仓库(数据仓库(DWDW)数据库(数据库(DBDB)分析型数据环境分析型数据环境操作型数据环境操作型数据环境面向分析(主题),支持面向分析(主题),支持DSSDSS面向业务,日常事务处理面向业务,日常事务处理集成的综合数据集成的综合数据非集成或者集成程度很低,非集成或者集成程度很低,主要是明细数据主要是明细数据历史数据(历史数据(5-105-10年)年)主要关心当前数据(主要关心当前数据(60-9060-90天)天)定期加载,加载后极少更新定期加载,加载后极少更新实时更新实时更新数据驱动的开发周期数据驱动的开发周期(CLDSCLDS)需求驱动的开发周期需求驱动的开发周期(SDL
8、CSDLC)现在学习的是第10页,共83页数据仓库主要应用在两个方面:数据仓库主要应用在两个方面:使用浏览分析工具在使用浏览分析工具在DWDW中寻找有用的信息。中寻找有用的信息。数据仓库系统支持在数据仓库系统支持在DWDW上的应用,形成决策支上的应用,形成决策支持系统持系统(DSS)(DSS)。v 数据仓库应用数据仓库应用10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第11页,共83页地球是一个复杂多变的系统,传统地学的各个学科由于自身的局地球是一个复杂多变的系统,传统地学的各个学科由于自身的局限,其研究范围已无法适应全球变化和区域可持续发展的要求。限,其研究范围
9、已无法适应全球变化和区域可持续发展的要求。如在交通规划中,往往需要使用大量历史的、现实的空间数据以如在交通规划中,往往需要使用大量历史的、现实的空间数据以及各应用领域的复杂数据进行数据分析,涉及多维数据视图的概及各应用领域的复杂数据进行数据分析,涉及多维数据视图的概念,仅靠关系数据库就将难以解决。念,仅靠关系数据库就将难以解决。同时,传统的同时,传统的GISGIS应用系统是面向应用、事务驱动的,应用系统是面向应用、事务驱动的,其中分析所需要的主题相当分散,不同的操作平台和数其中分析所需要的主题相当分散,不同的操作平台和数据标准使得决策支持系统几乎无法实现数据共享。为此,据标准使得决策支持系统几
10、乎无法实现数据共享。为此,必须通过大型的、多维化的数据库系统进行统一的组织、必须通过大型的、多维化的数据库系统进行统一的组织、管理管理 。二、空间数据仓库二、空间数据仓库10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库v 空间数据仓库的产生趋势空间数据仓库的产生趋势现在学习的是第12页,共83页 数数据据仓仓库库正正是是这这样样一一种种数数据据的的存存储储系系统统,它它提提供供了了来来自自异异地地、异异构构、种种类类不不同同的的应应用用系系统统的的集集成成化化和和历历史史化化的的数数据据。对对其其加加工工后后,在在数数据据仓仓库库中中存存储储、提提取取和和维维护护,灵灵活活地地
11、重重组组数数据据,呈呈现现出出多多维维数数据据视视图图,并并且且面面向向复复杂杂的的数数据据分分析析及及高高层层的的决决策策支支持持,从从而而为为有有关关部部门门或或企企业业进进行行全全局局范范围围的的多多维维分析、战略决策和长期趋势分析提供了有效的支持。分析、战略决策和长期趋势分析提供了有效的支持。由由于于空空间间数数据据的的特特殊殊性性,空空间间数数据据仓仓库库在在数数据据仓仓库库的的基基础础上上需需引引入入空空间间维维数数据据,根根据据主主题题从从不不同同的的GISGIS应应用用系系统统中中截截取取从从瞬瞬态态到到区区段段直直至至全全球球系系统统上上的的信信息息,从从而而提提供供最好的信
12、息服务。最好的信息服务。v 空间数据仓库的产生趋势空间数据仓库的产生趋势10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第13页,共83页 空间数据仓库(空间数据仓库(Spatial Data WarehouseSpatial Data Warehouse,简称,简称SDWSDW)是)是集成的集成的、面向主题的面向主题的、相对稳定的相对稳定的、反映时反映时间变化和地理空间变化的间变化和地理空间变化的空间数据存储,以支持各级空间数据存储,以支持各级管理人员基于空间数据的分析和决策。管理人员基于空间数据的分析和决策。v 空间数据仓库的概念和内涵空间数据仓库的概念和内涵1
13、0.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第14页,共83页 空间数据仓库是空间数据仓库是GISGIS、空间数据库与数据仓库技术相结合、空间数据库与数据仓库技术相结合的产物的产物,它在普通数据仓库基础上,引入空间数据,增加对,它在普通数据仓库基础上,引入空间数据,增加对空间数据的存贮、管理和分析能力,根据主题从不同的空间空间数据的存贮、管理和分析能力,根据主题从不同的空间数据源中截取不同规模的时空尺度上的信息,从而为地学研数据源中截取不同规模的时空尺度上的信息,从而为地学研究以及有关资源环境政策的制定等空间决策支持过程提供最究以及有关资源环境政策的制定等空间决策
14、支持过程提供最好的信息服务。好的信息服务。空间数据仓库是数据仓库与空间处理分析的综合,空间数据仓库是数据仓库与空间处理分析的综合,具有空间,时间和主题的高度集成具有空间,时间和主题的高度集成。从信息科学的角度来说,。从信息科学的角度来说,它是对数据仓库加进了非结构化信息处理。它是对数据仓库加进了非结构化信息处理。v 空间数据仓库的概念和内涵空间数据仓库的概念和内涵10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第15页,共83页SDWSDW支支持持多多种种数数据据源源:数数据据库库、数数据据文文件件、应应用用程序等;程序等;SDWSDW中中存存放放的的不不仅仅是是供
15、供使使用用的的数数据据,还还有有在在一一定定激激发发条条件件下下能能主主动动其其作作用用的的处处理理规规则则、算算法法,甚甚至至是是过程过程等;等;SDWSDW中中数数据据并并不不完完全全是是原原始始数数据据的的简简单单归归并并和和搬搬家家,而而是是增增值值和和统统一一,因因此此,“汇汇总总并并统统一一”是是一一种种可可取的描述;取的描述;v 空间数据仓库的概念和内涵空间数据仓库的概念和内涵10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第16页,共83页数数据据的的集集成成化化表表明明数数据据在在结结构构上上具具有有综综合合性性,并并且且在在语语言言上上是是异异构
16、构的的,在在进进入入SDWSDW之之前前,必必须须经经过过加加工工和和集集成成,这是这是SDWSDW建设中最关键,最复杂的一步;建设中最关键,最复杂的一步;历历史史化化表表明明它它可可以以截截取取不不同同时时间间尺尺度度上上的的信信息息,从从瞬瞬态态到到区区段段直直到到全全体体。SDWSDW以以时时间间为为基基准准管管理理(积积累累,使使用用并并处处理理)数据,即使依赖与时间维的数据结构;数据,即使依赖与时间维的数据结构;SDWSDW保保存存和和管管理理的的是是“对对象象”数数据据以以及及与与之之相相关关的的处处理理规规则则,算算法法和和过过程程等等的的统统一一体体,它它们们在在SDWSDW中
17、中以以打包及有序存放的形式被保存和维护,且需要即可使用。打包及有序存放的形式被保存和维护,且需要即可使用。v 空间数据仓库的概念和内涵空间数据仓库的概念和内涵10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第17页,共83页v 空空间间数数据据仓仓库库的的体体系系结结构构10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库空间数据仓库应用(空间决策支持系统等)空间数据仓库应用(空间决策支持系统等)分析结果分析结果联机分析处理联机分析处理数据挖掘数据挖掘数据仓库中信息数据仓库中信息多级存储策略多级存储策略数据库数据库空间数据库系统(数据管理部分)空间数据库
18、系统(数据管理部分)SDBSDBSDB数据采集与输入系统(数据源部分)数据采集与输入系统(数据源部分)核心核心GIS数据数据政府统计政府统计数据数据市场经济市场经济数据数据土地利用土地利用数据数据分析工具分析工具数据转换数据转换数据输入数据输入决策运算决策运算MBKB空空间间数数据据仓仓库库现在学习的是第18页,共83页 空空间间数数据据仓仓库库机机制制的的研研究究围围绕绕空空间间数数据据仓仓库库的的实实际际应用需求,探索空间数据仓库的关键技术。应用需求,探索空间数据仓库的关键技术。(1 1)支支持持空空间间信信息息的的空空间间数数据据仓仓库库模模型型:空空间间数数据据仓仓库库的的数数据据模模
19、型型是是普普通通数数据据仓仓库库的的数数据据模模型型的的有有效效扩扩充充,必必须须针针对对空空间信息的特点,对星型模型和雪花模型进行扩展。间信息的特点,对星型模型和雪花模型进行扩展。(2 2)支支持持空空间间数数据据导导航航的的元元数数据据机机制制:空空间间数数据据仓仓库库的的元元数数据据是是人人们们定定义义空空间间数数据据仓仓库库模模型型、理理解解空空间间数数据据意意义义的的重重要要窗窗口口,空空间间数数据据仓仓库库的的元元数数据据必必须须支支持持对对空空间数据分析的导航。间数据分析的导航。v 空间数据仓库的关键技术空间数据仓库的关键技术10.1 10.1 数据仓库与空间数据仓库数据仓库与空
20、间数据仓库现在学习的是第19页,共83页(3 3)面面向向海海量量空空间间信信息息的的数数据据存存储储策策略略:空空间间数数据据仓仓库库包包含含海海量量的的空空间间信信息息。支支持持对对海海量量空空间间信信息息的的高高效效的的存存储储和和检检索索是是空空间间数数据据仓仓库库的的重重要要需需求求,也也是是空空间间数数据据仓仓库库的的重重要要特特征征。因因此此需需要要研研究究面面向向海海量量空间信息的数据存储策略。空间信息的数据存储策略。(4 4)面面向向海海量量空空间间信信息息高高效效检检索索的的空空间间索索引引机机制制:数数据据索索引引是是提提高高数数据据检检索索效效率率的的有有效效途途径径。
21、由由于于空空间间数数据据仓仓库库中中涉涉及及海海量量的的空空间间信信息息,因因此此需需要要研研究究面面向向空空间间数据仓库的索引机制。数据仓库的索引机制。v 空间数据仓库的关键技术空间数据仓库的关键技术10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第20页,共83页(5 5)大大规规模模空空间间数数据据处处理理:由由于于空空间间数数据据所所包包含含的的数数据据量量比比较较大大,当当空空间间数数据据仓仓库库中中地地理理数数据据、元元数数据据以以及及历历史史数数据据的的数数据据量量急急速速增增长长时时数数据据的的存存储储和和管管理理机机制制的的调调整整策策略略等等问问
22、题题需需要更加深入的研究。要更加深入的研究。(6 6)查查询询的的建建立立和和数数据据导导航航技技术术:空空间间数数据据的的查查询询通通常常比比较较复复杂杂,而而目目前前的的用用户户界界面面形形式式很很难难满满足足。必必须须为为空空间间数数据据仓仓库库数数据据查查询询的的输输入入以以及及数数据据查查询询的的建建立立提提供供一一套套合合适适的的机制。机制。(7 7)快速计算、高速网络、空间数据库的无缝连接、数据)快速计算、高速网络、空间数据库的无缝连接、数据挖掘、空间数据联机分析和处理及服务的互操作等关键技术。挖掘、空间数据联机分析和处理及服务的互操作等关键技术。v 空间数据仓库的关键技术空间数
23、据仓库的关键技术10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第21页,共83页 目目前前国国外外数数据据仓仓库库以以及及空空间间数数据据仓仓库库方方面面的的主主要要工工作作基基础础 有有 很很 多多。StanfordStanford大大 学学 的的 数数 据据 仓仓 库库WHIPS(WareHouse WHIPS(WareHouse Information Information Project Project at at Stanford)Stanford);美美国国正正在在启启动动一一个个空空间间信信息息处处理理项项目目EOS(Earth EOS(Earth
24、 Overview Overview System)System),到到20032003年年,对对全全球球地地面面监监测测的的精精度度将将达达到到1 1米米的的分分辨辨率率,该该项项目目对对巩巩固固美美国国在在全全球球的的竞竞争争优优势势具具有有重重要要的的作作用用。该该项项目目的的主主要要组组成成部部分分之之一一就就是是空空间间数数据据的的联联机机分分析析与与挖挖掘掘技技术术的的研研究究;IBMIBM的的AlmendenAlmenden实实验验室室、北北美美和和德德国国的的一一些些公公司司、和和科科研研机机构构的的实实验验室室在在这这个领域的研究中处于领先位置。个领域的研究中处于领先位置。v
25、 国内外研究现状国内外研究现状10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第22页,共83页 目目前前的的空空间间数数据据仓仓库库原原型型系系统统主主要要有有 :AMicrosoft AMicrosoft TerraServer TerraServer(由由Jim Jim GrayGray主主持持 ),GeoMinerGeoMiner(由由加加拿拿大大Simon FraserSimon Fraser大学开发)等。大学开发)等。在在国国内内,国国家家“九九五五”科科技技重重点点攻攻关关项项目目 “空空间间信信息息共共享享和和处处理理技技术术研研究究”专专题题项项目
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 空间 数据仓库 数据 挖掘 优秀 PPT
限制150内