空间数据仓库与数据挖掘.ppt
现在学习的是第1页,共83页第十章第十章空间数据仓库空间数据仓库和数据挖掘和数据挖掘现在学习的是第2页,共83页 数据仓库和空间数据仓库数据仓库和空间数据仓库 空间信息基础设施空间信息基础设施 数据挖掘和空间数据挖掘数据挖掘和空间数据挖掘 主要内容:现在学习的是第3页,共83页10.1 10.1 数据仓库与空数据仓库与空间数据仓库间数据仓库 数据仓库数据仓库 空间数据仓库空间数据仓库现在学习的是第4页,共83页10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库 随随着着市市场场竞竞争争的的加加剧剧和和信信息息社社会会需需求求的的发发展展,出出现现了了数数据据集集中中化化、业业务务综综合合化化、决决策策科科学学化化的的趋趋势势。伴伴随随这这种种数数据据信信息息化化的的趋趋势势,从从大大量量数数据据中中提提取取(检检索索、查查询询等等)制制定定市市场场策策略略的的信信息息就就显显得得越越来来越越重重要要了了。这这种种需需求求既既要要求求联联机机服服务务,又又涉涉及及大大量量用用于于决决策策的的数数据据,而而传传统统的的数据库系统已无法满足这种需求。数据库系统已无法满足这种需求。一、数据仓库一、数据仓库现在学习的是第5页,共83页历史数据量很大;历史数据量很大;辅助决策信息涉及许多部门的数据,而不同系统辅助决策信息涉及许多部门的数据,而不同系统的数据难以集成;的数据难以集成;由于访问数据的能力不足,它对大量数据的访问由于访问数据的能力不足,它对大量数据的访问性能明显下降。性能明显下降。10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库一、数据仓库一、数据仓库无法满足的需求具体体现在三个方面:无法满足的需求具体体现在三个方面:现在学习的是第6页,共83页 随随着着C/SC/S技技术术的的成成熟熟和和并并行行数数据据库库的的发发展展,信信息息处处理理技技术术的的发发展展趋趋势势是是从从大大量量的的事事务务数数据据库库中中抽抽取取数数据据,并并将将其其清清理理、转转换换为为新新的的存存储储格格式式,即即为为决决策策目目标标把把数数据据聚聚合合在在一一种种特特殊殊的的格格式式中中。随随着着此此过过程程的的发发展展和和完完善善,这这种种支支持持决决策策的的、特特殊殊的的数数据据存储即被称为数据仓库存储即被称为数据仓库(Data Warehouse(Data Warehouse,DW)DW)。v 数据仓库产生趋势数据仓库产生趋势10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第7页,共83页数数据据仓仓库库(Data(Data Warehouse,Warehouse,简简称称DW)DW)是是支支持持管管理理决决策策过过程程的的、面面向向主主题题的的、集集成成的的、稳稳定定的的、不不同同时时间间的的数据集合。数据集合。主主题题是是数数据据归归类类的的标标准准,每每个个主主题题对对应应一一个个客客观观分分析析领领域域,如如客客户户、商商店店等等,它它可可为为辅辅助助决决策策集集成成多多个部门不同系统的大量数据。个部门不同系统的大量数据。数数据据仓仓库库包包含含了了大大量量历历史史数数据据,经经集集成成后后进进入入数数据据仓仓库库的的数数据据是是极极少少更更新新的的。数数据据仓仓库库内内的的数数据据时时限限为为5 5至至1010年,主要用于进行时间趋势分析。年,主要用于进行时间趋势分析。v 数据仓库定义数据仓库定义10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第8页,共83页数数据据仓仓库库的的数数据据量量很很大大,一一般般为为10GB10GB左左右右。它它是是一一般般数数据据库库 (100MB)(100MB)数数据据量量的的100100倍倍,大大型型数数据据仓仓库库达达到到TBTB级。级。v 数据仓库定义数据仓库定义10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库 数数据据仓仓库库是是一一种种分分析析型型环环境境,它它与与一一般般的的DBMSDBMS的的操操作作型型环环境境是是不不同同的的,两两者者的的比比较较有有利利于于对对数数据据仓仓库库的理解的理解。现在学习的是第9页,共83页10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库数据仓库(数据仓库(DWDW)数据库(数据库(DBDB)分析型数据环境分析型数据环境操作型数据环境操作型数据环境面向分析(主题),支持面向分析(主题),支持DSSDSS面向业务,日常事务处理面向业务,日常事务处理集成的综合数据集成的综合数据非集成或者集成程度很低,非集成或者集成程度很低,主要是明细数据主要是明细数据历史数据(历史数据(5-105-10年)年)主要关心当前数据(主要关心当前数据(60-9060-90天)天)定期加载,加载后极少更新定期加载,加载后极少更新实时更新实时更新数据驱动的开发周期数据驱动的开发周期(CLDSCLDS)需求驱动的开发周期需求驱动的开发周期(SDLCSDLC)现在学习的是第10页,共83页数据仓库主要应用在两个方面:数据仓库主要应用在两个方面:使用浏览分析工具在使用浏览分析工具在DWDW中寻找有用的信息。中寻找有用的信息。数据仓库系统支持在数据仓库系统支持在DWDW上的应用,形成决策支持上的应用,形成决策支持系统系统 (DSS)(DSS)。v 数据仓库应用数据仓库应用10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第11页,共83页地球是一个复杂多变的系统,传统地学的各个学科由于自身的局地球是一个复杂多变的系统,传统地学的各个学科由于自身的局限,其研究范围已无法适应全球变化和区域可持续发展的要求。限,其研究范围已无法适应全球变化和区域可持续发展的要求。如在交通规划中,往往需要使用大量历史的、现实的空间数据以如在交通规划中,往往需要使用大量历史的、现实的空间数据以及各应用领域的复杂数据进行数据分析,涉及多维数据视图的概及各应用领域的复杂数据进行数据分析,涉及多维数据视图的概念,仅靠关系数据库就将难以解决。念,仅靠关系数据库就将难以解决。同时,传统的同时,传统的GISGIS应用系统是面向应用、事务驱动的,其应用系统是面向应用、事务驱动的,其中分析所需要的主题相当分散,不同的操作平台和数据中分析所需要的主题相当分散,不同的操作平台和数据标准使得决策支持系统几乎无法实现数据共享。为此,标准使得决策支持系统几乎无法实现数据共享。为此,必须通过大型的、多维化的数据库系统进行统一的组织、必须通过大型的、多维化的数据库系统进行统一的组织、管理管理 。二、空间数据仓库二、空间数据仓库10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库v 空间数据仓库的产生趋势空间数据仓库的产生趋势现在学习的是第12页,共83页 数数据据仓仓库库正正是是这这样样一一种种数数据据的的存存储储系系统统,它它提提供供了了来来自自异异地地、异异构构、种种类类不不同同的的应应用用系系统统的的集集成成化化和和历历史史化化的的数数据据。对对其其加加工工后后,在在数数据据仓仓库库中中存存储储、提提取取和和维维护护,灵灵活活地地重重组组数数据据,呈呈现现出出多多维维数数据据视视图图,并并且且面面向向复复杂杂的的数数据据分分析析及及高高层层的的决决策策支支持持,从从而而为为有有关关部部门门或或企企业业进进行行全全局局范范围围的的多多维维分分析析、战战略略决决策策和和长长期期趋趋势分析提供了有效的支持。势分析提供了有效的支持。由由于于空空间间数数据据的的特特殊殊性性,空空间间数数据据仓仓库库在在数数据据仓仓库库的的基基础础上上需需引引入入空空间间维维数数据据,根根据据主主题题从从不不同同的的GISGIS应应用用系系统统中中截截取取从从瞬瞬态态到到区区段段直直至至全全球球系系统统上上的的信信息息,从从而而提提供供最最好的信息服务。好的信息服务。v 空间数据仓库的产生趋势空间数据仓库的产生趋势10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第13页,共83页 空间数据仓库(空间数据仓库(Spatial Data WarehouseSpatial Data Warehouse,简称,简称SDWSDW)是)是集成的集成的、面向主题的面向主题的、相对稳定的相对稳定的、反映时间反映时间变化和地理空间变化的变化和地理空间变化的空间数据存储,以支持各级管理空间数据存储,以支持各级管理人员基于空间数据的分析和决策。人员基于空间数据的分析和决策。v 空间数据仓库的概念和内涵空间数据仓库的概念和内涵10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第14页,共83页 空间数据仓库是空间数据仓库是GISGIS、空间数据库与数据仓库技术相结合、空间数据库与数据仓库技术相结合的产物的产物,它在普通数据仓库基础上,引入空间数据,增加,它在普通数据仓库基础上,引入空间数据,增加对空间数据的存贮、管理和分析能力,根据主题从不同的对空间数据的存贮、管理和分析能力,根据主题从不同的空间数据源中截取不同规模的时空尺度上的信息,从而为空间数据源中截取不同规模的时空尺度上的信息,从而为地学研究以及有关资源环境政策的制定等空间决策支持过地学研究以及有关资源环境政策的制定等空间决策支持过程提供最好的信息服务。程提供最好的信息服务。空间数据仓库是数据仓库与空间空间数据仓库是数据仓库与空间处理分析的综合,具有空间,时间和主题的高度集成处理分析的综合,具有空间,时间和主题的高度集成。从信。从信息科学的角度来说,它是对数据仓库加进了非结构化信息处息科学的角度来说,它是对数据仓库加进了非结构化信息处理。理。v 空间数据仓库的概念和内涵空间数据仓库的概念和内涵10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第15页,共83页SDWSDW支支持持多多种种数数据据源源:数数据据库库、数数据据文文件件、应应用用程序等;程序等;SDWSDW中中存存放放的的不不仅仅是是供供使使用用的的数数据据,还还有有在在一一定定激激发发条条件件下下能能主主动动其其作作用用的的处处理理规规则则、算算法法,甚甚至至是是过程过程等;等;SDWSDW中中数数据据并并不不完完全全是是原原始始数数据据的的简简单单归归并并和和搬搬家家,而而是是增增值值和和统统一一,因因此此,“汇汇总总并并统统一一”是是一一种种可可取的描述;取的描述;v 空间数据仓库的概念和内涵空间数据仓库的概念和内涵10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第16页,共83页数数据据的的集集成成化化表表明明数数据据在在结结构构上上具具有有综综合合性性,并并且且在在语语言言上上是是异异构构的的,在在进进入入SDWSDW之之前前,必必须须经经过过加加工工和和集集成成,这是这是SDWSDW建设中最关键,最复杂的一步;建设中最关键,最复杂的一步;历历史史化化表表明明它它可可以以截截取取不不同同时时间间尺尺度度上上的的信信息息,从从瞬瞬态态到到区区段段直直到到全全体体。SDWSDW以以时时间间为为基基准准管管理理(积积累累,使用并处理)数据,即使依赖与时间维的数据结构;使用并处理)数据,即使依赖与时间维的数据结构;SDWSDW保保存存和和管管理理的的是是“对对象象”数数据据以以及及与与之之相相关关的的处处理理规规则则,算算法法和和过过程程等等的的统统一一体体,它它们们在在SDWSDW中中以以打打包包及及有有序序存存放放的的形形式式被被保保存存和和维维护护,且且需需要要即即可可使用。使用。v 空间数据仓库的概念和内涵空间数据仓库的概念和内涵10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第17页,共83页v 空空间间数数据据仓仓库库的的体体系系结结构构10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库空间数据仓库应用(空间决策支持系统等)空间数据仓库应用(空间决策支持系统等)分析结果分析结果联机分析处理联机分析处理数据挖掘数据挖掘数据仓库中信息数据仓库中信息多级存储策略多级存储策略数据库数据库空间数据库系统(数据管理部分)空间数据库系统(数据管理部分)SDBSDBSDB数据采集与输入系统(数据源部分)数据采集与输入系统(数据源部分)核心核心GIS数据数据政府统计政府统计数据数据市场经济市场经济数据数据土地利用土地利用数据数据分析工具分析工具数据转换数据转换数据输入数据输入决策运算决策运算MBKB空空间间数数据据仓仓库库现在学习的是第18页,共83页 空空间间数数据据仓仓库库机机制制的的研研究究围围绕绕空空间间数数据据仓仓库库的的实实际际应用需求,探索空间数据仓库的关键技术。应用需求,探索空间数据仓库的关键技术。(1 1)支支持持空空间间信信息息的的空空间间数数据据仓仓库库模模型型:空空间间数数据据仓仓库库的的数数据据模模型型是是普普通通数数据据仓仓库库的的数数据据模模型型的的有有效效扩扩充充,必必须须针针对对空空间信息的特点,对星型模型和雪花模型进行扩展。间信息的特点,对星型模型和雪花模型进行扩展。(2 2)支支持持空空间间数数据据导导航航的的元元数数据据机机制制:空空间间数数据据仓仓库库的的元元数数据据是是人人们们定定义义空空间间数数据据仓仓库库模模型型、理理解解空空间间数数据据意意义义的的重重要要窗窗口口,空空间间数数据据仓仓库库的的元元数数据据必必须须支支持持对对空空间间数数据据分析的导航。分析的导航。v 空间数据仓库的关键技术空间数据仓库的关键技术10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第19页,共83页(3 3)面面向向海海量量空空间间信信息息的的数数据据存存储储策策略略:空空间间数数据据仓仓库库包包含含海海量量的的空空间间信信息息。支支持持对对海海量量空空间间信信息息的的高高效效的的存存储储和和检检索索是是空空间间数数据据仓仓库库的的重重要要需需求求,也也是是空空间间数数据据仓仓库库的的重重要要特特征征。因因此此需需要要研研究究面面向向海量空间信息的数据存储策略。海量空间信息的数据存储策略。(4 4)面面向向海海量量空空间间信信息息高高效效检检索索的的空空间间索索引引机机制制:数数据据索索引引是是提提高高数数据据检检索索效效率率的的有有效效途途径径。由由于于空空间间数数据据仓仓库库中中涉涉及及海海量量的的空空间间信信息息,因因此此需需要要研研究究面向空间数据仓库的索引机制。面向空间数据仓库的索引机制。v 空间数据仓库的关键技术空间数据仓库的关键技术10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第20页,共83页(5 5)大大规规模模空空间间数数据据处处理理:由由于于空空间间数数据据所所包包含含的的数数据据量量比比较较大大,当当空空间间数数据据仓仓库库中中地地理理数数据据、元元数数据据以以及及历历史史数数据据的的数数据据量量急急速速增增长长时时数数据据的的存存储储和和管管理理机机制制的调整策略等问题需要更加深入的研究。的调整策略等问题需要更加深入的研究。(6 6)查查询询的的建建立立和和数数据据导导航航技技术术:空空间间数数据据的的查查询询通通常常比比较较复复杂杂,而而目目前前的的用用户户界界面面形形式式很很难难满满足足。必必须须为为空空间间数数据据仓仓库库数数据据查查询询的的输输入入以以及及数数据据查查询询的的建建立立提供一套合适的机制。提供一套合适的机制。(7 7)快速计算、高速网络、空间数据库的无缝连接、数据)快速计算、高速网络、空间数据库的无缝连接、数据挖掘、空间数据联机分析和处理及服务的互操作等关键技术。挖掘、空间数据联机分析和处理及服务的互操作等关键技术。v 空间数据仓库的关键技术空间数据仓库的关键技术10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第21页,共83页 目目前前国国外外数数据据仓仓库库以以及及空空间间数数据据仓仓库库方方面面的的主主要要工工作作基基 础础 有有 很很 多多。StanfordStanford大大 学学 的的 数数 据据 仓仓 库库WHIPS(WareHouse WHIPS(WareHouse Information Information Project Project at at Stanford)Stanford);美美 国国 正正 在在 启启 动动 一一 个个 空空 间间 信信 息息 处处 理理 项项 目目EOS(Earth EOS(Earth Overview Overview System)System),到到20032003年年,对对全全球球地地面面监监测测的的精精度度将将达达到到1 1米米的的分分辨辨率率,该该项项目目对对巩巩固固美美国国在在全全球球的的竞竞争争优优势势具具有有重重要要的的作作用用。该该项项目目的的主主要要组组成成部部分分之之一一就就是是空空间间数数据据的的联联机机分分析析与与挖挖掘掘技技术术的的研研究究;IBMIBM的的AlmendenAlmenden实实验验室室、北北美美和和德德国国的的一一些些公公司司、和和科科研研机机构的实验室在这个领域的研究中处于领先位置。构的实验室在这个领域的研究中处于领先位置。v 国内外研究现状国内外研究现状10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第22页,共83页 目目前前的的空空间间数数据据仓仓库库原原型型系系统统主主要要有有 :AMicrosoft AMicrosoft TerraServer TerraServer(由由Jim Jim GrayGray主主持持 ),GeoMinerGeoMiner(由由加加拿拿大大Simon FraserSimon Fraser大学开发)等。大学开发)等。在在国国内内,国国家家“九九五五”科科技技重重点点攻攻关关项项目目 “空空间间信信息息共共享享和和处处理理技技术术研研究究”专专题题项项目目已已取取得得阶阶段段成成果果,提提出出了了空空间间信信息息共共享享系系统统设设计计方方案案。视视觉觉与与听听觉觉信信息息处处理理国国家家重重点点实实验验室室开开放放课课题题基基金金项项目目“空空间间数数据据联联机机分分析析与与空空间间数数据据挖挖掘掘研研究究”,该该项项目目重重点点对对空空间间数数据据联联机机分分析析与与空空间间数数据据挖挖掘掘及及底底层层的的空空间间数数据据仓仓库技术作基础理论研究。库技术作基础理论研究。v 国内外研究现状国内外研究现状10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第23页,共83页(1 1)空空间间数数据据仓仓库库模模型型的的研研究究:空空间间数数据据面面向向主主题题的的集集成成的的一一个个关关键键步步骤骤是是空空间间数数据据仓仓库库的的建建模模。空空间间数数据据仓仓库库的的逻逻辑辑模模型型与与普普通通数数据据仓仓库库模模型型一一样样,通通常常采采用用类类似似的的多多维维模模型型。普普通通数数据据仓仓库库模模型型通通常常采采用用星星型型模模型型或或雪雪花花模模型型。与与普普通通数数据据仓仓库库模模型型相相比比,空空间间数数据据仓仓库库要要管管理理复复杂杂的的空空间间数数据据类类型型,其其维维和和度度量量中中不不仅仅可可以以包包含含简简单单数数据据类类型型的的数数据据,同同时时也也可可以以包包含含空空间间对对象象。由由于于空空间间对对象象占占用用的的存存储储空空间间较较大大,其其操操作作也也比比较较复复杂杂,这这就就需需要要扩扩充充维维和和度度量量的的定定义义,以以便便更更有有效效地处理这样的维和度量。地处理这样的维和度量。v 目前空间数据仓库主要研究内容目前空间数据仓库主要研究内容10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第24页,共83页(2 2)海量空间数据的存储:)海量空间数据的存储:空间数据仓库通常以空空间数据仓库通常以空间数据库为基础,由于空间数据仓库涉及海量的空间间数据库为基础,由于空间数据仓库涉及海量的空间信息,同时空间信息计算耗费的资源较多,确定空间信息,同时空间信息计算耗费的资源较多,确定空间信息的合理存储策略(如数据分片等),以便计算和信息的合理存储策略(如数据分片等),以便计算和显示,也是当前许多专家关注的焦点。显示,也是当前许多专家关注的焦点。v 目前空间数据仓库主要研究内容目前空间数据仓库主要研究内容10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第25页,共83页(3 3)异异构构空空间间数数据据源源的的有有效效集集成成:空空间间数数据据仓仓库库所所要要集集成成的的数数据据分分布布于于各各个个企企业业或或各各个个政政府府部部门门,这这些些数数据据源源通通常常具具有有不不同同的的数数据据格格式式;此此外外,空空间间数数据据的的表表示示、存存储储和和访访问问方方式式目目前前还还没没有有统统一一的的标标准准,空空间间数数据据的的语语义义也也往往往往比比较较复复杂杂。这这就就给给空空间间数数据据的的集集成成和和共共享享带带来来了了极极大大的的困困难难,如如何何实实现现空空间间数数据据的的有有效效集集成成是是国国内内外外空空间间数数据据仓仓库工程的一个重点和难点。库工程的一个重点和难点。v 目前空间数据仓库主要研究内容目前空间数据仓库主要研究内容10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第26页,共83页(4 4)空间数据仓库的索引机制:)空间数据仓库的索引机制:空间数据库的索空间数据库的索引方法主要包括:引方法主要包括:z-z-序索引、四叉树索引、序索引、四叉树索引、kd-kd-树索树索引、引、R R树索引、树索引、R+R+树索引等。由于空间数据仓库中的树索引等。由于空间数据仓库中的数据具有海量的、极少更新的、随时间变化的特点,其数据具有海量的、极少更新的、随时间变化的特点,其主要的操作是数据的追加和查询,因此要求针对空间数主要的操作是数据的追加和查询,因此要求针对空间数据仓库的特点设计更加合适的空间数据仓库索引机制是据仓库的特点设计更加合适的空间数据仓库索引机制是空间数据仓库机制的重要组成部分,也是目前许多专家空间数据仓库机制的重要组成部分,也是目前许多专家关注的焦点。关注的焦点。v 目前空间数据仓库主要研究内容目前空间数据仓库主要研究内容10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第27页,共83页(5)(5)空空间间数数据据仓仓库库元元数数据据机机制制:空空间间数数据据仓仓库库的的元元数数据据是是确确定定空空间间数数据据仓仓库库的的逻逻辑辑结结构构、存存储储策策略略的的重重要要组组成成部部分分。从从数数据据仓仓库库建建设设者者的的角角度度来来看看,空空间间数数据据仓仓库库元元数数据据是是数数据据仓仓库库的的描描述述,是是关关于于数数据据加加载载方方法法和和数数据据加加载载频频率率、数数据据存存储储和和应应用用的的描描述述信信息息。从用户的角度来看从用户的角度来看,它是用户理解和使用数据仓库的向导。,它是用户理解和使用数据仓库的向导。空空间间数数据据仓仓库库元元数数据据的的主主要要内内容容包包括括:数数据据仓仓库库的的描描述述信信息息、数数据据仓仓库库的的信信息息源源描描述述、数数据据转转换换方方法法描描述述信信息息、数数据据加加载载方方法法的的描描述述信信息息、业业务务术术语语的的定定义义、业业务务处处理理的的规规则则的的描描述述信信息息。因因此此要要求求建建立立合合理理的的空空间间数数据据仓仓库库元元数数据的机制,确保空间数据仓库的合理性和高可用性。据的机制,确保空间数据仓库的合理性和高可用性。v 目前空间数据仓库主要研究内容目前空间数据仓库主要研究内容10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第28页,共83页 按按照照关关系系数数据据库库之之父父.CoddCodd的的定定义义,OLAPOLAP是是大大量量多多维维数数据据的的动动态态综综合合(synthesissynthesis)、分分析析(analysisanalysis)与与合合并并(consolidationconsolidation),它它是是能能够够快快速速交交互互地地,方方便便地地获获取取它它们们所所需需信信息息的的一一些些技技术术(多多维维数数据据分分析析,神神经经网网络络等等)的的综综合合,它它通通过过快快速速、一一致致、交交互互地地访访问问各各种种可可能能的的信信息息,试试图图帮帮助助数数据据分分析析人人员员、管理人员、决策者洞察数据显示,掌握隐藏其中地规律。管理人员、决策者洞察数据显示,掌握隐藏其中地规律。v OLAP(联机处理分析联机处理分析)OLAP(Online Analysis Processing)OLAP(Online Analysis Processing)的概念的概念10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第29页,共83页 关关于于OLAPOLAP地地详详细细定定义义,CoddCodd曾曾给给出出了了十十二二条条准准则则,其其后后,还还对对其其进进行行了了扩扩充充。根根据据产产品品的的实实际际应应用用情情况况和和用用户户对对产产品品的的需需求求,人人们们提提出出了了一一种种对对更更简简单单明明确确的的定定义义,即即共共享享多多维维信信息息的的快快速速分分 析析(Fast(Fast Analysis Analysis of of Shared Shared Multidimensional Multidimensional InformationInformation,简称,简称FASMI)FASMI)。目目前前,常常见见的的OLAPOLAP有有基基于于多多维维数数据据库库的的MOLAPMOLAP(MultiMulti demention demention OLAPOLAP)、基基 于于 关关 系系 数数 据据 库库ROLAP(Relation ROLAP(Relation OLAP)OLAP)以以及及混混合合的的HOLAPHOLAP(Hybrid Hybrid OLAPOLAP)。)。v OLAP(联机处理分析联机处理分析)OLAPOLAP的概念的概念10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第30页,共83页 OLTPOLTP和和OLAPOLAP有有很很大大的的差差别别,在在传传统统的的OLTPOLTP技技术术中中,所所依依赖赖的的是是实实体体、联联系系、功功能能分分解解、状状态态转转换换分分析析和和事事务务处处理理等等概概念念和和方方法法;而而在在OLAPOLAP技技术术中中,主主要要使使用用的的是是事事实实表表、维维表表、层层次次(hierarchies)(hierarchies)、稀疏性稀疏性(sparsity)(sparsity)、指标聚集等概念和方法。、指标聚集等概念和方法。OLAPOLAP与与OLTPOLTP的区别的区别v OLAP(联机处理分析联机处理分析)10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第31页,共83页 OLAPOLAP与与OLTPOLTP的区别的区别v OLAP(联机处理分析联机处理分析)10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库OLTPOLAP时间时间短时间框架短时间框架长时间框架长时间框架状态状态迅速变化的迅速变化的静态的静态的数据类型数据类型细节的、操作性数据细节的、操作性数据综合的、提炼的分析性数据综合的、提炼的分析性数据查询查询标准的事务标准的事务随机的、动态的查询随机的、动态的查询稳定性稳定性实时更新实时更新周期性刷新周期性刷新功能功能支持日常操作支持日常操作支持管理要求支持管理要求设计设计事件驱动面向应用事件驱动面向应用数据驱动面向分析数据驱动面向分析现在学习的是第32页,共83页多维空间数据模型多维空间数据模型空间数据空间数据CubeCube的构造和维护的构造和维护 空间空间CubeCube数据的多维显示数据的多维显示 OLAPOLAP目前主要研究内容目前主要研究内容v OLAP(联机处理分析联机处理分析)10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第33页,共83页支持支持cubecube构造的多维数据存储模型;构造的多维数据存储模型;空间数据空间数据cubecube实例化视图选择方法研究;实例化视图选择方法研究;空间数据空间数据cubecube的构造算法;的构造算法;在二级存储中高效构造高维的在二级存储中高效构造高维的cubecube和空间数和空间数据据cubecube;OLAPOLAP关键技术关键技术v OLAP(联机处理分析联机处理分析)10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第34页,共83页 空空间间数数据据仓仓库库系系统统是是引引入入数数据据仓仓库库后后的的计计算算机机系系统统。其其目目标标是是支支持持用用户户利利用用存存储储地地信信息息进进行行分析、处理和决策。分析、处理和决策。空空间间数数据据仓仓库库由由四四部部分分组组成成:数数据据、计计算算机机硬件、软件、用户硬件、软件、用户 。v 空间数据仓库系统空间数据仓库系统10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第35页,共83页在在操操作作上上,GIS,GIS源源数数据据由由异异构构变变为为同同构构,消消除除了了数数据据模模型型及及语语法法、语语义义的的差差异异,数数据据库库可可直直接接被被DBMSDBMS访访问问,加加快快了了查查询询和和分分析析处处理理的的速速度度。访访问问仓仓库库的的数数据据不不需需要要占占用用信信息息源源的的系系统统资资源源,不不会会像像直直接接访访问问信信息息源源那那样增加开销。样增加开销。在在功功能能上上,除除了了便便于于管管理理、维维护护外外,GIS,GIS空空间间数数据据仓仓库库为为其其数数据据挖挖掘掘准准备备了了条条件件。如如果果数数据据挖挖掘掘技技术术利利用用得得当当,还还可可扩扩充充GISGIS的的功功能能,当当然然,数数据据仓仓库库及及其其技技术并未抛弃关系型数据库和术并未抛弃关系型数据库和DBMSDBMS的一系列功能。的一系列功能。v 使用空间数据仓库的优势使用空间数据仓库的优势10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第36页,共83页有望解决有望解决OPENGISOPENGIS在数据上不一致的问题。在数据上不一致的问题。具具有有明明显显的的社社会会意意义义,有有利利于于加加强强商商业业、资资源源、环环境境等等的的宏宏观观决决策策。可可以以说说,数数据据仓仓库库是是伴伴随随着着C/SC/S技技术术和和并并行行数数据据库库的的发发展展孕孕育育而而生生的的,大大型型GISGIS要要处处理理多多源源的的、多多变变量量的的、异异构构的的、海海量量的的地地理理数数据据,就就要要采采用用能能解解决决这这些些问问题题的的技技术术。数数据据仓仓库库技技术术可可以解决其中的一些问题。以解决其中的一些问题。v GIS中使用空间数据仓库的优势中使用空间数据仓库的优势10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第37页,共83页空间数据粒度的划分;空间数据粒度的划分;空间数据的分割(面向图幅、面向图层、空间数据的分割(面向图幅、面向图层、面面向专题要素向专题要素 ););空间元数据的设计、管理及其标准化。空间元数据的设计、管理及其标准化。v 开发数据仓库应注意的问题开发数据仓库应注意的问题10.1 10.1 数据仓库与空间数据仓库数据仓库与空间数据仓库现在学习的是第38页,共83页10.2 10.2 空间数据基础设施空间数据基础设施空间信息基础设施的定义空间信息基础设施的定义 空间信息基础设施的目标空间信息基础设施的目标 空间信息基础设施组成空间信息基础设施组成 空间信息基础设施体系结构空间信息基础设施体系结构 NII&NSIINII&NSIISDW&NSIISDW&NSII 现在学习的是第39页,共83页 美美国国于于年年颁颁布布了了总总统统行行政政令令,实实施施国国家家空空间间数数据据基础设施计划。基础设施计划。国国家家空空间间信信息息基基础础设设施施(National(National Spatial Spatial Information Information InfrastructureInfrastructure,简简称称)的的定定义义为为:“一一个个国国家家内内描描述述地地球球上上地地理理要要素素和和现现象象的的分分布布及及其其属属性性的的所所有有地地理理信信息息的的组组合合,以以及及对对这这些些信信息息的的获获取取、处处理理、存存储储、分分发发和和提提高高使使用用所所需需的的技技术术、政政策策、标标准准和和人人力力资资源源”。是是为为使使用用、生生产产和和管管理理与与地地理理空空间间信信息息有有关关的的社社会会各各部部门门以以及及个个人人提提供供基基础础信信息息环环境境和和支支持持,是国家信息基础设施的子集。是国家信息基础设施的子集。一、国家空间信息基础设施定义一、国家空间信息基础设施定义10.2 10.2 空间数据基础设施空间数据基础设施现在学习的是第40页,共83页 在在今今天天的的信信息息社社会会和和网网络络环环境境下下,它它是是一一个个分分布布式式异异构构的的地地理理空空间间信信息息资资源源网网络络。空空间间信信息息基基础础设设施施的的体体系结构是实施地理空间信息基础设施概念的逻辑模型。系结构是实施地理空间信息基础设施概念的逻辑模型。空空间间信信息息基基础础设设施施在在区区域域层层次次上上分分为为全全球球空空间间信信息息基基础础设设施施()、区区域域空空间间信信息息基基础础设设施施()和国家空间信息基础设施(和国家空间信息基础设施(NSIINSII)。)。一、国家空间信息基础设施定义一、国家空间信息基础设施定义10.2 10.2 空间数据基础设施空间数据基础设施现在学习的是第41页,共83页空空间间信信息息具具有有区区域域性性、综综合合性性和和共共享享性性,NSIINSII旨旨在在建建立立作作为为各各部部门门共共同同使使用用的的基基础础信信息息,避避免免部部门门重重复复建建设设问问题题,提提高高信信息息标标准准化化程程度度,为为信信息息共共享享和和网络上的协作扫除障碍。网络上的协作扫除障碍。空空间间信信息息基基础础设设施施的的目目标标是是建建立立、维维护护和和使使用用一一个个空空间间信信息息框框架架。空空间间信信息息框框架架包包括括两两方方面面的的内内容容:一一是是空空间间信信息息内内容容,即即框框架架的的基基础础空空间间数数据据和和专专题题数数据据;二二是是空空间间信信息息服服务务,即即提提供供对对空空间间信信息息的的共享、集成和互操作的功能和接口。共享、集成和互操作的功能和接口。二、二、NSII的目标的目标10.2 10.2 空间数据基础设施空间数据基础设施现在学习的是第42页,共83页空空间间信信息息基基础础设设施施提提供供两两种种服服务务:一一是是为为广广大大社社会会群群众众提提供供普普通通服服务务,回回答答普普通通群群众众关关心心的的环环境境、交交通通、旅旅游游、新新闻闻、房房地地产产、商商业业、公公共共设设施施建建设设以以及及其其它它社社会会问问题题,用用户户通通过过简简单单的的个个人人计计算算机机浏浏览览界界面面,查查询询空空间间信信息息;二二是是为为各各个个专专用用部部门门的的特特殊殊应应用用服服务务,包包括括资资源源开开发发、环环境境管管理理、生生态态监监测测、区区域域规规划划等等制制图图和和空空间间分分析析,并并为为可可持持续续发发展展提提供供信信息息和和决决策策支持。支持。二、二、NSI