《空间数据仓库优秀PPT.ppt》由会员分享,可在线阅读,更多相关《空间数据仓库优秀PPT.ppt(26页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、空间数据仓库现在学习的是第1页,共26页1.空间数据仓库的概况1.1 空间数据仓库的基本概念 数据库的创始人W.H.Inmon定义数据仓库为支持管理的、决策过程的、面向主题的、集成的、稳定的、不同时间的数据集合。空间数据仓库是建立在传统的数据库基础上,依靠数据库实现对数据的高效存储,二者之间的区别在于其应用不同。因此,在数据组织、集成上有很大的差别:空间数据库作为源数据库负责数据的日常处理及一般的空间分析功能;空间数据仓库根据用户的要求对空间数据库中分散的、多源的空间数据进行集成和分析,截取不同时段上的信息,将数据的时间属性和空间属性紧密地结合起来,通过模型构建分析和比较,进行数据挖掘发现隐藏
2、在数据中的信息,从而为用户提供决策服务.现在学习的是第2页,共26页1.2 空间数据仓库的功能及特征 从组成上,空间数据仓库有三方面的功能:从分散、独立的空间数据库中获取空间数据,即数据ETL,包括数据抽取(extract)、转换(transform)、清洗(cleaning)、装载(loading),建立空间数据仓库;对数据的存储、管理和检索;数据集成及数据挖掘.空间数据仓库相比于空间数据库有以下特征1.2.1空间数据仓库是面向主题的 传统的GIS数据库是面向对象的,根据应用对数据进行组织,空间数据仓库是面向主题的,在空间数据库的基础上进行更高层次的数据组织和分析。现在学习的是第3页,共26
3、页1.2.2 空间数据仓库是集成的 空间数据仓库建立在GIS数据库的基础上,在进行决策时利用元数据对空间数据库里的地理空间数据进行抽取、转换,从而得到有用的的信息,把空间数据库中面向对象的数据转向面向主题的数据,实现决策支持。1.2.3 引用时间维 在进行趋势分析时需要对关于主题的各时期的空间数据进行概括总结、分析,空间仓库引进时间维把不同历史时期的空间数据组织到一起,使数据具有时间属性.1.2.4 空间方位的引入 在进行趋势分析时需要对关于主题的各时期的空间数据进行概括总结、分析,空间仓库引进时间维把不同历史时期的空间数据组织到一起,使数据具有时间属性.现在学习的是第4页,共26页1.3 空
4、间数据仓库的体系结构 空间数据仓库是存储、管理空间数据的一种组织形式,其物理实质仍是对数据的高效存储系统,由于使用目的不同,其存储的数据在量和质以及前端分析工具上与传统GIS应用系统有所不同。空间数据仓库按照功能划分为以下几部分:元数据、源数据、数据变换工具、空间数据仓库、客户端分析工具。现在学习的是第5页,共26页1.3.1 元数据 空间数据仓库的元数据是指描述空间数据的数据,它是数据仓库管理手段之一,也是空间数据交换的基础,是空间数据标准化与质量的保证。在空间数据仓库中,元数据可以分为两类,一类是管理元数据(AdministrativeMetadata),它是对源数据及其内容、数据仓库主题
5、、数据转换及各种操作信息的描述;另一类是用户元数据(User Metadata)它帮助用户查询信息、理解结果、了解数据仓库中的数据的组织方式等。在数据传输、信息共享、大力发展互操作的今天,元数据标准化是必小可少的,一定要借鉴和使用ISO制定的元数据标准。现在学习的是第6页,共26页1.3.2 源数据 空间数据仓库为了支持高层次的决策分析需要大量的数据。这些数据分布在小同的地理信息系统或其他信息系统中的应用系统数据,它们存贮在不同的平台和一般的数据库中。数据的来源丰富,类型多样式存储或分布式存储。现在学习的是第7页,共26页1.3.3数据变换工具 为了优化空间数据仓库的分析性能,源数据必须经过变
6、换以最适宜的方式进入空间数据仓库。变换主要包括提炼、转换、空间变换。数据提炼主要指数据的抽取,如数据项的重构、删迭不需要的运行信息、字段值的解码和翻译、补充缺漏的信息、检查数据的完整性和相容性等;数据转换主要指统一数据编码和数据结构、给数据加上时间标志、根据需要对数据集进行各种运算以及语义转换等;空间变换主要指空间坐标和比例尺的统一、赋予一般数据空间属性。数据转换工具为数据库和空间数据仓库之间架起了一座桥梁,使源数据得到了增值和统一,最大限度地满足了空间数据仓库高层次决策分析的需要。现在学习的是第8页,共26页1.3.4 空间数据仓库 源数据经过变换进入空间数据仓库。空间数据仓库以多维方式来组
7、织数据和显示数据。维是人们观察现实世界的角度,但多维数据库中的维并小是随意定义的,它是一种高层次的类型划分。为了获得较高的系统性能,维屏蔽掉了许多原始数据,决策分析所需的综介数据预先已被统计出来放在其中。主题维、时间维、空间维、非空间维是空间数据仓库最基本的组织方式。空间维和时间维是空间数据仓库反映现实世界动态变化的基础,它们的数据组织方式是整个空间数据仓库技术的关键。空间数据仓库的数据存储方式可分为虚拟存储方式、基于关系表的存储方式和多维数据库存储方式。基于关系表的数据模型主要有星形模型,雪花模型和混介模型。多维数据库数据模型主要是超立方体结构模型。现在学习的是第9页,共26页1.4 空间数
8、据仓库的建模1.4.1 多维数据模型选择 多维数据模型是资源环境空间数据仓库进行联机分析处理或多维分析的基础,维是观察问题的角度,通过多维模型可以对观察对象(某一主题)的不同侧而不同层次上进行分析。数据模式主要有:星型模式、雪花模式、混介模式和多维数据库模式。山于星型/雪花模式能够提供简洁和有组织的数据仓库结构,并且支持OLAP操作,因此在空间数据仓库的建模中,仍可沿用其基本框架。相比之下,星型结构更为简洁、便于OLAP操作、并易于浏览,较雪花结构来讲更适介于空间数据仓库的建模。现在学习的是第10页,共26页1.4.2 维的建模 在空间数据仓库中司建立三种类型的维:非空间维,仅仅包含非空间数据
9、的维,其泛化值也是非空间的。空间非空间维,这种类型的维的特点是在原始概念层次上是空间数据,但其泛化值在较高的层次上即变成非空间的数据。例如,在土地利用时空分布研究中,各种土地类型在云南省地图上的分布是用空间数据来表达的,而这些土地类型数据可以泛化为一些非空间的值,比如泛化为市一级行政区所包含的土地类型而积,其更高层次的泛化伯则全部变为非空间的数据,这种类型的维与非空间维所起的作用类似。空高层次的泛化数据都是空间数据。例如各中土地类型的精确分布情况及其泛化数据,如土地利用类型在全省范围的精确分布图形数据。现在学习的是第11页,共26页1.4.3 度量的建模 在空间数据仓库中可建立两种类型的度量:
10、数值型度量,仅仅包含数值型数据的度量。数值型度量可以进一步分为分布的、代数的和整体的。如果一个度量能用立方体分割和分布式聚介计算,那么它就是分布的,如count、sum、max如果一个度量能用分布式度量的代数操作运算,那么它就是代数的,如average、standard、deviation;如果一个度量,用于描述其子聚介的有储空间的大小没有常数约束,那么它就是全局的,如median、most frequent、rank空间度量,空间度量包含指向空间对象指针集合。例如,在泛化操作中,相同的单元,这样形成的度量包含这些区域的指针的集合。现在学习的是第12页,共26页1.5 空间数据仓库的结构框架
11、空间数据仓库是在GIS空间数据库的基础上,利用数据库技术、元数据技术、网络技术对海量地理空间数据进行集成、管理、查询分析、分发及应用,空间数据仓库的总体框架如图1所示(其中实线框架内为空间数据仓库系统的研究内容,虚线框架内为其它系统的研究内容)。现在学习的是第13页,共26页 地理空间数据库位于空间数据仓库的最底层,这些数据可能来自不同单位,表示不同时期由不同软件系统管理,它们相互独立,形成各式各样的异构数据,成为空间数据仓库的数据源.应用系统位于最顶层,它通过统一标准的数据接口提取地理空间数据为多种应用系统服务空间数据仓库系统位于中间层,它提取地理空间数据库中的数据,经过空间数据仓库进行数据
12、集成转换,为应用系统提供数据由此而看见空间数据仓库是一个多源数据共享、处理机制在网络技术、数据仓库技术日益成熟的今天,根据用户的不同需求,以空间数据仓库系统为平台,访问多个地理空间数据库,进行数据挖掘和GIS多维空间分析,为多种应用系统提供全面、科学、实用的决策支持。现在学习的是第14页,共26页2.空间数据仓库研究中主要研究方向 根据空间数据仓库的总体框架,目前空间数据仓库研究的重点有:空间数据的ETL、空间数据仓库元数据管理、GIS多维空间分析三方面.ETL是指从源系统中提取数据,转换数据为一个标准的格式,加载数据到目标数据存储区,是空间数据仓库的构建过程中不可避免的问题,可以有以下两种解
13、决方案:一是把数据源中的数据分为空间数据、多种数据库数据、XML文档数据花种形式,分别设计数据转换工ETL转换工具基于特定的软件,结合具体情况进行空间数据的集成转化.前一种方法需要对数据进行分别具;一是借助元数据管理、开发专用的现在学习的是第15页,共26页 前一种方法需要对数据进行分别具;一是借助元数据管理、开发专用的处理,在加载过程中要求空间数据仓库系统的储存、更新、管理数据效率较高;后一种方法由于引入元数据管理,对数据的要求比较高,在实施时劳动强度比较大,可引人智能技术,提高空间数据ETL自动化和分析集成的水平.介于元数据在GIS中的重要地位,后一种实现方法的前景是比较诱人的,这是因为元
14、数据是用来描述地理空间数据集的内容、质量、状态等其他特性的数据,它们在实现地理空间数据仓库的过程中起着重要的作用:指示空间数据仓库如何从多个地理信息数据库中提取出数据种类、数据标准等方面不同的地理空间数据;指示应用系统如何从空间数据仓库中提取出标准的集成的地理空间数据.为用户提供地理空间数据产品服务等.现在学习的是第16页,共26页 目前对空间数据仓库元数据的研究主要集中在地理空间数据元数据的研究上.国际上有三个组织对地理空间数据元数据标准进行了大量的研究,这三个组织分别是:美国联邦地理数据委员会(FGDC)、欧洲地理信息标准化委员会(CEN/TC287)以及国际标准化组织(ISO)地理信息/
15、地球信息业技术委员会(ISO/TV211).在国内有中国可持续发展信息共享元数据标准、NREDIS信息共享元数据内容标准等.但对空间数据仓库元数据的研究还是一片空白,当前可见的是武汉大学昊金华提出的空间数据仓库元数据的研究.现在学习的是第17页,共26页 GIS因为其空间分析功能而逐渐发展起来.但随着空间分析功能的深人研究,对空间数据的时间维、专题维的考虑日益成为GIS空间分析的重点,在空间数据仓库中引人时间信息维、专题信息维,可以大大提高了GIS空间分析的能力.目前国外提出空间数据立方体(SOLAP)技术,将来自不同领域的地理空间信息、专题信息1、专题信息2,专题信息n、时间信息按维的形式组
16、成一个易理解的超数据立方体.用地理空间维、专题维、时间维来描述空间对象,通过维的不同操作可产生不同的空间分析结果,以满足多维空间分析和概括的需求,实现GIS多维空间信息分析功能,进一步为用户提供决策支持,这无疑为GIS的发展提供了更为广阔的空间.大大的拓宽了GIS的应用范围.现在学习的是第18页,共26页3.空间数据仓库的应用实例一、澜沧江流域水资源空间数据仓库设计及实现 1.空间数据仓库体系框架设计 澜沧江流域水资源空间数据仓库体系结构由数据源、数据转换、空间数据仓库和客户端分析工具四个部分组成。集成器对来自各种异构数据源数据进行抽取、清洗和转换后,数据信息进入统一空间数据库管理平台,通过主
17、题的确定,建立空间数据立方体模型结构,形成空间数据仓库。最后,对多维数据进行多维分析及数据挖掘,并进行可视化处理。现在学习的是第19页,共26页2.空间数据仓库实现关键技术2.1 数据源 澜沧江流域数据信息形式多样,从地域单元上分成项目区、地区、县、乡四级;从数据类型上包括图形数据、图象数据、专题GIS数据、统计数据和成果图象数据五类。由于数据来自不同的GIS应用平台及数据库管理系统,如何将它们高效地集成起来是构建空间数据仓库的关键。为此,对数据信息的集成采取同类信息集成、异类信息集成两种方式。现在学习的是第20页,共26页同类信息集成 同类信息集成指对来源不同、格式各异的澜沧江区域多源数据,
18、包括属性数据、图形数据与图象数据,按类集成。它相当于对属性数据、图形数据及图象数据按类进行整理,解决数据格式异构性、主题异构性、语义异构性、编码异构性、投影参考坐标系异构性等一系列同类信息异构性问题。异类信息集成 异类信息集成指对澜沧江区域不同种类的信息进行集成,其关键是如何在各类数据信息之间建立起共同的识别字段。通过区域代码ID(国际码)作为属性数据、空间数据的识别字段,易于建立属性数据和空间数据两类数据间的关联现在学习的是第21页,共26页2.2 数据管理平台 由于RDBMS(关系型数据库管理系统)发展非常成熟,数据仓库普遍采用RDBMS来作为数据仓库的支持。对于空间数据仓库而言,由于空间
19、对象的引入,单纯的关系数据库是无法支持空间对象的存储和操作的,同时,为实现统一管理与主题相关的属性数据和图形、图象数据,采用了SQL Server(微软公司开发的一个关系数据库管理系统)关系数据库来管理属性数据,对于空间数据的存储管理,通过在SQL Server关系数据库上加载Mapinfo公司的Spatialware空间数据引擎构成空间数据库,解决了在关系数据库中存储连续、大型的空间数据的问题题,能够将传统文件格式存储的空间数据转移存储于空间数据库中,从而将属性数据和空间数据由同一数据库系统管理,便于空间信息的查询和操作。现在学习的是第22页,共26页2.3 空间数据仓库的建立 空间数据仓库
20、是建造立方体的基础,它的事实表和维表结构直接决定了立方体的结构。空间数据仓库的结构设计和传统数据仓库一样,通常采用星形模式和雪花模式。由于雪花模式难以理解,增加了查询的复杂度,所以采用了星形模式,针对一个主题,设计一个事实表和多个维度表。事实表反映了应用的主题,存储某一粒度级别的主题信息,维度表反映了用广分类主题信息的依据,存储主题信息的类别数据。在事实表和维度表确定之后,将事实表和维度表结构写入数据管理平台,通过提取和加载数据源数据,完成空间数据仓库的建立。现在学习的是第23页,共26页2.4 物理存储 空间数据仓库在物理存储上有MOLAP(多维数据库)和ROLAP(混合型数据库)两种选择,
21、这两种实现方法的优缺点与传统数据仓库的情况类似。由于空间数据的存储量大,采用ROLAP方式。现在学习的是第24页,共26页2.5 用户界面和查询工具 数据显示和查询工具是数据仓库及联机分析处理(OLAP)解决方案的重要组成部分,因为它们是最终用户直接接触的东酉。微软SQL Server Analysis Services集成了数据透视表服务.(PivotTable Server),它是一组实现将OLAP立方从OLAP服务器传递到客户端应用程序的工具,它可以将用户对立方体和聚集表查询得到的数据转化成用户界面元素。现在学习的是第25页,共26页4.结束语 总的来说空间数据仓库可以解决传统数据库无法解决的问题,有效地实现空间数据的深层次分析和挖掘,提供更为实用的决策服务.当前随着经济的发展,空间数据仓库被引用到农业、交通规划、城市规划等中,它的发展可以有力的支持数字城市、数字地球的建设,其发展前景广阔,但需要解决的问题仍相当多,需进行进一步的完善和发展.现在学习的是第26页,共26页
限制150内