空间数据仓库PPT讲稿.ppt
《空间数据仓库PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《空间数据仓库PPT讲稿.ppt(26页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、空间数据仓库第1页,共26页,编辑于2022年,星期日1.空间数据仓库的概况1.1 空间数据仓库的基本概念 数据库的创始人W.H.Inmon定义数据仓库为支持管理的、决策过程的、面向主题的、集成的、稳定的、不同时间的数据集合。空间数据仓库是建立在传统的数据库基础上,依靠数据库实现对数据的高效存储,二者之间的区别在于其应用不同。因此,在数据组织、集成上有很大的差别:空间数据库作为源数据库负责数据的日常处理及一般的空间分析功能;空间数据仓库根据用户的要求对空间数据库中分散的、多源的空间数据进行集成和分析,截取不同时段上的信息,将数据的时间属性和空间属性紧密地结合起来,通过模型构建分析和比较,进行数
2、据挖掘发现隐藏在数据中的信息,从而为用户提供决策服务.第2页,共26页,编辑于2022年,星期日1.2 空间数据仓库的功能及特征 从组成上,空间数据仓库有三方面的功能:从分散、独立的空间数据库中获取空间数据,即数据ETL,包括数据抽取(extract)、转换(transform)、清洗(cleaning)、装载(loading),建立空间数据仓库;对数据的存储、管理和检索;数据集成及数据挖掘.空间数据仓库相比于空间数据库有以下特征1.2.1空间数据仓库是面向主题的 传统的GIS数据库是面向对象的,根据应用对数据进行组织,空间数据仓库是面向主题的,在空间数据库的基础上进行更高层次的数据组织和分析
3、。第3页,共26页,编辑于2022年,星期日1.2.2 空间数据仓库是集成的 空间数据仓库建立在GIS数据库的基础上,在进行决策时利用元数据对空间数据库里的地理空间数据进行抽取、转换,从而得到有用的的信息,把空间数据库中面向对象的数据转向面向主题的数据,实现决策支持。1.2.3 引用时间维 在进行趋势分析时需要对关于主题的各时期的空间数据进行概括总结、分析,空间仓库引进时间维把不同历史时期的空间数据组织到一起,使数据具有时间属性.1.2.4 空间方位的引入 在进行趋势分析时需要对关于主题的各时期的空间数据进行概括总结、分析,空间仓库引进时间维把不同历史时期的空间数据组织到一起,使数据具有时间属
4、性.第4页,共26页,编辑于2022年,星期日1.3 空间数据仓库的体系结构 空间数据仓库是存储、管理空间数据的一种组织形式,其物理实质仍是对数据的高效存储系统,由于使用目的不同,其存储的数据在量和质以及前端分析工具上与传统GIS应用系统有所不同。空间数据仓库按照功能划分为以下几部分:元数据、源数据、数据变换工具、空间数据仓库、客户端分析工具。第5页,共26页,编辑于2022年,星期日1.3.1 元数据 空间数据仓库的元数据是指描述空间数据的数据,它是数据仓库管理手段之一,也是空间数据交换的基础,是空间数据标准化与质量的保证。在空间数据仓库中,元数据可以分为两类,一类是管理元数据(Admini
5、strativeMetadata),它是对源数据及其内容、数据仓库主题、数据转换及各种操作信息的描述;另一类是用户元数据(User Metadata)它帮助用户查询信息、理解结果、了解数据仓库中的数据的组织方式等。在数据传输、信息共享、大力发展互操作的今天,元数据标准化是必小可少的,一定要借鉴和使用ISO制定的元数据标准。第6页,共26页,编辑于2022年,星期日1.3.2 源数据 空间数据仓库为了支持高层次的决策分析需要大量的数据。这些数据分布在小同的地理信息系统或其他信息系统中的应用系统数据,它们存贮在不同的平台和一般的数据库中。数据的来源丰富,类型多样式存储或分布式存储。第7页,共26页
6、,编辑于2022年,星期日1.3.3数据变换工具 为了优化空间数据仓库的分析性能,源数据必须经过变换以最适宜的方式进入空间数据仓库。变换主要包括提炼、转换、空间变换。数据提炼主要指数据的抽取,如数据项的重构、删迭不需要的运行信息、字段值的解码和翻译、补充缺漏的信息、检查数据的完整性和相容性等;数据转换主要指统一数据编码和数据结构、给数据加上时间标志、根据需要对数据集进行各种运算以及语义转换等;空间变换主要指空间坐标和比例尺的统一、赋予一般数据空间属性。数据转换工具为数据库和空间数据仓库之间架起了一座桥梁,使源数据得到了增值和统一,最大限度地满足了空间数据仓库高层次决策分析的需要。第8页,共26
7、页,编辑于2022年,星期日1.3.4 空间数据仓库 源数据经过变换进入空间数据仓库。空间数据仓库以多维方式来组织数据和显示数据。维是人们观察现实世界的角度,但多维数据库中的维并小是随意定义的,它是一种高层次的类型划分。为了获得较高的系统性能,维屏蔽掉了许多原始数据,决策分析所需的综介数据预先已被统计出来放在其中。主题维、时间维、空间维、非空间维是空间数据仓库最基本的组织方式。空间维和时间维是空间数据仓库反映现实世界动态变化的基础,它们的数据组织方式是整个空间数据仓库技术的关键。空间数据仓库的数据存储方式可分为虚拟存储方式、基于关系表的存储方式和多维数据库存储方式。基于关系表的数据模型主要有星
8、形模型,雪花模型和混介模型。多维数据库数据模型主要是超立方体结构模型。第9页,共26页,编辑于2022年,星期日1.4 空间数据仓库的建模1.4.1 多维数据模型选择 多维数据模型是资源环境空间数据仓库进行联机分析处理或多维分析的基础,维是观察问题的角度,通过多维模型可以对观察对象(某一主题)的不同侧而不同层次上进行分析。数据模式主要有:星型模式、雪花模式、混介模式和多维数据库模式。山于星型/雪花模式能够提供简洁和有组织的数据仓库结构,并且支持OLAP操作,因此在空间数据仓库的建模中,仍可沿用其基本框架。相比之下,星型结构更为简洁、便于OLAP操作、并易于浏览,较雪花结构来讲更适介于空间数据仓
9、库的建模。第10页,共26页,编辑于2022年,星期日1.4.2 维的建模 在空间数据仓库中司建立三种类型的维:非空间维,仅仅包含非空间数据的维,其泛化值也是非空间的。空间非空间维,这种类型的维的特点是在原始概念层次上是空间数据,但其泛化值在较高的层次上即变成非空间的数据。例如,在土地利用时空分布研究中,各种土地类型在云南省地图上的分布是用空间数据来表达的,而这些土地类型数据可以泛化为一些非空间的值,比如泛化为市一级行政区所包含的土地类型而积,其更高层次的泛化伯则全部变为非空间的数据,这种类型的维与非空间维所起的作用类似。空高层次的泛化数据都是空间数据。例如各中土地类型的精确分布情况及其泛化数
10、据,如土地利用类型在全省范围的精确分布图形数据。第11页,共26页,编辑于2022年,星期日1.4.3 度量的建模 在空间数据仓库中可建立两种类型的度量:数值型度量,仅仅包含数值型数据的度量。数值型度量可以进一步分为分布的、代数的和整体的。如果一个度量能用立方体分割和分布式聚介计算,那么它就是分布的,如count、sum、max如果一个度量能用分布式度量的代数操作运算,那么它就是代数的,如average、standard、deviation;如果一个度量,用于描述其子聚介的有储空间的大小没有常数约束,那么它就是全局的,如median、most frequent、rank空间度量,空间度量包含指
11、向空间对象指针集合。例如,在泛化操作中,相同的单元,这样形成的度量包含这些区域的指针的集合。第12页,共26页,编辑于2022年,星期日1.5 空间数据仓库的结构框架 空间数据仓库是在GIS空间数据库的基础上,利用数据库技术、元数据技术、网络技术对海量地理空间数据进行集成、管理、查询分析、分发及应用,空间数据仓库的总体框架如图1所示(其中实线框架内为空间数据仓库系统的研究内容,虚线框架内为其它系统的研究内容)。第13页,共26页,编辑于2022年,星期日 地理空间数据库位于空间数据仓库的最底层,这些数据可能来自不同单位,表示不同时期由不同软件系统管理,它们相互独立,形成各式各样的异构数据,成为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 空间 数据仓库 PPT 讲稿
限制150内