空间数据挖掘与GIS的集成课件.pptx





《空间数据挖掘与GIS的集成课件.pptx》由会员分享,可在线阅读,更多相关《空间数据挖掘与GIS的集成课件.pptx(32页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2022年4月18日星期一1第六章第六章 空间知识与空间知识与GISGIS的集成的集成 nSK与GIS集成的意义 n空间数据挖掘基础n空间数据泛化在GIS中的应用n空间规则与GIS的集成n空间分类、聚类方法n空间挖掘的其他问题n空间数据挖掘原型系统介绍n其他日益发展的空间数据基础设施为空间数据的自动化处理提出了新的课题。空间数据库,不同于关系数据库,它一般具有空间拓扑或距离信息,通常需要以复杂的多维空间索引结构组织。空间挖掘(Spatial Mining)或被称作空间数据挖掘/空间数据库的知识发现,是数据挖掘技术在空间数据方面的应用。简言之,空间数据挖掘,就是从空间数据库中抽取隐含的知识、空间
2、关系或非显式地存储在空间数据库中的其他模式,用于理解空间数据、发现数据间(空间或非空间)的关系。由于空间数据的复杂性及其应用的专业性,在一般的数据挖掘的基本概念的基础上,需要研究空间数据挖掘特有的理论、方法和应用。2022年4月18日星期一22022年4月18日星期一3第八章第八章 空间知识与空间知识与GISGIS的集成的集成 内容提要内容提要nSK与GIS集成的意义 n空间数据挖掘基础n空间数据泛化在GIS中的应用n空间规则与GIS的集成n空间分类、聚类方法n空间挖掘的其他问题n空间数据挖掘原型系统介绍n其他两个空间实体之间存在若干拓扑关系。这些关系基于两个实体的位置:分离(Disjoint
3、) :A与B分离,表示B中任何点都不在A中,反之亦然。重叠/相交: A与B重叠或相交表示至少有一个点既在A里也在B里。等价: A与B这两个实体的所有点都是共有的。包含于: A包含于B,表示A的所有点都在B里。反之不一定。覆盖/包含: A覆盖或包含B,当且仅当B包含于A。根据实体在空间中的位置,可以定义方向,通常采用的是传统的地图方向:像东、南、西、北等等。空间谓词有三种形式:表示拓扑关系的谓词,如相交、覆盖等;表示空间方向的谓词,如东、西、左、右等;表示距离的谓词,如接近、远离等。2022年4月18日星期一4常用的两个空间实体之间的距离有:最小值方法:最小值方法:定义实体A和B的距离为A中的所
4、有点与和B中的所有点之间的欧氏或曼哈顿距离中最小的,即最大值方法:最大值方法:定义实体A和B的距离为A中的所有点与和B中的所有点之间的欧氏或曼哈顿距离中最大的,即平均值方法:平均值方法:定义实体A和B的距离为A中的所有点与和B中的所有点之间的欧氏或曼哈顿距离的平均值,即中心方法:中心方法:定义实体A和B的距离为A中的中心点与和B中的中心点之间的欧氏或曼哈顿距离的平均值,即),(),(min),(),( ,),(bbaaByxAyxyxyxdisBAdisbbaa),(),(max),(),( ,),(bbaaByxAyxyxyxdisBAdisbbaa2022年4月18日星期一5),(),()
5、,(),( ,),(bbaaByxAyxyxyxdisaverageBAdisbbaa),(),(),(cbcbcacayxyxdisBAdis空间统计学(Spatial Statistics)是依靠有序的模型来描述无序事件,根据不确定性和有限的信息来分析、评价和预测空间数据。空间统计学是基本的数据挖掘技术,特别是多元统计分析(如判别分析、主成分分析、因子分析、相关分析、多元回归分析等)。在空间数据库中许多空间数据通常是相关的,即空间对象受其邻近对象的影响,它是空间统计学向着实用的挖掘技术发展的一个重要研究课题。数理统计方法对非线性规划不能很好建模,难以处理不完全或不确定性数据,而且运算的代价
6、较高。它是空间统计学向着实用的挖掘技术发展的另一个研究课题。2022年4月18日星期一62022年4月18日星期一7第八章第八章 空间知识与空间知识与GISGIS的集成的集成 内容提要内容提要nSK与GIS集成的意义 n空间数据挖掘基础n空间数据泛化在GIS中的应用n空间规则与GIS的集成n空间分类、聚类方法n空间挖掘的其他问题n空间数据挖掘原型系统介绍n其他概念层次的使用显示了数据间关系的层次。应用空间数据特性,概念层次承认了层级中不同层次规则和关系的发展。从空间数据中挖掘所蕴含的概念是空间挖掘的重要任务之一。泛化与特化是概念归纳的主要手段,它对空间数据挖掘也是如此。2022年4月18日星期
7、一8逐步求精(Progressive Refinement)的分层是基于空间关系的,因此空间关系可以应用在一个更粗糙或者更精细的层次上。由于空间应用的数据量十分庞大,在寻求更多精确响应之前要先做出一些近似响应。MBR就是一个近似物体形状的办法。四叉树、R-树和其他大多数空间索引技术都采用了一种逐步求精的方式。逐步求精可以看作是对处理问题无用的数据所做的过滤。2022年4月18日星期一9数据库中的数据和对象在原始的概念层次包含有详细的信息,经常需要将大量数据的集合进行概括并以较高的概念层次展示,即对数据进行泛化。基于泛化的数据挖掘方法假定背景知识以概念层次的形式存在。概念层次可由专家提供,或借助
8、数据分析自动生成。空间数据库中可以定义两种类型的概念层次:空间概念层:地理区域之间空间关系的概念层次。非空间概念层:非空间属性所联系的非空间数据对应的概念层次。2022年4月18日星期一10首先对非空间属性作面向属性的归纳,将其泛化至更高的概念层次。对空间数据进行归纳:归纳进行至区域的数量达到阈值为止。然后对相关的非空间属性做相应地更改。将具有相同的泛化属性值的相邻区域合并在一起,可用邻近方法忽略具有不同非空间描述的小区域。例如,要知道我国西北部地区的平均降雨量,可以在空间层次中寻找西北部所有省,再对非空间属性(降雨量)进行比较,或者归纳(平均降雨量多、中等、少量等)。2022年4月18日星期
9、一11统计学信息网格方法(STatistical INformation Grid-based methodSTING),使用了一种类似四叉树的分层技术,把空间区域分成矩形单元。对空间数据库扫描一次,可以找到每个单元的统计参数(平均数,变化性,分布类型)。网格结构中的每个结点概括了该网格中所含内部属性的信息。STING方法可以看作是一种层次聚类技术。层级的顶层的组成就是整体空间。最低层是代表每个最小单元的叶子结点。如果使用一个单元在下一层中拥有四个子单元(网格)的话,单元的分割与四叉树中是一样的。2022年4月18日星期一122022年4月18日星期一13第八章第八章 空间知识与空间知识与GI
10、SGIS的集成的集成 内容提要内容提要nSK与GIS集成的意义 n空间数据挖掘基础n空间数据泛化在GIS中的应用n空间规则与GIS的集成n空间分类、聚类方法n空间挖掘的其他问题n空间数据挖掘原型系统介绍n其他空间规则可以概括对空间实体的结构及其之间关系的描述。在空间数据挖掘中有三种类型的规则:空间特性规则:描述数据,如:中国东部人均年收入约5万元。空间判别规则:描述不同种类数据间的差异,依靠它们能够区分不同种类的特点。如:中国东部人均收入高于中国西部。空间关联规则:是两个数据集合之间的关联。如越靠近市中心区的房价越高。所有这些规则都可以被看作是对空间类型的描述,而描述是一种为数据库或者其中一些
11、子集找到一个表示的方法。特性规则是一种最简化的形式。2022年4月18日星期一14空间关联规则挖掘是传统关联规则挖掘的延伸,常用最小支持度和最小可信度来作为基本的统计参数,由于空间数据的特点,往往是在多层概念上进行归纳。空间关联规则是空间数据实体之间的关联,有:非空间的先决条件和空间性的结果:如所有的重点学校都是位于老住宅区附近。空间性先决条件和非空间的结果:如在市中心的房价就比较贵。空间性先决条件和空间性结果:如在化工厂都分布市郊。挖掘空间关联规则的有效方法是自上而下、逐步加深的搜索技术,在空间数据库的概念中搜索频繁模式。2022年4月18日星期一152022年4月18日星期一16第八章第八
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 空间 数据 挖掘 GIS 集成 课件

限制150内