第七章-空间数据分析课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第七章-空间数据分析课件.ppt》由会员分享,可在线阅读,更多相关《第七章-空间数据分析课件.ppt(96页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、分析技术分析技术: 空间图形数据的拓扑运算; 非空间属性数据运算; 空间和非空间数据的联合运算。 空间分析空间分析是综合分析空间数据的技术的通称。空间分析有着十分丰富的内涵,它是构成地理信息系统的核心部分之一,在整个地理数据的应用中发挥着举足轻重的作用,也是GIS区别与其它信息系统的一个显著标志。 空间分析主要获得空间位置及其属性描述两方面的信息。 主要目的:以空间数据库为基础解决用户的实际问题运用各种几何逻辑运算手段7.1 空间索引 在介绍空间索引之前,先谈谈什么叫“索引“。对一个数据集做”索引“,是为了提高对这个数据集检索的效率。书的”目录“就是这本书内容的”索引“,当我们拿到一本新书,想
2、查看感兴趣内容的时候,我们会先查看目录,确定感兴趣的内容会在哪些页里,直接翻到那些页,就OK了,而不是从第一章节开始翻,一个字一个字地找我们感兴趣的内容,直到找到为止,这种检索内容的效率也太低了,如果一本书没有目录,可以想象有多么不方便可见书的目录有多重要,索引有多重要。 现在大家对索引有了感性认识,那什么是“空间索引“呢?”空间索引“也是”索引“,是对空间图形集合做的一个”目录“,提高在这个图形集合中查找某个图形对象的效率。 目前,常见空间索引类型有BSPBSP树树,KKD DB B树,树,R R树树,R+R+树和树和CELLCELL树树,空间索引的性能的优越直接影响空间数据库和地理信息系统
3、的整体性能 空间索引类型R 树是基于磁盘的索引结构,是 B 树(一维)在高维空间的自然扩展,易于与现有数据库系统集成,能够支持各种类型的空间查询处理操作,在实践中 得到了广泛的应用,是目前最流行的空间索引方法之一。R 树索引比较适合静态数据,例如用作底图的数据和不经常编辑的数据(属性数据的编辑除外)推荐建立 R 树索引。R 树空间索引方法是通过设计虚拟的矩形目标,将一些空间位置相近的目标对象,包含在这个矩形内,如下面左图所示,把这些矩形作为空间索引的节点,它 含有所包含的空间对象的指针。例如,A 中包含空间对象 D、E、F,B 中包含空间对象 H、I、J、K,C 中包含空间对象 L、M。如下面
4、右图所示为 R 树索引的例子。 在进行空间检索的时候,首先判断哪些矩形落在检索窗口内,再进一步判断哪些目标是被检索的内容。这样可以提高检索速度。 特点特点 (1)R树索引的空间检索效率非常高,检索精度也很高。 (2)R树索引的索引数据和地理数据不存储在一起,且R树索引的更新涉及到R树的平衡和分裂,比较复杂,更新速度较慢,大规模编辑后的查询效率降低,需要重建空间索引,适用于只读数据或者不经常进行空间数据编辑的数据。 适用情况适用情况 R树索引比较适合静态数据,例如用作底图的数据和不常被编辑的数据(属性数据的编辑除外)推荐建立R树索引。四叉树是一种重要的层次化数据集结构,主要用来表达二维坐标下空间
5、层次关系,实际上它是一维二叉树在二维空间的扩展。其基本思路是:把整个工作空间编码为0,用水平线和 垂直线将工作空间划分为相等的四部分,各每一部分按顺序分别编码为00、01、02和03,左上角为00,右下角为03;对划分后的格子按照同样的方式继续划分,比如对第00格继续划分, 划分后的四个小格子分别编码为000、001、002和003。根据需要,还可以继续划分,比如第031格子继续划分为0310、0311、0312和0313,如下图所示。以此类推, 可以一直划分下去,划分的层数取决于研究区域对象的数量和平均大小。假设上图所示的对象为整个工作空间的对象,则根据这个工作空间建立的四叉树结构如下图所示
6、:现在在 SuperMap 中,四叉树最多允许分成13层。基于希尔伯(Hilbert)编码的排序规则,从四叉树中可确定索引类中每个对象实例的被索引属性值是 属于哪个最小范围。从而提高了检索效率。四叉树索引适用于小数据量的高并发编辑。 根据数据集的某一属性字段或根据给定的一个范围,将空间对象进行分类,通过索引进行管理已分类的空间对象,以此提高查询检索速度。 根据上述原理,创建图库索引有两种方式,根据字段索引或者根据范围索引。 字段索引:即根据数据集的某一属性字段将空间对象进行分类,通过索引进行管理已分类的空间对象,以此提高查询检索速度。建议使用与位置信息相关的字段进行图库索引的 创建,例如对于全
7、国县级行政区域图,可以使用表示行政区域代码的字段进行图库索引的创建。 范围索引:即根据给定的一个范围(图幅的长和宽)将空间对象进行分类,通过索引进行管理已分类的空间对象,以此提高查询检索速度。对于按标准比例尺分幅存储(如1:25万 数据、1:10万数据、1:5万数据等)的数据合并到数据库中后生成的数据集,范围索引有着优异的效果,可以提供非常好的查询性能。在海量数据(即对象数超过百万个的数据)的显示和查询时优势尤其明显。建立图库索引后,在显示的时候,只显示你需要查看的那一幅或几幅地图,大大缩短显示时间。如下图所示为根据给定范围进行图库索引的示例:图库索引示意图 特别地,图库索引还可以被缓存到本地
8、(以二进制文件形式体现),这样可更进一步提高查询检索的速度。 动态索引结合了 R 树索引与四叉树索引的优点,提供非常好的并发编辑支持,具有很好的普适性。若不能确定数据适用于哪种空间索引,推荐建立动态索引。 动态索引采用划分多层网格的方式来组织管理数据,它的基本方法是将数据集按照一定的规则划分成相等或不相等的网格,记录每一个地理对象所占的网格 位置。在GIS中常用的是规则网格。当用户进行空间查询时,首先计算出用户查询对象所在的网格,通过该网格快速查询所选地理对象。可以优化查询操作。动态索引示意图 特点特点 当数据集在进行浏览操作的时候,动态索引方式的速度会比较快; 索引更新和并发的能力好; 索引
9、的空间检索精度高,准确度高。 注意:此索引类型支持数据集的动态并发编辑。 适用情况适用情况 动态索引结合了R 树索引与四叉树索引的优点,提供非常好的并发编辑支持,具有很好的普适性。 若不能确定数据适用于哪种空间索引,推荐建立动态索引。 补充说明补充说明 建立动态索引后,用户可以按图幅进行本地缓存,可以大大提高查询和浏览的速度。 查询和定位空间对象,并对空间对象进行量查询和定位空间对象,并对空间对象进行量算是算是GIS的基本功能之一的基本功能之一,它是它是GIS进行高层次进行高层次分析的基础。在分析的基础。在GIS中,为进行高层次分析,往中,为进行高层次分析,往往需要查询定位空间对象,并用一些简
10、单的量测往需要查询定位空间对象,并用一些简单的量测值对地理分布或现象进行描述,如长度、面积、值对地理分布或现象进行描述,如长度、面积、距离等。实际上距离等。实际上,空间分析首先始于空间查询和空间分析首先始于空间查询和量算,它是空间分析的定量基础。量算,它是空间分析的定量基础。7.2 空间信息查询 1、概念 空间查询的的一般问题是“有没有”,“是什么”,“在什么位置”,“怎么到达” 2、查询对象 图形中的信息 属性表中的信息 其他信息(例如关系等) 3、意义 信息管理:通过查询可以获取数据信息,进行信息管理和数据更新 特定信息提取:提取需要的信息,去除无用信息,便于使用 空间分析基础:查询结果一
11、般是对查找信息或数据的报告,研究对于这些信息单独提出进行相关分析。 图形和属性的互查是最常用的查询,主要有类:图形和属性的互查是最常用的查询,主要有类:1、按属性信息的要求来查询定位空间位置、按属性信息的要求来查询定位空间位置,称为称为“属性查图形属性查图形”。如在中国行政区划图上查询人口大于。如在中国行政区划图上查询人口大于4000万且城市人口大于万且城市人口大于1000万的省有哪些万的省有哪些?称为称为SQL查询查询.2、根据对象的空间位置查询有关的属性信息、根据对象的空间位置查询有关的属性信息,称为称为“图形查属性图形查属性”。如一般的。如一般的GIS软件都提供一个软件都提供一个“INF
12、O”工具,让用户利用鼠标工具,让用户利用鼠标,用点选、画线、矩形、圆、不规则多边形等工具选中地物,并显,用点选、画线、矩形、圆、不规则多边形等工具选中地物,并显示所查询对象的属性列表,可进行有关统计分析。示所查询对象的属性列表,可进行有关统计分析。1、基于空间关系查询、基于空间关系查询 空间实体间存在多种空间关系,包括拓扑、距离、方位空间实体间存在多种空间关系,包括拓扑、距离、方位等。如查找满足下列条件的城市:等。如查找满足下列条件的城市:在京沪线的东部;距离京沪线不超过在京沪线的东部;距离京沪线不超过50公里公里;城市人口大于城市人口大于100万万; 城市区域面积城市区域面积5000平方公里
13、平方公里. 简单的点线面相互关系拓扑查询包括:简单的点线面相互关系拓扑查询包括:面面查询面面查询:如与某个多边形相邻的多边形有哪些;如与某个多边形相邻的多边形有哪些;面线查询面线查询:如某个多边形内包含哪些线;如某个多边形内包含哪些线;面点查询面点查询:如某个多边形内有哪些点状地物;如某个多边形内有哪些点状地物;线面查询线面查询:如某条线经过的多边形有哪些;如某条线经过的多边形有哪些;线线查询线线查询:如与某条河流相连的支流有哪些;如与某条河流相连的支流有哪些;线点查询线点查询:如某条道路上有哪些桥梁,某条输电线上有哪些变电站;点面查如某条道路上有哪些桥梁,某条输电线上有哪些变电站;点面查询询
14、:如某个点落在那个多边形内;如某个点落在那个多边形内;点线查询点线查询:如某个结点由哪些线相交而成;如某个结点由哪些线相交而成; 2、基于空间关系和属性特征查询、基于空间关系和属性特征查询传统的传统的SQL并不能处理空间查询,对并不能处理空间查询,对GIS而言,需而言,需要对要对SQL进行扩展进行扩展,主要包括空间数据与属性数据的匹配等主要包括空间数据与属性数据的匹配等如地址匹配查询如地址匹配查询 根据街道的地址来查询事物的空间位置和属性信息是根据街道的地址来查询事物的空间位置和属性信息是GIS特有特有的一种查询功能,的一种查询功能,这种查询利用地理编码,输入街道的门牌号,就可以知道大这种查询
15、利用地理编码,输入街道的门牌号,就可以知道大致的位置和所在的街区。致的位置和所在的街区。它对空间分布的社会、经济调查和统计很有帮助,只它对空间分布的社会、经济调查和统计很有帮助,只要在调查表中添加了地址,要在调查表中添加了地址,GIS就可以自动地从空间位置的角度来统计分析各就可以自动地从空间位置的角度来统计分析各种经济社会调查资料。另外,这种查询也经常用于公用事业管理,事故分析等种经济社会调查资料。另外,这种查询也经常用于公用事业管理,事故分析等方面,如邮政、通讯、供水、供电、治安、消防、医疗等领域。方面,如邮政、通讯、供水、供电、治安、消防、医疗等领域。7.3 空间量算空间数量量算主要是指对
16、空间对象的几何参数进行量算,以获得关于这些几何体的属性信息。在地理数据库中,主要的空间数量量算有:Distance(geometry, geometry): double:两个几何体的距离测量 Length(geometry): double:几何测量 Area(geometry): double:面积测量 Buffer(double): Geometry:缓冲区运算,返回与当前几何体距离小于或等于某个距离的点的集合。 ConvexHull( ):Geometry:凸包运算,返回一个包含当前几何体所有点的凸包。由于地球是一个椭球体,因此在空间数据库之中,所有的几何体都是带有地图投影与空间参照系
17、的。空间数量量算都是在一定的投影与参照系下进行。对于若干几何体,由于不同参照系的椭球参数不同,如果把他们放在不同的空间参照系下进行空间数量量算,会得出不同的结果。7.3.1 几何量算 1 1长度长度 线状物体的长度是最基本的形态参数之一,线状物体的长度是最基本的形态参数之一,在矢量数据格式下,线由点组成,线状物体表在矢量数据格式下,线由点组成,线状物体表示为一个坐标串示为一个坐标串(Xi, Yi)(Xi, Yi),而线长度可由两点,而线长度可由两点间直线距离相加得到。则线状物体长度的计算间直线距离相加得到。则线状物体长度的计算公式为:公式为:空间信息量算空间信息量算 2面积面积 多边形的面积是
18、一个重要指标。多边形边界可以分多边形的面积是一个重要指标。多边形边界可以分解为上下两半,其面积就是上半边界下的积分值与下解为上下两半,其面积就是上半边界下的积分值与下半边界下的积分值之差。设面状物体的轮廓边界由一半边界下的积分值之差。设面状物体的轮廓边界由一个点的序列个点的序列P1 (x1 , y1), P2 ( x2, y2 ), ,Pn (xn, yn)表示,表示,其面积为其面积为:niiiiiyxyxS11121 2面积面积niiiiiyxyxS11121YoXSS1S2S=S2-S1YoXS1(X1,y1)(X2,y2)(X3,y3)(X4,y4)(X5,y5)S1=(x2-x1)(y
19、1+y2)/2+ (x3-x2)(y2+y3)/2 + (x4-x3)(y3+y4)/2 + (x5-x4)(y4+y5)/2空间信息量算空间信息量算 3弯曲度弯曲度弯曲度是描述线状物体弯曲程度的一个重弯曲度是描述线状物体弯曲程度的一个重要参数,它定义为曲线长度与曲线的两个端要参数,它定义为曲线长度与曲线的两个端点之间长度的比值,即点之间长度的比值,即 : 起点到终点的直线距离观测的路径长度w 4. 4. 质心量算质心量算 质心是描述地理现象空间分布的一个重要指标。质心可简质心可简单地描述为地理目标保持均匀分布的平衡点单地描述为地理目标保持均匀分布的平衡点。质心通常定义为一个多边形或面的几何中
20、心,当多边形比较简单时,计算很容易。当多边形形状复杂时,计算也更加复杂。 质心量算可用于对地理分布变化的跟踪;计算目标物对周围地区的经济辐射范围。如应用质心量测分析人口变迁、土地类型变化等。 分两种情况:分两种情况: 1)面状目标的重心。)面状目标的重心。可以理解为多边形内的平衡点,正如一块均质木可以理解为多边形内的平衡点,正如一块均质木块被悬挂起来的平衡点。块被悬挂起来的平衡点。空间信息量算空间信息量算 面状目标重心可以通过计算梯形重面状目标重心可以通过计算梯形重心的平均值而得到。将多边形的各个心的平均值而得到。将多边形的各个顶点投影到顶点投影到x轴上,就得到一系列梯轴上,就得到一系列梯形(
21、如图),所有梯形重心的联合就形(如图),所有梯形重心的联合就确定了整个多边形的重心。确定了整个多边形的重心。空间信息量算空间信息量算 按梯形计算重心位置按梯形计算重心位置空间信息量算空间信息量算 按梯形计算重心位置按梯形计算重心位置iiiGAAXX/iiiGAAYY/iXiYiA 按梯形计算重心位置按梯形计算重心位置6/ )(6/ )(2/ )(121211212111iiiiiiiiiiiiiiiiiiiiixxyyyyAYyyxxxxAXxxyyA空间信息量算空间信息量算 可理解为其分布中心。其重心计算方法是取离散可理解为其分布中心。其重心计算方法是取离散目标的加权平均中心,它是离散目标保
22、持均匀分布的目标的加权平均中心,它是离散目标保持均匀分布的平衡点。平衡点。 计算公式为:计算公式为:2)面状分布离散目标的重心)面状分布离散目标的重心 iiiiiGiiiiiGWYWYWXWX,其中,其中,i为离散目标物,为离散目标物,Wi为该目标物权重。为该目标物权重。Xi与与Yi为其坐标。为其坐标。空间信息量算空间信息量算 当把城市作为单个面状目标看待时,当把城市作为单个面状目标看待时,可以直接使用面状目标的形状系数,如形可以直接使用面状目标的形状系数,如形状率、圆形率、紧凑度等状率、圆形率、紧凑度等, ,这些指标计算较这些指标计算较简单,但只反映一个抽象的形状;简单,但只反映一个抽象的形
23、状; 当把城市作为面状目标的集合看待时当把城市作为面状目标的集合看待时,可以使用放射状指数、标准面积指数等,可以使用放射状指数、标准面积指数等形状系数,这些指标计算较复杂,但反映形状系数,这些指标计算较复杂,但反映了城市内部的具体联系。在多数指标中,了城市内部的具体联系。在多数指标中,都以圆形作为城市的标准形状。都以圆形作为城市的标准形状。一、空间信息分类 空间信息分类方法是地理信息系统功能组成的重要组成部分。与地图上所负载的已经专门分类和处理的数据相比较,地理信息系统存储的数据具有原始数据的性质,这样用户就可以根据不同的使用目的对数据进行任意提取和分析。7.3 空间信息分类与统计分析空间信息
24、分类与统计分析1. 主成分分析法 地理问题往往涉及大量的相互关联的自然和社会要素,太多的变量,无疑增加了分析问题的难度与复杂性。主成分分析就是把原来多个变量化为少数几个综合指标的一种统计分析方法。它克服了变量选择时的冗余和相关。要使这些较少的综合指标能够尽量多地反映原来较多指标的信息,那么它们的形式应当是原来变量指标的线性组合,且它们之间必须是独立的。空间信息分类与统计分析设有n个样本, p个变量指标 x1,x2 ,xp ,它们的综合指标为 Z1,Z2 ,Zp ,( mp ), 则应有pmpmmmppppxLxLxLZxLxLxLZxLxLxLZ2211222212121212111 L 是据
25、相关系数矩阵求出的相应的特征向量。 空间信息分类与统计分析2. 层次分析法 层次分析(AHP)是系统分析的数学工具之一,它把人的思维过程层次化、数量化,并用数学方法为分析、决策、预报、控制提供定量的依据。AHP方法把相互关联的要素按隶属关系分为若干层次,请有经验的专家对各层次各要素的相对重要性给出定量指标,利用数学方法综合专家意见给出各层次各要素的相对重要性权值,作为综合分析的基础。空间信息分类与统计分析选择旅游地的层次结构选择旅游地的层次结构 P3选择旅游地选择旅游地景景色色费费用用居居住住饮饮食食旅旅途途P1P2目标层 准则层 方案层 空间信息分类与统计分析3. 系统聚类分析法 聚类分析是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七 空间 数据 分析 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内