第七章 空间数据分析优秀课件.ppt
《第七章 空间数据分析优秀课件.ppt》由会员分享,可在线阅读,更多相关《第七章 空间数据分析优秀课件.ppt(97页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章 空间数据分析第1页,本讲稿共97页分析技术分析技术:空间图形数据的拓扑运算;非空间属性数据运算;空间和非空间数据的联合运算。空空间间分分析析是综合分析空间数据的技术的通称。空间分析有着十分丰富的内涵,它是构成地理信息系统的核心部分之一,在整个地理数据的应用中发挥着举足轻重的作用,也是GIS区别与其它信息系统的一个显著标志。第2页,本讲稿共97页空间分析主要获得空间位置及其属性描述两方面的信息。主要目的:以空间数据库为基础解决用户的实际问题运用各种几何逻辑运算手段第3页,本讲稿共97页7.1 空间索引在介绍空间索引之前,先谈谈什么叫“索引“。对一个数据集做”索引“,是为了提高对这个数据集
2、检索的效率。书的”目录“就是这本书内容的”索引“,当我们拿到一本新书,想查看感兴趣内容的时候,我们会先查看目录,确定感兴趣的内容会在哪些页里,直接翻到那些页,就OK了,而不是从第一章节开始翻,一个字一个字地找我们感兴趣的内容,直到找到为止,这种检索内容的效率也太低了,如果一本书没有目录,可以想象有多么不方便可见书的目录有多重要,索引有多重要。现在大家对索引有了感性认识,那什么是“空间索引“呢?”空间索引“也是”索引“,是对空间图形集合做的一个”目录“,提高在这个图形集合中查找某个图形对象的效率。目前,常见空间索引类型有BSP树树,KDB树,树,R树树,R+树和树和CELL树树,空间索引的性能的
3、优越直接影响空间数据库和地理信息系统的整体性能 第4页,本讲稿共97页空间索引类型R 树是基于磁盘的索引结构,是 B 树(一维)在高维空间的自然扩展,易于与现有数据库系统集成,能够支持各种类型的空间查询处理操作,在实践中 得到了广泛的应用,是目前最流行的空间索引方法之一。R 树索引比较适合静态数据,例如用作底图的数据和不经常编辑的数据(属性数据的编辑除外)推荐建立 R 树索引。R 树空间索引方法是通过设计虚拟的矩形目标,将一些空间位置相近的目标对象,包含在这个矩形内,如下面左图所示,把这些矩形作为空间索引的节点,它 含有所包含的空间对象的指针。例如,A 中包含空间对象 D、E、F,B 中包含空
4、间对象 H、I、J、K,C 中包含空间对象 L、M。如下面右图所示为 R 树索引的例子。第5页,本讲稿共97页在进行空间检索的时候,首先判断哪些矩形落在检索窗口内,再进一步判断哪些目标是被检索的内容。这样可以提高检索速度。特点特点(1)R树索引的空间检索效率非常高,检索精度也很高。(2)R树索引的索引数据和地理数据不存储在一起,且R树索引的更新涉及到R树的平衡和分裂,比较复杂,更新速度较慢,大规模编辑后的查询效率降低,需要重建空间索引,适用于只读数据或者不经常进行空间数据编辑的数据。适用情况适用情况R树索引比较适合静态数据,例如用作底图的数据和不常被编辑的数据(属性数据的编辑除外)推荐建立R树
5、索引。第6页,本讲稿共97页四叉树是一种重要的层次化数据集结构,主要用来表达二维坐标下空间层次关系,实际上它是一维二叉树在二维空间的扩展。其基本思路是:把整个工作空间编码为0,用水平线和 垂直线将工作空间划分为相等的四部分,各每一部分按顺序分别编码为00、01、02和03,左上角为00,右下角为03;对划分后的格子按照同样的方式继续划分,比如对第00格继续划分,划分后的四个小格子分别编码为000、001、002和003。根据需要,还可以继续划分,比如第031格子继续划分为0310、0311、0312和0313,如下图所示。以此类推,可以一直划分下去,划分的层数取决于研究区域对象的数量和平均大小
6、。第7页,本讲稿共97页假设上图所示的对象为整个工作空间的对象,则根据这个工作空间建立的四叉树结构如下图所示:现在在 SuperMap 中,四叉树最多允许分成13层。基于希尔伯(Hilbert)编码的排序规则,从四叉树中可确定索引类中每个对象实例的被索引属性值是 属于哪个最小范围。从而提高了检索效率。四叉树索引适用于小数据量的高并发编辑。第8页,本讲稿共97页根据数据集的某一属性字段或根据给定的一个范围,将空间对象进行分类,通过索引进行管理已分类的空间对象,以此提高查询检索速度。根据上述原理,创建图库索引有两种方式,根据字段索引或者根据范围索引。字段索引:即根据数据集的某一属性字段将空间对象进
7、行分类,通过索引进行管理已分类的空间对象,以此提高查询检索速度。建议使用与位置信息相关的字段进行图库索引的 创建,例如对于全国县级行政区域图,可以使用表示行政区域代码的字段进行图库索引的创建。第9页,本讲稿共97页范围索引:即根据给定的一个范围(图幅的长和宽)将空间对象进行分类,通过索引进行管理已分类的空间对象,以此提高查询检索速度。对于按标准比例尺分幅存储(如1:25万 数据、1:10万数据、1:5万数据等)的数据合并到数据库中后生成的数据集,范围索引有着优异的效果,可以提供非常好的查询性能。在海量数据(即对象数超过百万个的数据)的显示和查询时优势尤其明显。建立图库索引后,在显示的时候,只显
8、示你需要查看的那一幅或几幅地图,大大缩短显示时间。如下图所示为根据给定范围进行图库索引的示例:第10页,本讲稿共97页图库索引示意图 特别地,图库索引还可以被缓存到本地(以二进制文件形式体现),这样可更进一步提高查询检索的速度。第11页,本讲稿共97页动态索引结合了 R 树索引与四叉树索引的优点,提供非常好的并发编辑支持,具有很好的普适性。若不能确定数据适用于哪种空间索引,推荐建立动态索引。动态索引采用划分多层网格的方式来组织管理数据,它的基本方法是将数据集按照一定的规则划分成相等或不相等的网格,记录每一个地理对象所占的网格 位置。在GIS中常用的是规则网格。当用户进行空间查询时,首先计算出用
9、户查询对象所在的网格,通过该网格快速查询所选地理对象。可以优化查询操作。第12页,本讲稿共97页动态索引示意图 第13页,本讲稿共97页特点特点当数据集在进行浏览操作的时候,动态索引方式的速度会比较快;索引更新和并发的能力好;索引的空间检索精度高,准确度高。注意:此索引类型支持数据集的动态并发编辑。适用情况适用情况动态索引结合了R 树索引与四叉树索引的优点,提供非常好的并发编辑支持,具有很好的普适性。若不能确定数据适用于哪种空间索引,推荐建立动态索引。补充说明补充说明建立动态索引后,用户可以按图幅进行本地缓存,可以大大提高查询和浏览的速度。第14页,本讲稿共97页查询和定位空间对象,并对空间对
10、象进行量算是查询和定位空间对象,并对空间对象进行量算是GIS的基本功能之一的基本功能之一,它是它是GIS进行高层次分析的基础。进行高层次分析的基础。在在GIS中,为进行高层次分析,往往需要查询定位空间对中,为进行高层次分析,往往需要查询定位空间对象,并用一些简单的量测值对地理分布或现象进行描述,象,并用一些简单的量测值对地理分布或现象进行描述,如长度、面积、距离等。实际上如长度、面积、距离等。实际上,空间分析首先始于空间分析首先始于空间查询和量算,它是空间分析的定量基础。空间查询和量算,它是空间分析的定量基础。7.2 空间信息查询第15页,本讲稿共97页1、概念空间查询的的一般问题是“有没有”
11、,“是什么”,“在什么位置”,“怎么到达”2、查询对象图形中的信息属性表中的信息其他信息(例如关系等)第16页,本讲稿共97页3、意义信息管理:通过查询可以获取数据信息,进行信息管理和数据更新特定信息提取:提取需要的信息,去除无用信息,便于使用空间分析基础:查询结果一般是对查找信息或数据的报告,研究对于这些信息单独提出进行相关分析。第17页,本讲稿共97页图形和属性的互查是最常用的查询,主要有类:图形和属性的互查是最常用的查询,主要有类:1、按属性信息的要求来查询定位空间位置、按属性信息的要求来查询定位空间位置,称为称为“属性查图形属性查图形”。如在中。如在中国行政区划图上查询人口大于国行政区
12、划图上查询人口大于4000万且城市人口大于万且城市人口大于1000万的省有哪些万的省有哪些?称为称为SQL查查询询.2、根据对象的空间位置查询有关的属性信息、根据对象的空间位置查询有关的属性信息,称为称为“图形查属性图形查属性”。如一般的。如一般的GIS软件都提供一个软件都提供一个“INFO”工具,让用户利用鼠标,用点选、画线、矩形、工具,让用户利用鼠标,用点选、画线、矩形、圆、不规则多边形等工具选中地物,并显示所查询对象的属性列表,可进行有圆、不规则多边形等工具选中地物,并显示所查询对象的属性列表,可进行有关统计分析。关统计分析。第18页,本讲稿共97页1、基于空间关系查询、基于空间关系查询
13、 空间实体间存在多种空间关系,包括拓扑、距离、方位等。如空间实体间存在多种空间关系,包括拓扑、距离、方位等。如查找满足下列条件的城市:查找满足下列条件的城市:在京沪线的东部;距离京沪线不超过在京沪线的东部;距离京沪线不超过50公里公里;城市人口大于城市人口大于100万万;城市区域面积城市区域面积5000平方公里平方公里.第19页,本讲稿共97页简单的点线面相互关系拓扑查询包括:简单的点线面相互关系拓扑查询包括:面面查询面面查询:如与某个多边形相邻的多边形有哪些;如与某个多边形相邻的多边形有哪些;面线查询面线查询:如某个多边形内包含哪些线;如某个多边形内包含哪些线;面点查询面点查询:如某个多边形
14、内有哪些点状地物;如某个多边形内有哪些点状地物;线面查询线面查询:如某条线经过的多边形有哪些;如某条线经过的多边形有哪些;线线查询线线查询:如与某条河流相连的支流有哪些;如与某条河流相连的支流有哪些;线点查询线点查询:如某条道路上有哪些桥梁,某条输电线上有哪些变电站;点面查询如某条道路上有哪些桥梁,某条输电线上有哪些变电站;点面查询:如某个点如某个点落在那个多边形内;落在那个多边形内;点线查询点线查询:如某个结点由哪些线相交而成;如某个结点由哪些线相交而成;第20页,本讲稿共97页2、基于空间关系和属性特征查询、基于空间关系和属性特征查询传统的传统的SQL并不能处理空间查询,对并不能处理空间查
15、询,对GIS而言,需要对而言,需要对SQL进进行扩展行扩展,主要包括空间数据与属性数据的匹配等主要包括空间数据与属性数据的匹配等如地址匹配查询如地址匹配查询 根据街道的地址来查询事物的空间位置和属性信息是根据街道的地址来查询事物的空间位置和属性信息是GIS特有的一种查询功能,特有的一种查询功能,这种查询利用地理编码,输入街道的门牌号,就可以知道大致的位置和所在的街区。这种查询利用地理编码,输入街道的门牌号,就可以知道大致的位置和所在的街区。它对空它对空间分布的社会、经济调查和统计很有帮助,只要在调查表中添加了地址,间分布的社会、经济调查和统计很有帮助,只要在调查表中添加了地址,GIS就可以自就
16、可以自动地从空间位置的角度来统计分析各种经济社会调查资料。另外,这种查询也经常用于动地从空间位置的角度来统计分析各种经济社会调查资料。另外,这种查询也经常用于公用事业管理,事故分析等方面,如邮政、通讯、供水、供电、治安、消防、医疗等领公用事业管理,事故分析等方面,如邮政、通讯、供水、供电、治安、消防、医疗等领域。域。第21页,本讲稿共97页7.3 空间量算空间数量量算主要是指对空间对象的几何参数进行量算,以获得关于这些几何体的属性信息。在地理数据库中,主要的空间数量量算有:Distance(geometry,geometry):double:两个几何体的距离测量 Length(geometry
17、):double:几何测量 Area(geometry):double:面积测量 Buffer(double):Geometry:缓冲区运算,返回与当前几何体距离小于或等于某个距离的点的集合。ConvexHull():Geometry:凸包运算,返回一个包含当前几何体所有点的凸包。由于地球是一个椭球体,因此在空间数据库之中,所有的几何体都是带有地图投影与空间参照系的。空间数量量算都是在一定的投影与参照系下进行。对于若干几何体,由于不同参照系的椭球参数不同,如果把他们放在不同的空间参照系下进行空间数量量算,会得出不同的结果。第22页,本讲稿共97页7.3.1 几何量算1长度长度 线状物体的长度是
18、最基本的形态参数之一,线状物体的长度是最基本的形态参数之一,在矢量数据格式下,线由点组成,线状物体表示在矢量数据格式下,线由点组成,线状物体表示为一个坐标串为一个坐标串(Xi,Yi),而线长度可由两点间直,而线长度可由两点间直线距离相加得到。则线状物体长度的计算公式为:线距离相加得到。则线状物体长度的计算公式为:第23页,本讲稿共97页空间信息量算空间信息量算2面积面积 多多边边形形的的面面积积是是一一个个重重要要指指标标。多多边边形形边边界界可可以以分分解解为为上上下下两两半半,其其面面积积就就是是上上半半边边界界下下的的积积分分值值与与下下半半边边界界下下的的积积分分值值之之差差。设设面面
19、状状物物体体的的轮轮廓廓边边界界由由一一个个点点的的序序列列P1(x1,y1),P2(x2,y2),,Pn(xn,yn)表示,其面积为表示,其面积为:第24页,本讲稿共97页2面积面积YoXSS1S2S=S2-S1第25页,本讲稿共97页YoXS1(X1,y1)(X2,y2)(X3,y3)(X4,y4)(X5,y5)S1=(x2-x1)(y1+y2)/2+(x3-x2)(y2+y3)/2+(x4-x3)(y3+y4)/2+(x5-x4)(y4+y5)/2第26页,本讲稿共97页空间信息量算空间信息量算3弯曲度弯曲度弯弯曲曲度度是是描描述述线线状状物物体体弯弯曲曲程程度度的的一一个个重重要要参参
20、数数,它它定定义义为为曲曲线线长长度度与与曲曲线线的的两两个个端端点点之之间间长长度的比值,即度的比值,即:第27页,本讲稿共97页 4.4.质心量算质心量算 质心是描述地理现象空间分布的一个重要指标。质质心心可可简简单单地地描描述述为为地地理理目目标标保保持持均均匀匀分分布布的的平平衡衡点点。质心通常定义为一个多边形或面的几何中心,当多边形比较简单时,计算很容易。当多边形形状复杂时,计算也更加复杂。质心量算可用于对地理分布变化的跟踪;计算目标物对周围地区的经济辐射范围。如应用质心量测分析人口变迁、土地类型变化等。第28页,本讲稿共97页分两种情况:分两种情况:1)面面状状目目标标的的重重心心
21、。可可以以理理解解为为多多边边形形内内的的平平衡衡点点,正正如如一一块块均均质质木木块块被被悬挂起来的平衡点。悬挂起来的平衡点。空间信息量算空间信息量算第29页,本讲稿共97页面面状状目目标标重重心心可可以以通通过过计计算算梯梯形形重重心心的的平平均均值值而而得得到到。将将多多边边形形的的各各个个顶顶点点投投影影到到x轴轴上上,就就得得到到一一系系列列梯梯形形(如如图图),所所有有梯梯形形重心的联合就确定了整个多边形的重心。重心的联合就确定了整个多边形的重心。空间信息量算空间信息量算按梯形计算重心位置按梯形计算重心位置第30页,本讲稿共97页空间信息量算空间信息量算按梯形计算重心位置按梯形计算
22、重心位置设多边形的顶点序列设多边形的顶点序列设多边形的顶点序列设多边形的顶点序列(x(xi i,y,yi i)按顺时针编按顺时针编按顺时针编按顺时针编 码,码,码,码,则其重心的计算公式为:则其重心的计算公式为:则其重心的计算公式为:则其重心的计算公式为:其中,其中,其中,其中,和和和和 是第是第是第是第i i个梯形的重心的个梯形的重心的个梯形的重心的个梯形的重心的x x坐标和坐标和坐标和坐标和y y坐标,是梯形的面积。坐标,是梯形的面积。坐标,是梯形的面积。坐标,是梯形的面积。它们由下式得到:它们由下式得到:它们由下式得到:它们由下式得到:第31页,本讲稿共97页按梯形计算重心位置按梯形计算
23、重心位置第32页,本讲稿共97页空间信息量算空间信息量算可可理理解解为为其其分分布布中中心心。其其重重心心计计算算方方法法是是取取离离散散目目标标的的加加权权平均中心,它是离散目标保持均匀分布的平衡点。平均中心,它是离散目标保持均匀分布的平衡点。计算公式为:计算公式为:2)面状分布离散目标的重心)面状分布离散目标的重心其中,其中,i为离散目标物,为离散目标物,Wi为该目标物权重。为该目标物权重。Xi与与Yi为其坐标。为其坐标。第33页,本讲稿共97页空间信息量算空间信息量算5.5.形状量算形状量算形状量算形状量算 当当把把城城市市作作为为单单个个面面状状目目标标看看待待时时,可可以以直直接接使
24、使用用面面状状目目标标的的形形状状系系数数,如如形形状状率率、圆圆形形率率、紧紧凑凑度度等等,这这些些指指标标计计算算较较简简单单,但但只只反映一个抽象的形状;反映一个抽象的形状;当当把把城城市市作作为为面面状状目目标标的的集集合合看看待待时时,可可以以使使用用放放射射状状指指数数、标标准准面面积积指指数数等等形形状状系系数数,这这些些指指标标计计算算较较复复杂杂,但但反反映映了了城城市市内内部部的的具具体体联联系系。在在多多数数指指标标中中,都都以以圆圆形形作作为为城城市市的的标标准准形形状。状。第34页,本讲稿共97页一、空间信息分类 空间信息分类方法是地理信息系统功能组成的重要组成部分。
25、与地图上所负载的已经专门分类和处理的数据相比较,地理信息系统存储的数据具有原始数据的性质,这样用户就可以根据不同的使用目的对数据进行任意提取和分析。7.3 空间信息分类与统计分析第35页,本讲稿共97页空间信息分类与统计分析1.主成分分析法 地理问题往往涉及大量的相互关联的自然和社会要素,太多的变量,无疑增加了分析问题的难度与复杂性。主成分分析就是把原来多个变量化为少数几个综合指标的一种统计分析方法。它克服了变量选择时的冗余和相关。要使这些较少的综合指标能够尽量多地反映原来较多指标的信息,那么它们的形式应当是原来变量指标的线性组合,且它们之间必须是独立的。第36页,本讲稿共97页空间信息分类与
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七章 空间数据分析优秀课件 第七 空间 数据 分析 优秀 课件
限制150内