GIS空间分析.ppt
《GIS空间分析.ppt》由会员分享,可在线阅读,更多相关《GIS空间分析.ppt(109页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 空间统计分析方法由来 空间统计分析方法组成空间统计分析方法由分析空间变异与结构的半变异函数和用以空间局部估计的克立格插值法两个主要部分组成,是GIS空间分析的一个重要技术手段。由于空间现象之间存在不同方向、不同距离成分等相互作用,使得传统的数理统计方法无法很好地解决空间样本点的选取、空间估值和两组以上空间数据的关系等问题,因此,空间统计分析方法应运而生。空间统计分析方法的基本原理6.1空间自相关6.2空间局部估计6.3确定性插值法6.4探索性空间数据分析6.5ContentContents s6.1.1 空间统计分析的概念20世纪60年代,法国统计学家Matheron G通过大量理论研究,形
2、成了一门新的统计学分支,即空间统计学。空间统计学是以区域化变量理论为基础,以变异函数为主要工具,研究具有地理空间信息特性的事物或现象的空间相互作用及变化规律的学科。 自相关 空间统计分析的重要任务空间统计分析方法假设研究区中所有的值都是非独立的,相互之间存在相关性。在空间或时间范畴内,这种相关性被称为自相关。揭示空间数据的相关规律和利用相关规律进行未知点预测。由于空间统计分析包含这两个显著的任务,所以涉及两次使用样点数据,第一次用作估计空间自相关,第二次用作未知点预测。6.1.2 空间统计分析中的理论假设 1. 区域化变量区域化变量的两重性表现在观测前把它看成是随机场,依赖于坐标(Xu,Xv,
3、Xw),观测后是一个普通的空间三元函数值或一个空间点函数。 区域化变量是一种在空间上具有数值的实函数,它具有以下属性:空间局限性连续性各向异性区域化变量被限制于一定空间范围,这称为几何域。在几何域内,区域化变量的属性最为明显;在几何域外,不明显。不同的区域化变量具有不同程度的连续性,用区域化变量的半变异函数来描述。当区域化变量在各个方向上具有相同性质时称各向同性,否则称为各向异性。其它属性: 区域化变量在一定范围内呈一定程度的空间相关,当超出这一范围之后,相关性变弱甚至消失。 对于任一区域化变量,特殊的变异性可以叠加在一般的规律之上。 2. 协方差函数 CovZ(t1),Z(t2)=EZ(t1
4、)EZ(t1)Z(t2)EZ(t2) (6.1) 在随机函数中,当只有一个自变量x时称为随机过程,随机过程Z(t)在时间t1和t2处的随机变量Z(t1)、Z(t2)的二阶混合中心矩定义为随机过程的协方差函数记为CovZ(t1),Z(t2),即 CovZ(x),Z(x+h)=EZ(x)Z(x+h)EZ(x)EZ(x+h) (6.2) Cov(x,x+0)=EZ(x)2EZ(x)2 (6.3)当随机函数依赖于多个自变量时,Z(x)=Z(Xu,Xv,Xw)称为随机场,而随机场Z(x)在空间点x和x+h处的两个随机变量Z(x)和Z(x+h)的二阶混合中心矩定义为随机场Z(x)的自协方差函数,即随机场Z
5、(x)的自协方差函数亦称为协方差函数,一般地,协方差函数依赖于空间点x和向量h。当h=0时,协方差函数变为 3. 变异函数 (x,h)=1/2*VarZ(x)Z(x+h)2 =1/2*EZ(x)Z(x+h)21/2*EZ(x)EZ(x+h)2 (6.4)变异函数在一维条件下,当空间点x在一维x轴上变化时,区域变量Z(x)在点x和x+h处的值Z(x)与Z(x+h)差的方差一半定义为区域变量Z(x)在x轴上的变异函数,记为(x,h),即 在二阶平稳假设条件下对任意h有 EZ(x+h)=EZ(x) 因此,式(6.4)可改写为 (x,h)=1/2*EZ(x)Z(x+h)2 (6.5) 从式(6.5)可
6、知,变异函数依赖于x和h,当变异函数仅依赖于h,与x无关时,变异函数(x,h)可改写成(h),即 (h)=1/2*EZ(x)Z(X+h)2 (6.6)例如:假设某地区降水量Z(x)(单位:mm)是二维区域化随机变量,满足二阶平稳假设,其观测值的空间正方形网格数据如图1所示(点与点之间的距离为h=1 km)。试计算其南北方向及西北和东南方向的变异函数。图1 空间正方形网格数据(点间距h=1 km) 从图1可以看出,空间上有些点,由于某种原因没有采集到。如果没有缺失值,可直接对正方形网格数据结构计算变异函数;在有缺失值的情况下,也可以计算变异函数。只要“跳过”缺失点位置即可(图2)。 首先计算南北
7、方向上的变异函数值,由变异函数的计算公式可得 =385/72=5.35 图2 缺失值情况下样本数对的组成和计算过程为缺失值为缺失值 222222)3837()3836()3635()3537()3742()4240(3621) 1 (222222)4242()3536()3743()4340()3735()3538(222222)3738()3839()3940(3535)3535()3542()(222222)3336()3637()3739()3939()3034()3437(222222)4036()2932()3236()3637()3741()4137()3228()3438()30
8、29()2935()3533()3340(222222 同样计算出 最后,得到南北方向和西北东南方向上的变异函数计算结果见下表。同样可以计算东西方向上的变异函数。 9.26)2(17.55)3(25.69)4(22.90)5(方向 南北 方向 西北东南 h12345h1.412.824.245.657.07N(h) 36 27 21 13 5 N(h) 322113825.359.2617.5525.6922.907.0612.9530.8558.1350.00)(h)(h 4. 平稳性假设及内蕴假设 (1)平稳性假设 设某一随机函数Z(x),其空间分布律不因平移而改变,即若对任一向量h,关系
9、式 G(z1,z2,x1,x2,)=G(z1,z2,x1+h,x2+h,)成立时,则该随机函数为平稳性随机函数。确切的说,无论位移向量h多大,两个k维向量的随机变量Z(x1),Z(x2),Z(xk)和Z(x1+h),Z(x2+h),Z(xk+h)有相同的分布律。 当区域化变量满足下列两个条件时,称该区域化变量满足二阶平稳: 在整个研究区内,区域化变量Z(x)的数学期望对任意x存在且等于常数,即EZ(x)=m(常数),任意x。 在整个研究区内,区域化变量的空间协方差函数对任意x和h存在且平稳,即 CovZ(x),Z(x+h)=EZ(x)Z(x+h)-m2=C(h),任意x,h (2)内蕴假设 一
10、些自然现象和随机函数具有无限离散性,这时区域化变量Z(x)的增量Z(x)-Z(x+h)满足下列两个条件时,就称该区域化变量满足内蕴假设:在整个研究区内随机函数Z(x)的增量的数学期望为0,即 EZ(x)-Z(x+h)=0, 任意x,h 对于所有矢量的增量的方差函数存在且平稳 VarZ(x)-Z(x+h)=EZ(x)-Z(x+h)2 =2(x,h)=2(h),任意X,h 即要求Z(x)的半变异函数存在且平稳。 内蕴假设可以理解为: 随机函数Z(x)的增量Z(x)-Z(x+h)只依赖于分隔它们的向量h,而不依赖于具体位置x,这样,被向量h分割的每一对数据Z(x),Z(x+h)可以看成是一对随机变量
11、Z(x1),Z(x2)的一个不同现实,而半变异函数(h)的估计量*(h)为 (h)=1/2N(h)*Z(xi)-Z(xi+h)2 式中,N(h)是被向量h相分隔的试验数据对的数目。 准平稳假设如果随机函数只在有限大小的邻域内是平稳的,则称该随机函数服从准平稳假设。准平稳(或准内蕴)假设是一种折中方案,它既考虑到某现象相似性的尺度,也顾及到有效数据的多少。6.2.1 空间自相关理论 空间自相关性在空间统计分析中,相关分析可以检测两种现象的变化是否存在相关性,若所分析的统计量为不同观察对象的同一属性变量,则称之为自相关。通过检测一个位置上的变异是否依赖于邻近位置的变异来判断该变异是否存在空间自相关
12、性根据变异的性质可以将变异分为三种类型:绝对型变异,等级型变异和连续型变异 空间自相关 各向同/异性空间自相关是针对同一个属性变量而言的,当某一测样点属性值高,而其相邻点同一属性值也高时,为空间正相关;反之,为空间负相关。当空间自相关仅与两点间距离有关时,称为各向同性;否则为各向异性。6.2.2 空间自相关分析方法空间自相关方法按功能大致分为两类: 全域型自相关、区域型自相关最为常用的计算空间自相关方法是:Morans I、Gearys C、Getis、Join count以及空间自相关系数图等 1. Morans I法若在区域内有n个空间单元,每个空间单元皆有一个观察值X,空间单元i与空间单
13、元j的空间关系构成Wij的空间相邻矩阵,以1表示i和j相邻,以0表示i和j不相邻。其简单定义为 Wijnn 其中,Wij为表示区位相邻矩阵,Wij=1表示区位相邻,Wij=0则表示区位不相邻。 Moran Index值是应用较广泛的一种空间自相关性判定指标,其计算式为 式中, , 。Wij表示区位相邻矩阵;Cij表示属性相似矩阵;Xi和Xj分别为i和j空间单元属性数据值,Wij=1代表空间单元相邻,Wij=0代表不相邻,ij,Wii=0。ninjniiijjninjiijninjijninjijijXXnWXXXXWSWCWI11121111211)(1)( )((6.16) niiXXnS1
14、22)(1)(XXXXCjiij 若母体为随机分配,常采用统计验证的方式进一步判定Moran Index的期望值和变异数。I的期望值为 其变异数为其中, ; ; ; )()()(IVarIEIIZ) 1(1)(nIE(6.17) 2202021220212)() 3)(2)(1(62)(3) 33()(IEnnnWWnWWnnKWnWWnnnIVar ninjijWW110ninjjiijWWW1121)(niiiWWW122)(21214njjniinXXnXXk;Wi和和Wi为相关权重矩阵为相关权重矩阵i及及j行的总和。行的总和。 I值结果一定介于-1到1之间; I0为正相关,数值越大表示
15、空间分布的相关性越大,即空间上聚集分布的现象越明显; I0(正相关) I 0(负相关) 图6.1 空间自相关正负结果示意图 根据各空间间隔自相关值的计算,Morans I公式可改写为 其中,d代表空间间隔;Wij代表区位相邻矩阵。d=1代表空间单元是相邻的;d=2定义为与间隔一个的空间单元相接邻,而与原来的空间单元不相邻。 niijininjijninjijXXXXXXdWdWndI121111)()()()()((6.19) 区域空间自相关的定义为 其中,Ii为Local Moran Index,Wij为区位相邻矩阵。(6.20) njjiijiXXXXWI1)(nMoran散点图 以(Wz
16、,z)为坐标点的Moran散点图,常来研究局部的空间不稳定性,它对空间滞后因子Wz和z数据对进行了可视化的二维图示。 全局Moran指数,可以看作是Wz对于z的线性回归系数,对界外值以及对Moran指数具有强烈影响的区域单元,可通过标准回归来诊断出。 由于数据对(Wz,z)经过了标准化,因此界外值可易由2sigma规则可视化地识别出来。 Moran散点图的4个象限,分别对应于区域单元与其邻居之间4种类型的局部空间联系形式: 第1象限代表了高观测值的区域单元被同是高值的区域所包围的空间联系形式; 第2象限代表了低观测值的区域单元被高值的区域所包围的空间联系形式; 第3象限代表了低观测值的区域单元
17、被同是低值的区域所包围的空间联系形式; 第4象限代表了高观测值的区域单元被低值的区域所包围的空间联系形式。 与区域Moran指数相比,其重要的优势在于能够进一步具体区分区域单元和其邻居之间属于高值和高值、低值和低值、高值和低值、低值和高值之中的哪种空间联系形式。 并且,对应于Moran散点图的不同象限,可识别出空间分布中存在着哪几种不同的实体。 将Moran散点图与区域性自相关显著性 水 平 相 结 合 , 也 可 以 得 到 所 谓 的“Moran显著性水平图”,图中显示出显著的LISA区域,并分别标识出对应于Moran散点图中不同象限的相应区域。 应用实例应用实例 中国大陆30个省级行政区
18、人均GDP的空间关联分析。根据各省(直辖市、自治区)之间的邻接关系,采用二进制邻接权重矩阵,选取各省(直辖市、自治区)19982002年人均GDP的自然对数,依照公式计算全局Moran指数I,计算其检验的标准化统计量Z(I),结果如下表所示。年份IZP19980.50014.503 50.000 019990.506 94.555 10.000 020000.511 24.597 80.000 020010.505 94.553 20.000 020020.501 34.532 60.000 0 从表中可以看出,在19982002年期间,中国大陆30个省级行政区人均GDP的全局Moran指数均
19、为正值;在正态分布假设之上,对Moran指数检验的结果也高度显著。这就是说,在19982002年期间,中国大陆30个省级行政区人均GDP存在着显著的、正的空间自相关,也就是说各省级行政区人均GDP水平的空间分布并非表现出完全的随机性,而是表现出相似值之间的空间集聚,其空间联系的特征是:较高人均GDP水平的省级行政区相对地趋于和较高人均GDP水平的省级行政区相邻,或者较低人均GDP水平的省级行政区相对地趋于和较低人均GDP水平的省级行政区相邻。 以(Wz,z)为坐标,进一步绘制Moran散点图 可以发现,多数省(直辖市、自治区)位于第1和第3象限内,为正的空间联系,属于低低集聚和高高集聚类型,而
20、且位于第3象限内的低低集聚类型的省(直辖市、自治区)比位于第1象限内的高高集聚类型的省(直辖市、自治区)更多一些。 上图进一步显示了30个省级行政区人均GDP局部集聚的空间结构。可以看出,从人均GDP水平相对地来看: 高值被高值包围的高高集聚省(直辖市)有:北京、天津、河南、安徽、湖北、江西、海南、广东、福建、浙江、山东、上海、江苏; 低值被低值包围的低低集聚省(自治区)有:黑龙江、内蒙古、新疆、吉林、甘肃、山西、陕西、青海、西藏、四川、云南、辽宁、贵州; 被低值包围的高值省(直辖市)有:重庆、广西、河北;被高值包围的低值省份只有湖南。 2. Gearys Contiguity Ratio C
21、法 与Morans I类似,其表达式为 ninjijninjiijniiWyyWyynC11112_12_2)()(1(6.21) C = 1,表示不相关;0 C 1表示负相关。 3. Getis统计法 Anselin曾归纳各种空间聚集的研究方法,该方法经常表达为 其中,Wij代表i与j的空间关系,即类似上述空间相邻权重矩阵Wij;而yij则是i与j的观察式。 jijijyw(6.22) 全域型Getis 其中,wij(d)为距离d内的空间相邻权重矩阵。 若i与j相邻,wij(d)=1;若i与j不相邻,wij(d)=0。 区域型Getis 可量测每一个i在距离d的范围内,与每个j的相关程度。
22、njjnjjiijxxxdwdG11)()(ij (6.23) njjnjjijixxdwdG11)()(ij (6.24) 选取2001年我国30个省级行政区人均GDP数据,计算局部Getis统计量和局部Getis统计量的检验值Z(G),并绘制统计地图如下。 检验结果表明,贵州、四川、云南西部3省的Z值在0.05的显著性水平下显著,重庆的Z值在0.1的显著性水平下显著,该4省市在空间上相连成片分布,而且从统计学意义上来说,与该区域相邻的省区,其人均GDP趋于为同样是人均GDP低值的省区所包围。由此形成人均GDP低值与低值的空间集聚,据此可认识到西部落后省区趋于空间集聚的分布特征。 东部的江苏
23、、上海、浙江三省市的Z值在0.05的显著性水平下显著,天津的Z值在0.1的显著性水平下显著。而东部上海、江浙等发达省市趋于为一些相邻经济发展水平相对较高的省份所包围,东部发达地区的空间集聚分布特征也显现出来。 4. 空间自相关系数图分析法(以某地区为例)空间自相关空间间隔135791113151719-1.00-0.501.000.500.001.50图6.2 某地区某种空间自相关系数图 (1)图中有两处隆起处,代表微视尺度及宏观尺度上,存在显著的聚集分布现象,但聚集现象不存在于中观尺度上。(2)空间间隔为2时,空间自相关值有波峰,即在空间间隔为2时,其空间分布有最大的自相关性。 空间局部估计
24、 常见的克立格插值模型有: 插值一般分为两步:空间局部估计也称空间局部插值,它是利用在地表不同位置采集的样点生成一个连续表面。普通克立格、简单克立格、泛克立格、概率克立格、指示克立格、析取克立格及协同克立格等(1)样点空间结构量化分析;(2)对未知点进行预测 6.3.1 6.3.1 半变异函数分析半变异函数分析 1. 半变异函数及其性质 半变异函数是一个关于数据点的半变异值与数据点间距离的函数,设区域化变量Z(xi)和Z(xi+h)分别是Z(x)在空间位置xi和xi+h上的观测值(i=1,2,N(h),则半变异函数可由下式进行估计 其中,N(h)是分隔距离为h的样本量。 )(12)()()(2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GIS 空间 分析
限制150内