最新arcgis实习之空间统计分析.docx
Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-datearcgis实习之空间统计分析arcgis实习之空间统计分析空间统计分析实习报告Spatial statistics tools 分析模式工具集中的工具采用推论式统计,以零假设为起点,假设要素与要素相关的值均表现随机分布。然后计算P值说明,这种分布属于随机分布的概率。在应用中,返回Z得分和P值判断是否可以接受或拒绝零假设,同时在不同的工具中,还表示分布是聚集,或分散是标准差的倍数,在0.5-P的概率下接受随机分布的接受域 Average Nearest Neighbor 最邻近分析 根据每个要素预期最近要素的平均距离来计算最邻近指数,当指数大于1,要素有聚集分布的趋势,对于趋势如何,还要依据 zvalue和Pvalue 来判断,小于1时 ,趋向分散分布 最近邻指数的表示方法为:平均观测距离 与 预期平均距离 的比率,预期平均距离是假设随机分布中领域间的平均距离 这种方法对面积指值非常敏感(期望平均距离计算中需要面积参与运算),如果未指定面积参数,则使用输入要素周围最小外接矩形的面积(不一定合坐标轴垂直) Spatial Autocorrelation (Morans I) 空间自相关分析 更具要素位置的属性使用Global Morans I 统计量量测空间自相关性 Morans I是计算所评估属性的均值和方差,然后将每个要素减去均值,得到与 均值的偏差,将所有相邻要素的偏差相称,得到叉积。统计量的分子便是这些叉积之和。 如果相邻要素的值均大于均值,这叉积为正,如果以要素小于均值而一要素大于均值,则为负 如果数据集中的值倾向于在空间上集聚(高值聚集在高值附近,低值聚集在低值附近)则指数为正 ,如果高值排斥高值,倾向于低值,则指数为负 之后,将计算期望指数值,将之 与其比较,在给定的数据集中的要素个数和全部熟知的方差下,将计算Z得分和P值,用来指示次差异是否具有统计学上的显著性 Multi-Distance Spatial Cluster Analysis K函数分析确定要素(后与之有关连的值)是否显示某一距离范围内统计意义显著的聚类或离散基于 Ripley's K 函数的多距离空间聚类分析工具是另外一种分析事件点数据的空间模式的方法。该方法不同于此工具集中其他方法(空间自相关和热点分析)的特征是可汇总一定距离范围内的空间相关性(要素聚类或要素扩散)Ripley's K 函数可表明要素质心的空间聚类或空间扩散在邻域大小发生变化时是如何变化的。如果特定距离的k观测值大于k预期值,则与该距离下的随机分布相比,该分布的聚集程度更高,反之亦可。如果,k观测值大于HIConfEnv,则该距离的空间聚类具有统计学上的显著性,如果k观测值小于LwConFEnv,则该距离的空间离散具有统计学上的显著性对于置信区间,点的每个随机分布称为“排列”将一组点随机分布多次,将对每个距离选择相对预期k值向下和向上最大的k值,作为置信区间 Anselin Local Morans I局部Morans I 分析 给定一组加权要素,使用 局部Morans I统计量来识别具有统计显著性的热点,冷点和空间异常值。 Z得分 和 p值 是统计显著性的指标,用于逐个要素判断是否拒绝零假设。他们可指示表面相似性和向异性 如果要素 Z值是一个较高的正数,则表示周围的要素拥有相似值,输出要素Cotype字段会将具有统计显著性的高值聚类表示为 HH,低值聚类表示为LL如果要素的 z 得分是一个较低的负值,则表示有一个具有统计显著性的空间异常值。输出要素类中的 COType 字段将指明要素是否是高值要素而四周围绕的是低值要素 (HL),或者要素是否是低值要素而四周围绕的是高值要素 (LH)。Getis-Ord General G 高低聚类分析使用 Getis-Ord General G统计可度量高值或低值的聚类程度Z得分越高或越低,聚类程度就越高,如果 z得分接近零,则表示不存在明显的聚类,为正表示高值的聚类。为负表示低值的聚类Hot spot Analysis(Getis-Ord Gi*) 热点分析如果给定一组加权要素,使用 Getis-Ord Gi* 统计识别具有统计显著性的热点和冷点如果要素的 z 得分高且 p 值小,则表示有一个高值的空间聚类。如果 z 得分低并为负数且 p 值小,则表示有一个低值的空间聚类。z 得分越高(或越低),聚类程度就越大。如果 z 得分接近于零,则表示不存在明显的空间聚类。Adabg00 模式分析Average Nearest Neighbor 最邻近分析 最邻近指数小于1。聚集分布。Z得分为-10.9,对应的P值为0.000000,即这种分布是随机的情况概率为0.00000对于点数据,没有明显的边界,所以默认面积计算(最小外接矩形)Spatial Autocorrelation (Morans I) 空间自相关分析空间关系模型参数说明空间要素之间的关系,越接近现实,结果越准确指定反距离和固定距离中的距离参数,默认距离为所有要素最临近距离的最大值聚集分布Multi-Distance Spatial Cluster Analysis K函数分析通过Calculate Distance Band From Neighbor count 计包含一个近邻点的最大距离,作为k函数的起始距离。 将最近邻距离的期望距离作为间隔 在此距离以内,均为集聚,但大于这距离,分布变为分散且,聚集具有统计意义上的聚集,离散并未具有统计意义上的显著性Anselin Local Morans I局部Morans I 分析保证每个要素都有相邻要素由index和z得分决定高值集聚Getis-Ord General G 高低聚类分析Hot spot Analysis(Getis-Ord Gi*) 热点分析P值小,z得分越大,高值聚集Z得分越小,低值聚集Adabg00 模式分析Adabg00属性结构有两种属性将会被用于模式分析中(Lation(拉丁人口密度)和Dentity(人口密度)、为了得到adsbg的大概人口分布,首先使用密度分割,分层设色以 dentity字段可以看出,adage人口分布呈现聚集态势,四周人口稀少,大多数集中在内部 以 latino字段相交人口分布,拉丁人口分布除右下角外,其余和人口分布大致相识使用模式分析探索人口分布为了使用Globle Morans I ,首先计算包含最近要素的最大距离选做Morans的距离参数18850 相关性分析 聚集分布可以看到,adage的人口有聚集分布的态势使用局部Morans I 判断热点,冷点和异常值(聚集类型)蓝色和紫色为异常值区域红色 为高值聚集地区蓝色为低值聚集地区使用 G统计量计算总体聚集程度相较 人口分布,聚集没有人口分布强烈可以看到,adage人口呈现聚集分布,且类型为高值聚集接着对 latino 做相应的操作聚集类型和人口分布相同有异常值为高值聚集,但相较人口分布,这种高值聚集较小和人口分布的热点不同分析Z得分和P值与不同空间组合的关系对于同一图层,p值和z得分是一一对应的,当z得分的绝对值变大时,对应的p值(接受是随机分布的假设)也变小全局Morans I 和G 统计量用来指出要素呈现距离分布或离散分布,高值聚集或离散或低值聚集(当p值非常小时,z为正且越大,聚集分布越明显,反之亦可)(G统计量:当p值非常小时,z为正且越大,高值聚集明显,为0,离散分布,为负且越小,低值聚集越明显)局部Morans I(cluster and outlier聚集和异常分析)和G统计量(hot spot热点分析)根据每个要素的z得分和p值推出要素分布的相似或相异分布局部Morans I(cluster and outlier聚集和异常分析)直接添加cotype字段,指出该要素的空间组合情况,如HH,LL,HL,LH,但z得分为正且较大时,说明正自相关,于是,将高值的聚类表示为hh,低值的聚类表示为ll,当Z得分为负且较大时,说明负相关越强,于是将高值附近的低值围绕极记为hl,反之Lh,这就是在全局请款下的异常值HOT SPOT分析:如果要素的 z 得分高且 p 值小,则表示有一个高值的空间聚类。如果 z 得分低并为负数且 p 值小,则表示有一个低值的空间聚类。z 得分越高(或越低),聚类程度就越大。如果 z 得分接近于零,则表示不存在明显的空间聚类。没有COtype字段,可以更具自己的需要,设定阈值,和局部Morans指数相近-