ARCGIS空间统计分析.ppt
《ARCGIS空间统计分析.ppt》由会员分享,可在线阅读,更多相关《ARCGIS空间统计分析.ppt(81页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、ARCGIS空间统计分析,空间统计工具功能,ARCGIS“空间统计”工具箱概述,注意: ARCGIS“空间统计”工具箱,只要分析中涉及距离(对于空间统计总是如此),就应使用 投影坐标系(而不是基于度、分、秒的 地理坐标系)对数据进行 投影。,1.ARCGIS空间统计任务,汇总某分布模式的关键特征。 标识具有统计显著性的空间聚类(热点/冷点)和空间异常值。 评估聚类或分散的总体模式。 对空间关系建模。,1.1汇总关键特征,1.2标识具有统计显著性的聚类,1.3评估整体空间模式,1.4关系建模,2.“空间统计”分析工具,空间统计工具箱包含一系列用于分析空间分布、模式、过程和关系的统计工具。尽管空间
2、统计和非空间统计(传统统计方法)在概念和目标方面可能存在某些相似性,但空间统计具有其固有的独特性,因为它们是专门为处理地理数据而开发的。与传统的非空间统计分析方法不同,空间统计方法是将地理空间(邻域、区域、连通性和/或其他空间关系)直接融入到数学逻辑中。,2.“空间统计”分析工具,“分析模式”工具集中的工具都采用推论式统计,它们以零假设为起点,假设要素或与要素相关的值都表现成空间随机模式。然后它们再计算出一个 p 值用来表示零假设的正确概率(观测到的模式只不过是完整空间随机性的许多可能版本之一)。在制定特定决策时可能需要高置信度的数据,这时,计算概率就可能很重要。,2.1“分析模式”工具集,2
3、.2“分析模式”工具中各方法的工作原理(计算方法)与结果分析,2.2.1.平均最近邻的计算,2.2.1 平均最近的相邻要素,“平均最近邻”工具将返回五个值:平均观测距离、预期平均距离、最近邻指数、z 得分和 p 值。,2.2.1 平均最近的相邻要素,z 得分和 p 值结果是统计显著性的量度,用来判断是否拒绝零假设。对于“平均最近邻”统计,零假设指明要素是随机分布的。 “最近邻指数”的表示方式是“平均观测距离”与“预期平均距离”的比率。预期平均距离是假设随机分布中的邻域间的平均距离。如果指数小于 1,所表现的模式为聚类;如果指数大于 1,则所表现的模式趋向于离散或竞争。 平均最近邻方法对“面积”
4、值非常敏感(面积参数值的细微变化都能导致结果产生巨大变化)。因此,“平均最近邻”工具最适用于对固定研究区域中不同的要素进行比较。可对研究区域面使用“计算面积”工具以获得面积参数值。,2.2.2高/低聚类(Getis-Ord General G) 的计算,2.2.2高/低聚类(Getis-Ord General G) 的计算,2.2.2高/低聚类(Getis-Ord General G) 的计算,2.2.2高/低聚类(Getis-Ord General G),“高/低聚类”工具可返回 5 个值:General G 观测值、General G 期望值、方差、z 得分及 p 值。,2.2.2 高/低
5、聚类(Getis-Ord General G),输入字段应包含多种非负 值。如果输入字段包含负值,将显示错误消息。此外,此统计数学方法要求待分析的变量存在一定程度的变化;如,如果所有输入都是 1 便无法求解。如果要使用此工具分析事件数据的空间模式,应考虑聚合事件数据。 z 得分和 p 值是统计显著性的量度,用来判断是否拒绝零假设。对于此工具,零假设表示与要素相关的值随机分布。,2.2.2 高/低聚类(Getis-Ord General G),“高/低聚类”工具可返回 5 个值:General G 观测值、General G 期望值、方差、z 得分及 p 值。,2.2.3多距离空间聚类分析(Ri
6、pleys K 函数)的计算,2.2.3 多距离空间聚类分析(Ripleys K 函数),确定要素(或与要素相关联的值)是否显示某一距离范围内统计意义显著的聚类或离散。,2.2.3 多距离空间聚类分析(Ripleys K 函数),确定要素(或与要素相关联的值)是否显示某一距离范围内统计意义显著的聚类或离散。,2.2.3 多距离空间聚类分析(Ripleys K 函数),工具输出是一个包含以下字段的表:ExpectedK 和 ObservedK 分别包含 K 预期值和 K 观测值。DiffK 字段包含 K 观测值与 K 预期值的差值。如果指定了置信区间选项,则附加字段 LwConfEnv 和 Hi
7、ConfEnv 也将包含在输出表中。这些字段包含工具的每个迭代(由距离段数量参数指定)的置信区间信息。K 函数还可以创建图层汇总结果。 如果特定距离的 K 观测值大于 K 预期值,则与该距离(分析规模)的随机分布相比,该分布的聚类程度更高。如果 K 观测值小于 K 预期值,则与该距离的随机分布相比,该分布的离散程度更高。如果 K 观测值大于 HiConfEnv 值,则该距离的空间聚类具有统计学上的显著性。如果 K 观测值小于 LwConfEnv 值,则该距离的空间离散具有统计学上的显著性。 启用以图形方式显示结果参数可以创建汇总工具结果的折线图。预期结果以蓝线表示,而观测结果则以红线表示。观测
8、线在预期线之上表明数据集在该距离内表现为聚类。观测线在预期线之下表明数据集在该距离内表现为离散。折线图以图层方式创建。,2.2.3 多距离空间聚类分析(Ripleys K 函数),工具输出是一个包含以下字段的表:ExpectedK 和 ObservedK 分别包含 K 预期值和 K 观测值。DiffK 字段包含 K 观测值与 K 预期值的差值。如果指定了置信区间选项,则附加字段 LwConfEnv 和 HiConfEnv 也将包含在输出表中。这些字段包含工具的每个迭代(由距离段数量参数指定)的置信区间信息。K 函数还可以创建图层汇总结果。 如果特定距离的 K 观测值大于 K 预期值,则与该距离
9、(分析规模)的随机分布相比,该分布的聚类程度更高。如果 K 观测值小于 K 预期值,则与该距离的随机分布相比,该分布的离散程度更高。如果 K 观测值大于 HiConfEnv 值,则该距离的空间聚类具有统计学上的显著性。如果 K 观测值小于 LwConfEnv 值,则该距离的空间离散具有统计学上的显著性。 启用以图形方式显示结果参数可以创建汇总工具结果的折线图。预期结果以蓝线表示,而观测结果则以红线表示。观测线在预期线之上表明数据集在该距离内表现为聚类。观测线在预期线之下表明数据集在该距离内表现为离散。折线图以图层方式创建。,2.2.4空间自相关 (Global Morans I) 的计算,2.
10、2.4空间自相关 (Global Morans I) 的计算,2.2.4空间自相关(Global Morans I),“空间自相关”工具将返回五个值:Morans I 指数、预期指数、方差、z 得分及 p 值。 用 z 得分或 p 值指示统计显著性时,如果Morans I 指数值为正则指示聚类趋势,如果 Morans I 指数值为负则指示离散趋势。Global Morans I 工具通过计算 z 得分和 p 值来指示您是否可以拒绝零假设。此种情况下,零假设表示要素值随机分布于研究区域中。,2.2.5 z 得分和p 值,大多数统计检验在开始时都首先确定一个零假设。模式分析工具(“分析模式”工具集
11、和“聚类分布制图”工具集)的零假设是完全空间随机性 (CSR),它或者是要素本身的完全空间随机性,或者是与这些要素关联的值的完全空间随机性。模式分析工具所返回的 z 得分和 p 值可以判断出是否可以拒绝零假设。通常,运行其中一种模式分析工具,同时希望 z 得分和 p 值会指明可以 拒绝零假设,因为此工具将表明:要素(或与要素关联的值)会表现出具有统计显著性的聚类或分散,而不是随机模式。只要在空间数据中发现聚类这样的空间结构,就证明某些基础空间过程在发挥作用。 p 值表示概率。是所观测到的空间模式由某一随机过程创建的概率。当 p 很小时(足够小?),意味着所观测到的空间模式不太可能产生于随机过程
12、(小概率),因此您可以拒绝零假设。 Z 得分是标准差的倍数。如返回的 z 得分为 +2.5,我们就会说,结果是 2.5 倍标准差。z 得分和 p 值都与标准正态分布相关联。,2.2.5 z 得分和p 值,在正态分布的尾部出现非常高或非常低的 z 得分(负值),这些得分与非常小的 p 值相关。当得到很小的 p 值以及非常高或非常低的 z 得分时,就表明观测到的空间模式不太可能反映出零假设 (CSR) 所表示的理论上的随机模式。,2.2.5 z 得分和p 值,2.2.5 z 得分和p 值,2.3 “聚类分布制图”工具集,“聚类分布制图”工具可通过执行聚类分析来识别具有统计显著性的热点、冷点和空间异
13、常值的位置。当根据一个或多个聚类的位置需要执行行动时,“聚类分布制图”工具集的用途特别明显。,2.3.1“聚类和异常值分析(Anselin Local Morans I)”的计算,2.3.1“聚类和异常值分析(Anselin Local Morans I)”的计算,2.3.1“聚类和异常值分析(Anselin Local Morans I)”的计算,2.3.1“聚类和异常值分析(Anselin Local Morans I)”,给定一组加权要素,使用 Anselin Local Morans I 统计量来识别具有统计显著性的热点、冷点和空间异常值。 正值 I 表示要素具有包含同样高或同样低的属
14、性值的邻近要素;该要素是聚类的一部分。负值 I 表示要素具有包含不同值的邻近要素;该要素是异常值。在任何一个实例中,要被视为具有统计学上的显著性的聚类和异常值,要素的 p 值必须足够小。,2.3.1“聚类和异常值分析(Anselin Local Morans I)”的计算,基于欧氏距离或者曼哈顿距离的计算需要投影数据来准确测量距离。 对于线和面要素,会在距离计算中使用要素质心。对于多点、折线 (polyline) 或由多部分组成的面,使用所有要素部分的加权平均中心来计算质心。点要素的加权项是 1,线要素的加权项是长度,而面要素的加权项是面积。 输入字段应包含多种值。此方法要求待分析的变量存在一
15、定程度的变化;如果所有输入都是 1 便无法求解。 如果要素的 z 得分是一个较高的正值,则表示周围的要素拥有相似值(高值或低值)。输出要素类中的 COType 字段会将具有统计显著性(0.05 的显著水平)的高值聚类表示为 HH,将具有统计学显著性(0.05 的显著水平)的低值聚类表示为 LL。 如果要素的 z 得分是一个较低的负值(如 -1.96),则表示有一个具有统计显著性(0.05 的显著水平)的空间异常值。输出要素类中的 COType 字段将指明要素是否是高值要素而四周围绕的是低值要素 (HL),或者要素是否是低值要素而四周围绕的是高值要素 (LH)。,2.3.2 热点分析 (Geti
16、s-Ord Gi*)的计算,2.3.2 热点分析 (Getis-Ord Gi*)的计算,为数据集中的每个要素返回的 Gi* 统计就是 z 得分。对于具有显著统计学意义的正的 z 得分,z 得分越高,高值(热点)的聚类就越紧密。对于统计学上的显著性负 z 得分,z 得分越低,低值(冷点)的聚类就越紧密。 此工具使用 z 得分和 p 值为输入要素类中的每个要素创建一个新的输出要素类。如果对于“输入要素类”应用了选择集,则只会对所选要素进行分析,且在“输出要素类”中也将仅显示所选要素。,2.3.2 热点分析 (Getis-Ord Gi*)的计算,z 得分基于随机化零假设进行计算。 基于欧氏距离或者曼
17、哈顿距离的计算需要投影数据来准确测量距离。 对于线和面要素,会在距离计算中使用要素质心。对于多点、折线 (polyline) 或由多部分组成的面,使用所有要素部分的加权平均中心来计算质心。点要素的加权项是 1,线要素的加权项是长度,而面要素的加权项是面积。 输入字段应包含多种值。此统计数学方法要求待分析的变量存在一定程度的变化。,2.4 度量地理分布工具集,2.4.1 中心要素,识别点、线或面要素类中位于最中央的要素。 工具执行过程中会首先对数据集中每个要素质心与其他各要素质心之间的距离计算并求和。然后,选择与所有其他要素的最小累积距离相关联的要素(如果指定权重,则为加权),并将其复制到一个新
18、创建的输出要素类中。 中心要素工具用于创建一个包含了处于最中央位置的要素的新的要素类。,2.4.2 方向分布(标准差椭圆),测量一组点或区域的趋势的一种常用方法便是分别计算 x 和 y 方向上的标准距离。这两个测量值可用于定义一个包含所有要素分布的椭圆的轴线。由于该方法是由平均中心作为起点对 x 坐标和 y 坐标的标准差进行计算,从而定义椭圆的轴,因此该椭圆被称为标准差椭圆。利用该椭圆,您可以查看要素的分布是否是狭长形的,并因此具有特定方向。,2.4.2 方向分布(标准差椭圆),测量一组点或区域的趋势的一种常用方法便是分别计算 x 和 y 方向上的标准距离。这两个测量值可用于定义一个包含所有要
19、素分布的椭圆的轴线。由于该方法是由平均中心作为起点对 x 坐标和 y 坐标的标准差进行计算,从而定义椭圆的轴,因此该椭圆被称为标准差椭圆。利用该椭圆,您可以查看要素的分布是否是狭长形的,并因此具有特定方向。,2.4.2 方向分布(标准差椭圆),2.4.2 方向分布(标准差椭圆),2.4.2 方向分布(标准差椭圆),标准差椭圆工具可为每个案例(案例分组字段参数)都创建一个包含椭圆面的新输出要素类。这些椭圆面的属性值包括平均中心的 X 和 Y 坐标、两个标准距离(长轴和短轴)以及椭圆的方向。字段名分别为 CenterX、CenterY、XStdDist、YStdDist 和 Rotation。如果
20、提供了案例分组字段,同时也会将此字段添加到输出要素类。 基于欧氏距离或者曼哈顿距离的计算需要投影数据来准确测量距离。 如果要素的基础空间模式集中于中心且朝向外围的要素较少(一种空间正态分布),则一个标准差椭圆面约包含聚类中 68 的要素,两个标准差约包含聚类中 95 的要素,三个标准差约包含聚类中 99 的要素。 “旋转”输出字段中的值表示从顶点开始按顺时针方向对长轴测量的旋转度。,2.4.2 方向分布(标准差椭圆),案例分组字段用于在进行分析前将要素分组。如果指定了案例分组字段,会首先根据案例分组字段值对输入要素进行分组,然后再计算每组的标准差椭圆。案例分组字段可以是整型、日期或字符串类型。
21、 可以根据可选的权重字段进行标准差椭圆计算(例如,获取按严重程度衡量的交通事故的椭圆)。“权重字段”应为数字。 对于线和面要素,会在距离计算中使用要素质心。对于多点、折线 (polyline) 或由多部分组成的面,使用所有要素部分的加权平均中心来计算质心。点要素的加权项是 1,线要素的加权项是长度,而面要素的加权项是面积。 地图图层可用于定义输入要素类。在使用带有选择内容的图层时,分析只会包括所选的要素。,2.4.2 方向分布(标准差椭圆),应用: 在地图上标示一组犯罪行为的分布趋势可以确定该行为与特定要素(一系列酒吧或餐馆、某条特定街道等)的关系。 在地图上标示地下水井样本的特定污染可以指示
22、毒素的扩散方式,这在部署减灾策略时非常有用。 对各个种族或民族所在区域的椭圆的大小、形状和重叠部分进行比较可以提供与种族隔离或民族隔离相关的深入信息。 绘制一段时间内疾病爆发情况的椭圆可建立疾病传播的模型。,2.4.3 线性方向平均值,一组线要素的趋势可通过计算这些线的平均角度进行度量。用于计算该趋势的统计量称为方向平均值。尽管统计量本身被称为方向平均值,但它实际上用于测量方向或方位。 许多线状要素指向某一方向(它们都具有一个起点和一个终点)。这类线通常可表示移动对象(例如飓风)的路径。而其他线状要素(例如断层线)则没有起点和终点。这些要素则被认为具有方位而不具有方向。例如,断层线可能具有西北
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- arcgis 空间 统计分析
限制150内