第六章 空间统计分析.ppt
《第六章 空间统计分析.ppt》由会员分享,可在线阅读,更多相关《第六章 空间统计分析.ppt(60页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章第六章 空间统计分析空间统计分析6.1 属性数据统计分析6.2 回归分析6.3 GIS数据内插方法6.4 景观格局分析6.1 6.1 属性数据统计分析属性数据统计分析1 属性数据的集中特征数(1)频数和频率 将变量xi(i1,n)按照大小顺序排列,并按一定的间距分组,变量在各组出现或发生的次数称为频数;各组频数与总频数之比叫做频率。计算出各组的频率后,可以作出频率分布图,若以纵轴表示频率,横轴表示分组,就可以作出频率直方图,用以表示事件发生的频率和分布状况。分组编号分组编号 数值数值 频数频数 频率频率 1(13)1,1,2,3,3,3 6 0.24 2(46)4,5,5,6 4 0.1
2、6 3(79)7,8,8,8,9 5 0.204(1012)10,10,11,12 4 0.165(1315)13,13,14,14,15,15 6 0.24频率分布表频率直方图(2)平均数 平均数反映了数据取值的集中位置。对于数据Xi(i1,2,n),通常有简单算术平均数、加权算术平均数、调和平均数和集合平均数。简单算术平均数:将所有数据的数值相加,再除以数据的总数目,公式为 加权算术平均数:当数据对数据总体的影响的权重值不同时,计算该平均数,将每个数据乘以权值后再相加,所得到的和除以数据的总体权重数,计算公式为 调和平均数:各个数据的倒数的算术平均数的倒数,又称为倒数平均数,调和平均数也分
3、简单调和平均数和加权调和平均数,其公式分别为 几何平均数:是n个数据连乘的积开n次方根,计算公式为(3)数学期望 以概率为权值的加权平均数称为数学期望,其计算公式为其中,Pi为事件发生的概率。(4)中位数 对于有序排列的数据集X,位于中间位置的数据即为中位数。中位数可以代替算术平均数反映某种现象变化的一般水平,不受极端值的影响。在有极大值和极小值的有序数据集中,当数据的个数n为奇数时,(n+1)/2位数为中位数;n为偶数时,n/2和(n/2)+1位的两个数的平均值即为中位数。(5)众数 众数是一个数据集或一组变量中出现次数最多的数据或变量。众数可能不唯一,也不受极端值的影响,在总体数据数目或变
4、量数目较多的情况下,它反映数据或变量分布的集中趋势。2 属性数据的离散特征数(1)极差 极差是一组数据中最大值与最小值之差,即RMaxx1,x2,xnMinx1,x2,xn 根据定义,一个数据集的离差和恒等于0。若将离差取绝对值后求和,再取平均值,得到平均离差:(2)离差、平均离差与离差平方和 一组数据中的各数据值与其平均数之差称为离差,即:离差平方和:平均离差和和离差平方和是表示各数值相对于平均数得离散程度的重要统计量。(3)方差与标准差 方差是均方差的简称,是以离差平方和除以变量个数求得的,记为s2,即:(4)变差系数 变差系数用来衡量数据相对变化的程度:标准差是方差的平方根,记为3 属性
5、数据的图表分析(1)直方图 根据属性数据的某一属性特征值的分布区间将其标识在二维坐标系中,一个坐标轴代表了属性特征值的值域,另外一个坐标轴代表了对应每一属性特征值的数目。直方图可以很好地反映属性数据的分布趋势。(2)散点图 散点图一般是在二维平面上表示。以属性数据的两个属性特征值作为坐标轴,将属性数据标识在二维坐标系中,形成二维空间中的一些离散点。通过判断这些离散点的相互关系,进而确定两种属性的相互关系及其相关性。(3)折线图 以属性数据的两个属性特征值作为坐标轴,将属性数据标识在二维坐标系中,然后沿着一个坐标轴的方向,将这些属性数据连线,构成折线图,反映了一种属性随着另外一种属性持续变化的发
6、展动态及变化趋势。(4)柱状图 柱状图是用长方形的条柱表示属性数据,而条柱的长度则表示为某一属性的大小,可以用条柱的颜色和文理来表示不同的属性特征。有水平条柱图和竖直条柱图之分。(5)饼状图 在表示属性数据的某些特征时,一个饼状图分为若干扇形,每个扇形代表了一个属性数据,该扇形的面积或者弧长则表示该属性数据的一个属性特征在众多属性数据中所占的比重。属性数据越多,用饼状图表示的效果越差。4 属性数据的综合评价(1)主成分法 在处理实际问题时,多个变量之间经常存在一定的相关性,为了降低分析时间和分析难度,提高分析效率,希望能够用较少的几个变量来代替原有的多个变量,且要求这较少的几个变量能够尽可能反
7、映原有的多个变量的信息,主成分法就是这样一种降维方法。基本原理 主成分分析是把多个变量划分为少数几个综合指标的一种统计分析方法,从数学角度看,是一种降维处理技术。假定有n个地理样本,每个样本都有p个变量,则构成一个np矩阵:x11 x12 x1px21 x22 x2p xn1 xn2 xnpX=记原来的变量指标为 x1,x2,xp,新变量指标为z1,z2,zm(mp),则 当p较大时,如果在p维空间中考察问题,问题比较复杂,需要进行降维。z1 a11x1a12x2a1pxp z2 a21x1a22x2a2pxp zm am1x1am2x2ampxn 系数aij确定原则:(i)zi和zj相互无关
8、;(ii)z1是x1,xp的一切线性组合中方差最大者;z2是与z1不相关的x1,xp的所有线性组合中方差最大者;zm是与z1,xm-1不相关的x1,xp的所有线性组合中方差最大者。这样确定的新变量z1,z2,zm(mp)分别称为原变量x1,x2,xp的第1、第2、第m主成分。其中z1在总方差中占的比例最大,z2,zm 方差依次递减。找主成分就是确定原来变量xj在诸主成分zi上的荷载aij,他们分别是x1,x2,xp的相关矩阵的m个较大的特征值所对应的特征向量。计算步骤(i)计算相关系数矩阵r11 r12 r1pr21 r22 r2p rp1 rn2 rppR=公式(1)(ii)计算特征值与特征
9、向量 解特征方程I-R=0 求出特征值i(i=1,p),并使其按照大小顺序排列,即12p0,然后分别求出对应于特征值i的特征向量ei(i=1,p)。(iii)计算主成分贡献率及累计贡献率 主成分zi的贡献率为:累计贡献率为:(i=1,p)一般取累计贡献率85%95%的特征值1,2,m所对应的第1,第2,第m个主成分。(iv)计算主成分载荷 应用实例样本序号人口密度人均耕地面积森林覆盖率农民人均收入人均粮食产量经济作物比例耕地面积比例果园与林地比例灌溉田面积比例1363.90.35216.1019229526.7418.492.23126.262141.51.68424.30175245232.
10、3114.461.45527.063100.61.06765.60118127018.260.1627.47212.484143.71.33633.20143635417.4811.801.89217.5320117.61.24554.5080517518.105.7890.0488.461(i)计算相关系数矩阵 x1 x2 x3 x4 x5 x6 x7 x8 x9 x1 1.000 -0.327 -0.714 -0.336 0.309 0.408 0.709 0.156 0.744 x2 -0.327 1.000 -0.035 0.644 0.420 0.255 0.009 -0.078 0
11、.094 x3 -0.714 -0.035 1.000 0.070 -0.740 -0.755 -0.930 -0.109 -0.924 x4 -0.336 0.644 0.070 1.000 0.383 0.069 -0.046 -0.031 0.073 x5 0.309 0.420 -0.740 0.383 1.000 0.734 0.672 0.098 0.747 x6 0.408 0.255 -0.755 0.069 0.734 1.000 0.658 0.222 0.707 x7 0.709 0.009 -0.930 -0.046 0.672 0.658 1.000 -0.030 0
12、.890 x8 0.156 -0.078 -0.109 -0.031 0.098 0.222 -0.030 1.000 0.290 x9 0.744 0.094 -0.924 0.073 0.747 0.707 0.890 0.290 1.000 (ii)由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率。主成分 特征值 贡献率(%)累积贡献率(%)z1 4.661 51.791 51.791 z2 2.089 23.216 75.007 z3 1.043 11.589 86.596 z4 0.507 5.638 92.234 z5 0.315 3.502 95.736 z6 0.1
13、93 2.140 97.876 z7 0.114 1.271 99.147 z8 0.045 0.504 99.650 z9 0.031 0.350 100.00 根据上表中的数据,第一、第二、第三主成分的累积贡献率已经达到了86.596%,因此只需要求出这三个主成分z1、z2、z3即可。(iii)对于特征值1=4.661,2=2.089,3=1.043分别求出其特征向量e1、e2、e3,再计算出各变量x1,x2,x9在主成分z1、z2、z3上的载荷。z1 z2 z3 占方差的百分数(%)x1 0.739 -0.532 -0.006 82.918 x2 0.123 0.887 -0.002 8
14、0.191 x3 -0.964 0.009 0.009 92.948 x4 0.004 0.868 0.003 75.346 x5 0.813 0.444 -0.001 85.811 x6 0.819 0.179 0.125 71.843 x7 0.933 -0.133 -0.251 95.118 x8 0.197 -0.100 0.970 98.971 x9 0.964 -0.002 0.009 92.939 从表中可以看出:第一主成分z1与x1(人口密度),x5(人均粮食产量),x6(经济作物比例),x7(耕地比例),x9(灌溉田比例)呈现出较强的正相关,与x3呈现出较强的负相关,这几个变
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第六章 空间统计分析 第六 空间 统计分析
限制150内