计量地理学第五章优秀课件.ppt
《计量地理学第五章优秀课件.ppt》由会员分享,可在线阅读,更多相关《计量地理学第五章优秀课件.ppt(43页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、计量地理学第五章第1页,本讲稿共43页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析1地理要素间的相关分析地理要素间的相关分析一、地理相关的意义一、地理相关的意义所谓相关,是指两个或两个以上的变量间相互关系是否密切。相关分析所谓相关,是指两个或两个以上的变量间相互关系是否密切。相关分析仅限于测定两个或两个以上的变量间相关程度和性质。而地理相关则是仅限于测定两个或两个以上的变量间相关程度和性质。而地理相关则是指应用相关分析法来研究各地理要素间的相互关系和联系强度。指应用相关分析法来研究各地理要素间的相互关系和联系强度。在地理系统中,各要素间存在着各种不同的关系
2、。一种是确定性的关系,在地理系统中,各要素间存在着各种不同的关系。一种是确定性的关系,即函数关系,这在地理系统中比较少见,因为很多地理要素的变化具有即函数关系,这在地理系统中比较少见,因为很多地理要素的变化具有随机性的缘故;另一种关系是相关关系,即要素间既存在较密切的关系,随机性的缘故;另一种关系是相关关系,即要素间既存在较密切的关系,但又不能由一个要素的值精确地求出另一个要素的值。还有一种情况,但又不能由一个要素的值精确地求出另一个要素的值。还有一种情况,是各要素之间完全没有任何关系。如图是各要素之间完全没有任何关系。如图51所示:所示:第2页,本讲稿共43页第五章第五章 地理系统要素间的相
3、关分析与回归分析地理系统要素间的相关分析与回归分析从图中可以看出,若设从图中可以看出,若设x、y为两种地理要素。第一种情况,若为两种地理要素。第一种情况,若y严格随严格随x变化而变化,如变化而变化,如(a)所示,所有观测点均落在直线或曲线上,则称为完全所示,所有观测点均落在直线或曲线上,则称为完全相关或函数关系;第二种情况,若观测点落在直线或曲线两旁,如相关或函数关系;第二种情况,若观测点落在直线或曲线两旁,如(b)所所示,则称为统计相关;第三种情况,若观测点分布散乱,则两种地理要示,则称为统计相关;第三种情况,若观测点分布散乱,则两种地理要素完全无关,相互独立。素完全无关,相互独立。第3页,
4、本讲稿共43页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析二、地理相关程度的度量方法二、地理相关程度的度量方法计量地理学中用不同的指标来度量不同类型的地理相关的程度。计量地理学中用不同的指标来度量不同类型的地理相关的程度。(一)简单直线相关程度的度量(一)简单直线相关程度的度量一般情况下,当两个地理要素间为直线相关时,需要分析其相关程度和一般情况下,当两个地理要素间为直线相关时,需要分析其相关程度和相关方向。所谓相关程度指两者关系的密切程度,而相关方向可分为正相关方向。所谓相关程度指两者关系的密切程度,而相关方向可分为正相关与负相关。前者指两个要素间呈同方
5、向变化,而后者相反。这两者相关与负相关。前者指两个要素间呈同方向变化,而后者相反。这两者可用一个共同的指标度量,就是相关系数。可用一个共同的指标度量,就是相关系数。1.一般常用的相关系数一般常用的相关系数(r)计算公式计算公式其中,其中,第4页,本讲稿共43页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析上式计算出的相关系数,具有下列三点性质:上式计算出的相关系数,具有下列三点性质:(1)相关系数的分布范围,介于)相关系数的分布范围,介于1与与+1之间;之间;(2)当相关系数为正值时,表示两个要素之间为正相关,相关系数为)当相关系数为正值时,表示两个要素之间
6、为正相关,相关系数为负值时,表示两个要素之间为负相关;负值时,表示两个要素之间为负相关;(3)相关系数的绝对值越大,表示两个要素间相关程度越密切。)相关系数的绝对值越大,表示两个要素间相关程度越密切。例例1:北京市多年各月平均气温与:北京市多年各月平均气温与5cm深的平均地温,数据如表深的平均地温,数据如表51所所示。依据相关系数的计算公式可得:示。依据相关系数的计算公式可得:0.9995,由此可见,北京市的各月,由此可见,北京市的各月平均气温与平均气温与5cm的平均地温呈正相关,而且相关极为密切。的平均地温呈正相关,而且相关极为密切。第5页,本讲稿共43页第五章第五章 地理系统要素间的相关分
7、析与回归分析地理系统要素间的相关分析与回归分析2.顺序(等级)相关系数(顺序(等级)相关系数(rs)计算公式)计算公式顺序相关不但适用于数量资料的相关分析,而且适用于质的资料。表示顺序相关不但适用于数量资料的相关分析,而且适用于质的资料。表示两个要素顺序间直线相关程度和方向的系数,称为顺序相关系数。当使两个要素顺序间直线相关程度和方向的系数,称为顺序相关系数。当使用两个要素间的数值计算相关系数不方便时,可用顺序相关系数的计算用两个要素间的数值计算相关系数不方便时,可用顺序相关系数的计算公式来求得。公式来求得。例例2:现仍以北京市各月平均气温与:现仍以北京市各月平均气温与5cm平均地温为例,列成
8、表平均地温为例,列成表52说说明其计算过程。首先将表中两个要素的观测值按大小顺序排列起来,最明其计算过程。首先将表中两个要素的观测值按大小顺序排列起来,最大值排为大值排为1号,依次类推。将两个要素的顺序号相减,即为号,依次类推。将两个要素的顺序号相减,即为d,将其平方,将其平方求和并带入上面公式,即可得到两者的顺序相关系数求和并带入上面公式,即可得到两者的顺序相关系数rs。第6页,本讲稿共43页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析第7页,本讲稿共43页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析(二)简单非线性
9、相关程度的度量(二)简单非线性相关程度的度量表示简单非线性相关程度的统计量,通常用相关指数表示简单非线性相关程度的统计量,通常用相关指数Ryx来度量。相关指来度量。相关指数的性质如下:数的性质如下:(1)相关指数的分布范围介于)相关指数的分布范围介于0到到1之间;之间;(2)相关指数的数值越大,两个要素间的曲线相关程度越密切。)相关指数的数值越大,两个要素间的曲线相关程度越密切。(3)相关指数必大于或至少等于用同一批资料所求得的相关系数的绝)相关指数必大于或至少等于用同一批资料所求得的相关系数的绝对值。对值。第8页,本讲稿共43页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的
10、相关分析与回归分析(三)多要素相关与相关矩阵(三)多要素相关与相关矩阵对于多个地理要素,则可计算出各要素两两之间的相关系数,并构成相对于多个地理要素,则可计算出各要素两两之间的相关系数,并构成相关矩阵。关矩阵。例例3:现给出世界上自然植被的生产量与水热资源的原始地理数据(表:现给出世界上自然植被的生产量与水热资源的原始地理数据(表53),利用相关系数公式得到其相关矩阵,形式如下所示:),利用相关系数公式得到其相关矩阵,形式如下所示:第9页,本讲稿共43页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析三、相关系数的显著性检验三、相关系数的显著性检验为了判定我们
11、所计算出来的相关系数是否有意义,通常还要进一步对相为了判定我们所计算出来的相关系数是否有意义,通常还要进一步对相关系数作显著性检验。关系数作显著性检验。为了使用上方面,前人已经制出了相关系数检验表(附录二)。其中为了使用上方面,前人已经制出了相关系数检验表(附录二)。其中n表示所使用资料的个数(自由度表示所使用资料的个数(自由度f为为n-2),),为信度。为信度。对计算出的相关系数进行显著性检验证明要素间相关程度是显著的之后,对计算出的相关系数进行显著性检验证明要素间相关程度是显著的之后,就可以对其进行进一步的回归分析了。就可以对其进行进一步的回归分析了。第10页,本讲稿共43页第五章第五章
12、地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析2地理要素间的回归分析地理要素间的回归分析一、地理回归分析的意义和作用一、地理回归分析的意义和作用地理系统各要素之间的相互关系,可通过大量的观测、试验或实验取得地理系统各要素之间的相互关系,可通过大量的观测、试验或实验取得一定的地理数据,然后用数理统计的方法,寻找出隐藏在随机性后面的一定的地理数据,然后用数理统计的方法,寻找出隐藏在随机性后面的统计规律,而用回归方程来表达。统计规律,而用回归方程来表达。地理回归分析主要是研究地理要素之间联系的数学表达式,有自变量与地理回归分析主要是研究地理要素之间联系的数学表达式,有自变量与因
13、变量之分,从而可由自变量的取值来预测、延长或插补和控制因变量因变量之分,从而可由自变量的取值来预测、延长或插补和控制因变量的取值,所以它有地理预测的性质。的取值,所以它有地理预测的性质。地理回归分析的主要内容包括:地理回归分析的主要内容包括:1.1.由一组地理数据确定这些要素间的定量数学表达式,即回归模型;由一组地理数据确定这些要素间的定量数学表达式,即回归模型;2.2.利用回归模型,根据自变量的值来预测或控制因变量的取值。利用回归模型,根据自变量的值来预测或控制因变量的取值。第11页,本讲稿共43页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析二、一元地理
14、回归模型的建立二、一元地理回归模型的建立一元地理回归是要解决两个要素间的定量关系。由于两个要素之间的数一元地理回归是要解决两个要素间的定量关系。由于两个要素之间的数量关系类型的差别,一元地理回归包括线性回归模型和非线性回归模型量关系类型的差别,一元地理回归包括线性回归模型和非线性回归模型分述如下:分述如下:(一)一元线性地理回归模型的建立(一)一元线性地理回归模型的建立假设有两个要素(变量)假设有两个要素(变量)x x和和y y。x x为自变量,为自变量,y y为因变量。为因变量。x x可以是降水量、可以是降水量、蒸发量、土壤中的有机质含量等;蒸发量、土壤中的有机质含量等;y y可以是河流径流
15、量、土壤含水量等。可以是河流径流量、土壤含水量等。假定一元线性模型结构为:假定一元线性模型结构为:y yi i=A+Bx=A+Bxi i+i i式中,式中,A A、B B为待定参数,为待定参数,i=1,2,.,ni=1,2,.,n,而(,而(x xi i,y yi i)为)为n n组观测数据,组观测数据,i i为随机变量。参数为随机变量。参数A A、B B一般总是未知的,需根据观测值采用最小二乘一般总是未知的,需根据观测值采用最小二乘法来估计。法来估计。第12页,本讲稿共43页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析设设a a和和b b分别为参数分别为
16、参数A A和和B B的最小二乘估计值,于是便得到了一元线性回归的最小二乘估计值,于是便得到了一元线性回归模型为模型为上式代表上式代表x x和和y y之间关系的最佳拟和直线,通常称为回归直线。它满足之间关系的最佳拟和直线,通常称为回归直线。它满足y y的的实际观测值与回归值之间的误差平方和最小。这就是最小二乘法。实际观测值与回归值之间的误差平方和最小。这就是最小二乘法。1.1.参数参数a a和和b b的最小二乘估计的最小二乘估计根据最小二乘原理,可得根据最小二乘原理,可得a a、b b的计算公式如下:的计算公式如下:第13页,本讲稿共43页第五章第五章 地理系统要素间的相关分析与回归分析地理系统
17、要素间的相关分析与回归分析2.2.一元线性地理回归模型的具体建立方法与步骤一元线性地理回归模型的具体建立方法与步骤建立一元线性地理回归模型,就是用已有的地理数据来确定建立一元线性地理回归模型,就是用已有的地理数据来确定a a和和b b的值。的值。现仍以北京市各月平均气温现仍以北京市各月平均气温x x与与5cm5cm平均地温平均地温y y为例,建立一元线性地理回为例,建立一元线性地理回归模型的过程如下:归模型的过程如下:(1 1)将表中的各项数据代入相应的计算公式,得到)将表中的各项数据代入相应的计算公式,得到a a、b b的数值。的数值。(2 2)当参数)当参数a a与与b b求出后,便可得出
18、一元线性地理回归模型如下:求出后,便可得出一元线性地理回归模型如下:第14页,本讲稿共43页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析3.3.一元线性地理回归模型的效果检验一元线性地理回归模型的效果检验当一元线性地理回归模型求出来以后,它的效果如何,它所揭示的地理当一元线性地理回归模型求出来以后,它的效果如何,它所揭示的地理规律性强不强,用它来进行地理预测精度如何?所有这些问题都需要进规律性强不强,用它来进行地理预测精度如何?所有这些问题都需要进一步作出分析。一步作出分析。(1 1)回归模型估计的误差)回归模型估计的误差由线性回归模型所得到的由线性回归模
19、型所得到的y y的估计值往往与实测值的估计值往往与实测值y y不完全一致,它们之不完全一致,它们之间的误差称为估计误差,以标准差的形式表示为间的误差称为估计误差,以标准差的形式表示为在实际地理问题中,只要比较在实际地理问题中,只要比较S S与允许的偏差即可。与允许的偏差即可。第15页,本讲稿共43页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析(2 2)回归模型的显著性检验)回归模型的显著性检验观测值观测值y yi i与其平均值与其平均值yy的差异可用离差平方和来表示,记为的差异可用离差平方和来表示,记为S S总总。它又可。它又可以进行如下的分解:以进行如下
20、的分解:上式右侧的第一项是所有观测点上式右侧的第一项是所有观测点yiyi与回归值的残差平方和,表示除了与回归值的残差平方和,表示除了x x对对y y的线性影响以外的一切因素对的线性影响以外的一切因素对y y的变异影响,故称为剩余平方和,记作的变异影响,故称为剩余平方和,记作Q Q;第二项反映了在;第二项反映了在y y的总偏差中,由的总偏差中,由x x与与y y的线性关系引起的的线性关系引起的y y的变化分布,的变化分布,故称为回归平方和,记作故称为回归平方和,记作U U。故有:。故有:S S总总U+QU+Q。第16页,本讲稿共43页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间
21、的相关分析与回归分析一个回归效果的好坏取决于一个回归效果的好坏取决于U U在总离差平方和中的比例或者在总离差平方和中的比例或者U U与与Q Q的比值。的比值。若取前者则有:若取前者则有:从从U U与与Q Q比值的大小来考虑,可利用如下的比值的大小来考虑,可利用如下的F F检验方法。检验方法。根据前人的研究,统计量根据前人的研究,统计量F FU/(Q/(n-2)U/(Q/(n-2)符合第一自由度为符合第一自由度为1 1,第二自由,第二自由度为度为n-2n-2的的F F分布,根据前面学习的分布,根据前面学习的F F检验方法,即可对回归模型的显著检验方法,即可对回归模型的显著性进行检验。性进行检验。
22、第17页,本讲稿共43页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析(二)一元非线性地理回归模型的建立(二)一元非线性地理回归模型的建立在许多实际地理问题中,有时两个要素之间的关系并不是线性关系,而在许多实际地理问题中,有时两个要素之间的关系并不是线性关系,而是某种非线性关系,这时我们选择适当的类型曲线比配直线更符合地理是某种非线性关系,这时我们选择适当的类型曲线比配直线更符合地理实际情况。例如:我国武夷山南坡地形高度与年降水量之间的关系,玉实际情况。例如:我国武夷山南坡地形高度与年降水量之间的关系,玉米产量与耗水量之间的关系等等。米产量与耗水量之间的关系
23、等等。对于这一类地理问题,首先需要选配曲线,确定曲线的类型,然后再化对于这一类地理问题,首先需要选配曲线,确定曲线的类型,然后再化曲线回归模型为直线回归模型处理。曲线回归模型为直线回归模型处理。第18页,本讲稿共43页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析1.1.选配曲线的基本方法选配曲线的基本方法根据理论分析、过去的经验或观测数据的根据理论分析、过去的经验或观测数据的分布趋势与特点,来确定两个要素之间的曲线类型及其函数形式,从而分布趋势与特点,来确定两个要素之间的曲线类型及其函数形式,从而求非线性地理回归模型的过程及其方法,叫做曲线选配。求非线性地
24、理回归模型的过程及其方法,叫做曲线选配。一般是先通过变量变化,把非线性函数关系化为线性关系,再采用线性一般是先通过变量变化,把非线性函数关系化为线性关系,再采用线性回归的方法确定参数。当曲线的函数类型确定后,下一步就是求函数中回归的方法确定参数。当曲线的函数类型确定后,下一步就是求函数中的参数的参数a a和和b b。确定参数的办法仍然是最小二乘法。确定参数的办法仍然是最小二乘法。第19页,本讲稿共43页第五章第五章 地理系统要素间的相关分析与回归分析地理系统要素间的相关分析与回归分析2.2.地理上常见的非线性回归模型的建立方法地理上常见的非线性回归模型的建立方法在地理问题上,较常见的曲线类型有
25、:幂函数型、指数函数型、对数函在地理问题上,较常见的曲线类型有:幂函数型、指数函数型、对数函数型等。下面说明不同类型的非线性地理回归模型的建立方法与步骤。数型等。下面说明不同类型的非线性地理回归模型的建立方法与步骤。(1 1)幂函数型)幂函数型两个地理要素之间的幂函数表达式为两个地理要素之间的幂函数表达式为y=axy=axb b对上式两边取常用对数或自然对数,得对上式两边取常用对数或自然对数,得lny=lna+blnxlny=lna+blnx令令Y=lnyY=lny,A=lnaA=lna,X=lnxX=lnx,则上式为,则上式为 Y=A+bX Y=A+bX这样就将曲线模型转化成线性模型了。这样
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 地理学 第五 优秀 课件
限制150内