计量地理学第八章主成份精选PPT.ppt
《计量地理学第八章主成份精选PPT.ppt》由会员分享,可在线阅读,更多相关《计量地理学第八章主成份精选PPT.ppt(20页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、计量地理学第八章主成份第1页,此课件共20页哦第八章第八章 地理系统要素关系的主成分分析地理系统要素关系的主成分分析第2页,此课件共20页哦第八章第八章 地理系统要素关系的主成分分析地理系统要素关系的主成分分析问题的提出第3页,此课件共20页哦第八章第八章 地理系统要素关系的主成分分析地理系统要素关系的主成分分析问题的提出第4页,此课件共20页哦第八章第八章 地理系统要素关系的主成分分析地理系统要素关系的主成分分析在地理系统的区域构成分析中,常常用多个指标来分析、比较各个地理区域的在地理系统的区域构成分析中,常常用多个指标来分析、比较各个地理区域的特征和特征和“职能职能”,为地理区域类型的划分
2、和制定区域发展战略提供依据。但由于,为地理区域类型的划分和制定区域发展战略提供依据。但由于指标多会增加分析问题的复杂性,指标多会增加分析问题的复杂性,以少数几个指标或以少数几个指标或“成分成分”来代表多数指标来代表多数指标就就成为分析这类问题的关键。成为分析这类问题的关键。例如:在土地资源研究中,需要对土壤样品进行多指标的分析化验,而这些要素之间很可例如:在土地资源研究中,需要对土壤样品进行多指标的分析化验,而这些要素之间很可能存在密切关系,要考察全部要素或指标,需要做大量重复的工作。而以少数指标代替全能存在密切关系,要考察全部要素或指标,需要做大量重复的工作。而以少数指标代替全部指标,则可以
3、使研究问题简化。部指标,则可以使研究问题简化。本章介绍解决上述问题的数学方法本章介绍解决上述问题的数学方法主成分分析主成分分析,它,它是原始变量的线性组合是原始变量的线性组合,但,但较原始较原始变量更集中、更典型地表明了研究对象的特征变量更集中、更典型地表明了研究对象的特征。第5页,此课件共20页哦第八章第八章 地理系统要素关系的主成分分析地理系统要素关系的主成分分析1主成分分析方法的原理主成分分析方法的原理主成分分析是把原来多个指标化为少数几个综合指标的一种统计方法主成分分析是把原来多个指标化为少数几个综合指标的一种统计方法。设有。设有n个地理区域,每个地理区域测得个地理区域,每个地理区域测
4、得p个指标,总共有个指标,总共有np个观测数据。若个观测数据。若n=100,p=10,则有,则有1000个地理数据。如何从这么多指标的数据中抓住地理事物个地理数据。如何从这么多指标的数据中抓住地理事物的内在规律性呢?的内在规律性呢?如前所述,多数情况下,指标之间存在着相关关系,这时要弄清楚它们的规律如前所述,多数情况下,指标之间存在着相关关系,这时要弄清楚它们的规律须在须在p维空间中加以考察,这是比较麻烦的。为了克服这个困难,一个自然的想维空间中加以考察,这是比较麻烦的。为了克服这个困难,一个自然的想法是法是找较少的综合指标来代表原来较多的指标,而这些综合指标既能尽量多地反映找较少的综合指标来
5、代表原来较多的指标,而这些综合指标既能尽量多地反映原来的信息,彼此之间又是独立的原来的信息,彼此之间又是独立的。综合指标如何选取呢?通常是取原指标的线性组合,适当调整它们的系数,使综合指标如何选取呢?通常是取原指标的线性组合,适当调整它们的系数,使综合指标之间相互独立且代表性最好。综合指标之间相互独立且代表性最好。第6页,此课件共20页哦第八章第八章第八章第八章 地理系统要素关系的主成分分析地理系统要素关系的主成分分析地理系统要素关系的主成分分析地理系统要素关系的主成分分析如果原来的单项指标记为如果原来的单项指标记为x1,x2,.xp;它们的综合指标记为;它们的综合指标记为z1,z2,.zm(
6、mp)。特别当)。特别当p=2时,原指标是时,原指标是x1,x2。设设n个散布点大致为一个椭圆形。如图个散布点大致为一个椭圆形。如图81,若在椭圆长轴方向取坐标,若在椭圆长轴方向取坐标z1,短短轴方向取坐标轴方向取坐标z2,这相当于在平面上作一个坐标变换,变换后的坐标具有下述性质:,这相当于在平面上作一个坐标变换,变换后的坐标具有下述性质:(1)n个点的坐标个点的坐标z1和和z2的相关性几乎为零;的相关性几乎为零;(2)二维平面上)二维平面上n个点的波动大部分可以归结为个点的波动大部分可以归结为z1轴上的波动。轴上的波动。第7页,此课件共20页哦第八章第八章 地理系统要素关系的主成分分析地理系
7、统要素关系的主成分分析于是称于是称z1和和z2是原指标是原指标x1和和x2的主成分。如果图的主成分。如果图81的椭圆是相当扁平的,则可以考的椭圆是相当扁平的,则可以考虑虑z1方向上的波动,忽视方向上的波动,忽视z2方向的波动,不会犯很大错误。方向的波动,不会犯很大错误。z1就是就是x1和和x2的综合指标。的综合指标。显然有显然有z1=l11x1+l12x2。反映反映n个点波动情况的整体离差平方和满足如下关系:个点波动情况的整体离差平方和满足如下关系:所谓所谓z1反映的信息就是其相关部分在整个离差平方和中的比例,这个比例越大越好。主成反映的信息就是其相关部分在整个离差平方和中的比例,这个比例越大
8、越好。主成分分析就是找出原指标的一系列综合指标,并计算各个综合指标的离差平方和,选取数值分分析就是找出原指标的一系列综合指标,并计算各个综合指标的离差平方和,选取数值较大的几个作为主成分,以作为后面分析的基础。较大的几个作为主成分,以作为后面分析的基础。第8页,此课件共20页哦基本原理 问题的提出:有n个地理样本,每个样本共有p个变量,构成一个np阶的地理数据矩阵 当p较大时,在p维空间中考察问题比较麻烦。定义:(记x1,x2,xP为原变量指标,z1,z2,zm(mp)为新变量指标)(1)(2)第9页,此课件共20页哦z1,z2,zm分别称为原变量指标x1,x2,xP的第一,第二,第m主成分。
9、主成分分析的主要任务就是确定每一个主成分主成分分析的主要任务就是确定每一个主成分Z Zi在在原变量原变量x xj上的载荷上的载荷l lij系数lij的确定原则:zi与zj(ij;i,j=1,2,m)相互无关;z1是x1,x2,xP的一切线性组合中方差最大者,z2是与z1不相关的x1,x2,xP的所有线性组合中方差最大者;zm是与z1,z2,zm1都不相关 的x1,x2,xP的所有线性组合中方差最大者。第10页,此课件共20页哦计算步骤 计算相关系数矩阵 rij(i,j=1,2,p)为原变量xi与xj的相关系数。计算步骤:解特征方程,求出特征值,并使其按大小顺序排列,即 分别求出对应于特征值的特
10、征向量 要求=1,即,其中表示向量的第j个分量。计算主成分贡献率及累计贡献率(3)第11页,此课件共20页哦(5)(6)各主成分的得分:计算主成分载荷累计贡献率:贡献率:第12页,此课件共20页哦第八章第八章 地理系统要素关系的主成分分析地理系统要素关系的主成分分析2主成分分析的解法主成分分析的解法下面用一个简单的例子来说明主成分分析的解法。下面用一个简单的例子来说明主成分分析的解法。设有一组古生物腕足动物贝壳标本的两个变量:长度和宽度。所测量的数据设有一组古生物腕足动物贝壳标本的两个变量:长度和宽度。所测量的数据列于表列于表81。图。图82是数据的散布图。是数据的散布图。第13页,此课件共2
11、0页哦第八章第八章第八章第八章 地理系统要素关系的主成分分析地理系统要素关系的主成分分析地理系统要素关系的主成分分析地理系统要素关系的主成分分析表表81中中x1为贝壳长度,其方差为贝壳长度,其方差2 2x x1 1=20.3=20.3;x x2 2为贝壳宽度,其方差为贝壳宽度,其方差2 2x x2 2=24.1=24.1;x x1 1与与x x2 2的协方差的协方差COVCOV(x x1 1,x,x2 2)=COV=COV(x x2 2,x,x1 1)=15.6=15.6。可用方差协方差矩阵表示。可用方差协方差矩阵表示。我们可以在同一坐标系统中,用向量来表示方差和协方差,如图我们可以在同一坐标
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 地理学 第八 成份 精选 PPT
限制150内