主成分分析方法PPT课件优秀PPT.ppt
《主成分分析方法PPT课件优秀PPT.ppt》由会员分享,可在线阅读,更多相关《主成分分析方法PPT课件优秀PPT.ppt(60页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章第六章 地理系统要素的主成分分析地理系统要素的主成分分析 v主成分分析的原理主成分分析的原理v主成分分析的解法主成分分析的解法 v主成分分析方法应用实例主成分分析方法应用实例问题的提出问题的提出v地理系统是多要素的困难系统。变量太多,会增加分析问地理系统是多要素的困难系统。变量太多,会增加分析问题的难度与困难性,而且多个变量之间是具有确定的相关题的难度与困难性,而且多个变量之间是具有确定的相关关系的关系的v能否在相关分析的基础上,用较少的新变量代替原来较多能否在相关分析的基础上,用较少的新变量代替原来较多的旧变量,而且使这些较少的新变量尽可能多地保留原来的旧变量,而且使这些较少的新变量尽
2、可能多地保留原来变量所反映的信息?变量所反映的信息?v主成分分析方法就是综合处理这种问题的一种强有力的工主成分分析方法就是综合处理这种问题的一种强有力的工具。主成分分析是把原来多个变量划为少数几个综合指标具。主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。从数学角度来看,这是一种降维处的一种统计分析方法。从数学角度来看,这是一种降维处理技术理技术1 主成分分析方法的基本原理主成分分析方法的基本原理 假定有假定有n个地理样本,每个样本共有个地理样本,每个样本共有p p个个变量,构成一个变量,构成一个np阶的地理数据矩阵阶的地理数据矩阵v 当当p p较大时,在较大时,在p p维空
3、间中考察问题比较麻烦。维空间中考察问题比较麻烦。为了克服这一困难,就须要进行降维处理为了克服这一困难,就须要进行降维处理.v 要求:较少的几个综合指标尽量多地反映原来要求:较少的几个综合指标尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是较多变量指标所反映的信息,同时它们之间又是彼此独立的彼此独立的例,成果数据v100个学生的数学、物理、化学、语文、历史、英语的成果如下表(部分)。v对对于于多多维维变变量量的的状状况况和和二二维维类类似似,也也有有高高维的椭球,只不过无法直观地望见维的椭球,只不过无法直观地望见v首首先先把把高高维维椭椭球球的的主主轴轴找找出出来来,再再用用代代表表大
4、大多多数数数数据据信信息息的的最最长长的的几几个个轴轴作作为为新新变变量;这样,主成分分析就基本完成量;这样,主成分分析就基本完成v留留意意,和和二二维维状状况况类类似似,高高维维椭椭球球的的主主轴轴也也是是相相互互垂垂直直的的。这这些些相相互互正正交交的的新新变变量量是原先变量的线性组合,叫做主成分是原先变量的线性组合,叫做主成分.v正正如如二二维维椭椭圆圆有有两两个个主主轴轴,三三维维椭椭球球有有三三个个主主轴轴一样,有几个变量,就有几个主成分一样,有几个变量,就有几个主成分v选选择择越越少少的的主主成成分分,降降维维就就越越好好。什什么么是是标标准准呢呢?那那就就是是这这些些被被选选的的
5、主主成成分分所所代代表表的的主主轴轴的的长长度度之之和和占占了了主主轴轴长长度度总总和和的的大大部部分分。有有些些文文献献建建议议,所所选选的的主主轴轴总总长长度度占占全全部部主主轴轴长长度度之之和和的的大大约约85%即即可可,其其实实,这这只只是是一一个个大大体体的的说说法法;具具体体选几个,要看实际状况而定选几个,要看实际状况而定定义:定义:记记x x1 1,x x2 2,x xP P为原变量指标,为原变量指标,z z1 1,z z2 2,z zmm(mmp p)为新变量指标)为新变量指标v系数系数lijlij的确定原则:的确定原则:v zi zi与与zj zj(ijij;i i,j=1j
6、=1,2 2,mm)相互无关)相互无关vz1z1是是x1x1,x2x2,xPxP的一切线性组合中方差最大的一切线性组合中方差最大者,者,z2z2是与是与z1z1不相关的不相关的x1x1,x2x2,xPxP的全部线的全部线性组合中方差最大者;性组合中方差最大者;zm zm是与是与z1z1,z2z2,zmzm1 1都不相关的都不相关的x1x1,x2x2,xPxP,的全部的全部线性组合中方差最大者。则新变量指标线性组合中方差最大者。则新变量指标z1z1,z2z2,zmzm分别称为原变量指标分别称为原变量指标x1x1,x2x2,xPxP的第一,的第一,其次,其次,第,第mm主成分主成分 v从以上的分析
7、可以看出,主成分分析的实质就从以上的分析可以看出,主成分分析的实质就是确定原来变量是确定原来变量xjxj(j=1j=1,2 2,p p)在诸主)在诸主成分成分zi zi(i=1i=1,2 2,mm)上的荷载)上的荷载 lij lij(i=1 i=1,2 2,mm;j=1 j=1,2 2,p p)v从几何上看从几何上看,找主成分的问题找主成分的问题,就是找出就是找出P P维空间维空间中椭球体的主轴问题;从数学上简洁知道,从中椭球体的主轴问题;从数学上简洁知道,从数学上可以证明,它们分别是相关矩阵的数学上可以证明,它们分别是相关矩阵的mm个个较大的特征值所对应的特征向量较大的特征值所对应的特征向量
8、特征值与特征向量与特征值与特征向量与方差方差-协方差矩阵的联系协方差矩阵的联系v例如例如6个样方、个样方、2个种的多度数据是:个种的多度数据是:样方样方1 12 23 34 45 56 6物种物种X X1 15 56 64 46 60 03 3物种物种X X2 211118 87 76 62 22 2数据的中心化数据的中心化样方样方1 12 23 34 45 56 6总和总和物种物种X X1 11 12 20 02 2-4-4-1-10 0物种物种X X2 25 52 21 10 0-4-4-4-40 0中心化后的原始数据矩阵中心化后的原始数据矩阵v把坐标轴把坐标轴X1、X2刚性地旋转刚性地旋
9、转一个角度,得一个角度,得到图中新坐标到图中新坐标轴轴Y1和和Y2Y1Y2v6个样方点在新坐标系中位置的数据为:个样方点在新坐标系中位置的数据为:v与中心化后的原始数据有如下关系:与中心化后的原始数据有如下关系:v每个平方和都是每个平方和都是6个点在相应坐标轴上方差的(个点在相应坐标轴上方差的(6-1)倍)倍 每一项都相当于数据的每一项都相当于数据的离差平方和,因为离差平方和,因为x x1j1j,x,x2j2j与与y y1j1j,y,y2j2j的平均值的平均值都为都为0 0?v由由v它的取值只依靠于坐标轴旋转角度一个变量,取极它的取值只依靠于坐标轴旋转角度一个变量,取极大值的必要条件是对大值的
10、必要条件是对的导数为的导数为0。即。即v =0v =0v所以上述条件等同于所以上述条件等同于v因此,假如原坐标旋转后的因此,假如原坐标旋转后的Y1轴是我们要轴是我们要求的使求的使Var(Y1)最大的直线的话,则必定最大的直线的话,则必定有有Var(Y2)最小,且最小,且 。这说明。这说明6个样方点对新坐标的离差矩阵应为个样方点对新坐标的离差矩阵应为 是是对角矩阵对角矩阵,并且,并且v 和和 是对称离差矩阵是对称离差矩阵S的两个特征根(的两个特征根(),而),而U的每一行是相应的特征向量的每一行是相应的特征向量 一、主成分的基本理论一、主成分的基本理论二、主成分分析的几何说明二、主成分分析的几何
11、说明v进行主成分分析的目的,就是找出转换矩阵进行主成分分析的目的,就是找出转换矩阵U2 主成分分析的解法主成分分析的解法一、用方差一、用方差协方差矩阵求解主成分例协方差矩阵求解主成分例v例例:设有一组古生物腕足动物贝壳标本的两个变量设有一组古生物腕足动物贝壳标本的两个变量:长度和宽度长度和宽度.所测量的数据列于表所测量的数据列于表8-1.X X1 1X X2 2X X1 1X X2 23 32 2121210104 41010121211116 65 513136 66 68 8131314146 61010131315157 72 2131317177 7131314147 78 89 91
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 成分 分析 方法 PPT 课件 优秀
限制150内