欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    主成分分析方法PPT课件优秀PPT.ppt

    • 资源ID:55884055       资源大小:527.50KB        全文页数:60页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    主成分分析方法PPT课件优秀PPT.ppt

    第六章第六章 地理系统要素的主成分分析地理系统要素的主成分分析 v主成分分析的原理主成分分析的原理v主成分分析的解法主成分分析的解法 v主成分分析方法应用实例主成分分析方法应用实例问题的提出问题的提出v地理系统是多要素的困难系统。变量太多,会增加分析问地理系统是多要素的困难系统。变量太多,会增加分析问题的难度与困难性,而且多个变量之间是具有确定的相关题的难度与困难性,而且多个变量之间是具有确定的相关关系的关系的v能否在相关分析的基础上,用较少的新变量代替原来较多能否在相关分析的基础上,用较少的新变量代替原来较多的旧变量,而且使这些较少的新变量尽可能多地保留原来的旧变量,而且使这些较少的新变量尽可能多地保留原来变量所反映的信息?变量所反映的信息?v主成分分析方法就是综合处理这种问题的一种强有力的工主成分分析方法就是综合处理这种问题的一种强有力的工具。主成分分析是把原来多个变量划为少数几个综合指标具。主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。从数学角度来看,这是一种降维处的一种统计分析方法。从数学角度来看,这是一种降维处理技术理技术1 主成分分析方法的基本原理主成分分析方法的基本原理 假定有假定有n个地理样本,每个样本共有个地理样本,每个样本共有p p个个变量,构成一个变量,构成一个np阶的地理数据矩阵阶的地理数据矩阵v 当当p p较大时,在较大时,在p p维空间中考察问题比较麻烦。维空间中考察问题比较麻烦。为了克服这一困难,就须要进行降维处理为了克服这一困难,就须要进行降维处理.v 要求:较少的几个综合指标尽量多地反映原来要求:较少的几个综合指标尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是较多变量指标所反映的信息,同时它们之间又是彼此独立的彼此独立的例,成果数据v100个学生的数学、物理、化学、语文、历史、英语的成果如下表(部分)。v对对于于多多维维变变量量的的状状况况和和二二维维类类似似,也也有有高高维的椭球,只不过无法直观地望见维的椭球,只不过无法直观地望见v首首先先把把高高维维椭椭球球的的主主轴轴找找出出来来,再再用用代代表表大大多多数数数数据据信信息息的的最最长长的的几几个个轴轴作作为为新新变变量;这样,主成分分析就基本完成量;这样,主成分分析就基本完成v留留意意,和和二二维维状状况况类类似似,高高维维椭椭球球的的主主轴轴也也是是相相互互垂垂直直的的。这这些些相相互互正正交交的的新新变变量量是原先变量的线性组合,叫做主成分是原先变量的线性组合,叫做主成分.v正正如如二二维维椭椭圆圆有有两两个个主主轴轴,三三维维椭椭球球有有三三个个主主轴轴一样,有几个变量,就有几个主成分一样,有几个变量,就有几个主成分v选选择择越越少少的的主主成成分分,降降维维就就越越好好。什什么么是是标标准准呢呢?那那就就是是这这些些被被选选的的主主成成分分所所代代表表的的主主轴轴的的长长度度之之和和占占了了主主轴轴长长度度总总和和的的大大部部分分。有有些些文文献献建建议议,所所选选的的主主轴轴总总长长度度占占全全部部主主轴轴长长度度之之和和的的大大约约85%即即可可,其其实实,这这只只是是一一个个大大体体的的说说法法;具具体体选几个,要看实际状况而定选几个,要看实际状况而定定义:定义:记记x x1 1,x x2 2,x xP P为原变量指标,为原变量指标,z z1 1,z z2 2,z zmm(mmp p)为新变量指标)为新变量指标v系数系数lijlij的确定原则:的确定原则:v zi zi与与zj zj(ijij;i i,j=1j=1,2 2,mm)相互无关)相互无关vz1z1是是x1x1,x2x2,xPxP的一切线性组合中方差最大的一切线性组合中方差最大者,者,z2z2是与是与z1z1不相关的不相关的x1x1,x2x2,xPxP的全部线的全部线性组合中方差最大者;性组合中方差最大者;zm zm是与是与z1z1,z2z2,zmzm1 1都不相关的都不相关的x1x1,x2x2,xPxP,的全部的全部线性组合中方差最大者。则新变量指标线性组合中方差最大者。则新变量指标z1z1,z2z2,zmzm分别称为原变量指标分别称为原变量指标x1x1,x2x2,xPxP的第一,的第一,其次,其次,第,第mm主成分主成分 v从以上的分析可以看出,主成分分析的实质就从以上的分析可以看出,主成分分析的实质就是确定原来变量是确定原来变量xjxj(j=1j=1,2 2,p p)在诸主)在诸主成分成分zi zi(i=1i=1,2 2,mm)上的荷载)上的荷载 lij lij(i=1 i=1,2 2,mm;j=1 j=1,2 2,p p)v从几何上看从几何上看,找主成分的问题找主成分的问题,就是找出就是找出P P维空间维空间中椭球体的主轴问题;从数学上简洁知道,从中椭球体的主轴问题;从数学上简洁知道,从数学上可以证明,它们分别是相关矩阵的数学上可以证明,它们分别是相关矩阵的mm个个较大的特征值所对应的特征向量较大的特征值所对应的特征向量特征值与特征向量与特征值与特征向量与方差方差-协方差矩阵的联系协方差矩阵的联系v例如例如6个样方、个样方、2个种的多度数据是:个种的多度数据是:样方样方1 12 23 34 45 56 6物种物种X X1 15 56 64 46 60 03 3物种物种X X2 211118 87 76 62 22 2数据的中心化数据的中心化样方样方1 12 23 34 45 56 6总和总和物种物种X X1 11 12 20 02 2-4-4-1-10 0物种物种X X2 25 52 21 10 0-4-4-4-40 0中心化后的原始数据矩阵中心化后的原始数据矩阵v把坐标轴把坐标轴X1、X2刚性地旋转刚性地旋转一个角度,得一个角度,得到图中新坐标到图中新坐标轴轴Y1和和Y2Y1Y2v6个样方点在新坐标系中位置的数据为:个样方点在新坐标系中位置的数据为:v与中心化后的原始数据有如下关系:与中心化后的原始数据有如下关系:v每个平方和都是每个平方和都是6个点在相应坐标轴上方差的(个点在相应坐标轴上方差的(6-1)倍)倍 每一项都相当于数据的每一项都相当于数据的离差平方和,因为离差平方和,因为x x1j1j,x,x2j2j与与y y1j1j,y,y2j2j的平均值的平均值都为都为0 0?v由由v它的取值只依靠于坐标轴旋转角度一个变量,取极它的取值只依靠于坐标轴旋转角度一个变量,取极大值的必要条件是对大值的必要条件是对的导数为的导数为0。即。即v =0v =0v所以上述条件等同于所以上述条件等同于v因此,假如原坐标旋转后的因此,假如原坐标旋转后的Y1轴是我们要轴是我们要求的使求的使Var(Y1)最大的直线的话,则必定最大的直线的话,则必定有有Var(Y2)最小,且最小,且 。这说明。这说明6个样方点对新坐标的离差矩阵应为个样方点对新坐标的离差矩阵应为 是是对角矩阵对角矩阵,并且,并且v 和和 是对称离差矩阵是对称离差矩阵S的两个特征根(的两个特征根(),而),而U的每一行是相应的特征向量的每一行是相应的特征向量 一、主成分的基本理论一、主成分的基本理论二、主成分分析的几何说明二、主成分分析的几何说明v进行主成分分析的目的,就是找出转换矩阵进行主成分分析的目的,就是找出转换矩阵U2 主成分分析的解法主成分分析的解法一、用方差一、用方差协方差矩阵求解主成分例协方差矩阵求解主成分例v例例:设有一组古生物腕足动物贝壳标本的两个变量设有一组古生物腕足动物贝壳标本的两个变量:长度和宽度长度和宽度.所测量的数据列于表所测量的数据列于表8-1.X X1 1X X2 2X X1 1X X2 23 32 2121210104 41010121211116 65 513136 66 68 8131314146 61010131315157 72 2131317177 7131314147 78 89 9151513139 95 5171713139 98 8171717179 914141818191910107 720202020111112121、方差、方差协方差的计算协方差的计算v主成分分析的实质主成分分析的实质;就是要求出方差就是要求出方差协方差矩阵的特征向量及协方差矩阵的特征向量及其对应的特征值,即要找出方差其对应的特征值,即要找出方差协方差矩协方差矩阵所确定的椭球的主轴,交确定其长度阵所确定的椭球的主轴,交确定其长度方差方差协方差矩阵为协方差矩阵为 求特征值求特征值v特征向量的求解特征向量的求解v当当 时时,v化为联立方程化为联立方程v求得求得 v同理求得同理求得 时的特征向量时的特征向量v算出算出v第一主成分第一主成分I:特征值为:特征值为37.9,特征向量为,特征向量为v其次主成分其次主成分II:特征值为:特征值为6.5,特征向量为,特征向量为v特征向量的方向由特征向量的方向由I、II中包括的两个数字限中包括的两个数字限制制v第一主成分第一主成分Z1的方差为的方差为37.9,其次主成分,其次主成分Z2的方差为的方差为6.5。两者之和恰为。两者之和恰为X1和和X2的总方的总方差差44.4。可见,两个主成分。可见,两个主成分Z1、Z2所代表的所代表的信息分别为信息分别为86%和和14%。假如用。假如用Z1代表原来代表原来的数据的数据,则仅损失信息则仅损失信息14%。但若用。但若用X1和和X2来代表原来的数据,则将损失信息来代表原来的数据,则将损失信息46%或或54%。3、主成分得分的计算、主成分得分的计算v依据(依据(8-3)式,得到主成分的表达式为)式,得到主成分的表达式为原原始始数数据据的的主主成成分分得得分分Z Z1 1Z Z2 2Z Z1 1Z Z2 23.483.480.930.9315.4215.422.42.410.1410.14-3.6-3.616.1716.171.741.747.717.711.21.213.0813.085.795.799.969.96-0.78-0.7819.0819.080.510.5111.4611.46-2.1-2.119.8319.83-0.15-0.156.126.123.933.9321.3321.33-1.47-1.4714.3714.37-3.33-3.3314.4914.495.885.8812.0312.030.060.0619.6519.652.672.679.699.693.453.4520.9720.974.174.1711.9411.941.471.4723.9723.971.531.5316.4416.44-2.49-2.4926.1326.130.960.9611.8511.852.882.8828.228.21.81.816.2616.260.330.33二、主成分分析的步骤二、主成分分析的步骤v对原始地理数据对原始地理数据v进行标准化处理进行标准化处理(标准标准差标准化差标准化),即),即v其中其中v计算相关系数矩阵计算相关系数矩阵Rv计算特征值和特征向量计算特征值和特征向量v依据特征方程依据特征方程 计算特征值,即解计算特征值,即解v的特征多项式,求的特征多项式,求 并使特征值按并使特征值按从大到小的依次排列,即从大到小的依次排列,即v列出关于每个特征值的特征向量列出关于每个特征值的特征向量v|计算主成分贡献率及累计贡献率计算主成分贡献率及累计贡献率 贡献率贡献率:累计贡献率累计贡献率:一般取累计贡献率达一般取累计贡献率达8595%8595%的特征值的特征值所对应的第一、第二、所对应的第一、第二、第、第mm(mpmp)个主成分)个主成分v计算主成分载荷计算主成分载荷(主成分主成分Z Zk k与变量与变量x xi i之间的相关系之间的相关系数数)v各主成分的得分:各主成分的得分:3 特征值与特征向量的计算方法特征值与特征向量的计算方法v雅可比法雅可比法适合于对称矩阵适合于对称矩阵任一实对称矩阵任一实对称矩阵A,均存在一正交变换矩阵,均存在一正交变换矩阵T,使使那么那么 就是就是A的特征向量,的特征向量,T的列向量就是相应的特征向量的列向量就是相应的特征向量二维状况二维状况v如令如令v 则则v将原始矩阵将原始矩阵A化成了对角矩阵化成了对角矩阵 。由于由于T是正交阵,是正交阵,A和和对角线元素之和都等于对角线元素之和都等于a11+a22雅可比法的计算步骤雅可比法的计算步骤v1、选择对称矩阵中非对角线元素最大者,记、选择对称矩阵中非对角线元素最大者,记为为v2、作正交变换、作正交变换假设在原始矩阵的对角线以外元素中,以的确定假设在原始矩阵的对角线以外元素中,以的确定值为最大。设,作一个转轴变换值为最大。设,作一个转轴变换4 主成分分析方法应用实例主成分分析方法应用实例例例2,2,依据表依据表1 1中给出的数据,对某农业生态经济系统中给出的数据,对某农业生态经济系统做主成分分析做主成分分析表表1 1 某农业生态经济系统各区域单元的有关数据某农业生态经济系统各区域单元的有关数据 步步骤骤如如下下:将将表表中中的的数数据据作作标标准准差差标标准准化化处处理理,然后将它们代入公式计算相关系数矩阵然后将它们代入公式计算相关系数矩阵表表2 2相关系数矩阵相关系数矩阵 (2 2)由相关系数矩阵计算特征值,以及)由相关系数矩阵计算特征值,以及各个主成分的贡献率与累计贡献率(见表各个主成分的贡献率与累计贡献率(见表3 3)。由表)。由表3 3可知,第一,其次,第三主成分可知,第一,其次,第三主成分的累计贡献率已高达的累计贡献率已高达86.596%86.596%(大于(大于85%85%),故只须要求出第一、其次、第三主),故只须要求出第一、其次、第三主成分成分z1z1,z2z2,z3z3即可。即可。表表3 3特征值及主成分贡献率特征值及主成分贡献率 (3 3)对于特征值)对于特征值=4.6610=4.6610,=2.0890=2.0890,=1.0430=1.0430分别求出其特征向量分别求出其特征向量e e1 1,e e2 2,e e3 3,再,再用公式计算各变量用公式计算各变量x x1 1,x x2 2,x x9 9在主成分在主成分z z1 1,z z2 2,z z3 3上的载荷(表上的载荷(表4 4)。)。表表4 4 主成分载荷主成分载荷 第一主成分第一主成分z1与与x1,x5,x6,x7,x9呈显出较呈显出较强的正相关,与强的正相关,与x3呈显出较强的负相关,而这呈显出较强的负相关,而这几个变量则综合反映了生态经济结构状况,因几个变量则综合反映了生态经济结构状况,因此可以认为第一主成分此可以认为第一主成分z1是生态经济结构的代是生态经济结构的代表。表。其次主成分其次主成分z2与与x2,x4,x5呈显出较强的正相呈显出较强的正相关,与关,与x1呈显出较强的负相关,其中,除了呈显出较强的负相关,其中,除了x1为人口总数外,为人口总数外,x2,x4,x5都反映了人均占有都反映了人均占有资源量的状况,因此可以认为其次主成分资源量的状况,因此可以认为其次主成分z2代代表了人均资源量表了人均资源量 分析:分析:明显,用三个主成分z1、z2、z3代替原来9个变量(x1,x2,x9),描述农业生态经济系统,可以使问题更进一步简化、明白第三主成分第三主成分z3z3,与,与x8x8呈显出的正相关程度最高,呈显出的正相关程度最高,其次是其次是x6x6,而与,而与x7x7呈负相关,因此可以认为第三呈负相关,因此可以认为第三主成分在确定程度上代表了农业经济结构主成分在确定程度上代表了农业经济结构 另外,表另外,表4 4中最终一列(占方差的百分数),中最终一列(占方差的百分数),在确定程度反映了三个主成分在确定程度反映了三个主成分z1z1、z2z2、z3z3包含原包含原变量(变量(x1x1,x2x2,x9x9)的信息量多少)的信息量多少

    注意事项

    本文(主成分分析方法PPT课件优秀PPT.ppt)为本站会员(1398****507)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开