主成分分析法ppt讲稿.ppt
《主成分分析法ppt讲稿.ppt》由会员分享,可在线阅读,更多相关《主成分分析法ppt讲稿.ppt(48页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于主成分分析法PPT第一页,讲稿共四十八页哦一、主成分分析法概述一、主成分分析法概述u每个人都会遇到有很多变量的数据。u这些数据的共同特点是变量很多,在如此多的变量之中,有很多是相关的。人们希望能够找出它们的少数“代表”来对它们进行描述。u介绍两种把变量维数降低以便于描述、理解和分析的方法:主成分分析(principal component analysis)和因子分析(factor analysis)。实际上主成分分析可以说是因子分析的一个特例。第二页,讲稿共四十八页哦u定义: 主成分分析(Principal Components Analysis ,PCA)也称为主分量分析,是一种通过降
2、维来简化数据结构的方法,即如何把多个变量(变量)转化为少数几个综合变量(综合变量),而这几个综合变量可以反映原来多个变量的大部分信息。主成分:把相关的变量变为无关的主成分。u 注意:进行主成分的变量之间必须要有相关性,经过分析后变量之间独立。第三页,讲稿共四十八页哦二、主成分分析法基本原理二、主成分分析法基本原理u主成分分析就是设法将原来众多具有一定相关性的变量(如p个变量),重新组合成一组新的相互无关的综合变量来代替原来变量。怎么处理?u通常数学上的处理就是将原来p个变量作线性组合作为新的综合变量。如何选择?u如果将选取的第一个线性组合即第一个综合变量记为F1,自然希望F1尽可能多的反映原来
3、变量的信息。怎样反映?第四页,讲稿共四十八页哦u最经典的方法就是用方差来表达,即var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中所选取的F1应该是方差最大的,故称之为第一主成分(principal component I)。u如果第一主成分不足以代表原来p个变量的信息,再考虑选取F2即第二个线性组合。F2称为第二主成分(principal component II)。F1和F2的关系?第五页,讲稿共四十八页哦1 1、基于类型的古村落旅游竞争力分析基于类型的古村落旅游竞争力分析本文以社区参与型古村落为主要研究对象,采用主成分分析法、层次熵法等确定主要的旅游评价指标并获得其贡献指
4、数。三、主成分分析法的应用三、主成分分析法的应用第六页,讲稿共四十八页哦2 2、基于主成分分析的新疆与全国旅游产业竞争力评价基于主成分分析的新疆与全国旅游产业竞争力评价 本文采用主成分分析(PCA)方法,对新疆旅游业的竞争能力与全国其他省、区、直辖市进行比较。对全国31个省、区、直辖市的310个原始数据,根据PCA方法的原理和步骤进行计算机处理,可以得到主成分因子的特征值、贡献率与累积贡献率及因子提取结果。前3个主成分因子的累积贡献率达87.154%,根据累积贡献率大于85%的主成分因子选取原则,选择前3个主成分因子,而且选择的3个主成分因子相互之间不存在相关性。第七页,讲稿共四十八页哦四、主
5、成分分析法的步骤四、主成分分析法的步骤1)数据归一化处理:数据标准化(Z) 2)计算相关系数矩阵R:3)计算特征值; 特征值越大说明重要程度越大。4)计算主成分贡献率及方差的累计贡献率;5)计算主成分载荷与特征向量: 主成分的负荷值大小反映了主成分因子对可测变量的影响程度;载荷值越大说明此变量对主成分的解释越多,及贡献越大。6)写出主成分模型第八页,讲稿共四十八页哦u主成分选取的条件: (1)特征值(特征值1); (2)方差的累计贡献率。(前K个主成分的方差累计贡献率达到了80%或85%,也可以说累计贡献率80%或85%)(较多)。 两个条件满足其一就可以了,究竟以哪个为主依个人情况而定或根据
6、实际情况两个结合使用。如果前K个主成分的累计贡献率达到了85%,则表明取前K个主成分基本包含了全部测量指标所具有的信息,从而达到了变量降维的目的。第九页,讲稿共四十八页哦五、主成分分析法的操作流程第十页,讲稿共四十八页哦第十一页,讲稿共四十八页哦第十二页,讲稿共四十八页哦第十三页,讲稿共四十八页哦第十四页,讲稿共四十八页哦第十五页,讲稿共四十八页哦第十六页,讲稿共四十八页哦uKMO检验是在主成份分析前对数据的分析: KMO越接近于1越好,等于相关系数,0.5就可以。1、相关系数R:KMO检验六、主成分分析法的结果分析六、主成分分析法的结果分析第十七页,讲稿共四十八页哦第十八页,讲稿共四十八页哦
7、2、确定主成分、确定主成分本操作是选择以特征根大于1为标准提取主成分,提取了4个主成分。按照累积方差的观点,应该提取80%或85%的值,本例题提取5个主成分,其累积方差贡献率为85.644,应该提取前五个主成分。 第十九页,讲稿共四十八页哦两个条件都满足第二十页,讲稿共四十八页哦3、写出主成分模型写出主成分模型 第二十一页,讲稿共四十八页哦2、写出主成分模型写出主成分模型 主成分因子载荷矩阵: 载荷值越大,说明此变量对主成分的解释越多,及贡献越大;越大越好。第二十二页,讲稿共四十八页哦 前面的表给出的是因子载荷矩阵,主成分系数应该为特征向量,其换算方法为:用主成分载荷矩阵中的数据除以主成分相对
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 成分 分析 ppt 讲稿
限制150内