主成分因子分析.docx
《主成分因子分析.docx》由会员分享,可在线阅读,更多相关《主成分因子分析.docx(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、一 主成分分析法的原理主成分分析法是利用降维的思想,在损失很少信息的前提下把多个指标转化为几个综合指标的多元统计方法 这些综合指标通常被称为主成分,主成分相比原始变量而言,具有更多的优越性,即在研究许多复杂问题时不至于丢失太多信息,从而使我们更容易抓住事物的主要矛盾,提高分析效率 该方法的核心就是通过主成分分析,选择n个主分量Y1,Y2,Yn,其中Yi (i=1,2, ,n)为第i个主成分的得分,以主分量Yi 的方差贡献率ai 作为权数,构造综合评价函数:Y=a1Y2+a2Y2+ +anYn,这样当我们把第i个主成分的得分算出来后,便可以很快求出综合得分,并且按照得分的高低来排序 同时我们可以
2、根据第i个主成分的得分来衡量某地区或某企业在第i个主成分所代表的经济效益方面的地位二、主成分分析的基本思想 在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太 多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主成分分析正是适应这一要求产生的,是解决这类题的理想工具。 同样,在科普效果评估的过程中也
3、存在着这样的问题。科普效果是很难具体量化的。在实际评估工作中,我们常常会选用几个有代表性的综合指标,采用打分的方法来进行评估,故综合指标的选取是个重点和难点。如上所述,主成分分析法正是解决这一问题的理想工具。因为评估所涉及的众多变量之间既然有一定的相关性,就必然存在着起支配作用的因素。根据这一点,通过对原始变量相关矩阵内部结构 的关系研究,找出影响科普效果某一要素的几个综合指标,使综合指标为原来变量的线 性拟合。这样,综合指标不仅保留了原始变量的主要信息,且彼此间不相关,又比原始 变量具有某些更优越的性质,就使我们在研究复杂的科普效果评估问题时,容易抓住主 要矛盾。 上述想法可进一步概述为:设
4、某科普效果评估要素涉及个指标,这指标构 成的维随机向量为。对作正交变换,令,其中为正交阵,的各分量是不相关的,使得的各分量在某个评估要素中的作用容易解释,这就使得我们有可能从主分量中选择主要成分,削除对这一要素影响微弱的部分,通过 对主分量的重点分析,达到对原始变量进行分析的目的。的各分量是原始变量线性组合,不同的分量表示原始变量之间不同的影响关系。由于这些基本关系很可能与特定的作用过程相联系,主成分分析使我们能从错综复杂的科普评估要素的众多指标中,找出一些主要成分,以便有效地利用大量统计数据,进行科普效果评估分析,使我们在研究科普效果评估问题中,可能得到深层次的一些启发,把科普效果评估研究引
5、向深入。 例如,在对科普产品开发和利用这一要素的评估中,涉及科普创作人数百万人、科 普作品发行量百万人、科普产业化(科普示范基地数百万人)等多项指标。经过主成分分析计算,最后确定个或个主成分作为综合评价科普产品利用和开发的综合指标,变量数减少,并达到一定的可信度,就容易进行科普效果的评估。 三、主成分分析方法的原理(一)成分分析法是一种降维的统计方法,它借助于一个正交变换,将其分量相关的原随机向量转化成其分量不相关的新随机向量,这在代数上表现为将原随机向量的协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,使之指向样本点散布最开的p 个正交方向,然后对多维变量系统进行降维处
6、理,使之能以一个较高的精度转换成低维变量系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统。 (二)主成分分析的基本思路即:在设计指标体系时尽可能多的选择指标, 然后用一种方这些指标的特点综合而成少数几个新的指标, 这几个新指标既能够尽可能多地反映原来的指标的信息, 而且彼此间又差异显著。如果从数学上对主成分分析进行解释,即为:设有p个原始指标:X1, X2,X3, Xp, 用来对n个单位进行评价, 则共有np个数据。主成分分析的目的是要将这些原始指标组合成新的相互独立的综合指标: y1, y2,y3, yp, 这些综合指标表现为原始指标的线性函数:y1=l11X1+l12X2+l
7、1pXp,y2=l21X1+l22X2+l2pXpYp=lp1X1+lp2X2lppXp通过数学计算可将p个原始指标的总方差分解为p个不相关的综合指标的方差之和 1+ 2+ p, 并使第一个综合指标y1方差达到最大(贡献率最大), 第二个综合指标y2的方差次大, 以此类推,一般前面几个综合指标y1、 y2、 yr(rp) 即可包含总方差中绝大部分,也就是说, 主成分分析可以使原始指标的大部分方差“ 集中” 于少数几个主成分(综合指标)上, 通过对这几个主成分的分析来实现对总体的综合评价。(三)采用主成分分析法进行综合评价的原因第一, 主成分分析的降维处理技术能较好地解决多指标评价的要求。第二,
8、 主成分分析进行多指标综合评价时的权数处理与其他方法相比有很大的区别。主成分分析在进行多指标综合评价时, 权数是从信息量和系统效应角度来确定的。在数理统计中, 信息量通常是用离差平方和或方差来表示的。主成分分析计算综合评价时用的是信息量权数。信息量权数是从指标所含区分样本的信息量多少来确定重要程度的。(四)用主成分分析法进行多指标综合评价的几个优点消除了评价指标间的相关影响。另外, 主成分分析用于多指标综合评价是对彼此独立的分量进行合成, 正适于采用加权线性相合成方法, 不必在合成方法选择上多做工作。减少了指标选择的工作量。在主成分分析中由于可以消除评价指标间的相关影响, 因而在指标选择上相对
9、容易些。但主成分分析法确定评价指标的原则是宁多勿少, 尽可能地全面。主成分分析可以保留原始评价指标的大部分信息。如果指标选择不够全面, 就会先天不足,再好的分析方法也会失去效用。在主成分分析将原始变量变换为成分的过程中, 同时形成了反映成分和指标包含信息量的权数, 以计算综合评价值, 这比人为地确定权数, 工作量少些, 也有助于保证客观地反映样本间的现实关系。此外, 随着电子计算机技术的发展, SAS、 SPSS等商品化统计分析软件的推广与应用, 使得主成分分析在各类综合评价实践中的广泛应用成为现实。四、主成分分析的主要作用概括起来说,主成分分析主要由以下几个方面的作用。 1主成分分析能降低所
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 成分 因子分析
限制150内