主成分分析法介绍(15页).doc
《主成分分析法介绍(15页).doc》由会员分享,可在线阅读,更多相关《主成分分析法介绍(15页).doc(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、- 主成分分析方法 我们进行系统分析评估或医学上因子分析等时,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。因此,我们就会很自然地想到,能否在各个变量之间相关关系研究的基础上,用较少的新变量代替原来较多的变量,而且使这些较少的新变量尽可能多地保留原来较多的变量所反映的信息?事实上,这种想法是可以实现的,本节拟介绍的主成分分析方法就是综合处理这种问题的一种强有力的方法。第一节 主成分分析方法的原理主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。假定有n样本,每
2、个样本共有p个变量描述,这样就构成了一个np阶的数据矩阵: (1)如何从这么多变量的数据中抓住事物的内在规律性呢?要解决这一问题,自然要在p维空间中加以考察,这是比较麻烦的。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标来代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多指标所反映的信息,同时它们之间又是彼此独立的。那么,这些综合指标(即新变量)应如何选取呢?显然,其最简单的形式就是取原来变量指标的线性组合,适当调整组合系数,使新的变量指标之间相互独立且代表性最好。如果记原来的变量指标为,它们的综合指标新变量指标为,(mp)。则在(2)式中,系数lij由下列
3、原则来决定:(1)zi与zj(ij;i,j=1,2,m)相互无关;(2)z1是x1,x2,xp的一切线性组合中方差最大者;z2是与z1不相关的x1,x2,xp的所有线性组合中方差最大者;zm是与z1,z2,zm-1都不相关的x1,x2,xp的所有线性组合中方差最大者。且(2)式要求:这样决定的新变量指标z1,z2,zm分别称为原变量指标x1,x2,xp的第一,第二,第m主成分。其中,z1在总方差中占的比例最大,z2,z3,zm的方差依次递减。在实际问题的分析中,常挑选前几个最大的主成分,这样既减少了变量的数目,又抓住了主要矛盾,简化了变量之间的关系。从以上分析可以看出,找主成分就是确定原来变量
4、xj(j=1,2,p)在诸主成分zi(i=1,2,m)上的载荷lij(i=1,2,m;j=1,2,p)。同时,不是别的,而恰好是x1,x2,xp的相关矩阵的特征值所对应的特征向量。且z1方差取到最大就是x1,x2,xp相关矩阵在第一个特征值所对应特征向量处达到。zm方差取到最大就是x1,x2,xp相关矩阵在第m个特征值所对应特征向量处达到。第二节 主成分分析的解法主成分分析的计算步骤通过上述主成分分析的基本原理的介绍,我们可以把主成分分析计算步骤归纳如下:(1)计算相关系数矩阵 (3)在公式(3)中,(i,j=1,2,p)为原来变量与的相关系数,其计算公式为.(4)因为R是实对称矩阵(即rij
5、=rji),所以只需计算其上三角元素或下三角元素即可。(2)计算特征值与特征向量首先解特征方程I-R=0求出特征值i(i=1,2,p),并使其按大小顺序排列,即12,p0;然后分别求出对应于特征值i的特征向量ei(i=1,2,p)。(3)计算主成分贡献率及累计贡献率。一般取累计贡献率达85-95的特征值,所对应的第一,第二,第m(mp)个主成分。(4)计算主成分得分矩阵由此可以进一步计算主成分得分矩阵:Z= (5)进一步还可以根据式:计算各主成分得分:(6)和总得分: (7)主成分分析应用实例实证研究1本文是对实施西部大开发以来的经济增长状况作实证研究,把西部地区10个省(自治区、直辖市)的经
6、济增长状况作为研究对象集,即= 重庆, 四川,贵州,云南,西藏,陕西,甘肃,青海,宁夏,新疆 选取17个经济指标值:即:地区生产总值、财政收入、固定资产投资、城市用水普及率、城市燃气普及率、每万人拥有交通公共车辆、人均城市道路面积、普通高等学校数、每千人医疗卫生机构床位数、居民收入与消费指标等17个经济指标。进行主成分分析:西部地区2011横向因子分析解释的总方差 成份初始特征值提取平方和载入旋转平方和载入合计 方差的 %累积 %合计方差的 %累积 %合计方差的 %累积 %17.30242.95142.9517.30242.95142.9516.51538.32138.32124.57626.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 成分 分析 介绍 15
限制150内