主成分分析与因子分析关系探讨及软件实现.pdf
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《主成分分析与因子分析关系探讨及软件实现.pdf》由会员分享,可在线阅读,更多相关《主成分分析与因子分析关系探讨及软件实现.pdf(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、主成分分析与因子分析关系探讨及软件实现O 弓I 畜别、德山(辽宁师范大学数学学院,辽宁大连11 6 0 2 9)摘要:文章论述了主成分分析与因子分析之间的区别与联系同时指出S P S S 软件实现主成分分析的错误之处,并给出其正确的实现方法。另外,针对文献【4,5 1 中提出的因子分析模型精确解加以探讨,指出其精确解实际上就是主成分解,并以具体实例加以说明。关键词:主成分分析;因子分析;特征值;特征向量;栽荷矩阵中图分类号:0 2 1文献标识码:A文章编号:1 0 0 2 6 4 8 7(2 0 0 8)1 3-0 1 5 3 0 3实际中所研究的问题经常涉及多个指标变量由于变量个数太多,并且
2、彼此之问存在一定的相关性使得数据存在着一定的信息重叠。于是人们希望能用较少的综合变量来代替原来信息冗余的较多的变量,且这几个综合变量又能充分反映原来变量的信息。且彼此之间不相关。主成分分析就是将多个指标化为少数几个综合指标的统计方法。因子分析是主成分分析的推广因子分析的目的是用几个潜在的随机量去描述多变量间的协方差关系,这些随机量叫做因子。因子分析与主成分分析存在密切的联系,但也有显著的区别。目前已经有很多软件能够实现主成分分析和因子分析,其中最常用的是S P S S 和S A S。S P S S 并没有单独实现主成分分析的功能模块而是将其嵌入在因子分析模块中。这也使得在应用时容易造成二者之间
3、的混淆。本文将阐述它们之间的区别与联系,从而揭示二者之间的易混淆之处并给出其正确的软件实现方法。另外,本文将针对文献【4,5】中的因子分析模型精确解展开一些讨论。1主成分分析与因-T-f r#i t l,2 31 1 主成分分析设研究对象涉及P 个指标,分别用X。,X 2,X。表示,这P 个指标构成的P 维随机向量为x=(x。,X 2,X p)7。设随机向量X 的均值为斗,协方差矩阵为。主成分分析就是对X进行线性变换以形成新的综合变量用Y 表示,即满足下式:Y i-u X+1 1 一+u P i=l,2,p(1)为了使新的综合变量能够充分反映原来变量的信息希望Y;的方差尽可能大且各Y;之间不相
4、关。由于没有限制条件方差可以任意大,于是有下面的约束条件:u i l 2-b l l i 2 2+u 占l(i=l,2,p)。满足条件的Y 被称为第i 个主成分。理沦推导可知主成分可以由协方差矩阵求出。设协方差矩阵的特征值一特征向量对为(入U),供,u p),其中入-入2 入。I 0,则第i 个主成分为Y;-1 1 于是有v a r(Y J=k。一般选取累计贡献率达到8 5 以上的前几个主成分作为研究的指标。主成分的选取也要考虑其解释能力。当协方差矩阵未知时,一般南样本协方差矩阵来代替。主成分也可以由相关矩阵求出但其结果有时与协方差矩阵求出的结果是不同的。一般为了消除量纲的影响经常由相关矩阵求
5、主成分。当数据被标准化处理后,协方差矩阵和相关矩阵是相同的。1 2 因子分析主成分分析是将原始变星综合成若干个主成分变量来表示,而因子分析是将原始变量用若干个公共的因子变量来表示。因子分析有R 型因子分析和Q 型因子分析,这里我们只讨论R 型因子分析。为了方便这里把原始变量及标准化后的变量均用X 表示,F 1,F z,,蹦m p),表示标准化后的公共因子。构造因子分析模型需要以下条件满足:(1)X=()(1,x 2,x p)7 是可观测随机向量,E(X)-0,C O V()【)=,这里将X 看作是标准化变量。所以协方差矩阵与相关矩阵R 相等。(2)F=伊I,F 2,,F J 7(m p)是不可
6、观测的变量E(D-0,c o v(D:I,即F 的各分量是互不相关。(3)e=(8 I,8 2,8 p)7 与F 互不相关,且E(e)-0,协方差矩阵为对角矩阵。=d i a g(t r u 2,c r 2 2 2,叮0,即8 的各分量之间也是互不相关的。因子分析模型为X i=a l l F l+a 垃F 一+a h。F:一i,i=l,2,p(2)模型(2 1 写成矩阵形式为:X=A F+8。(3)a“1其中,A=l;il,F 为公共因子A 为因子载荷矩阵,e【J为特殊因子。由因子分析假设易知C O v()【。D=a i i,由于都是标准化变量,所以也是二者的相关系数。称h i 2=a i l
7、 2+a 淑i-l,2,统计与决策2 0 0 8 年第1 3 期(总第2 6 5 期)1 5 3 万方数据p)为x i 的共同度,其表明X;对公共因子的依赖程度,其值越大表明公共因子解释X;方差的比例越大,因子分析的效果越好。另外g j 2=a-j 2+2 0=1,2,-,m),为公共因子E 对x 所提供的方差贡献。通过该值的大小可以提炼出最有影响的公共因子。2 主成分分析与因-子J Y T 的区别与联系由前所述我们不难理解求主成分相对简单。只要求出协方差矩阵(或相关矩阵)的特征值和特征向量,然后通过式(1)就可以计算出主成分得分,进而完成主成分分析。而因子分析可分为确定因子载荷、因子旋转及计
8、算因子得分三个步骤。确定因子载荷的方法有主成分法、主轴因子法、极大似然法等。不管何种方法确定的初始因子载荷矩阵都不是唯一的。其因子的意义往往含糊不清。为此,往往采用因子旋转的方法得到更明确、更具实际意义的公共因子。因子旋转法有正交旋转和斜交旋转等。因子载荷矩阵确定以后,还要计算各个因子得分。由于公共因子是不可观测的,一般通过式(2)无法直接计算因子得分。计算因子得分的方法有加权最d*-乘法、回归法等。由此可知因子分析的意义更广泛。因子分析中确定因子载荷矩阵的主成分法可以建立因子分析与主成分分析之间的联系。下面给出确定因子载荷矩阵的主成分法。由于式(1)中各个特征向量是正交的,因此很容易得到由Y
9、 到X 的转换关系:X i-u u Y I+u J 一+u _ Y P i=l,2,P”只保留前m 个主成分而把后面的部分用;代替,则(4)变为:X i-U I i Y l+u z Y 2+u d Y。I+扣i=l,2,p(5)(5)式在形式上与因子分析模型(2)是一致的,且X(i-1,2,m)之间互不相关。为了使Y;为满足条件的公共因子,只需将其标准化。于是令F i=Y i k i i,a i i、ku i,则(5)变为:X;=a l l F l+a 岔F 一+a i。F m+8 j i=l,2,p(6)于是根据主成分法求得的初始因子载荷矩阵(未旋转)为:A=(、入IU b、入2u 2 。、
10、入l。u J式(7)正是主成分分析与因子分析的联系所在。当然因子分析可进一步进行因子旋转而得到最终的因子载荷矩阵。3主成分分析的S P S S 软件实现下面给出主成分分析的S P s S 软件实现方法,并与S A S软件的结果进行比较。S P S S 软件中没有单独的主成分分析模块,而是将其嵌入在因子分析模块中但应用时很容易将二者混淆,进而导致错误的结果。目前很多关于S P S S 软件的书上介绍主成分分析的操作步骤都是不完善的,原因是所做的结果实际上是未旋转的因子分析。下面以文献【3 中的一个例子来说明正确的操作方法。该例是随机抽取的3 0 名学生的数据,包括身高、体重、胸围和坐高四个指标。
11、这里略去原1 5 4统计与决策2 0 0 8 年第1 3 期(总第2 6 5 期)始数据。S P S S 软件实现主成分分析的步骤为:(1)选A n a l y 距一D a t aR e d u c t i o n-*F a c t o r 打开因子分析对话框;(2)将四个指标变量选入V 商a b l e s 窗1 2 1 中;(3)在D e s c r i p t i v e s 按钮的对话框下选中c o e f f i c i e n t s。表明按照相关矩阵计算;在E x t r a c t i o n按钮对话框下M e t h o d 下选P r i n c i p a lc o m
12、p o n e n t s,E x t r a c tN u m b e ro ff a c t o r s 取2;(4)R o t a t i o n 按钮对话框下,M e t h o d 选N o n e,表示不旋转;(5)S c o r e s 按钮对话框下,选中S a v ea sv a r i a b l e s。M e t h o d 选R e g r e s s i o n;(6)点击O K 完成。前两个特征值为3 5 4 1 和0 3 1 3 主成分的累计贡献率为9 6 3 6。表l 列出了前1 0 个样本的得分情况,即F,F 2。注意这里并不是主成分得分,而是因子得分很多教材
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 成分 分析 因子分析 关系 探讨 软件 实现
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内