主成分分析在SPSS中的应用.doc
《主成分分析在SPSS中的应用.doc》由会员分享,可在线阅读,更多相关《主成分分析在SPSS中的应用.doc(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、山西农业大学学报 第 6 卷 J. Shanxi Agric . Univ . ( 第 5 期 ) No. 5 Vol . 000006 6 2007 主成分分析在 S P SS 何亮 ( 山西财经大学 管理科学与工程学院 , 中的应用 山西 太原 030012) 摘 要 : 主成分分析是利用降维的思想 , 在损失很少信息的前提下把多个指标转化 为几个综合指 标的多元统计方法 。 这里主要解释主成分分析方法的基本 理论 , 计软件中实现的方法 。 关键词 : 主成分分析 ; SPSS 在实际 当中的作 用和在 SP SS 统 中图分类号 : C931 1 文献标识码 : A 文章 编号 : 1
2、671 816X ( 2007) 05 0020 03 Principal Components Analysis in SPSS HE Liang ( M anagement Science and Engineer ing D ep ar tment , ics , T aiy uan S hanx i 030012, China) Shanx i Univer sity of Finance and E conom Abstracts: Pr incipal components analy sis is a way of multivariate St atistical analys
3、is w hich make many index es be less o nes w ith a few info rmations lo st. Based on the data reduction. In this ar ticle, it mainly make clear the theor y of principal co mpo nents Analysis and the w ay to SPSS. Key words: P rincipal co mpo nents analysis, SPSS implement it in 一 、 主成分分析的基本原理 ( 3) (
4、4) 主成分保留了原始变量绝大多数 信息。 各主成分之间互不相关。 1、主成分分析概述 主成分分析 ( Pr incipal com po nents analy sis) 也 称 主分 3、主成分分析的基本理论 : 设对某 一事 物的 研 究涉 及 p 个 指 标 , 分别 用 X1 , X 2, 量分析 , 是由 霍特 林 ( H otelling ) 于 1933 年 首先 提 出 的。 , Xp 表示 , 这 p 个指标构成 的 p 维 随机向 量为 X= ( X 1, 主成分分析是利用降维的思想 , 在损失很 少信息的前提下把 X2 , ! 。 , Xp ) 。设随机向 量 X 的
5、均值 为 , 协 方 差矩 阵 为 多个指标转化为几个综合指标的多元统计方法。通常把转化 生成的综合指标称之为主成分 , 其中每个主成分都是原始变 对 X 进行线性变 换 , 可以 形成 新的综 合变 量 , 用 Y 表 量的线 形组合 , 且各个主成分之间互不相关 , 这就使得主成 示 , 也就是说 , 新的综 合变量可 以由原 来的变 量线 性表示 , 分比原始变量具有某些更优越的性能。这样在研究复杂问题 时就可以只考虑少数几个主成分而不至于损失太多信息 , 从 而更容易抓住主要矛盾 , 揭 示事物 内部变 量之间 的规律 性 , 同时使问题得到简化 , 提高分析效率。 2、主成分分析基本
6、思想 即满足下式 : Y 1 = u11 Y 2 = u21 Y p = up1 X1 + X1 + X1 + u12 u22 up2 X2 + X2 + X2 + + + + u u u 1p 2p pp X X X p p p 在对某一事物进行实证研究中 , 为了更全面、准确地反 由于可以任意地对原始变量 进行上述线性变换 , 由不同 映出事物的特征及其发展规律 , 人们往往要考虑与其有关系 的线性变换得 到的 综合变 量 Y 的统计 特性 也不 尽相 同。因 的多个指标 , 一方面人们为了避免遗漏重要的信息而考虑尽 此为了取得较好的效果 , 我们 总是希 望 Yi= ui X 的方差 尽
7、 可能 多的指标 , 而另一方面随着考虑指标的增多增加了问题 可能大且各 Y1 之间相互独立 , 由于 的复杂性 , 由于各指标均是对同一事物的反映 , 不可避免地 v ar ( Y 1) = v ar ( u1 X) = u1 ! u 1 造成信息地大量重叠 , 基于此 , 主成分分析研究通过原来变 而对任给的常数 c, 有 量地少数几个线形组合来结实原来变量绝大多数信息地一种 v ar ( cu1 X) = cu1 u1 c= c2 u1 ! u1 多元统计方法。 因此对 u 1 不加限制时 , 可使 var ( Y1 ) 任 意增大 , 问题 一般地说 , 利用主成分分析得到的主成分与原
8、始变量之 将变得没有意思。我们将线性变 换约束在下面的原则之下 : 2 2 2 间有如下基本关系 : ( 1) 每 一个主成分都是 ; 原始变量的线形组合。 , 1、 u1 u1 = p) ; 1, 即 u i1 + ui2 + + u ip = 1 ( i= 1, 2, ( 2) 收稿日期 : 主 成分的数目大大小于原始变量的数目。 2007 01 20 2、 Y 1 与 Y j 相互无关 ( i j; I, j= 1, 2, , p) ; 作者简介 : 何亮 ( 1982 ) , 男 ( 汉 ) , 山西太原人 , 在读硕士 , 主要从事项目管理与技术评析方面的研究。 何亮 : 主成分分析
9、在 SPSS 中的应用 E xtrac tion Me thod : Pr inc ip al Comp onent A naly sis # 21 # 3、 Y 1 是 X1 , X2 , , Xp 的一切满足 原则 1 的 线性组 表 2 合中方差最大者 ; Y 2 是与 Y 1 不相 关的 X1 , X 2, , X p 所 有线性组合中方差最大者 ; , Y p 是与 Y1 , Y 2 , , Y p- 1 Comp on ent Ini tial Eigenv alues Ext racti on Sums of Squared L oadi ngs 都不相关的 X1 , 者。 X2
10、 , , X p 的 所 有 线性 组 合中 方 差最 大 T otal of Variance% Cumula tive % T otal of Varia nce% Cumula tive % 基于以上三条原则决定的综合变量Y 1 , Y2 , , Y p 分 别称为原始变量的第 一、第二、 、第 p 个主 成分。其 中 , 1 2 12 731 2 304 67 006 12 125 67 006 79 131 12 731 2 304 67 006 12 125 67 006 79 131 各综合变量在总方差中所占的比重依次递减 , 作中 , 通常只挑选前几个方差最大的主成分 , 系统
11、结构、抓住问题实质的目的。 二 、 主成分分析步骤 1、根据研究问题选取初始分析变量 ; 在实际研究工 从而达到简化 3 4 5 6 7 8 9 10 1 077 804 489 447 330 264 174 132 5 667 4 233 2 573 2 353 1 735 1 391 915 692 84 798 89 030 91 603 93 956 95 691 97 082 97 997 98 689 1 077 5 667 84 798 2、根据初始变量特性 判断由 协方差 阵求主 成分还 是由 相关阵求主成分 ; 3、求协方差阵或相关阵的特征根与相应标准特征 向量 ; 4、判
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 成分 分析 SPSS 中的 应用
限制150内