第8章 主成分分析与因子分析-1.ppt
《第8章 主成分分析与因子分析-1.ppt》由会员分享,可在线阅读,更多相关《第8章 主成分分析与因子分析-1.ppt(108页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第8章章 主成分分析与因子分析主成分分析与因子分析许多变量之间存在的相关性增加了问题许多变量之间存在的相关性增加了问题分析的复杂性分析的复杂性在减少分析变量的同时,尽量减少原变在减少分析变量的同时,尽量减少原变量包含信息的损失,对所收集的资料做量包含信息的损失,对所收集的资料做全面的分析全面的分析主要内容主要内容8.1 主成分分析主成分分析8.2 因子分析因子分析8.3 主成分分析和因子分析的区别主成分分析和因子分析的区别8.4 用用SPSS进行因子分析进行因子分析主成分和因子分析的作用主成分和因子分析的作用 能降低所研究的数据空间的维数;能降低所研究的数据空间的维数;可以用于分析筛选回归变
2、量,构造回归可以用于分析筛选回归变量,构造回归模型;模型;可以用于综合评价;可以用于综合评价;可以对变量进行分类可以对变量进行分类主成分分析主成分分析n能尽可能多地反映原来变量的有用信息,能尽可能多地反映原来变量的有用信息,且相互之间又是无关的综合变量称为且相互之间又是无关的综合变量称为主成主成分分(Principal Components)n主成分分析主成分分析就是考虑各变量间的相互关系,就是考虑各变量间的相互关系,利用降维的思想把多个变量转换成较少的利用降维的思想把多个变量转换成较少的几个互不相关的综合变量几个互不相关的综合变量主成分分析原理消除自变量间的相关性与多维变量降维坐标的旋转变换
3、正交阵正交阵正交阵正交阵降维依据降维依据降维依据降维依据 原理一般化 满足满足(1)(2)正交或正交或正交或正交或U U为正交阵为正交阵为正交阵为正交阵主成分分析的基本问题n每一个主成分的系数如何确定每一个主成分的系数如何确定n如何保留主成分如何保留主成分n如何解释主成分如何解释主成分主成分系数的确定n前提假设前提假设 n第一主成分的系数满足:第一主成分的系数满足:系数的求解结论n若若 的特征值为的特征值为 对应的单位特征向量为:对应的单位特征向量为:nP P个主成分分别是:个主成分分别是:且(且(1 1)(2 2)或或或主成分的保留主成分总方差主成分总方差主成分总方差主成分总方差=原变量的总
4、方差原变量的总方差原变量的总方差原变量的总方差选择主成分的方法(1)贡献率:第i 个主成分的贡献率为累积贡献率:前m个主成分的累积贡献率为选择法则:保留m 个主成分(Cumulative)选择主成分的方法(2)特征值大于特征值大于1原则原则 若若则保留则保留m个主成分个主成分主成分的解释原始指标原始指标 对各个主成分的贡献对各个主成分的贡献 相关系数:相关系数:保留的保留的m个主成分对每个个主成分对每个 的贡献的贡献主成分与原指标间的相关系数m个主成分对原始指标 的贡献前m个主成分提取了 中 的信息由相关阵求主成分指标标准化指标标准化标准化变量的协标准化变量的协方差阵为原始变方差阵为原始变量的
5、相关系数阵量的相关系数阵求相关系数阵的特征值:求相关系数阵的特征值:和对应的单位特征向量:和对应的单位特征向量:写出写出p p个主成分的表达式个主成分的表达式前前m 个主成分的累积贡献率:个主成分的累积贡献率:主成分与标准化指标间的相关系数主成分与标准化指标间的相关系数 主成分的方差主成分的方差样本主成分的计算过程样本主成分的计算过程求数据的样本相关系数阵求数据的样本相关系数阵 求求 的特征值的特征值 和所对应的单位特征向量:和所对应的单位特征向量:(Correlation Matrices)(Eigenvalues)(Eigenvectores)主成分的系数主成分的系数写出写出p p个主成分
6、的表达式:个主成分的表达式:是样本均值是样本均值,是样本标准差是样本标准差标准化数据标准化数据主成分分析的SPSS实现Analyze Data Reduction Factor选取选取点击点击点击点击点击点击1点击点击2点击点击可选可选可选可选可选可选点击点击点击点击点击点击1点击点击2点击点击3可选可选主成分的最后得分点击点击1点击点击2计算计算命名命名计算计算命名命名主成分的应用(主成分的应用(1)利用第一主成分进行综合评价利用第一主成分进行综合评价第一主成分的第一主成分的系数都大于系数都大于0 0第一主成分的第一主成分的贡献率超过贡献率超过80%80%(正向指标)主成分综合评价的SPSS
7、实现Transform Rank Cases点击点击1点击点击2可选可选点击点击主成分的应用(2)。u利用第一、二个主成分进行分类利用第一、二个主成分进行分类若第一、二个主成分的若第一、二个主成分的累积贡献率累积贡献率 ,则由第一、二个主成分在平面上则由第一、二个主成分在平面上的散点图,实现对样品进行分类的散点图,实现对样品进行分类主成分分类的SPSS实现Graphs Scatter确定确定点击点击点击点击点击点击主成分回归(应用3)第二步第二步第三步第三步第一步第一步建立因变量建立因变量 与自变量与自变量 之间的回归方之间的回归方程程若发现自变量若发现自变量之间有多重共之间有多重共线性线性,
8、利用利用的样本数据进的样本数据进行主成分分析行主成分分析若主成分若主成分的累积贡献率的累积贡献率超过超过85%,则,则建立建立 与与的回归方程的回归方程科研案例 n韩伟,李钢.主成分分析在地区科技竞争力评测中的应用.数理统计与管理.2006,25(5):512-517摘要n近年来对于科技竞争力的研究在国内近年来对于科技竞争力的研究在国内方兴未艾方兴未艾,其中对于科技竞争力的评测其中对于科技竞争力的评测是众多学者研究的重点和热点是众多学者研究的重点和热点,也是各也是各级决策者最为关心、最为重要的课题级决策者最为关心、最为重要的课题之一。本文根据科技竞争力概念和内之一。本文根据科技竞争力概念和内涵
9、来确定评测指标体系的构成要素涵来确定评测指标体系的构成要素,建建立了评测指标体系立了评测指标体系,并利用主成分分析并利用主成分分析方法对采集来的数据进行分析方法对采集来的数据进行分析,得到最得到最终的评测结果。终的评测结果。国际竞争力n企业目前和未来在各自的环境中企业目前和未来在各自的环境中,以比以比其国内和国外的竞争者更具有吸引力其国内和国外的竞争者更具有吸引力的价格和质量来进行设计生产并销售的价格和质量来进行设计生产并销售产品一级提供服务的能力和机会。产品一级提供服务的能力和机会。1985年世界经济论坛年世界经济论坛n是一个国家是一个国家(地区地区)或企业在世界市场或企业在世界市场上均衡的
10、生产出比其他竞争对手更多上均衡的生产出比其他竞争对手更多财富的能力。财富的能力。1994 年的国际竞争力报告年的国际竞争力报告一般综合评价过程综合指标综合指标确定权重确定权重数据处理数据处理选择指标体系选择指标体系区域科技竞争力评价区域科技竞争力评价n三级指标体系三级指标体系n将第三级指标混在一起,对混合指将第三级指标混在一起,对混合指标进行主成分分析,利用少数的几标进行主成分分析,利用少数的几个主成分代替第二级指标个主成分代替第二级指标n利用利用DELPH和和AHP方法确定第二方法确定第二级主成分指标和一级指标的权重级主成分指标和一级指标的权重n最后得到每个一级指标的综合值和最后得到每个一级
11、指标的综合值和每个地区科技竞争力的综合值每个地区科技竞争力的综合值因子分析 1.1.因子分析的基本理论因子分析的基本理论因子分析的基本理论因子分析的基本理论 4 4.因子得分因子得分因子得分因子得分2.2.因子分析的数学模型因子分析的数学模型因子分析的数学模型因子分析的数学模型3.3.公公公公因子的求法因子的求法因子的求法因子的求法 2.2.因子分析的数学模型因子分析的数学模型因子分析的数学模型因子分析的数学模型因子分析的基本理论 因子分析与主成分分析的共同点因子分析与主成分分析的共同点通过对相关矩阵的研究将多个变量归结为少数的几个综合变量(因子)因子分析因子分析n1904年年Charles
12、Spearman发表发表对智力测验对智力测验得分进行统计分析得分进行统计分析n因子分析探讨存在因子分析探讨存在相关关系相关关系的变量之间是的变量之间是否存在否存在不能直接观测不能直接观测到但是对可观测指标到但是对可观测指标的变化起的变化起支配作用支配作用的潜在因子(的潜在因子(Factor)的)的分析方法分析方法n商店有一系列指标,但是消费者真正关心商店有一系列指标,但是消费者真正关心的是:商店的环境、服务和商品的价格,的是:商店的环境、服务和商品的价格,这三者就是因子。这三者就是因子。因子分析因子分析n做什么?做什么?因子分析是多元统计分析中处理降维的一种统计因子分析是多元统计分析中处理降维
13、的一种统计方法,它主要将具有错综复杂关系的变量或者样方法,它主要将具有错综复杂关系的变量或者样品综合为数量较少的几个因子,以再现原始变量品综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系与因子之间的相互关系n依据处理的对象不同,可以分为两类:依据处理的对象不同,可以分为两类:R R型因子分析,对变量做降维处理型因子分析,对变量做降维处理 Q Q型因子分析,对样本做降维处理处理型因子分析,对样本做降维处理处理 因子分析基本思想因子分析基本思想n研究变量的相关矩阵内部结构研究变量的相关矩阵内部结构n找出能控制所有变量的少数几个公共因子找出能控制所有变量的少数几个公共因子去描述多个变量之
14、间的相关关系去描述多个变量之间的相关关系n根据相关性大小把变量分组根据相关性大小把变量分组组内变量相关性较高组内变量相关性较高不同组变量相关性较低不同组变量相关性较低nR型因子分析型因子分析n因子分析的几个概念因子分析的几个概念n1、因子载荷、因子载荷n2、变量共同度、变量共同度 n3、公因子、公因子Fj的方差贡献的方差贡献 n4 4、因子旋转、因子旋转 因子旋转的目的是为了使得因子载荷阵的结构简因子旋转的目的是为了使得因子载荷阵的结构简化,便于对公共因子进行解释。化,便于对公共因子进行解释。这里所谓的结构简化是使每个变量仅在一个公共这里所谓的结构简化是使每个变量仅在一个公共因子上有较大的载荷
15、,而在其余公共因子上载荷因子上有较大的载荷,而在其余公共因子上载荷比较小。比较小。这种变换因子载荷阵的方法称为因子轴的旋转。这种变换因子载荷阵的方法称为因子轴的旋转。旋转的方法有很多种,如正交旋转,斜交旋轴等。旋转的方法有很多种,如正交旋转,斜交旋轴等。n5、因子得分、因子得分因子分析的一般步骤因子分析的一般步骤n第一步:确定分析变量,第一步:确定分析变量,收集收集数据资料数据资料n第二步:对原始数据进行第二步:对原始数据进行标准化标准化n第三步:计算所选变量的第三步:计算所选变量的相关系数相关系数矩阵矩阵n第四步:提取第四步:提取公因子公因子,主成分分析,累计方差贡,主成分分析,累计方差贡献
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第8章 主成分分析与因子分析-1 成分 分析 因子分析
限制150内