因子分析2003版.ppt
《因子分析2003版.ppt》由会员分享,可在线阅读,更多相关《因子分析2003版.ppt(54页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、因子分析2003版 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望 在科学研究中,往往希望尽可能多地收集反映研究对象的在科学研究中,往往希望尽可能多地收集反映研究对象的多个变量,以期能对问题有比较全面、完整的把握与认识。多多个变量,以期能对问题有比较全面、完整的把握与认识。多变量的大样本虽然能为科学研究提供大量的信息,但是在一定变量的大样本虽然能为科学研究提供大量的信息,但是在一定程度上增加了数据采集的工作量,更重要的是在大多数情况下,程度上增加了数据采集的工作量
2、,更重要的是在大多数情况下,许多变量之间可能存在相关性,许多变量之间可能存在相关性,这意味着表面上看来彼此不同这意味着表面上看来彼此不同的变量并不能从各个侧面反映事物的不同属性,而恰恰是事物的变量并不能从各个侧面反映事物的不同属性,而恰恰是事物同一种属性的不同表现。同一种属性的不同表现。2 如何从众多相关的指标中找出少数几个综合性指如何从众多相关的指标中找出少数几个综合性指标来反映原来指标所包含的主要信息,这就需要进行标来反映原来指标所包含的主要信息,这就需要进行 因子分因子分析(析(Factor Analysis),它是用少数几个因子来描述许多指标或),它是用少数几个因子来描述许多指标或因素
3、之间的联系,即:因素之间的联系,即:用较少几个因子反映原始数据的大部分用较少几个因子反映原始数据的大部分信息的统计方法。信息的统计方法。3 在在SPSS系系统统里里,实实现现因因子子分分析析的的功功能能是是在在Data Reduction命命令令菜单中。菜单中。4统计学原理统计学原理 因子分析的含义因子分析的含义 因因子子分分析析,又又叫叫因因素素分分析析,就就是是通通过过寻寻找找众众多多变变量量的的公公共共因因素素来来简简化化变变量量中中存存在在复复杂杂关关系系的的一一种种统统计计方方法法,它它将将多多个个变变量量综综合合为为少少数数几几个个“因因子子”以以再再现现原原始始变变量量与与“因因
4、子子”之之间间的的相关关系。相关关系。5 因子分析的主要应用寻找基本结构数据化简6寻找基本结构寻找基本结构 在在多多元元统统计计中中,经经常常遇遇到到诸诸多多变变量量之之间间存存在在强强相相关关的的问问题题,它它会会对对分分析析带带来来许许多多困困难难。通通过过因因子子分分析析,可可以以找找出出几几个个较较少少的的有有实实际际意意义义的的因因子子,反反映映出出原原来来数数据据的的基基本本结结构构。例例如如:调调查查汽汽车车配配件件的的价价格格中中,通通过过因因子子分分析析从从20个个指指标标中中概概括括出出原原材材料料供供应应商商、配配件件厂厂商商、新新进进入入者者、后后市市场场零零部部件件厂
5、厂商商、整整车车厂厂和和消消费费者者6个个基基本本指指标标。从从而而找出对企业配件价格起决定性作用的几个指标。找出对企业配件价格起决定性作用的几个指标。7数据化简数据化简 通通过过因因子子分分析析,可可以以找找出出少少数数的的几几个个因因子子来来代代替替原来的变量做回归分析、聚类分析、判别分析等。原来的变量做回归分析、聚类分析、判别分析等。8数学模型 因子分析可以通过下面的数学模型来表示:独特因子公共因素9 因因子子分分析析把把每每个个原原始始变变量量分分解解成成两两部部分分:一一部部分分是是由由所所有有变变量量共共同同具具有有的的少少数数几几个个因因子子所所构构成成的的,即即所所谓谓公公共共
6、因因素素部部分分;另另一一部部分分是是每每个个变变量量独独自自具具有有的的因因素素,即即所所谓谓独独特特因因子子部部分分。其其中中 叫叫做做公公共共因因子子,它它们们是是在在各各个个变变量量中中共共同同出出现现的的因因子子。我我们们可可以以把把它它们们看看作作多多维维空空间间分分布布中中互互相相垂垂直直的的 个个坐坐标标轴轴。表表示示影影响响 的的独独特特因因子子,指指原原有有变变量量不不能能被被因因子子变变量量所所解解释释的的部部分分,相相当当于于回回归归分分析析中中的的残残差差部部分分。叫叫做做因因子子负负荷荷(载载荷荷),它它是是第第 个个变变量量在在第第 个个主主因因子子上上的的负负荷
7、荷或或叫叫做做第第 个个变变量量在在在在第第 个个主主因因子子上上的的权权值值,它它反反映了第映了第 个变量在第个变量在第 个主因子上的相对重要性。个主因子上的相对重要性。10 主主成成分分分分析析:通通过过对对一一组组变变量量的的几几个个线线性性组组合合来来解解释释这这组组变变量量的的方方差差和和协协方方差结构,以达到数据的压缩和数据的解释的目的。差结构,以达到数据的压缩和数据的解释的目的。若有一些指标若有一些指标,取综合指标即它们的线性组合,取综合指标即它们的线性组合F,当然有很多,当然有很多,我们希望线性组合我们希望线性组合F包含很多的信息,即包含很多的信息,即var(F)最大,这样得到
8、最大,这样得到F记为记为F1,然后再,然后再找找F2,F1与与 F2无关,以此类推,我们找到了一组综合变量无关,以此类推,我们找到了一组综合变量 F1,F2,Fm,这组变量,这组变量基本包含了原来变量的所有信息。基本包含了原来变量的所有信息。主成分分析主成分分析11主成分分析的数学模型主成分分析的数学模型12主成分分析与因子分析的公式上的区别主成分分析与因子分析的公式上的区别因子分析因子分析(m0.9 非常适合非常适合0.8KMO0.9 适合适合0.7KMO0.8 一般一般0.6KMO0.7 不太适合不太适合KMO0.5 不适合不适合17 简单相关系数:简单相关系数:相关系数:表示两要素之间的
9、相关程度的统计指标。相关系数:表示两要素之间的相关程度的统计指标。对于两个要素对于两个要素x与与y,如果它们的样本值分别为,如果它们的样本值分别为 xi与与yi(i=1,2,.,n),它们),它们之间的相关系数:之间的相关系数:18偏相关系数偏相关系数 在在多多要要素素构构成成的的系系统统中中,当当研研究究某某一一个个要要素素对对另另一一个个要要素素的的影影响响或或相相关关程程度度时时,把把其其它它要要素素的的影影响响视视为为常常数数,而而单单独独研研究究两两个个要要素素之之间间的的相相互互关关系系的的密密切切程程度度时时,称称为偏相关。用以度量偏相关程度的统计量,称为偏相关系数。为偏相关。用
10、以度量偏相关程度的统计量,称为偏相关系数。一一级级偏偏相相关关系系数数:假假设设有有三三个个要要素素x1、x2、x3,它它们们之之间间的的偏偏相相关关系系数数共共有有三三个个,即即r12.3,r13.2,r23.1其计算公式分别如下:其计算公式分别如下:19r12.3,r13.2,r23.1又称为一级偏相关系数又称为一级偏相关系数20 二二级级偏偏相相关关系系数数:若若有有四四个个要要素素x1、x2、x3和和x4,则则有有六六个个偏偏相相关关系系数数,即即r12.34,r13.24,r14.23,r23.14,r24.13,r34.12,称称为为二二级级偏偏相相关关系系数数,计算公式如下:计算
11、公式如下:21222.提取因子提取因子 决决定定因因子子提提取取的的方方法法(即即求求初初始始因因子子)的的方方法法很很多多,有有“主主成成分分分分析析法法”,“主主轴轴因因子子法法”,“极极大大似似然然法法”,“最最小小二二乘乘法法”,“Alpha因因子子提提取取法法”和和“映映象象因因子子提提取取法法”等等等等。最最常常用用的的是是“主主成成分分分分析析法法”和和“主主轴轴因因子子法法”,其中又以,其中又以“主成分分析法主成分分析法”的使用最为普遍。的使用最为普遍。在提取因子的过程中涉及下列名词,现分别说明在提取因子的过程中涉及下列名词,现分别说明:23(1)特征值)特征值 特特征征值值是
12、是指指每每个个变变量量在在某某一一公公共共因因子子上上的的因因子子负负荷荷的的平平方方总总和和,又又叫叫特特征征根根。在在因因子子分分析析的的公公共共因因子子提提取取中中,特特征征值值最最大大的的公公共共因因子子会会最最先先被被提提取取,最最后后提提取取特特征征值值最最小小的的公公共共因因子子。因因子子分分析析的的目目的的就就是是使使因因子子维维度度简简单单化化,希希望望以以最最小小的的公公共共因因子子能能对对总总变变异异量量作作最最大大的的解解释释,因而提取的因素愈少愈好,而提取因子之累积解释的变异量则愈大愈好。因而提取的因素愈少愈好,而提取因子之累积解释的变异量则愈大愈好。24 每个公共因
13、子对原始数据的解释能力,可以用该因子所每个公共因子对原始数据的解释能力,可以用该因子所解释的总方差来衡量,通常称为该因子的贡献率,它等于和该因子有解释的总方差来衡量,通常称为该因子的贡献率,它等于和该因子有关的因子负荷的平方和,实际中常用相对指标来表示。相对指标体现关的因子负荷的平方和,实际中常用相对指标来表示。相对指标体现公共因子的相对重要性,即每个公共因子所解释的方差占所有变量总公共因子的相对重要性,即每个公共因子所解释的方差占所有变量总方差的比例。方差的比例。(2)因子的贡献率)因子的贡献率253.决定旋转方法决定旋转方法 旋旋转转法法使使得得因因子子负负荷荷量量更更易易于于解解释释。在
14、在因因子子提提取取时时通通常常提提取取初初始始因因子子后后,对对因因子子无无法法作作有有效效的的解解释释。为为了了更更好好地地解解释释因因子子,必必须须对对负负荷荷矩矩阵阵进进行行旋旋转转,旋旋转转目目的的在在于于改改变变每每个个变变量量在在各各因因子子的的负负荷荷量量的的大大小小。旋旋转转方方法法有有两两种种:一一种种为为正正交交旋旋转转,如如“方方差差极极大大正正交交旋旋转转法法”,“四四次次方方极极大大正正交交旋旋转转法法”,“等等量量方方差差极极大大正正交交旋旋转转法法”;另另一一种种为为斜斜交交旋旋转转,如如“斜斜交交旋旋转转法法”,“迫迫近近最最大大方方差差斜斜交交旋旋转转法法”等
15、等。正正交交旋旋转转时时,坐坐标标轴轴在在旋旋转转过过程程中中始始终终保保持持垂垂直直,新新生生成成的的因因子子保保持持不不相相关关性性。斜斜交交旋旋转转中中坐坐标标轴轴中中的的夹夹角角可可以以是是任任意意度度数数,新新生生成成的的因因子子之之间间不不能能保保持持不不相相关关性性。在在使使用用过过程程中中一一般般选选用用正正交交旋旋转法(正交旋转可以最大程度的保证新生成的因子之间保持不相关性)。转法(正交旋转可以最大程度的保证新生成的因子之间保持不相关性)。264.因子的命名因子的命名 因因子子的的命命名名是是因因子子分分析析的的一一个个核核心心问问题题。旋旋转转后后可可决决定定因因子子个个数
16、数,并并对对其其进进行行命命名名。对对于于新新因因子子变变量量的的命命名名要要根根据据新新因因子子变变量量与与原原变变量量的的关关系系,即即观观察察旋旋转转后后的的因因子子负负荷荷矩矩阵阵中中某某个个新新因因子子变变量量能能够够同同时时解解释释多多少少原原变变量量的的信息。信息。275.计算因子得分计算因子得分 计计算算因因子子得得分分是是因因子子分分析析的的最最后后一一步步。因因子子变变量量确确定定后后,便便可可计计算算各各因因子子在在每每个个样样本本上上的的具具体体数数值值,这这些些数数值值就就是是因因子子的的得得分分,形形成成的的新新变变量量称称为为因因子子变变量量,它它和和原原变变量量
17、的的得得分分相相对对应应。有有了了因因子子得得分分,在在以以后后的的分分析析中中就就可可以以因因子子变变量量代代替替原原有有变变量量进进行行数数据据建建模模,或或利利用用因子变量对样本进行分类或评价等研究,进而实现降维和简化的目标。因子变量对样本进行分类或评价等研究,进而实现降维和简化的目标。28因子分析的对话框介绍因子分析的对话框介绍 在在Factor Analysis对对话话框框中中,左左边边较较大大的的矩矩形形框框是是源源变变量量框框,右右边边“Variables”框为选入分析的变量框框为选入分析的变量框 29各变量的基本统计量(包各变量的基本统计量(包括均数,标准差和样本量)括均数,标
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 因子分析 2003
限制150内