因子分析2003版学习.pptx
《因子分析2003版学习.pptx》由会员分享,可在线阅读,更多相关《因子分析2003版学习.pptx(54页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 在科学研究中,往往希望尽可能多地收集反映研究对象的多个变量,以期能对问题有比较全面、完整的把握与认识。多变量的大样本虽然能为科学研究提供大量的信息,但是在一定程度上增加了数据采集的工作量,更重要的是在大多数情况下,许多变量之间可能存在相关性,这意味着表面上看来彼此不同的变量并不能从各个侧面反映事物的不同属性,而恰恰是事物同一种属性的不同表现。1第1页/共54页 如何从众多相关的指标中找出少数几个综合性指标来反映原来指标所包含的主要信息,这就需要进行 因子分析(Factor Analysis),它是用少数几个因子来描述许多指标或因素之间的联系,即:用较少几个因子反映原始数据的大部分信息的统计方
2、法。2第2页/共54页 在 SPSS系 统 里,实 现 因 子 分 析 的 功 能 是 在 Data Reduction命令菜单中。3第3页/共54页统计学原理 因子分析的含义 因子分析,又叫因素分析,就是通过寻找众多变量的公共因素来简化变量中存在复杂关系的一种统计方法,它将多个变量综合为少数几个“因子”以再现原始变量与“因子”之间的相关关系。4第4页/共54页 因子分析的主要应用寻找基本结构数据化简5第5页/共54页寻找基本结构 在多元统计中,经常遇到诸多变量之间存在强相关的问题,它会对分析带来许多困难。通过因子分析,可以找出几个较少的有实际意义的因子,反映出原来数据的基本结构。例如:调查汽
3、车配件的价格中,通过因子分析从20个指标中概括出原材料供应商、配件厂商、新进入者、后市场零部件厂商、整车厂和消费者6个基本指标。从而找出对企业配件价格起决定性作用的几个指标。6第6页/共54页数据化简 通过因子分析,可以找出少数的几个因子来代替原来的变量做回归分析、聚类分析、判别分析等。7第7页/共54页数学模型 因子分析可以通过下面的数学模型来表示:独特因子公共因素8第8页/共54页 因子分析把每个原始变量分解成两部分:一部分是由所有变量共同具有的少数几个因子所构成的,即所谓公共因素部分;另一部分是每个变量独自具有的因素,即所谓独特因子部分。其中 叫做公共因子,它们是在各个变量中共同出现的因
4、子。我们可以把它们看作多维空间分布中互相垂直的 个坐标轴。表示影响 的独特因子,指原有变量不能被因子变量所解释的部分,相当于回归分析中的残差部分。叫做因子负荷(载荷),它是第 个变量在第 个主因子上的负荷或叫做第 个变量在在第 个主因子上的权值,它反映了第 个变量在第 个主因子上的相对重要性。9第9页/共54页 主成分分析:通过对一组变量的几个线性组合来解释这组变量的方差和协方差结构,以达到数据的压缩和数据的解释的目的。若有一些指标,取综合指标即它们的线性组合F,当然有很多,我们希望线性组合F包含很多的信息,即var(F)最大,这样得到F记为F1,然后再找F2,F1与 F2无关,以此类推,我们
5、找到了一组综合变量 F1,F2,Fm,这组变量基本包含了原来变量的所有信息。主成分分析10第10页/共54页主成分分析的数学模型11第11页/共54页主成分分析与因子分析的公式上的区别因子分析因子分析(m0.9 非常适合非常适合0.8KMO0.9 适合适合0.7KMO0.8 一般一般0.6KMO0.7 不太适合不太适合KMO0.5 不适合不适合16第16页/共54页 简单相关系数:简单相关系数:相关系数:表示两要素之间的相关程度的统计指标。相关系数:表示两要素之间的相关程度的统计指标。对于两个要素对于两个要素x与与y,如果它们的样本值分别为,如果它们的样本值分别为 xi与与yi(i=1,2,.
6、,n),它们之间的相关系数:),它们之间的相关系数:17第17页/共54页偏相关系数 在多要素构成的系统中,当研究某一个要素对另一个要素的影响或相关程度时,把其它要素的影响视为常数,而单独研究两个要素之间的相互关系的密切程度时,称为偏相关。用以度量偏相关程度的统计量,称为偏相关系数。在多要素构成的系统中,当研究某一个要素对另一个要素的影响或相关程度时,把其它要素的影响视为常数,而单独研究两个要素之间的相互关系的密切程度时,称为偏相关。用以度量偏相关程度的统计量,称为偏相关系数。一级偏相关系数一级偏相关系数:假设有三个要素假设有三个要素x1、x2、x3,它们之间的偏相关系数共有三个,即它们之间的
7、偏相关系数共有三个,即r12.3,r13.2,r23.1其计算公式分别如下:其计算公式分别如下:18第18页/共54页r12.3,r13.2,r23.1又称为一级偏相关系数又称为一级偏相关系数19第19页/共54页 二级偏相关系数:若有四个要素x1、x2、x3和x4,则有六个偏相关系数,即r12.34,r13.24,r14.23,r23.14,r24.13,r34.12,称为二级偏相关系数,计算公式如下:20第20页/共54页21第21页/共54页2.提取因子 决定因子提取的方法(即求初始因子)的方法很多,有“主成分分析法”,“主轴因子法”,“极大似然法”,“最小二乘法”,“Alpha因子提取
8、法”和“映象因子提取法”等等。最常用的是“主成分分析法”和“主轴因子法”,其中又以“主成分分析法”的使用最为普遍。在提取因子的过程中涉及下列名词,现分别说明在提取因子的过程中涉及下列名词,现分别说明:22第22页/共54页(1)特征值)特征值 特特征征值值是是指指每每个个变变量量在在某某一一公公共共因因子子上上的的因因子子负负荷荷的的平平方方总总和和,又又叫叫特特征征根根。在在因因子子分分析析的的公公共共因因子子提提取取中中,特特征征值值最最大大的的公公共共因因子子会会最最先先被被提提取取,最最后后提提取取特特征征值值最最小小的的公公共共因因子子。因因子子分分析析的的目目的的就就是是使使因因子
9、子维维度度简简单单化化,希希望望以以最最小小的的公公共共因因子子能能对对总总变变异异量量作作最最大大的的解解释释,因而提取的因素愈少愈好,而提取因子之累积解释的变异量则愈大愈好。因而提取的因素愈少愈好,而提取因子之累积解释的变异量则愈大愈好。23第23页/共54页 每个公共因子对原始数据的解释能力,可以用该因子所解释的总方差来衡量,通常称为该因子的贡献率,它等于和该因子有关的因子负荷的平方和,实际中常用相对指标来表示。相对指标体现公共因子的相对重要性,即每个公共因子所解释的方差占所有变量总方差的比例。(2)因子的贡献率)因子的贡献率24第24页/共54页3.决定旋转方法 旋转法使得因子负荷量更
10、易于解释。在因子提取时通常提取初始因子后,对因子无法作有效的解释。为了更好地解释因子,必须对负荷矩阵进行旋转,旋转目的在于改变每个变量在各因子的负荷量的大小。旋转方法有两种:一种为正交旋转,如“方差极大正交旋转法”,“四次方极大正交旋转法”,“等量方差极大正交旋转法”;另一种为斜交旋转,如“斜交旋转法”,“迫近最大方差斜交旋转法”等。正交旋转时,坐标轴在旋转过程中始终保持垂直,新生成的因子保持不相关性。斜交旋转中坐标轴中的夹角可以是任意度数,新生成的因子之间不能保持不相关性。在使用过程中一般选用正交旋转法(正交旋转可以最大程度的保证新生成的因子之间保持不相关性)。25第25页/共54页4.因子
11、的命名 因子的命名是因子分析的一个核心问题。旋转后可决定因子个数,并对其进行命名。对于新因子变量的命名要根据新因子变量与原变量的关系,即观察旋转后的因子负荷矩阵中某个新因子变量能够同时解释多少原变量的信息。26第26页/共54页5.计算因子得分 计算因子得分是因子分析的最后一步。因子变量确定后,便可计算各因子在每个样本上的具体数值,这些数值就是因子的得分,形成的新变量称为因子变量,它和原变量的得分相对应。有了因子得分,在以后的分析中就可以因子变量代替原有变量进行数据建模,或利用因子变量对样本进行分类或评价等研究,进而实现降维和简化的目标。27第27页/共54页因子分析的对话框介绍 在Facto
12、r Analysis对话框中,左边较大的矩形框是源变量框,右边“Variables”框为选入分析的变量框 28第28页/共54页各变量的基本统计量(包括各变量的基本统计量(包括均数,标准差和样本量)均数,标准差和样本量)因子分析的初始解(包括原因子分析的初始解(包括原变量的公因子方差,与变量变量的公因子方差,与变量数目相同的因子,各因子的数目相同的因子,各因子的特征值及其所占总方差的百特征值及其所占总方差的百分比和累计百分比)分比和累计百分比)相关系数矩阵相关系数矩阵相关系数矩阵单侧检验的相关系数矩阵单侧检验的概率值概率值相关系数矩阵的行列式相关系数矩阵的行列式KMO和巴特利球型检验和巴特利球
13、型检验相关系数矩阵的逆矩阵相关系数矩阵的逆矩阵反映象协方差阵和相关阵反映象协方差阵和相关阵再生相关阵(给出因子分析后的相关阵及其残差,再生相关阵(给出因子分析后的相关阵及其残差,下三角为再生相关阵,上三角为残差,即再生相关下三角为再生相关阵,上三角为残差,即再生相关系数与原始相关系数之差)系数与原始相关系数之差)Descriptives 按钮按钮29第29页/共54页“Analyze”指定提取因子的依据:指定提取因子的依据:Correlation matrix:相关系数矩阵(系统默认,当相关系数矩阵(系统默认,当原有变量存在数量级的差异时,通常选择该选项)原有变量存在数量级的差异时,通常选择该
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 因子分析 2003 学习
限制150内