书签分享收藏举报版权申诉 / 78

立即下载

当前位置：首页 > 教育专区 > 大学资料 > 应用统计学因子分析幻灯片.ppt

应用统计学因子分析幻灯片.ppt

上传人：石***

文档编号：87544581

上传时间：2023-04-16

格式：PPT

页数：78

大小：3.27MB

( 4.5 )

《应用统计学因子分析幻灯片.ppt》由会员分享，可在线阅读，更多相关《应用统计学因子分析幻灯片.ppt（78页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、应用统计学因子分析第1页，共78页，编辑于2022年，星期六因子分析的基本理论因子分析的基本理论v1 1、什么是因子分析？、什么是因子分析？因子分析是主成分分析的推广，也是利用因子分析是主成分分析的推广，也是利用降维降维的思想，的思想，由研究原始变量相关矩阵或协方差矩阵的内部依赖关系由研究原始变量相关矩阵或协方差矩阵的内部依赖关系出发，把一些具有错综复杂关系的多个变量归结为少数出发，把一些具有错综复杂关系的多个变量归结为少数几个综合因子的一种多元统计分析方法。几个综合因子的一种多元统计分析方法。v2 2、因子分析的基本思想：、因子分析的基本思想：把每个研究变量分解为几个影响因素变量，将每个原始

2、变量把每个研究变量分解为几个影响因素变量，将每个原始变量分解成两部分因素，一部分是由所有变量共同具有的少数几个分解成两部分因素，一部分是由所有变量共同具有的少数几个公公共因子共因子组成的，另一部分是每个变量独自具有的因素，即组成的，另一部分是每个变量独自具有的因素，即特殊特殊因子因子。第2页，共78页，编辑于2022年，星期六v3 3、因子分析的目的：、因子分析的目的：l因子分析的目的之一，因子分析的目的之一，简化变量维数。简化变量维数。即要使因素结构简单化，即要使因素结构简单化，希望以最少的共同因素（公共因子），能对总变异量作最大希望以最少的共同因素（公共因子），能对总变异量作最大的解释，因

3、而抽取得因子愈少愈好，但抽取因子的累积解释的解释，因而抽取得因子愈少愈好，但抽取因子的累积解释的变异量愈大愈好。的变异量愈大愈好。l在因子分析的公共因子抽取中，应最先抽取特征值最大的公共在因子分析的公共因子抽取中，应最先抽取特征值最大的公共因子，其次是次大者，最后抽取公共因子的特征值最小因子，其次是次大者，最后抽取公共因子的特征值最小通常通常会接近会接近0 0。第3页，共78页，编辑于2022年，星期六v例：在企业形象或品牌形象的研究中，消费者可以通过一个有例：在企业形象或品牌形象的研究中，消费者可以通过一个有2424个指标构成个指标构成的评价体系，评价百货商场的的评价体系，评价百货商场的2

4、424个方面的优劣。个方面的优劣。v但消费者主要关心的是三个方面，即商店的环境、商店的服务和商但消费者主要关心的是三个方面，即商店的环境、商店的服务和商品的价格。因子分析方法可以通过品的价格。因子分析方法可以通过2424个变量，找出反映商店环境、个变量，找出反映商店环境、商店服务水平和商品价格的三个潜在的因子，对商店进行综合评商店服务水平和商品价格的三个潜在的因子，对商店进行综合评价。而这三个公共因子可以表示为：价。而这三个公共因子可以表示为：v称称是不可观测的潜在因子是不可观测的潜在因子,称为公共因子。称为公共因子。2424个变量共享这三个变量共享这三个因子，但是每个变量又有自己的个性，不

5、被包含的部分个因子，但是每个变量又有自己的个性，不被包含的部分，称为特，称为特殊因子。殊因子。第4页，共78页，编辑于2022年，星期六v4 4、主成分分析分析与因子分析的联系和差异：、主成分分析分析与因子分析的联系和差异：联系：联系：（1 1）因子分析是主成分分析的推广，是主成分分析的逆问题。（）因子分析是主成分分析的推广，是主成分分析的逆问题。（2 2）二者都是以二者都是以降维降维为目的，都是从协方差矩阵或相关系数矩阵出发。为目的，都是从协方差矩阵或相关系数矩阵出发。区别区别：（1 1）主成分分析模型是原始变量的线性组合，是将原始变量加以综合、主成分分析模型是原始变量的线性组合，是将原始

6、变量加以综合、归纳，仅仅是变量变换；而因子分析是将原始变量加以分解，描述原始变量协方差归纳，仅仅是变量变换；而因子分析是将原始变量加以分解，描述原始变量协方差矩阵结构的模型；只有当提取的公因子个数等于原始变量个数时，因子分析才对应矩阵结构的模型；只有当提取的公因子个数等于原始变量个数时，因子分析才对应变量变换。（变量变换。（2 2）主成分分析，中每个主成分对应的系数是唯一确定的；因子分析中）主成分分析，中每个主成分对应的系数是唯一确定的；因子分析中每个因子的相应系数即因子载荷不是唯一的。（每个因子的相应系数即因子载荷不是唯一的。（3 3）因子分析中因子载荷的不唯一性）因子分析中因子载荷的不唯一

7、性有利于对公因子进行有效解释；而主成分分析对提取的主成分的解释能力有限。有利于对公因子进行有效解释；而主成分分析对提取的主成分的解释能力有限。第5页，共78页，编辑于2022年，星期六v5 5、因子分析模型：、因子分析模型：设设个变量，如果表示为个变量，如果表示为第6页，共78页，编辑于2022年，星期六（1 1）（2 2）称称为为公公共共因因子子，是是不不可可观观测测的的变变量量，他他们们的的系系数数称称为为因因子子载载荷荷。是是特特殊殊因因子子，是是不不能能被被前前m m个公共因子包含的部分。其中：个公共因子包含的部分。其中：相互独立即不相关；相互独立即不相关；即即互不相关，方差为互

8、不相关，方差为1 1。第7页，共78页，编辑于2022年，星期六（3 3）即互不相关，方差不一定相等，即互不相关，方差不一定相等，。满足以上条件的，称为满足以上条件的，称为正交因子模型正交因子模型如如果果（）不不成成立立，即即各各公公共共因因子子之之间间不不独独立立，则因子分析模型为则因子分析模型为斜交因子模型斜交因子模型第8页，共78页，编辑于2022年，星期六公因子公因子F1公因子公因子F2共同度共同度hi特殊因子特殊因子ix1=代数代数10.8960.3410.9190.081x2=代数代数20.8020.4960.8890.111x3=几何几何0.5160.8550.9970.003

9、x4=三角三角0.8410.4440.9040.096x5=解析几何解析几何0.8330.4340.8820.118特征特征值值 G3.1131.4794.9590.409方差方差贡贡献率献率（变变异量）异量）62.26%29.58%91.85%案例案例F F1 1 体现逻辑思维和运算能力，体现逻辑思维和运算能力，F F2 2 体现空间思维和推理能力体现空间思维和推理能力第9页，共78页，编辑于2022年，星期六v6 6、因子分析模型中的几个重要统计量的意义：、因子分析模型中的几个重要统计量的意义：（1 1）因子负荷量（或称因子载荷）因子负荷量（或称因子载荷）-是指因子结构中原始是指因子结构中

10、原始变量与因子分析时抽取出的公共因子的相关程度。变量与因子分析时抽取出的公共因子的相关程度。第10页，共78页，编辑于2022年，星期六在在各各公公共共因因子子不不相相关关的的前前提提下下，（载载荷荷矩矩阵阵中中第第i i行行，第第j j列列的的元元素素）是是随随机机变变量量xi*与与公公共共因因子子F Fj j的的相相关关系系数数，表表示示x xi i*依依赖赖于于F Fj j的的程程度度。反反映映了了第第i i个个原原始始变变量量在在第第j j个个公公共共因因子子上上的的相相对对重重要要性性。因因此此绝绝对对值值越越大，则公共因子大，则公共因子F Fj j与原有变量与原有变量x xi

11、i的关系越强。的关系越强。第11页，共78页，编辑于2022年，星期六（2 2）共同度共同度-又称共性方差或公因子方差又称共性方差或公因子方差（community或或common variance）就是变量与每个公共因子之负荷量的平方总和就是变量与每个公共因子之负荷量的平方总和（一行中所有因素负荷量的平方和）。（一行中所有因素负荷量的平方和）。变量变量的共同度是因子载的共同度是因子载荷矩阵的第荷矩阵的第i i行的元素的平方和。记为行的元素的平方和。记为从共同性的大小可以判断这个原始实测变量与公共因子间之关从共同性的大小可以判断这个原始实测变量与公共因子间之关系程度。如因子分析案例中系程度。

12、如因子分析案例中共同度共同度h h1 12 2=(0.896)=(0.896)平方平方+(0.341)+(0.341)平方平方=0.919=0.919l特殊因子方差（剩余方差）特殊因子方差（剩余方差）-各变量的特殊因素影响大小就是各变量的特殊因素影响大小就是1 1减减掉该变量共同度的值。如掉该变量共同度的值。如 =1-0.919=0.081=1-0.919=0.081第12页，共78页，编辑于2022年，星期六统计意义统计意义：两边求方差两边求方差所有的公共因子和特殊因子对变量所有的公共因子和特殊因子对变量的贡献为的贡献为1 1。h hi i2 2反映了全部公共因子反映了全部公共因子对变

13、量对变量X Xi i*的影响，是全部公共因子对变量方差所做出的贡献，或者说的影响，是全部公共因子对变量方差所做出的贡献，或者说X Xi i*对公共因子的共同依赖程度，称为公共因子对变量对公共因子的共同依赖程度，称为公共因子对变量X Xi i*的方差贡献。的方差贡献。H Hi i2 2接近于接近于1 1，表明该变量的原始信息几乎都被选取的公共因子说明了。，表明该变量的原始信息几乎都被选取的公共因子说明了。特殊因子的方差，反映了原有变量方差中无法被公共因子描述的特殊因子的方差，反映了原有变量方差中无法被公共因子描述的比例。比例。第13页，共78页，编辑于2022年，星期六（3 3）特征值特征值-是

14、第是第j j个公共因子个公共因子F Fj j对于对于X X*的每一分量的每一分量X Xi i*所提供的方差所提供的方差的总和。又称第的总和。又称第j j个公共因子的方差贡献。即个公共因子的方差贡献。即每个变量与某一共同因素每个变量与某一共同因素之因素负荷量的平方总和之因素负荷量的平方总和（因子载荷矩阵中某一公共因子列所有因子负（因子载荷矩阵中某一公共因子列所有因子负荷量的平方和）。荷量的平方和）。如因子分析案例中如因子分析案例中 F1F1的特征值的特征值 G=G=（0.8960.896）平方平方+（0.8020.802）平方）平方+（0.5160.516）平方）平方+（0.8410.841）平

15、方）平方+（0.8330.833）平方）平方=3.113=3.113（4 4）方差贡献率）方差贡献率-指公共因子对实测变量的贡献，又称变异量。方差指公共因子对实测变量的贡献，又称变异量。方差贡献率贡献率=特征值特征值G/G/实测变量数实测变量数p p，是衡量公共因子相对重要性的指标，是衡量公共因子相对重要性的指标，G Gi i越大，表明公共因子越大，表明公共因子F Fj j对对X X*的贡献越大，该因子的重要程度越高。的贡献越大，该因子的重要程度越高。如因子分析案例中如因子分析案例中 F1F1的贡献率为的贡献率为3.113/5=62.26%3.113/5=62.26%第14页，共78页，编辑于

16、2022年，星期六因子的基本内容因子的基本内容v1 1、因子分析的基本步骤：、因子分析的基本步骤：（1 1）因子分析的前提条件鉴定）因子分析的前提条件鉴定考察原始变量之间是否存在较强的相关关系，是否适合进行考察原始变量之间是否存在较强的相关关系，是否适合进行因子分析。因为：因子分析。因为：因子分析的主要任务之一就是对原有变量中信息重叠的部因子分析的主要任务之一就是对原有变量中信息重叠的部分提取和综合成因子，最终实现减少变量个数的目的。所以要分提取和综合成因子，最终实现减少变量个数的目的。所以要求原有变量之间应存在较强的相关关系。否则，如果原有变量求原有变量之间应存在较强的相关关系。否则，如果

17、原有变量相互独立，不存在信息重叠，也就无需进行综合和因子分析。相互独立，不存在信息重叠，也就无需进行综合和因子分析。（2 2）因子提取）因子提取研究如何在样本数据的基础上提取综合因子。研究如何在样本数据的基础上提取综合因子。第15页，共78页，编辑于2022年，星期六（3 3）因子旋转）因子旋转通过正交旋转或斜交旋转使提取出的因子具有可解释性。通过正交旋转或斜交旋转使提取出的因子具有可解释性。（4 4）计算因子得分）计算因子得分通过各种方法求解各样本在各因子上的得分，为进一通过各种方法求解各样本在各因子上的得分，为进一步分析奠定基础。步分析奠定基础。第16页，共78页，编辑于2022年，

18、星期六v2 2、因子分析前提条件、因子分析前提条件相关性分析：相关性分析：分析方法主要有：分析方法主要有：（1 1）计算相关系数矩阵）计算相关系数矩阵(correlation correlation coefficients matrix)coefficients matrix)如果相关系数矩阵中的大部分相关系数如果相关系数矩阵中的大部分相关系数值均小于值均小于0.30.3，即各变量间大多为弱相关，即各变量间大多为弱相关，原则上这些变量不适合进行因子分析。原则上这些变量不适合进行因子分析。（2 2）计算反映象相关矩阵（）计算反映象相关矩阵（Anti-image Anti-image corre

19、lation matrix)correlation matrix)第17页，共78页，编辑于2022年，星期六反映象相关矩阵，如果其主对角线外的元素大多绝对值较反映象相关矩阵，如果其主对角线外的元素大多绝对值较小，对角线上的元素值较接近小，对角线上的元素值较接近1 1，则说明这些变量的相关性，则说明这些变量的相关性较强，适合进行因子分析。较强，适合进行因子分析。其中主对角线上的元素为某变量的其中主对角线上的元素为某变量的MSA(Measure of Sample MSA(Measure of Sample Adequacy)Adequacy)：是变量是变量和变量和变量（）间的简单相关系数，

20、间的简单相关系数，是变量是变量和变量和变量（）在控制了其他变量影响下的偏相关在控制了其他变量影响下的偏相关系数，即净相关系数。系数，即净相关系数。取值在取值在0 0和和1 1之间，越接近之间，越接近1 1，意味着变，意味着变量量与其他变量间的相关性越强，越接近与其他变量间的相关性越强，越接近0 0则相关性越弱。则相关性越弱。第18页，共78页，编辑于2022年，星期六（3 3）巴特利特球度检验（）巴特利特球度检验（Bartlett test of sphericity)Bartlett test of sphericity)该检验以原有变量的相关系数矩阵为出发点，其零假设该检验以原有变量

21、的相关系数矩阵为出发点，其零假设H0H0是：相是：相关系数矩阵为单位矩阵，即相关系数矩阵主对角元素均为关系数矩阵为单位矩阵，即相关系数矩阵主对角元素均为1 1，非主对，非主对角元素均为角元素均为0 0。（即原始变量之间无相关关系）。（即原始变量之间无相关关系）。依据相关系数矩阵的行列式计算可得其近似服从卡方分布。如果依据相关系数矩阵的行列式计算可得其近似服从卡方分布。如果统计量卡方值较大且对应的统计量卡方值较大且对应的sigsig值小于给定的显著性水平值小于给定的显著性水平a a时，零假设时，零假设不成立。即说明相关系数矩阵不太可能是单位矩阵，变量之间存在相不成立。即说明相关系数矩阵不太可能是

22、单位矩阵，变量之间存在相关关系，适合做因子分析。关关系，适合做因子分析。第19页，共78页，编辑于2022年，星期六（4 4）KMO(Kaiser-Meyer-Olkin)KMO(Kaiser-Meyer-Olkin)检验检验 KMOKMO检验的统计量是用于比较变量间简单相关系数矩阵和偏相关检验的统计量是用于比较变量间简单相关系数矩阵和偏相关系数的指标，数学定义为：系数的指标，数学定义为：KMO KMO与与MSAMSA区别是它将相关系数矩阵中的所有元素都加入到了平方区别是它将相关系数矩阵中的所有元素都加入到了平方和计算中。和计算中。KMOKMO值越接近值越接近1 1，意味着变量间的相关性越强，

23、原有变，意味着变量间的相关性越强，原有变量适合做因子分析；越接近量适合做因子分析；越接近0 0，意味变量间的相关性越弱，越不，意味变量间的相关性越弱，越不适合作因子分析。适合作因子分析。KaiserKaiser给出的给出的KMOKMO度量标准：度量标准：0.90.9以上非常适合；以上非常适合；0.80.8表示适合；表示适合；0.70.7表示一般；表示一般；0.60.6表示不太适合；表示不太适合；0.50.5以下表示极不以下表示极不适合。适合。第20页，共78页，编辑于2022年，星期六v3 3、因子提取和因子载荷矩阵的求解：、因子提取和因子载荷矩阵的求解：因子载荷矩阵求解的方法：因子载荷矩阵求

24、解的方法：（1 1）基于主成分模型的主成分分析法）基于主成分模型的主成分分析法（2 2）基于因子分析模型的主轴因子法）基于因子分析模型的主轴因子法（3 3）极大似然法极大似然法（4 4）最小二乘法）最小二乘法（5 5）a a因子提取法因子提取法（6 6）映象分析法）映象分析法第21页，共78页，编辑于2022年，星期六（1 1）基于主成分模型的主成分分析法）基于主成分模型的主成分分析法Principal componentsPrincipal components设随机向量的均值为，协方差为,为的特征根，为对应的标准化特征向量，则第22页，共78页，编辑于2022年，星期六上式给出

25、的上式给出的表达式是精确的，然而，它实际上是毫无价值表达式是精确的，然而，它实际上是毫无价值的，因为我们的目的是寻求用少数几个公共因子解释，故略的，因为我们的目的是寻求用少数几个公共因子解释，故略去后面的去后面的p-mp-m项的贡献，有：项的贡献，有：第23页，共78页，编辑于2022年，星期六上式有一个假定，模型中的特殊因子是不重要的，因而从上式有一个假定，模型中的特殊因子是不重要的，因而从的分解中忽略了特殊因子的方差。的分解中忽略了特殊因子的方差。第24页，共78页，编辑于2022年，星期六例例:假定某地固定资产投资率假定某地固定资产投资率，通货膨胀率，通货膨胀率，失业率，失业率

26、，相关系数矩阵为，相关系数矩阵为试用主成分分析法求因子分析模型。试用主成分分析法求因子分析模型。第25页，共78页，编辑于2022年，星期六(1)(1)求解特征根求解特征根(2)(2)求解特征向量：求解特征向量：(3)(3)因子载荷矩阵：因子载荷矩阵：第26页，共78页，编辑于2022年，星期六(4)(4)因子分析模型：因子分析模型：可取前两个因子可取前两个因子F1F1和和F F2 2为公共因子，第一公因子为公共因子，第一公因子F F1 1物价就业因子，物价就业因子，对对X X的贡献为的贡献为1.551.55。第一公因子。第一公因子F F2 2为投资因子，对为投资因子，对X X的贡献为的贡献

27、为0.850.85。共同度分别为。共同度分别为1 1，0.7060.706，0.7060.706。第27页，共78页，编辑于2022年，星期六（2 2）基于因子分析模型的主轴因子法）基于因子分析模型的主轴因子法Principal axis Principal axis factoringfactoring 是对主成分方法的修正，假定我们首先对变量进行标准化是对主成分方法的修正，假定我们首先对变量进行标准化变换。则变换。则 R=AAR=AA+D+D R R*=AA=AA=R-D=R-D称称R R*为约相关矩阵，为约相关矩阵，R R*对角线上的元素是对角线上的元素是 ,而不是而不是1 1。第28页

28、，共78页，编辑于2022年，星期六直接求直接求R R*的前的前p p个特征根和对应的正交特征向量。得个特征根和对应的正交特征向量。得如下的矩阵：如下的矩阵：第29页，共78页，编辑于2022年，星期六当特殊因子当特殊因子的方差的方差已知：已知：第30页，共78页，编辑于2022年，星期六方差矩阵未知，估计的方法有如下几种：方差矩阵未知，估计的方法有如下几种：1 1）取）取，在这个情况下主因子解与主成分解等价；，在这个情况下主因子解与主成分解等价；2 2）取）取，为为x xi i与其他所有的原始变量与其他所有的原始变量x xj j的复相关系数的平的复相关系数的平方，即方，即x xi i

29、对其余的对其余的p-1p-1个个x xj j的回归方程的判定系数，这是因为的回归方程的判定系数，这是因为x xi i 与公共与公共因子的关系是通过其余的因子的关系是通过其余的p-1p-1个个x xj j 的线性组合联系起来的；的线性组合联系起来的；3 3）取）取，这意味着取，这意味着取x xi i与其余的与其余的x xj j的简单相关系的简单相关系数的绝对值最大者；数的绝对值最大者；第31页，共78页，编辑于2022年，星期六 4 4）取）取，其中要求该值为正数。，其中要求该值为正数。5 5）取）取，其中，其中是是的对角元素。的对角元素。第32页，共78页，编辑于2022年，星期六例

30、：例：假定某地固定资产投资率假定某地固定资产投资率，通货膨胀率，通货膨胀率，失业率，失业率，相关系，相关系数矩阵为数矩阵为试用主因子分析法求因子分析模型。假定用试用主因子分析法求因子分析模型。假定用代替初始的代替初始的。第33页，共78页，编辑于2022年，星期六（1 1）求解特征根：）求解特征根：（2 2）对应的非）对应的非0 0特征向量：特征向量：（3 3）因子载荷矩阵表：）因子载荷矩阵表：第34页，共78页，编辑于2022年，星期六（4 4）因子分析模型：）因子分析模型：（5 5）新的共同度：）新的共同度：第35页，共78页，编辑于2022年，星期六v4 4、因子旋转：、因子旋转

31、：为什么要旋转因子？为什么要旋转因子？建立了因子分析数学目的不仅仅要找出公共因子以及对变建立了因子分析数学目的不仅仅要找出公共因子以及对变量进行分组，更重要的要知道每个公共因子的意义，以便进量进行分组，更重要的要知道每个公共因子的意义，以便进行进一步的分析，如果每个公共因子的含义不清，则不便于行进一步的分析，如果每个公共因子的含义不清，则不便于进行实际背景的解释。进行实际背景的解释。由于因子载荷阵是不惟一的，所以应该对由于因子载荷阵是不惟一的，所以应该对因子载荷阵进行旋转。因子载荷阵进行旋转。目的是目的是使每个变量在尽可能少的因子上有使每个变量在尽可能少的因子上有比较高的载荷，让某个变量在某个

32、因子上的载荷趋于比较高的载荷，让某个变量在某个因子上的载荷趋于1 1，而在其，而在其他因子上的载荷趋于他因子上的载荷趋于0 0。即：。即：使载荷矩阵每列或行的元素平方值向使载荷矩阵每列或行的元素平方值向0 0和和1 1两极分化。两极分化。第36页，共78页，编辑于2022年，星期六奥运会十项全能运动项目奥运会十项全能运动项目得分数据的因子分析得分数据的因子分析百米跑成绩百米跑成绩跳远成绩跳远成绩铅球成绩铅球成绩跳高成绩跳高成绩 400 400米跑成绩米跑成绩百米跨栏百米跨栏铁饼成绩铁饼成绩撑杆跳远成绩撑杆跳远成绩标枪成绩标枪成绩 1500 1500米跑成绩米跑成绩第37页，共

33、78页，编辑于2022年，星期六第38页，共78页，编辑于2022年，星期六因因子子载载荷荷矩矩阵阵因子载荷矩阵可以看出，除第一因子在所有的变量在公共因子上有较大的因子载荷矩阵可以看出，除第一因子在所有的变量在公共因子上有较大的正载荷，可以称为一般运动因子。其他的正载荷，可以称为一般运动因子。其他的3 3个因子不太容易解释。似乎是跑和投个因子不太容易解释。似乎是跑和投掷的能力对比，似乎是长跑耐力和短跑速度的对比。于是考虑旋转因子，得下掷的能力对比，似乎是长跑耐力和短跑速度的对比。于是考虑旋转因子，得下表表第39页，共78页，编辑于2022年，星期六旋转变幻后因子载荷矩阵旋转变幻后因子载荷矩阵

34、第40页，共78页，编辑于2022年，星期六通过旋转，因子有了较为明确的含义。通过旋转，因子有了较为明确的含义。百米跑，百米跑，跳跳远远和和 400400米米跑跑，需需要要爆爆发发力力的的项项目目在在有有较较大大的的载载荷荷，可可以以称为短跑速度因子；称为短跑速度因子；铅铅球球，铁铁饼饼和和标标枪枪在在上上有有较较大大的的载载荷荷，可可以以称称为为爆爆发性臂力因子；发性臂力因子；百百米米跨跨栏栏，撑撑杆杆跳跳远远，跳跳远远和和为为跳跳高高在在上上有有较较大大的的载荷，载荷，爆发腿力因子；爆发腿力因子；长跑耐力因子。长跑耐力因子。第41页，共78页，编辑于2022年，星期六旋转的方

35、法旋转的方法有：有：（1 1）正交旋转；（）正交旋转；（2 2）斜交旋转）斜交旋转（1 1）正交旋转）正交旋转由初始载荷矩阵由初始载荷矩阵A A左乘一正交矩阵得到；左乘一正交矩阵得到；目的是新的载荷系数目的是新的载荷系数尽可能的接近于尽可能的接近于0 0或尽可能的远离或尽可能的远离0 0；只是在；只是在旋转后的新的公因旋转后的新的公因子仍保持独立性。主要有以下方法：子仍保持独立性。主要有以下方法：varimax:varimax:方差最大旋转。简化对因子的解释方差最大旋转。简化对因子的解释quartmax:quartmax:四次最大正交旋转。简化对变量的解释四次最大正交旋转。简化对变量的解释e

36、quamax:equamax:等量正交旋转等量正交旋转第42页，共78页，编辑于2022年，星期六A A、方差最大法方差最大法方差最大法从简化因子载荷矩阵的每一方差最大法从简化因子载荷矩阵的每一列列出发，使和每出发，使和每个因子有关的载荷的平方的方差最大。当只有少数几个变量在某个因子有关的载荷的平方的方差最大。当只有少数几个变量在某个因子上有较高的载荷时，对因子的解释最简单。个因子上有较高的载荷时，对因子的解释最简单。方差最大的直观方差最大的直观意义是希望通过因子旋转后，使每个因子上的载荷尽量拉开距离，一意义是希望通过因子旋转后，使每个因子上的载荷尽量拉开距离，一部分的载荷趋于部分的载荷趋于

37、 1 1，另一部分趋于，另一部分趋于0 0。第43页，共78页，编辑于2022年，星期六B B、四次方最大旋转四次方最大旋转四次方最大旋转是从简化载荷矩阵的四次方最大旋转是从简化载荷矩阵的行行出发，通过旋转初始出发，通过旋转初始因子，使每个变量只在一个因子上有较高的载荷，而在其它的因子，使每个变量只在一个因子上有较高的载荷，而在其它的因子上尽可能低的载荷。如果每个变量只在一个因子上有非零因子上尽可能低的载荷。如果每个变量只在一个因子上有非零的载荷，这时的因子解释的载荷，这时的因子解释是最简单的。是最简单的。四次方最大法通过使因子载荷矩阵中每一行的因子载荷四次方最大法通过使因子载荷矩阵中每一行

38、的因子载荷平方的方差达到最大。平方的方差达到最大。C C、等量最大法等量最大法等量最大法把四次方最大法和方差最大法结合起来求行等量最大法把四次方最大法和方差最大法结合起来求行和列因子载荷平方的方差的加权平均最大。和列因子载荷平方的方差的加权平均最大。第44页，共78页，编辑于2022年，星期六（2 2）斜交旋转）斜交旋转目的是新的载荷系数尽可能的接近于目的是新的载荷系数尽可能的接近于0 0或尽可能的远离或尽可能的远离0 0；只是在旋转时，放弃了因子之间彼此独立的限制，旋转后的新；只是在旋转时，放弃了因子之间彼此独立的限制，旋转后的新公因子更容易解释。主要有以下的方法：公因子更容易解释。主要有

39、以下的方法：direct oblimin:direct oblimin:直接斜交旋转。允许因子之间具有相关性；直接斜交旋转。允许因子之间具有相关性；promax:promax:斜交旋转方法。允许因子之间具有相关性；斜交旋转方法。允许因子之间具有相关性；第45页，共78页，编辑于2022年，星期六v5 5、因子得分、因子得分因子得分的概念因子得分的概念前面我们主要解决了用公共因子的线性组合来表示一组观测变前面我们主要解决了用公共因子的线性组合来表示一组观测变量的有关问题。如果我们要使用这些因子做其他的研究，比如把得到量的有关问题。如果我们要使用这些因子做其他的研究，比如把得到的因子作为自变量来

40、做回归分析，对样本进行分类或评价，这就需要的因子作为自变量来做回归分析，对样本进行分类或评价，这就需要我们对公共因子进行测度，即给出我们对公共因子进行测度，即给出公共因子的值公共因子的值。第46页，共78页，编辑于2022年，星期六例例：人人均均要要素素变变量量因因子子分分析析。对对我我国国3232个个省省市市自自治治区区的的要要素素状状况况作作因因子子分析。指标体系中有如下指标：分析。指标体系中有如下指标：X1 X1：人口（万人）人口（万人）X2 X2：面积（万平方公里）面积（万平方公里）X3 X3：GDPGDP（亿元）亿元）X4 X4：人均水资源（立方米人均水资源（立方米/人）人）X5X5

41、：人均生物量（吨人均生物量（吨/人）人）X6X6：万人拥有的大学生数（人）万人拥有的大学生数（人）X7X7：万人拥有科学家、工程师数（人）万人拥有科学家、工程师数（人）Rotated Factor PatternRotated Factor Pattern FACTOR1 FACTOR2 FACTOR3 FACTOR1 FACTOR2 FACTOR3 X1 -0.21522 -0.27397 0.89092 X1 -0.21522 -0.27397 0.89092 X2 0.63973 -0.28739 -0.28755 X2 0.63973 -0.28739 -0.28755 X3 -0.1

42、5791 0.06334 0.94855 X3 -0.15791 0.06334 0.94855 X4 0.95898 -0.01501 -0.07556 X4 0.95898 -0.01501 -0.07556 X5 0.97224 -0.06778 -0.17535 X5 0.97224 -0.06778 -0.17535 X6 -0.11416 0.98328 -0.08300 X6 -0.11416 0.98328 -0.08300 X7 -0.11041 0.97851 -0.07246 X7 -0.11041 0.97851 -0.07246第47页，共78页，编辑于2022年，星

43、期六 X1=-0.21522F1-0.27397F2+0.89092F3 X2=0.63973F1-0.28739F2-0.28755F3 X3=-0.15791F1+0.06334F2+0.94855F3 X4=0.95898F1-0.01501F2-0.07556F3 X5=0.97224F1-0.06778F2-0.17535F3 X6=-0.11416F1+0.98328F2-0.08300F3 X7=-0.11041F1+0.97851F2-0.07246F3第48页，共78页，编辑于2022年，星期六高载荷指标高载荷指标因子命名因子命名因子因子1 1X2X2；面积（万平方公里）面积

44、（万平方公里）X4:X4:人均水资源（立方米人均水资源（立方米/人）人）X5:X5:人均生物量（吨人均生物量（吨/人）人）自然资源因子自然资源因子因子因子2 2X6X6：万人拥有的大学生数（人）万人拥有的大学生数（人）X7X7：万万人人拥拥有有的的科科学学家家、工工程程师师数数（人）（人）人力资源因子人力资源因子因子因子3 3X1;X1;人口（万人）人口（万人）X3:GDP(X3:GDP(亿元亿元)经济发展总量因子经济发展总量因子第49页，共78页，编辑于2022年，星期六Standardized Scoring Coefficients FACTOR1 FACTOR2 FACTOR3 X1

45、0.05764 -0.06098 0.50391 X2 0.22724 -0.09901 -0.07713 X3 0.14635 0.12957 0.59715 X4 0.47920 0.11228 0.17062 X5 0.45583 0.07419 0.10129 X6 0.05416 0.48629 0.04099 X7 0.05790 0.48562 0.04822F1=0.05764X1+0.22724X2+0.14635X3+0.47920X4+0.45583X5+0.05416X6+0.05790X7F1=0.05764X1+0.22724X2+0.14635X3+0.47920

46、X4+0.45583X5+0.05416X6+0.05790X7F2=-0.06098X1-0.09901X2+0.12957X3+0.11228X4+0.07419X5+0.48629X6+0.48562X7F2=-0.06098X1-0.09901X2+0.12957X3+0.11228X4+0.07419X5+0.48629X6+0.48562X7F3=0.50391X1-0.07713X2+0.59715X3+0.17062X4+0.10129X5+0.04099X6+0.04822X7F3=0.50391X1-0.07713X2+0.59715X3+0.17062X4+0.10129

47、X5+0.04099X6+0.04822X7第50页，共78页，编辑于2022年，星期六前三个因子得分前三个因子得分REGION FACTOR1FACTOR2FACTOR3beijing-0.081694.23473-0.37983tianjin-0.474221.31789-0.87891hebei-0.22192-0.358020.86263shanxi1-0.48214-0.32643-0.54219neimeng0.54446-0.66668-0.92621liaoning-0.205110.463770.34087jilin-0.214990.10608-0.57431heilong

48、j 0.10839-0.11717-0.02219shanghai-0.200692.38962-0.04259第51页，共78页，编辑于2022年，星期六因子分析的数学模型为：因子分析的数学模型为：原变量被表示为公共因子的线性组合，当载荷矩阵旋转之原变量被表示为公共因子的线性组合，当载荷矩阵旋转之后，公共因子可以做出解释，通常的情况下，我们还想反过后，公共因子可以做出解释，通常的情况下，我们还想反过来把公共因子表示为原变量的线性组合。来把公共因子表示为原变量的线性组合。因子得分函数：因子得分函数：第52页，共78页，编辑于2022年，星期六可见，要求得每个因子的得分，必须求得分函数的系数，而

49、由可见，要求得每个因子的得分，必须求得分函数的系数，而由于于pmpm，所以不能得到精确的得分，只能通过估计。所以不能得到精确的得分，只能通过估计。因子得分的计算方法：因子得分的计算方法：（1 1）运用回归分析思想求解）运用回归分析思想求解（2 2）BartlettBartlett（3 3）Anderson-rubinAnderson-rubin第53页，共78页，编辑于2022年，星期六（1 1）运用回归分析思想求解）运用回归分析思想求解第54页，共78页，编辑于2022年，星期六则，我们有如下的方程组：则，我们有如下的方程组：第55页，共78页，编辑于2022年，星期六j=1,2,m第56页

50、，共78页，编辑于2022年，星期六注：共需要解注：共需要解m m次才能解出次才能解出所有的得分函数的系数。所有的得分函数的系数。第57页，共78页，编辑于2022年，星期六（2 2）BartlettBartlett法法(即：加权最小二乘法）即：加权最小二乘法）把一个个体的p个变量的取值X*当作因变量，把求因子解中得到的A作为自变量数据阵，对于这个个体在公因子上的取值f，当作未知参数，而特殊因子的取值看作误差e，于是得到如下的线性回归模型：x*=Af+e，则称未知参数f为取值为X*的因子得分。最小二乘法第58页，共78页，编辑于2022年，星期六（02020202）选择分析变量）选择分析变量

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

18 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 应用统计学因子分析幻灯片

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：应用统计学因子分析幻灯片.ppt
链接地址：https://www.taowenge.com/p-87544581.html