因子分析步骤幻灯片.ppt
因子分析步骤第1页,共26页,编辑于2022年,星期五一、前言一、前言变量的相关性变量的相关性公共因子?公共因子?将多个实测变量转换成少数几个不将多个实测变量转换成少数几个不相关的综合指数相关的综合指数第2页,共26页,编辑于2022年,星期五二、因子分析模型二、因子分析模型一般地,设一般地,设X=(x1,x2,xp)为可观测的为可观测的随机变量,且有随机变量,且有f=(f1,f2,fm)为公共(共性)因子为公共(共性)因子(common factor),简称因子),简称因子(factor)第3页,共26页,编辑于2022年,星期五e=(ee=(e1 1,e,e2 2,e,ep p)为特殊因子为特殊因子(specific factorspecific factor)f f和和e e均为不可直接观测的随机变量均为不可直接观测的随机变量=(=(1 1,2 2,p p)为总体为总体x x的均的均值值A=(aA=(aijij)p*mp*m为因子负荷(载荷)为因子负荷(载荷)(factor loadingfactor loading)矩阵)矩阵第4页,共26页,编辑于2022年,星期五通常先对通常先对x作标准化处理,使其均值为零,作标准化处理,使其均值为零,方差为这样就有方差为这样就有假定()假定()fi的均数为,方差为;的均数为,方差为;()()e ei i的均数为,方差为的均数为,方差为i i;()()fi与与e ei i相互独立相互独立则称则称x x为具有为具有m m个公共因子的因子模型个公共因子的因子模型第5页,共26页,编辑于2022年,星期五如果再满足()如果再满足()f fi i与与f fj j相互独立(相互独立(ijij),),则称该因子模型为正交因子模型。则称该因子模型为正交因子模型。正交因子模型具有如下特性:正交因子模型具有如下特性:x x的方差可表示为的方差可表示为设设第6页,共26页,编辑于2022年,星期五()()h hi i2 2是是m m个公共因子对第个公共因子对第i i个变量个变量的贡献,称为第的贡献,称为第i i个共同度个共同度(communalitycommunality)或共性方差,公因)或共性方差,公因子方差(子方差(common variancecommon variance)()()i i称为特殊方差(称为特殊方差(specific specific variancevariance),是不能由公共因子解释),是不能由公共因子解释的部分的部分第7页,共26页,编辑于2022年,星期五因子载荷(负荷)因子载荷(负荷)a aijij是随机变量是随机变量x xi i与公与公共因子共因子f fj j的相关系数。的相关系数。设设称称g gj j2 2为公共因子为公共因子f fj j对对x x的的“贡献贡献”,是衡量,是衡量公共因子公共因子f fj j重要性的一个指标。重要性的一个指标。第8页,共26页,编辑于2022年,星期五三、因子分析的步骤三、因子分析的步骤输入原始数据输入原始数据xn*p,计算样本均值和方差,计算样本均值和方差,进行标准化计算(处理);进行标准化计算(处理);求样本相关系数矩阵求样本相关系数矩阵R=(rij)p*p;求相关系数矩阵的特征根求相关系数矩阵的特征根i i(1 1,2 2,p p0)0)和相应的标准正交的和相应的标准正交的特征向量特征向量li;第9页,共26页,编辑于2022年,星期五确定公共因子数;确定公共因子数;计算公共因子的共性方差计算公共因子的共性方差hi2;对载荷矩阵进行旋转,以求能更好地解对载荷矩阵进行旋转,以求能更好地解释公共因子;释公共因子;对公共因子作出专业性的解释。对公共因子作出专业性的解释。第10页,共26页,编辑于2022年,星期五四、因子分析提取因子的方法四、因子分析提取因子的方法主成分法主成分法(principal component factor)第11页,共26页,编辑于2022年,星期五每一个公共因子的载荷系数之平方和等每一个公共因子的载荷系数之平方和等于对应的特征根,即该公共因子的方于对应的特征根,即该公共因子的方差。差。第12页,共26页,编辑于2022年,星期五极大似然法(极大似然法(maximum likelihood factor)假定原变量服从正态分布,公共因子和假定原变量服从正态分布,公共因子和特殊因子也服从正态分布,构造因子特殊因子也服从正态分布,构造因子负荷和特殊方差的似然函数,求其极负荷和特殊方差的似然函数,求其极大,得到唯一解。大,得到唯一解。第13页,共26页,编辑于2022年,星期五主因子法(主因子法(principal factor)设原变量的相关矩阵为设原变量的相关矩阵为R=(rij),其逆矩,其逆矩阵为阵为R-1=(rij)。各变量特征方差的初始。各变量特征方差的初始值取为逆相关矩阵对角线元素的倒数,值取为逆相关矩阵对角线元素的倒数,i i=1/r=1/riiii。则共同度的初始值为则共同度的初始值为(hi)2=1-i i=1-1/rii。第14页,共26页,编辑于2022年,星期五以以(hi)2代替相关矩阵中的对角线上的元素,得代替相关矩阵中的对角线上的元素,得到约化相关矩阵。到约化相关矩阵。(h1)2 r12 r1p r21 (h2)2 r2p R=.rp1 rp2 (hp)2R的前的前m个特征根及其对应的单位化特征向个特征根及其对应的单位化特征向量就是主因子解。量就是主因子解。第15页,共26页,编辑于2022年,星期五迭代主因子法迭代主因子法(iterated principal factor)主因子的解很不稳定。因此,常以估计的共主因子的解很不稳定。因此,常以估计的共同度为初始值,构造新的约化矩阵,再计同度为初始值,构造新的约化矩阵,再计算其特征根及其特征向量,并由此再估计算其特征根及其特征向量,并由此再估计因子负荷及其各变量的共同度和特殊方差,因子负荷及其各变量的共同度和特殊方差,再由此新估计的共同度为初始值继续迭代,再由此新估计的共同度为初始值继续迭代,直到解稳定为止。直到解稳定为止。第16页,共26页,编辑于2022年,星期五Heywood现象现象残差矩阵残差矩阵第17页,共26页,编辑于2022年,星期五五、因子旋转五、因子旋转目的:使因子负荷两极分化,要么接目的:使因子负荷两极分化,要么接近于近于0,要么接近于,要么接近于1。常用的旋转方法:常用的旋转方法:第18页,共26页,编辑于2022年,星期五(1 1)方差最大正交旋转)方差最大正交旋转(varimax orthogonal varimax orthogonal rotationrotation)基本思想:使公共因子的相对负荷基本思想:使公共因子的相对负荷(l lijij/h/hi i2 2)的方差之和最大,且保持原公)的方差之和最大,且保持原公共因子的正交性和公共方差总和不变。共因子的正交性和公共方差总和不变。可使每个因子上的具有最大载荷的变量可使每个因子上的具有最大载荷的变量数最小,因此可以简化对因子的解释。数最小,因此可以简化对因子的解释。第19页,共26页,编辑于2022年,星期五(2 2)斜交旋转)斜交旋转(oblique rotationoblique rotation)因子斜交旋转后,各因子负荷发生了较因子斜交旋转后,各因子负荷发生了较大变化,出现了两极分化。各因子间不大变化,出现了两极分化。各因子间不再相互独立,而彼此相关。各因子对各再相互独立,而彼此相关。各因子对各变量的贡献的总和也发生了改变。变量的贡献的总和也发生了改变。适用于大数据集的因子分析。适用于大数据集的因子分析。第20页,共26页,编辑于2022年,星期五六、因子得分六、因子得分Thomson法,即回归法法,即回归法回归法得分是由回归法得分是由Bayes思想导出的,得到的思想导出的,得到的因子得分是有偏的,但计算结果误差较因子得分是有偏的,但计算结果误差较小。小。第21页,共26页,编辑于2022年,星期五Bartlett法法Bartlett因子得分是极大似然估计,也是加权因子得分是极大似然估计,也是加权最小二乘回归,得到的因子得分是无偏的,最小二乘回归,得到的因子得分是无偏的,但计算结果误差较大。但计算结果误差较大。因子得分可用于模型诊断,也可用作进一因子得分可用于模型诊断,也可用作进一步分析的原始资料。步分析的原始资料。第22页,共26页,编辑于2022年,星期五七、因子分析应用实例七、因子分析应用实例第23页,共26页,编辑于2022年,星期五八、因子分析应用的注意事项八、因子分析应用的注意事项应用条件应用条件(1)变量是计量的,能用线性相关系)变量是计量的,能用线性相关系数(数(Pearson积叉相关系数)表示。积叉相关系数)表示。(2)总体的同质性)总体的同质性第24页,共26页,编辑于2022年,星期五样本量样本量没有估计公式。至少要保证样本相关系没有估计公式。至少要保证样本相关系数稳定可靠。数稳定可靠。因子数目因子数目一般认为,累积贡献要达到一般认为,累积贡献要达到80%以上。以上。但要注意但要注意Heywood现象。现象。第25页,共26页,编辑于2022年,星期五谢谢!谢谢!第26页,共26页,编辑于2022年,星期五