13因子分析.ppt
《13因子分析.ppt》由会员分享,可在线阅读,更多相关《13因子分析.ppt(59页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二十讲第二十讲 多元相关(续)多元相关(续)一、主成分分析一、主成分分析二、因子分析二、因子分析三、典型相关分析三、典型相关分析一、因子分析模型引入一、因子分析模型引入考虑人的五个生理指标:考虑人的五个生理指标:x1.收缩压,收缩压,x2.舒张压,舒张压,x3.心跳间隔,心跳间隔,x4.呼吸间隔,呼吸间隔,x5.舌下温度。舌下温度。这五个指标受植物神经支配,而植物神经分为交这五个指标受植物神经支配,而植物神经分为交感神经与副交感神经。感神经与副交感神经。以上五个指标至少有两个公共因子对其有影响。以上五个指标至少有两个公共因子对其有影响。f1:交感神经交感神经;f2:副交感神经副交感神经有无其
2、他因子影响?有无其他因子影响?x与各因子之间的关系?与各因子之间的关系?建立模型建立模型可观测变量可观测变量x1,x2,x5如何表示成如何表示成不可观测的公共因子不可观测的公共因子f1,f 2的线性组合?的线性组合?因子分析由来因子分析由来 因子分析(factoranalysis)最早由英国心理学家C.E.斯皮尔曼提出。他发现学生的各科成绩之间存在着一定的相关性,一科成绩好的学生,往往其他各科成绩也比较好,从而推想是否存在某些潜在的共性因子,或称某些一般智力条件影响着学生的学习成绩。百米跑成绩 跳远成绩 铅球成绩 跳高成绩 400米跑成绩 百米跨栏 铁饼成绩 撑杆跳远成绩 标枪成绩 1500米
3、跑成绩 奥运会十项全能运动项目奥运会十项全能运动项目得分数据的因子分析得分数据的因子分析 7 公共因子有较为明确的含义公共因子有较为明确的含义 百米x1、跳远x2、400米x5等需要短跑爆发力的项目在 F1有较大载荷,称为短跑速度因子 铅球x3、铁饼x7、标枪x9在F2上有较大载荷,称为爆发性臂力因子 百米栏x6,撑杆跳x8,跳远x2,跳高x4,在F3上有较大载荷,称为爆发性腿力因子 400米x5,1500米x10,在F4上有较大载荷,称为长跑耐力因子二、因子分析数学模型二、因子分析数学模型因子分析方法是用尽可能少的不可观测的因子分析方法是用尽可能少的不可观测的“公共因子公共因子”与与“特殊因
4、子特殊因子”之和来描述和刻画之和来描述和刻画原来的每个观测分量。其目的是尽可能合理原来的每个观测分量。其目的是尽可能合理地解释存在于原始变量之间的相关性,且简化地解释存在于原始变量之间的相关性,且简化变量的维数与结构。变量的维数与结构。(一)因子模型(一)因子模型模型模型称为称为因子模型因子模型,其中假设,其中假设1.是可观测的向量,且均是可观测的向量,且均值值协方差阵协方差阵等于其相关等于其相关矩阵矩阵2.是不可观测的向是不可观测的向量,其均值量,其均值协方差阵是协方差阵是3.与与相互独立,且相互独立,且的协方差阵为对角矩阵的协方差阵为对角矩阵用向量可将因子模型表示为用向量可将因子模型表示为
5、其中其中满足前述三个假设条件,满足前述三个假设条件,是是矩阵,矩阵,模型中模型中叫做公共因子,它们是在各叫做公共因子,它们是在各观测变量表达式中都共同出现的因子,是相观测变量表达式中都共同出现的因子,是相互独立的不可观测的隐变量。互独立的不可观测的隐变量。叫做特殊因子,是原观测变量叫做特殊因子,是原观测变量各个分量的特殊因子,各特殊因子之间及特各个分量的特殊因子,各特殊因子之间及特殊因子与公共因子之间都是相互独立的。殊因子与公共因子之间都是相互独立的。矩阵矩阵的元素的元素叫做因子载荷,当叫做因子载荷,当的绝的绝对值对值()表明表明与与的相依程度的大小,的相依程度的大小,即公共因子即公共因子对于
6、对于的影响程度,故称的影响程度,故称为为公共因子载荷量,简称因子载荷,而矩阵公共因子载荷量,简称因子载荷,而矩阵称称为因子载荷矩阵。为因子载荷矩阵。因子分析因子分析:从一组可观测资料出发,从一组可观测资料出发,分析出公共因子与特殊因子,并求出相应的分析出公共因子与特殊因子,并求出相应的载荷矩阵载荷矩阵A,解释各公共因子的含义。,解释各公共因子的含义。(二)因子载荷矩阵的统计意义(二)因子载荷矩阵的统计意义1.因子载荷因子载荷的统计意义的统计意义因为因为且且因此因此既是既是与与协方差,协方差,又是它们的又是它们的相关系数相关系数,就是说,就是说是用来度量是用来度量可用可用线性组合表示的线性组合表
7、示的程度,因子载荷程度,因子载荷,表示,表示与与的依赖程度。的依赖程度。2.变量共同度的统计意义变量共同度的统计意义称因子载荷矩阵称因子载荷矩阵中中各行元素的平方和各行元素的平方和为变量为变量的共同度。由于的共同度。由于矩阵矩阵AA的主对角元素恰为各的主对角元素恰为各的共同度。的共同度。上式表明变量上式表明变量的方差由两部分组成:其一是的方差由两部分组成:其一是它是全部公共因子对于变量它是全部公共因子对于变量的总方差所的总方差所作出的贡献;其二是作出的贡献;其二是它是变量它是变量的特殊因的特殊因子所产生的方差,仅与变量子所产生的方差,仅与变量的本身变化有关,的本身变化有关,而与公共因子无关,常
8、称为剩余方差。而与公共因子无关,常称为剩余方差。3.公共因子公共因子的方差贡献统计意义的方差贡献统计意义将载荷矩阵将载荷矩阵的各列元素之平方和的各列元素之平方和称为公共因子称为公共因子对对的贡献。的贡献。4始观测变量始观测变量X的协差阵的分解(不唯一)的协差阵的分解(不唯一)三、因子载荷矩阵三、因子载荷矩阵A的估计的估计因子因子载载荷矩荷矩阵阵的估的估计计方法方法约约有有10多种,多种,如主成分法、主因子法、重心法、影像分如主成分法、主因子法、重心法、影像分析法,最大似然解、最小平方法、阿析法,最大似然解、最小平方法、阿尔尔法法抽因法、拉奥典型抽因法等等。抽因法、拉奥典型抽因法等等。这这些方法
9、些方法本本质质上大都属近似方法,是以相关系数矩上大都属近似方法,是以相关系数矩阵为阵为基基础础的,所不同的是相关系数矩的,所不同的是相关系数矩阵对阵对角角线线上的上的值值,采用不同的估,采用不同的估值值方法。方法。设随机向量设随机向量 的均值为的均值为,协方差为,协方差为,为为 的特征根,的特征根,为对应的为对应的标准化特征向量,则标准化特征向量,则(1 1)主成分分析法)主成分分析法 上式给出的上式给出的表达式是精确的,然而它实际上毫无价值,表达式是精确的,然而它实际上毫无价值,因为我们的目的是寻求少数几个公共因子解释,故略因为我们的目的是寻求少数几个公共因子解释,故略去后面的去后面的p-m
10、项的贡献,有项的贡献,有注:注:残差矩阵为残差矩阵为其中S为样本的协方差矩阵。则有 (2 2)主因子法)主因子法 主因子方法是对主成分方法的修正,假定我们已经先对变量进行了标准化变换。则 R=AA+D R*=AA=R-D 称R*为约相关矩阵,R*对角线上的元素是 ,而不是1。设 是 的初始估计,则 的初始估的初始估计计方法有如下几种方法有如下几种:1)取取 ,在这个情况下主因子解与主成分解,在这个情况下主因子解与主成分解等价;等价;2 2)取)取 ,为为x xi i与其他所有的原始变量与其他所有的原始变量x xj j的复相关系数的平方,即的复相关系数的平方,即x xi i对其余的对其余的p-1
11、p-1个个x xj j的回归的回归方程的判定系数,这是因为方程的判定系数,这是因为x xi i 与公共因子的关系是与公共因子的关系是通过其余的通过其余的p-1p-1个个x xj j 的线性组合联系起来的;的线性组合联系起来的;3)取 ,这意味着取xi与其余的xj的简单相关系数的绝对值最大者;4)取 ,其中要求该值为正数。5)取 ,其中 是 的对角元素。例1假定某地固定假定某地固定资产资产投投资资率率,通,通货货膨膨胀胀率率,失,失业业率率,相关系数矩,相关系数矩阵为阵为R=试试用主成分分析法求因子分析模型。用主成分分析法求因子分析模型。30 特征根为特征根为:可取前两个因子可取前两个因子F1和
12、和F2为公共因子。为公共因子。第一公因子第一公因子F1是是“物价就业因子物价就业因子”,对,对X的贡献为的贡献为1.55。第二公因子第二公因子F2是是“投资因子投资因子”,对,对X的贡献为的贡献为0.85。共同度分别为共同度分别为1,0.706,0.706。法二法二:用主因子分析法求解因子分析模型用主因子分析法求解因子分析模型假定用假定用 代替初始的代替初始的 特征根为:对应的非零特征向量为:4 4、因子旋转、因子旋转 建建立立因因子子分分析析模模型型的的目目的的,不不仅仅要要找找出出公公共共因因子子,更更重重要要的的是是解解析析公公共共因因子子的的实实际际意意义义,以以便便进进行行进进一一步
13、步分分析析。如如果果每每个个公公共共因因子子的的含含义义不不清清,则则不不便便于于进进行实际背景的解释。行实际背景的解释。由由于于因因子子载载荷荷阵阵不不惟惟一一,可可以以对对因因子子载载荷荷阵阵进进行行旋旋转转,使使因因子子载载荷荷阵阵的的结结构构简简化化,使使每每列列或或行行的的元元素素平方值向平方值向0 0和和1 1两极分化两极分化,有助于解释因子的意义。有助于解释因子的意义。有有三三种种主主要要的的正正交交旋旋转转法法:四四次次方方最最大大法法、方方差差最最大法和等量最大法。大法和等量最大法。百米跑成绩百米跑成绩 跳远成绩跳远成绩 铅球成绩铅球成绩 跳高成绩跳高成绩 400米跑成绩米跑
14、成绩 百米跨栏百米跨栏 铁饼成绩铁饼成绩 撑杆跳远成绩撑杆跳远成绩 标枪成绩标枪成绩 1500米跑成绩米跑成绩奥运会十项全能运动项目奥运会十项全能运动项目得分数据的因子分析得分数据的因子分析 因子载荷矩阵可以看出,除第一因子在所有的变量在公因子载荷矩阵可以看出,除第一因子在所有的变量在公共因子上有较大的正载荷,可以称为一般运动因子。其他的共因子上有较大的正载荷,可以称为一般运动因子。其他的3个因子不太容易解释。于是考虑旋转因子,得下表个因子不太容易解释。于是考虑旋转因子,得下表 通过旋转,因子有了较为明确的含义。通过旋转,因子有了较为明确的含义。百米跑,百米跑,跳跳远远和和 400米米跑跑,需
15、需要要爆爆发发力力的的项项目目在在 有有较较大大的的载荷,载荷,可以称为可以称为短跑速度因子短跑速度因子;铅铅球球,铁铁饼饼和和 标标枪枪在在 上上有有较较大大的的载载荷荷,可可以以称为称为爆发性臂力因子爆发性臂力因子;百百米米跨跨栏栏,撑撑杆杆跳跳远远,跳跳远远和和为为 跳跳高高在在 上上有较大的载荷,有较大的载荷,爆发腿力因子爆发腿力因子;长跑耐力因子长跑耐力因子。5 5、因子得分、因子得分 (一)因子得分的概念(一)因子得分的概念 前前面面主主要要解解决决了了用用公公共共因因子子的的线线性性组组合合来来表表示一组观测变量的因子建模问题。示一组观测变量的因子建模问题。要要使使用用这这些些因
16、因子子模模型型,比比如如把把得得到到的的因因子子作作为为自自变变量量来来做做回回归归分分析析,或或对对样样本本进进行行分分类类或或评评价价,都都需需要要对对公公共共因因子子进进行行度度量量,估估计计出出公公共共因因子的取值(因子得分)。子的取值(因子得分)。比比如如根根据据某某人人的的心心理理测测试试成成绩绩,评评估估他他的的智智商、情商等。商、情商等。人均要素变量因子分析人均要素变量因子分析对对我国我国3232个省市自治区的人均要素状况作因子分析。个省市自治区的人均要素状况作因子分析。指指标标体系中有如下指体系中有如下指标标:X1 X1:人口(万人:人口(万人 X2 X2:面:面积积(万平方
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 13 因子分析
限制150内