最新多元统计分析-因子分析PPT课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《最新多元统计分析-因子分析PPT课件.ppt》由会员分享,可在线阅读,更多相关《最新多元统计分析-因子分析PPT课件.ppt(63页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多元统计分析多元统计分析-因子分析因子分析2第一节 因子分析的基本思想9第二节第二节 因子分析模型因子分析模型 一、数学模型一、数学模型)(2211pmFaFaFaXimimiii 设 个变量,如果表示为iX), 2 , 1(pippmpmppmmpFFFaaaaaaaaaXXX212121222211121121 AFX10 称为 公共因子,是不可观测的变量,他们的系数称为因子载荷。 是特殊因子,是不能被前m个公共因子包含的部分。并且满足:mFFF,21icov( , )0,F,F即不相关;1 11212 122212()()()()()()cov()()()()()ppppppE FE F
2、E FE FE FE FEE FE FE FF,F011IFD111)(mFFF,21即 互不相关,方差为1。1222221)(pD即互不相关,方差不一定相等, 。), 0(2iiN13用矩阵的表达方式 AFXIFDFE)(, 0)(1 )(),()(, 0)()2(22221pdiagDE0),cov()3(F14 1 1、因子载荷、因子载荷 aij 的统计意义的统计意义 因子载荷因子载荷 是第是第i i个变量与第个变量与第j j个公共因子的相关系数个公共因子的相关系数 ija模型为模型为 imimiiFaFaX11),cov(),cov(1jikmkikjiFFaFXijFxaji (载荷
3、矩阵中第(载荷矩阵中第i i行,第行,第j j列的元素)反映了列的元素)反映了第第i i个变量与第个变量与第j j个公共因子的相关性。绝对值越大,个公共因子的相关性。绝对值越大,相关的密切程度越高。相关的密切程度越高。),cov(),cov(1jijkmkikFFFaija 根据公共因子的模型性质,有根据公共因子的模型性质,有 三、三、 因子载荷矩阵中的几个统计特征因子载荷矩阵中的几个统计特征15n 因子载荷不是惟一的 AFX*cov()()EF ,F 0且满足因子模型的条件*FA)(FTATFTF*设T为一个pp 的正交矩阵,令A*=AT, ,则模型可以表示为0)()()(*FETFTEFE
4、ITFDTFTDFD)()()(*),()(, 0)(22221pdiagDE162 2、变量共同度的统计意义、变量共同度的统计意义统计意义统计意义:imimiiFaFaX11两边求方差两边求方差 )()()()(2121imimiiVarFVaraFVaraXVarmjiija1221 所有的公共因子和特殊因子对变量所有的公共因子和特殊因子对变量 的贡献为的贡献为1 1。如果。如果 非常非常靠近靠近1 1, 非常小,则因子分析的效果好,从原变量空间到公共因非常小,则因子分析的效果好,从原变量空间到公共因子空间的转化性质好。子空间的转化性质好。iXmjija122imjija12定义:变量定义
5、:变量 的共同度是因子载荷矩阵的第的共同度是因子载荷矩阵的第i i行的元行的元素的平方和。记为素的平方和。记为iX。mjijiah12217 3 3、公共因子、公共因子 方差贡献的统计意义方差贡献的统计意义jF因子载荷矩阵中各列元素的平方和 称为所有的 对 的方差贡献和。衡量的相对重要性。piijjag122), 1(mjjFiXjF18第三节第三节 因子载荷矩阵的估计方法因子载荷矩阵的估计方法 设随机向量 的均值为 ,协方差为 , 为的特征根, 为对应的标准化特征向量,则pxxx,21x021pp21u,u,ul 主成分分析法主成分分析法UUp2119 上式给出的 表达式是精确的,然而,它实
6、际上是毫无价值的,因为我们的目的是寻求用少数几个公共因子解释,故略去后面的p-m项的贡献,有21111mmmmmmp1122ppu uu uu uuuu up2uuuuuuppp21122111100p212ppuuuuuu20 12 mmm1122AA +Du uu uu uD1121122 mmp mpmm p2uuuuuDAADu 上式有一个假定,模型中的特殊因子是不重要的,因而从 的分解中忽略了特殊因子的方差。22212(,)pdiagD其中221miiiijjsa21 AFX)()()(DAFADXD),(22221pdiagAA22 例例 假定某地固定资产投资率假定某地固定资产投资
7、率 ,通货膨胀率,通货膨胀率 ,失业,失业率率 ,相关系数矩阵为,相关系数矩阵为试用主成分分析法求因子分析模型。试用主成分分析法求因子分析模型。1x2x3x15/25/15/215/15/15/1123 特征根为: 55. 11 85. 02 6 . 03 6 . 0707. 085. 0331. 055. 1629. 06 . 0707. 085. 0331. 055. 1629. 0085. 0883. 055. 1475. 0A707. 0331. 0629. 0707. 0331. 0629. 00883. 0475. 0U548. 0305. 0783. 0548. 0305. 07
8、83. 00814. 0569. 024 可取前两个因子F1和F2为公共因子,第一公因子F1物价就业因子,对X的贡献率为51.67%。第二公因子F2为投资因子,对X的贡献为28.33%。共同度分别为1,0.706,0.706。211814. 0569. 0FFx3212548. 0305. 0783. 0FFFx3213548. 0305. 0783. 0FFFx25第四节第四节 因子旋转(正交变换)因子旋转(正交变换) 因子分析的数学目的不仅仅要找出公共因子以及对变量进行分组,更重要的要知道每个公共因子的含义,以便进行进一步的分析。如果每个公共因子的含义不清,则不便于进行实际背景的解释。由于
9、因子载荷阵是不惟一的,所以应该对因子载荷阵进行旋转。目的是使因子载荷阵的结构简化,使载荷矩阵每列或行的元素平方值平方值向0和1两极分化。主要的正交旋转法有方差最大法方差最大法和和四次方最大法四次方最大法。(一)为什么要旋转因子(一)为什么要旋转因子26 百米跑成绩 跳远成绩 铅球成绩 跳高成绩 400米跑成绩 百米跨栏 铁饼成绩 撑杆跳远成绩 标枪成绩 1500米跑成绩 1X2X3X4X5X6X7X8X9X10X奥运会十项全能运动项目奥运会十项全能运动项目得分数据的因子分析得分数据的因子分析 27 因子载荷矩阵可以看出,除第一因子中所有的变量在公共因子上有较大的正载荷,可以称为一般运动因子。其
10、他的3个因子不太容易解释。似乎是跑和投掷的能力对比,似乎是长跑耐力和短跑速度的对比。于是考虑旋转因子,得下表 28变量F1F2F3F4共同度X1X2X3X4X5X6X7X8X9X100.8840.6310.2450.2390.7970.4040.186-0.036-0.0480.0450.1360.1940.8250.1500.0750.1530.8140.1760.735-0.0410.1560.5150.2230.7500.1020.6350.1470.7620.1100.112-0.113-0.006-0.1480.0760.468-0.17-0.0790.2170.1410.9340.
11、840.700.810.650.870.620.720.660.570.8929 通过旋转,因子有了较为明确的含义。通过旋转,因子有了较为明确的含义。 百米跑,百米跑, 跳远和跳远和 400米跑,需要爆发力的项目在米跑,需要爆发力的项目在 有较大的有较大的载荷,载荷, 可以称为短跑速度因子;可以称为短跑速度因子; 铅球,铅球, 铁饼和铁饼和 标枪在标枪在 上有较大的载荷,可以上有较大的载荷,可以称为爆发性臂力因子;称为爆发性臂力因子; 百米跨栏,百米跨栏, 撑杆跳远,撑杆跳远, 跳远和为跳远和为 跳高在跳高在 上上有较大的载荷,有较大的载荷, 爆发腿力因子;爆发腿力因子; 为长跑耐力因子。为长
12、跑耐力因子。2X5X1F1F3X7X9X2F6X8X2X4X3F3F4F1X30(二)旋转方法(二)旋转方法 1、方差最大法方差最大法2、四次方最大旋转四次方最大旋转31 1 1、方差最大法、方差最大法 方差最大法从简化因子载荷矩阵的方差最大法从简化因子载荷矩阵的每一列每一列出发,使和每个因出发,使和每个因子有关的载荷值平方的方差最大。当只有少数几个变量在某个子有关的载荷值平方的方差最大。当只有少数几个变量在某个因子上有较高的载荷值时,对因子的解释最简单。因子上有较高的载荷值时,对因子的解释最简单。方差最大的直观意义是希望通过因子旋转后,使每个因子上的载荷值尽量拉开距离,一部分的载荷趋于1,另
13、一部分趋于0。2122211211ppaaaaaaAppppFaFaXFaFaXFaFaX2211222212121212111132cossinsincosT设旋转矩阵为:cossinsincosAATB则cossinsincoscossinsincos112112111211ppppaaaaaaaa211211ppbbbb332221212211ppbbbb 21221222212112211111piipiipiipiibpbpbpbpVmax根据求极值的原理,使根据求极值的原理,使 0V,由此可求出因子轴旋转角度,由此可求出因子轴旋转角度34当公共因子个数m2时,可以将上述m=2的方法
14、用于21mm逐次对每两个公共因子进行旋转。每旋转一次,V值就会增大,即V是单调不减的,并且V是有界的,因为因子载荷的绝对值不大于1。因此,经过若干次旋转后,V变化相对就不大了,即可停止旋转。对两因子的旋转,35 2 2、四次方最大旋转、四次方最大旋转 四次方最大旋转是从简化载荷矩阵的行出发,通过四次方最大旋转是从简化载荷矩阵的行出发,通过旋转初始因子,使每个变量只在一个因子上有较高的旋转初始因子,使每个变量只在一个因子上有较高的载荷,而在其它的因子上尽可能低的载荷。载荷,而在其它的因子上尽可能低的载荷。如果每个变量只在一个因子上有非零的载荷,这时的因子解释是最简单的。 四次方最大法通过使因子载
15、荷矩阵中每一行每一行的因子载荷平方的方差达到最大。36max)(21122pimjiijmhbQ简化准则为:pimjiijiijpimjiijmhbmhbmhbQ112422421122)2()(pimjpimjiijpimjiijmhbmhb111124211242max114pimjijbQ最终的简化准则为:pimjpiipiiijmhhmb11141442pimjpiiijhmb11144137旋转后因子的共同度旋转后因子的共同度设 正交矩阵,做正交变换正交矩阵,做正交变换 AB )()(1mlljilppijabBmjmjmlljilijiabh111222)()(Bmjmlmjmlm
16、ltttjljitilljilaaa1111122)(2111222Aimlmjmlilljilhaa旋转后因子的共同度没有发生变化!旋转后因子的共同度没有发生变化!38旋转后公共因子的方差贡献旋转后公共因子的方差贡献设 正交矩阵,做正交变换正交矩阵,做正交变换 AB )()(1mlljilppijabB pipimlljilijjabS111222)()(Bpimlpimlmltttjljitilljilaaa1111122 pimlmlljjljilSa1112222)(A旋转后公共因子的方差贡献发生了变化!旋转后公共因子的方差贡献发生了变化!39第五节第五节 因子得分因子得分 (一)因子
17、得分的概念(一)因子得分的概念 前面我们主要解决了用公共因子的线性组合来表示一组观测变量的有关问题。如果我们要使用这些因子做其他的研究,比如把得到的因子作为自变量来做回归分析,对样本进行分类或评价,这就需要我们对公共因子进行测度,即给出公共因子的值。40 因子分析的数学模型为: pmpmppmmpFFFaaaaaaaaaXXX212121222211121121 因子得分函数: pjpjjXXF11mj, 1可见,要求得每个因子的得分,必须求得分函数的系数,而由于pm,所以不能得到精确的得分,只能通过估计。41 2、回归、回归法法 pmpmppmmpFFFaaaaaaaaaXXX2121212
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新 多元 统计分析 因子分析 PPT 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内