多元统计分析因子分析讲稿.ppt





《多元统计分析因子分析讲稿.ppt》由会员分享,可在线阅读,更多相关《多元统计分析因子分析讲稿.ppt(62页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多元统计分析因子分析第一页,讲稿共六十二页哦2第一节 因子分析的基本思想第二页,讲稿共六十二页哦3因子分析的基本思想因子分析的基本思想n因子分析是根据相关矩阵内部的依赖关系,把一些具有错综复杂关系的变量综合为数量较少的几个因子。通过不同因子来分析决定某些变量的本质及其分类的一种统计方法。n简单地说,就是根据相关性大小把变量分组,使得同组内的变量之间相关性较高,不同组的变量相关性较低。每组变量代表一个基本结构,这个基本结构称为因子。第三页,讲稿共六十二页哦4例如n某机关对其职员就以下6个方面进行考核,这6个方面是职员的词汇、阅读、写作能力,以及数字、代数、微积分的运算能力。而这6个方面可归结为职
2、员的语文能力和数学能力两个方面。第四页,讲稿共六十二页哦5例如n某公司与48名申请工作的人进行面谈,然后就申请人十五个方面进行打分,这十五个方面分别是:申请书的形式、外貌、学术能力、讨人申请书的形式、外貌、学术能力、讨人喜欢的能力、自信心、洞察力、诚实、推销能喜欢的能力、自信心、洞察力、诚实、推销能力、经验、工作积极性、抱负、理解能力、潜力、经验、工作积极性、抱负、理解能力、潜力、入围公司的强烈程度、适应性力、入围公司的强烈程度、适应性。这15个方面可归结为应聘者的外露能力、讨人喜欢的能外露能力、讨人喜欢的能力、经验、专业能力力、经验、专业能力这4个方面。第五页,讲稿共六十二页哦6因子分析(f
3、actor analysis)是一种数据简化的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量来表示其基本的数据结构。这几个假想变量能够反映原来众多变量的主要信息。原始的变量是可观测的显在变量,而假想变量是不可观测的潜在变量,称为因子。例如,在企业形象或品牌形象的研究中,消费者可以通过一个有24个指标构成的评价体系,评价百货商场的24个方面的优劣。第六页,讲稿共六十二页哦7但消费者主要关心的是三个方面,即商店的环境环境、商店的服务服务和商品的价格商品的价格。因子分析方法可以通过24个变量,找出反映商店环境、商店服务水平和商品价格的三个潜在的因子,对商店
4、进行综合评价。而这三个公共因子可以表示为:iiiiiFFFX33221124,1i 称 是不可观测的潜在因子潜在因子。24个变量共享这三个因子,但是每个变量又有自己的个性,不被包含的部分 ,称为特殊因子特殊因子。321FFF、i第七页,讲稿共六十二页哦8注意:注意:n因子分析与回归分析不同,因子分析中的因子是一个比较抽象的概念,而回归因子有非常明确的实际意义。n主成分分析分析与因子分析也有不同,主成分分析仅仅是变量变换,而因子分析需要构造因子模型。n主成分分析:原始变量的线性组合表示新的综合变量,即主成分。n因子分析:潜在的假想变量和随机影响变量的线性组合表示原始变量。第八页,讲稿共六十二页哦
5、9第二节第二节 因子分析模型因子分析模型 一、数学模型一、数学模型)(2211pmFaFaFaXimimiii 设 个变量,如果表示为iX),2,1(pippmpmppmmpFFFaaaaaaaaaXXX212121222211121121 AFX第九页,讲稿共六十二页哦10 称为 公共因子,是不可观测的变量,他们的系数称为因子载荷。是特殊因子,是不能被前m个公共因子包含的部分。并且满足:mFFF,21icov(,)0,F,F即不相关;1 11212 122212()()()()()()cov()()()()()ppppppE FE FE FE FE FE FEE FE FE FF,F0第十页
6、,讲稿共六十二页哦11IFD111)(mFFF,21即 互不相关,方差为1。第十一页,讲稿共六十二页哦1222221)(pD即互不相关,方差不一定相等,。),0(2iiN第十二页,讲稿共六十二页哦13用矩阵的表达方式 AFXIFDFE)(,0)(1)(),()(,0)()2(22221pdiagDE0),cov()3(F第十三页,讲稿共六十二页哦14 1 1、因子载荷、因子载荷 aij 的统计意义的统计意义 因子载荷因子载荷 是第是第i i个变量与第个变量与第j j个公共因子的相关系数个公共因子的相关系数 ija模型为模型为 imimiiFaFaX11),cov(),cov(1jikmkikj
7、iFFaFXijFxaji (载荷矩阵中第(载荷矩阵中第i i行,第行,第j j列的元素)反映了第列的元素)反映了第i i个变个变量与第量与第j j个公共因子的相关性。绝对值越大,相关的密切个公共因子的相关性。绝对值越大,相关的密切程度越高。程度越高。),cov(),cov(1jijkmkikFFFaija 根据公共因子的模型性质,有根据公共因子的模型性质,有 三、三、因子载荷矩阵中的几个统计特征因子载荷矩阵中的几个统计特征第十四页,讲稿共六十二页哦15n 因子载荷不是惟一的 AFX*cov()()EF,F 0且满足因子模型的条件*FA)(FTATFTF*设T为一个pp 的正交矩阵,令A*=A
8、T,则模型可以表示为0)()()(*FETFTEFEITFDTFTDFD)()()(*),()(,0)(22221pdiagDE第十五页,讲稿共六十二页哦162 2、变量共同度的统计意义、变量共同度的统计意义统计意义统计意义:imimiiFaFaX11两边求方差两边求方差)()()()(2121imimiiVarFVaraFVaraXVarmjiija1221 所有的公共因子和特殊因子对变量所有的公共因子和特殊因子对变量 的贡献为的贡献为1 1。如果。如果 非常非常靠近靠近1 1,非常小,则因子分析的效果好,从原变量空间到公共因非常小,则因子分析的效果好,从原变量空间到公共因子空间的转化性质好
9、。子空间的转化性质好。iXmjija122imjija12定义:变量定义:变量 的共同度是因子载荷矩阵的第的共同度是因子载荷矩阵的第i i行的元行的元素的平方和。记为素的平方和。记为iX。mjijiah122第十六页,讲稿共六十二页哦17 3 3、公共因子、公共因子 方差贡献的统计意义方差贡献的统计意义jF因子载荷矩阵中各列元素的平方和 称为所有的 对 的方差贡献和。衡量的相对重要性。piijjag122),1(mjjFiXjF第十七页,讲稿共六十二页哦18第三节第三节 因子载荷矩阵的估计方法因子载荷矩阵的估计方法 设随机向量 的均值为,协方差为,为的特征根,为对应的标准化特征向量,则pxxx
10、,21x021pp21u,u,un 主成分分析法主成分分析法UUp21第十八页,讲稿共六十二页哦19 上式给出的 表达式是精确的,然而,它实际上是毫无价值的,因为我们的目的是寻求用少数几个公共因子解释,故略去后面的p-m项的贡献,有21111mmmmmmp1122ppu uu uu uuuu up2uuuuuuppp21122111100p 212ppuuuuuu第十九页,讲稿共六十二页哦20 12 mmm1122AA+Du uu uu uD1121122 mmp mpmm p2uuuuuDAADu 上式有一个假定,模型中的特殊因子是不重要的,因而从 的分解中忽略了特殊因子的方差。22212(
11、,)pdiagD其中221miiiijjsa第二十页,讲稿共六十二页哦21 AFX)()()(DAFADXD),(22221pdiagAA第二十一页,讲稿共六十二页哦22 例例 假定某地固定资产投资率假定某地固定资产投资率 ,通货膨胀率,通货膨胀率 ,失业率,失业率 ,相,相关系数矩阵为关系数矩阵为试用主成分分析法求因子分析模型。试用主成分分析法求因子分析模型。1x2x3x15/25/15/215/15/15/11第二十二页,讲稿共六十二页哦23 特征根为:55.11 85.02 6.03 6.0707.085.0331.055.1629.06.0707.085.0331.055.1629.0
12、085.0883.055.1475.0A707.0331.0629.0707.0331.0629.00883.0475.0U548.0305.0783.0548.0305.0783.00814.0569.0第二十三页,讲稿共六十二页哦24 可取前两个因子F1和F2为公共因子,第一公因子F1物价就业因子,对X的贡献率为51.67%。第二公因子F2为投资因子,对X的贡献为28.33%。共同度分别为1,0.706,0.706。211814.0569.0FFx3212548.0305.0783.0FFFx3213548.0305.0783.0FFFx第二十四页,讲稿共六十二页哦25第四节第四节 因子旋
13、转(正交变换)因子旋转(正交变换)因子分析的数学目的不仅仅要找出公共因子以及对变量进行分组,更重要的要知道每个公共因子的含义,以便进行进一步的分析。如果每个公共因子的含义不清,则不便于进行实际背景的解释。由于因子载荷阵是不惟一的,所以应该对因子载荷阵进行旋转。目的是使因子载荷阵的结构简化,使载荷矩阵每列或行的元素平方值平方值向0和1两极分化。主要的正交旋转法有方差方差最大法最大法和和四次方最大法四次方最大法。(一)为什么要旋转因子(一)为什么要旋转因子第二十五页,讲稿共六十二页哦26 百米跑成绩 跳远成绩 铅球成绩 跳高成绩 400米跑成绩 百米跨栏 铁饼成绩 撑杆跳远成绩 标枪成绩 1500
14、米跑成绩 1X2X3X4X5X6X7X8X9X10X奥运会十项全能运动项目奥运会十项全能运动项目得分数据的因子分析得分数据的因子分析 第二十六页,讲稿共六十二页哦27变量共同度0.6910.217-0.58-0.2060.840.7890.184-0.1930.0920.70.7020.5350.047-0.1750.80.6740.1340.1390.3960.650.620.551-0.084-0.4190.870.6870.042-0.1610.3450.620.621-0.5210.109-0.2340.720.5380.0870.4110.440.660.434-0.4390.372
15、-0.2350.570.1470.5960.658-0.2790.891F2F3F4F1X2X3X4X5X6X7X8X9X10X 因子载荷矩阵可以看出,除第一因子中所有的变量在公共因子上有较大的正载荷,可以称为一般运动因子。其他的3个因子不太容易解释。似乎是跑和投掷的能力对比,似乎是长跑耐力和短跑速度的对比。于是考虑旋转因子,得下表 第二十七页,讲稿共六十二页哦28变量F1F2F3F4共同度X1X2X3X4X5X6X7X8X9X100.8840.6310.2450.2390.7970.4040.186-0.036-0.0480.0450.1360.1940.8250.1500.0750.153
16、0.8140.1760.735-0.0410.1560.5150.2230.7500.1020.6350.1470.7620.1100.112-0.113-0.006-0.1480.0760.468-0.17-0.0790.2170.1410.9340.840.700.810.650.870.620.720.660.570.89第二十八页,讲稿共六十二页哦29 通过旋转,因子有了较为明确的含义。通过旋转,因子有了较为明确的含义。百米跑,百米跑,跳远和跳远和 400米跑,需要爆发力的项目在米跑,需要爆发力的项目在 有较大的有较大的载荷,载荷,可以称为短跑速度因子;可以称为短跑速度因子;铅球,铅球
17、,铁饼和铁饼和 标枪在标枪在 上有较大的载荷,可以上有较大的载荷,可以称为爆发性臂力因子;称为爆发性臂力因子;百米跨栏,百米跨栏,撑杆跳远,撑杆跳远,跳远和为跳远和为 跳高在跳高在 上上有较大的载荷,有较大的载荷,爆发腿力因子;爆发腿力因子;为长跑耐力因子。为长跑耐力因子。2X5X1F1F3X7X9X2F6X8X2X4X3F3F4F1X第二十九页,讲稿共六十二页哦30(二)旋转方法(二)旋转方法 1、方差最大法方差最大法2、四次方最大旋转四次方最大旋转第三十页,讲稿共六十二页哦31 1 1、方差最大法、方差最大法 方差最大法从简化因子载荷矩阵的方差最大法从简化因子载荷矩阵的每一列每一列出发,使
18、和每个因子有关出发,使和每个因子有关的载荷值平方的方差最大。当只有少数几个变量在某个因子上有较的载荷值平方的方差最大。当只有少数几个变量在某个因子上有较高的载荷值时,对因子的解释最简单。高的载荷值时,对因子的解释最简单。方差最大的直观意义是希望通过因子旋转后,使每个因子上的载荷值尽量拉开距离,一部分的载荷趋于1,另一部分趋于0。2122211211ppaaaaaaAppppFaFaXFaFaXFaFaX22112222121212121111第三十一页,讲稿共六十二页哦32cossinsincosT设旋转矩阵为:cossinsincosAATB则cossinsincoscossinsincos
19、112112111211ppppaaaaaaaa211211ppbbbb第三十二页,讲稿共六十二页哦332221212211ppbbbb 21221222212112211111piipiipiipiibpbpbpbpVmax根据求极值的原理,使根据求极值的原理,使 0V,由此可求出因子轴旋转角度,由此可求出因子轴旋转角度第三十三页,讲稿共六十二页哦34当公共因子个数m2时,可以将上述m=2的方法用于21mm逐次对每两个公共因子进行旋转。每旋转一次,V值就会增大,即V是单调不减的,并且V是有界的,因为因子载荷的绝对值不大于1。因此,经过若干次旋转后,V变化相对就不大了,即可停止旋转。对两因子的
20、旋转,第三十四页,讲稿共六十二页哦35 2 2、四次方最大旋转、四次方最大旋转 四次方最大旋转是从简化载荷矩阵的行出发,通过旋四次方最大旋转是从简化载荷矩阵的行出发,通过旋转初始因子,使每个变量只在一个因子上有较高的载荷转初始因子,使每个变量只在一个因子上有较高的载荷,而在其它的因子上尽可能低的载荷。,而在其它的因子上尽可能低的载荷。如果每个变量只在一个因子上有非零的载荷,这时的因子解释是最简单的。四次方最大法通过使因子载荷矩阵中每一行每一行的因子载荷平方的方差达到最大。第三十五页,讲稿共六十二页哦36max)(21122pimjiijmhbQ简化准则为:pimjiijiijpimjiijmh
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计分析 因子分析 讲稿

限制150内