欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    统计学主成分分析和因子分析.pptx

    • 资源ID:88344209       资源大小:298.13KB        全文页数:58页
    • 资源格式: PPTX        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    统计学主成分分析和因子分析.pptx

    会计学1统计学主成分分析和因子分析统计学主成分分析和因子分析第十章第十章主成分分析和因子分析主成分分析和因子分析 第1页/共58页汇报什么?汇报什么?n n假定你是一个公司的财务经理,掌握假定你是一个公司的财务经理,掌握了公司的所有数据,这包括了公司的所有数据,这包括众多的变众多的变量量,如:,如:固定资产、流动资金、借贷固定资产、流动资金、借贷的数额和期限、各种税费、工资支出、的数额和期限、各种税费、工资支出、原料消耗、产值、利润、折旧、职工原料消耗、产值、利润、折旧、职工人数、分工和教育程度等等人数、分工和教育程度等等。n n如果让你向上级或有关方面介绍公司如果让你向上级或有关方面介绍公司状况,你能够把这些指标和数字都状况,你能够把这些指标和数字都原原封不动地摆出去吗封不动地摆出去吗?第2页/共58页需要高度概括需要高度概括n在在如如此此多多的的变变量量之之中中,有有很很多多是是相相关关的的。人人们们希希望望能能够够找找出出它它们们的的少少数数“代代表表”来来对它们进行描述。对它们进行描述。n需需要要把把这这种种有有很很多多变变量量的的数数据进行高度概括。据进行高度概括。第3页/共58页n n本本章章介介绍绍两两种种把把变变量量维维数数降降低低以以便便于于描描述述、理理解解和和分分析析的的方方法法:主主成成分分分分析析(principal principal component component analysisanalysis)和和因因子子分分析析(factor factor analysisanalysis)。)。n n实实际际上上主主成成分分分分析析可可以以说说是是因因子子分分析析的的一一个个特特例例。在在引引进进主主成成分分分分析析之前,先看下面的例子。之前,先看下面的例子。10.1 主成分分析主成分分析第4页/共58页成绩数据(成绩数据(student.txt)n n100个个学学生生的的数数学学、物物理理、化化学学、语语文文、历历史史、英英语语的的成成绩绩如如下下表表(部部分)。分)。第5页/共58页SPSS数据形式数据形式第6页/共58页从本例可能提出的问题从本例可能提出的问题n n目目前前的的问问题题是是,能能否否把把这这个个数数据据的的6 6个个变变量量用用一一两两个个综综合合变变量量来表示呢?来表示呢?n n这这一一两两个个综综合合变变量量包包含含有有多多少少原来的信息呢?原来的信息呢?n n能能否否利利用用找找到到的的综综合合变变量量来来对对学学生生排排序序或或据据此此进进行行其其他他分分析析呢?呢?第7页/共58页空间的点空间的点n n例例中中数数据据点点是是六六维维的的;即即每每个个观观测测值值是是6维维空空间间中中的的一一个个点点。希希望望把把6维空间用低维空间表示。维空间用低维空间表示。n n先先假假定定只只有有二二维维,即即只只有有两两个个变变量量,由横坐标和纵坐标所代表;由横坐标和纵坐标所代表;n n每每个个观观测测值值都都有有相相应应于于这这两两个个坐坐标标轴的两个坐标值;轴的两个坐标值;第8页/共58页空间的点空间的点n n如如果果这这些些数数据据形形成成一一个个椭椭圆圆形形状状的的点点阵阵(这这在在二二维维正正态态的的假假定定下下是是可可能能的的)该该椭椭圆圆有有一一个个长长轴轴和和一一个个短短轴。在短轴方向上数据变化很少;轴。在短轴方向上数据变化很少;n n在在极极端端的的情情况况,短短轴轴如如退退化化成成一一点点,长长轴轴的的方方向向可可以以完完全全解解释释这这些些点点的的变变化化,由由二二维维到到一一维维的的降降维维就就自自然然完成了。完成了。第9页/共58页第10页/共58页椭圆的长短轴椭圆的长短轴n n当当坐坐标标轴轴和和椭椭圆圆的的长长短短轴轴平平行行,那那么么代代表表长长轴轴的的变变量量就就描描述述了了数数据据的的主主要要变变化化,而而代代表表短短轴轴的的变变量就描述了数据的次要变化。量就描述了数据的次要变化。n n但但是是,坐坐标标轴轴通通常常并并不不和和椭椭圆圆的的长长短短轴轴平平行行。因因此此,需需要要寻寻找找椭椭圆圆的的长长短短轴轴,并并进进行行变变换换,使使得得新变量和椭圆的长短轴平行。新变量和椭圆的长短轴平行。第11页/共58页椭圆的长短轴椭圆的长短轴n n如如果果长长轴轴变变量量代代表表了了数数据据包包含含的的大大部部分分信信息息,就就用用该该变变量量代代替替原原先先的的两两个个变变量量(舍舍去去次次要要的的一一维维),降维就完成了。,降维就完成了。n n椭椭圆圆的的长长短短轴轴相相差差得得越越大大,降降维维也越有道理。也越有道理。第12页/共58页第13页/共58页主轴和主成分主轴和主成分n n多多维维变变量量的的情情况况和和二二维维类类似似,也也有有高高维维的的椭椭球球,只只不不过过不不那那么么直直观观罢罢了。了。n n首首先先把把高高维维椭椭球球的的主主轴轴找找出出来来,再再用用代代表表大大多多数数数数据据信信息息的的最最长长的的几几个个轴轴作作为为新新变变量量;这这样样,主主成成分分分分析就基本完成了。析就基本完成了。第14页/共58页主轴和主成分主轴和主成分n n正正如如二二维维椭椭圆圆有有两两个个主主轴轴,三三维维椭椭球球有有三三个个主主轴轴一一样样,有有几几个个变变量量,就有几个主轴。就有几个主轴。n n和和二二维维情情况况类类似似,高高维维椭椭球球的的主主轴轴也是互相垂直的。也是互相垂直的。n n这这些些互互相相正正交交的的新新变变量量是是原原先先变变量量的的 线线 性性 组组 合合,叫叫 做做 主主 成成 分分(principal component)。第15页/共58页主成分之选取主成分之选取n n选选择择越越少少的的主主成成分分,降降维维就就越越好好。什什么是标准呢?么是标准呢?n n那那就就是是这这些些被被选选的的主主成成分分所所代代表表的的主主轴轴的的长长度度之之和和占占了了主主轴轴长长度度总总和和的的大大部分。部分。n n有有些些文文献献建建议议,所所选选的的主主轴轴总总长长度度占占所所有有主主轴轴长长度度之之和和的的大大约约85%即即可可,其其实实,这这只只是是一一个个大大体体的的说说法法;具具体体选几个,要看实际情况而定。选几个,要看实际情况而定。第16页/共58页主成分分析的数学主成分分析的数学n n要要寻寻找找方方差差最最大大的的方方向向。即即,使使向向量量X的线性组合的线性组合aX的方差最大的方向的方差最大的方向a.n n而而Var(aX)=aCov(X)a;由由于于Cov(X)未未知知;于于是是用用X的的样样本本相相关关阵阵R来来近近似似.要要寻寻找找向向量量a使使得得aRa最最大大(注注意意相相关关阵和协方差阵差一个常数)阵和协方差阵差一个常数)n n这涉及相关阵和特征值。这涉及相关阵和特征值。回顾一下吧回顾一下吧!n n选择几个主成分呢选择几个主成分呢?要看要看“贡献率贡献率.”第17页/共58页对于我们的数据,对于我们的数据,SPSSSPSS输出为输出为这这里里的的Initial Eigenvalues就就是是这这里里的的六六个个主主轴轴长长度度,又又称称特特征征值值(数数据据相相关关阵阵的的特特征征值值)。头头两两个个成成分分特特征征值值累累积积占占了了总总方方差差的的81.142%。后后面面的的特特征征值值的的贡贡献献越越来越少。来越少。第18页/共58页特征值的贡献还可以从特征值的贡献还可以从SPSS的所谓碎石图看出的所谓碎石图看出第19页/共58页怎么解释这两个主成分。主成分是原始六怎么解释这两个主成分。主成分是原始六个变量的线性组合。这由下表给出。个变量的线性组合。这由下表给出。这这里里每每一一列列代代表表一一个个主主成成分分作作为为原原来来变变量量线线性性组组合合的的系系数数(比比例例)。比比如如第第一一主主成成分分为为数数学学、物物理理、化化学学、语语文文、历历史史、英英语语这这六六个个变变量量的的线线性性组组合合,系系数数(比比例例)为为-0.806,-0.674,-0.675,0.893,0.825,0.836。第20页/共58页如如用用x x1 1,x x2 2,x x3 3,x x4 4,x x5 5,x x6 6分分别别表表示示原原先先的的六六个个变变量量,而而用用y y1 1,y y2 2,y y3 3,y y4 4,y y5 5,y y6 6表表示示新新的的主主成成分分,那那么么,第第一一和和第第二二主主成成分为分为这这些些系系数数称称为为主主成成分分载载荷荷(loading),它它表表示示主主成成分分和和相相应应的的原原先先变变量量的的相相关系数。关系数。第21页/共58页比比如如y1表表示示式式中中x1的的系系数数为为-0.806,这这就就是是说说第第一一主主成成分分和和数数学学变变量量的的相相关系数为关系数为-0.806。相相关关系系数数(绝绝对对值值)越越大大,主主成成分分对对该该变变量量的的代代表表性性也也越越大大。可可以以看看得得出出,第第一一主主成成分分对对各各个个变变量量解解释释得得都都很很充充分分。而而最最后后的的几几个个主主成成分分和和原原先先的的变变量就不那么相关了。量就不那么相关了。第22页/共58页可以把第一和第二主成可以把第一和第二主成分的载荷点出一个二维图分的载荷点出一个二维图以直观地显示它们如何解以直观地显示它们如何解释原来的变量的。这个图释原来的变量的。这个图叫做载荷图。叫做载荷图。第23页/共58页该图该图左面三个点是数学、物理、化学三科左面三个点是数学、物理、化学三科,右边三个点是语文、历史、外语三科。右边三个点是语文、历史、外语三科。图中图中的六个点由于比较挤,不易分清,但只要认的六个点由于比较挤,不易分清,但只要认识到这些点的坐标是前面的第一二主成分载识到这些点的坐标是前面的第一二主成分载荷,坐标是前面表中第一二列中的数目,还荷,坐标是前面表中第一二列中的数目,还是可以识别的。是可以识别的。第24页/共58页10.2 因子分析因子分析n n主主主主成成成成分分分分分分分分析析析析从从从从原原原原理理理理上上上上是是是是寻寻寻寻找找找找椭椭椭椭球球球球的的的的所所所所有有有有主主主主轴。原先有几个变量,就有几个主成分。轴。原先有几个变量,就有几个主成分。轴。原先有几个变量,就有几个主成分。轴。原先有几个变量,就有几个主成分。n n而而而而因因因因子子子子分分分分析析析析是是是是事事事事先先先先确确确确定定定定要要要要找找找找几几几几个个个个成成成成分分分分,这这这这里里里里叫叫叫叫因因因因子子子子(factorfactor)(比比比比如如如如两两两两个个个个),那那那那就就就就找找找找两个。两个。两个。两个。n n这这这这使使使使得得得得在在在在数数数数学学学学模模模模型型型型上上上上,因因因因子子子子分分分分析析析析和和和和主主主主成成成成分分分分分分分分析析析析有有有有不不不不少少少少区区区区别别别别。而而而而且且且且因因因因子子子子分分分分析析析析的的的的计计计计算算算算也也也也复复复复杂杂杂杂得得得得多多多多。根根根根据据据据因因因因子子子子分分分分析析析析模模模模型型型型的的的的特特特特点点点点,它它它它还还还还 多多多多 一一一一 道道道道 工工工工 序序序序:因因因因 子子子子 旋旋旋旋 转转转转(factor factor rotationrotation);这个步骤可以使结果更好。);这个步骤可以使结果更好。);这个步骤可以使结果更好。);这个步骤可以使结果更好。第25页/共58页10.2 因子分析因子分析n n对于计算机,因子分析并不费事。对于计算机,因子分析并不费事。n n从从输输出出的的结结果果来来看看,因因子子分分析析也也有有因因子子载载荷荷(factor loading)的的概概念念,代代表表了了因因子子和和原原先先变变量量的的相相关关系系数数。但但是是在在因因子子分分析析公公式式中中的的因因子子载载荷荷位置和主成分分析不同。位置和主成分分析不同。n n因因子子分分析析也也给给出出了了二二维维图图;其其解解释释和主成分分析的载荷图类似。和主成分分析的载荷图类似。第26页/共58页主成分分析与因子分析的公式上的区别主成分分析与因子分析的公式上的区别主成分分析主成分分析因子分析因子分析(mp)因子得分因子得分第27页/共58页因子分析的数学因子分析的数学n因子分析需要许多假定才能够解.n具体公式.第28页/共58页对于我们的数据,对于我们的数据,SPSSSPSS因子分析输出为因子分析输出为第29页/共58页这个表说明六个变量和因子的关系。这个表说明六个变量和因子的关系。为简单记,我们用为简单记,我们用x1,x2,x3,x4,x5,x6来表示来表示math(数学),(数学),phys(物理),(物理),chem(化学),(化学),literat(语文),(语文),history(历史),(历史),english(英语)等变量。这样因子(英语)等变量。这样因子f1和和f2与这些原变量之间的关系是与这些原变量之间的关系是(注意,和主成分分析不同,这里(注意,和主成分分析不同,这里把成分(因子)写在方程的右边,把成分(因子)写在方程的右边,把原变量写在左边;但相应的系数把原变量写在左边;但相应的系数还是主成分和各个变量的线性相关还是主成分和各个变量的线性相关系数,也称为因子载荷):系数,也称为因子载荷):第30页/共58页第31页/共58页这里,这里,第一个因子主要和语文、历第一个因子主要和语文、历史、英语三科有很强的正相关;史、英语三科有很强的正相关;而而第二个因子主要和数学、物理、化第二个因子主要和数学、物理、化学三科有很强的正相关学三科有很强的正相关。因此可以给第一个因子起名为因此可以给第一个因子起名为“文文科因子科因子”,而给第二个因子起名为,而给第二个因子起名为“理科因子理科因子”。从这个例子可以看出,因子分析的从这个例子可以看出,因子分析的结果比主成分分析解释性更强。结果比主成分分析解释性更强。第32页/共58页这这些些系系数数所所形形成成的的散散点点图图(在在SPSS中中也也称载荷图)为称载荷图)为可以直观看出每个因子代表了一类学科可以直观看出每个因子代表了一类学科 第33页/共58页计算因子得分计算因子得分n n可以根据输出可以根据输出算出每个学生的第一个因子和第二个因子的大小,算出每个学生的第一个因子和第二个因子的大小,即算出即算出每个学生每个学生的因子得分的因子得分f1和和f2。第34页/共58页该输出说明第一和第二主因子为(习该输出说明第一和第二主因子为(习惯上用字母惯上用字母f来表示因子)可以按照如来表示因子)可以按照如下公式计算,该函数称为因子得分下公式计算,该函数称为因子得分(factor score)。)。人们可以根据这两套因子得分对学生分人们可以根据这两套因子得分对学生分别按照文科和理科排序。当然得到因子别按照文科和理科排序。当然得到因子得分只是得分只是SPSS软件的一个选项。软件的一个选项。第35页/共58页10.310.3因子分析和主成分分析的一些注意事项因子分析和主成分分析的一些注意事项因子分析和主成分分析的一些注意事项因子分析和主成分分析的一些注意事项 n n可可以以看看出出,因因子子分分析析和和主主成成分分分分析析都都依依赖赖于于原原始始变变量量,也也只只能能反反映映原原始始变变量量的的信信息息。所所以以原原始始变变量量的的选选择很重要。择很重要。n n另另外外,如如果果原原始始变变量量都都本本质质上上独独立立,那那么么降降维维就就可可能能失失败败,这这是是因因为为很很难难把把很很多多独独立立变变量量用用少少数数综综合合的的变变量量概概括括。数数据据越越相相关关,降降维维效效果果就就越好。越好。第36页/共58页10.310.3因子分析和主成分分析的一些注意事项因子分析和主成分分析的一些注意事项因子分析和主成分分析的一些注意事项因子分析和主成分分析的一些注意事项 n n在在得得到到分分析析的的结结果果时时,并并不不一一定定会会都都得得到到如如我我们们例例子子那那样样清清楚楚的的结结果果。这这与与问问题题的的性性质质,选选取取的的原原始始变变量量以及数据的质量等都有关系以及数据的质量等都有关系n n在在用用因因子子得得分分进进行行排排序序时时要要特特别别小小心心,特特别别是是对对于于敏敏感感问问题题。由由于于原原始始变变量量不不同同,因因子子的的选选取取不不同同,排排序可以很不一样。序可以很不一样。第37页/共58页SPSSSPSS实现实现(因子分析与主成分分析因子分析与主成分分析因子分析与主成分分析因子分析与主成分分析)n n拿拿拿拿student.savstudent.sav为例,选为例,选为例,选为例,选AnalyzeAnalyzeData ReductionData ReductionFactorFactor进入主进入主进入主进入主对话框;对话框;对话框;对话框;n n把把把把mathmath、physphys、chemchem、literatliterat、historyhistory、englishenglish选入选入选入选入VariablesVariables,然后点击,然后点击,然后点击,然后点击ExtractionExtraction,n n在在在在MethodMethod选择一个方法(如果是主成分分析,则选选择一个方法(如果是主成分分析,则选选择一个方法(如果是主成分分析,则选选择一个方法(如果是主成分分析,则选Principal Principal ComponentsComponents),),),),n n下面的选项可以随意,比如要画碎石图就选下面的选项可以随意,比如要画碎石图就选下面的选项可以随意,比如要画碎石图就选下面的选项可以随意,比如要画碎石图就选Scree plotScree plot,另外在,另外在,另外在,另外在ExtractExtract选项可以按照特征值的大小选主成分(或因子),也可选项可以按照特征值的大小选主成分(或因子),也可选项可以按照特征值的大小选主成分(或因子),也可选项可以按照特征值的大小选主成分(或因子),也可以选定因子的数目;以选定因子的数目;以选定因子的数目;以选定因子的数目;n n之后回到主对话框(用之后回到主对话框(用之后回到主对话框(用之后回到主对话框(用ContinueContinue)。然后点击)。然后点击)。然后点击)。然后点击RotationRotation,再在该,再在该,再在该,再在该对话框中的对话框中的对话框中的对话框中的MethodMethod选择一个旋转方法(如果是主成分分析就选选择一个旋转方法(如果是主成分分析就选选择一个旋转方法(如果是主成分分析就选选择一个旋转方法(如果是主成分分析就选NoneNone),),),),n n在在在在DisplayDisplay选选选选Rotated solutionRotated solution(以输出和旋转有关的结果)和(以输出和旋转有关的结果)和(以输出和旋转有关的结果)和(以输出和旋转有关的结果)和Loading plotLoading plot(以输出载荷图);之后回到主对话框(用(以输出载荷图);之后回到主对话框(用(以输出载荷图);之后回到主对话框(用(以输出载荷图);之后回到主对话框(用ContinueContinue)。)。)。)。n n如果要计算因子得分就要点击如果要计算因子得分就要点击如果要计算因子得分就要点击如果要计算因子得分就要点击ScoresScores,再选择,再选择,再选择,再选择Save as variablesSave as variables(因子得分就会作为变量存在数据中的附加列上)和计算因子(因子得分就会作为变量存在数据中的附加列上)和计算因子(因子得分就会作为变量存在数据中的附加列上)和计算因子(因子得分就会作为变量存在数据中的附加列上)和计算因子得分的方法(比如得分的方法(比如得分的方法(比如得分的方法(比如RegressionRegression);要想输出);要想输出);要想输出);要想输出Component Score Component Score Coefficient MatrixCoefficient Matrix表,就要选择表,就要选择表,就要选择表,就要选择Display factor scoreDisplay factor score coefficient coefficient matrixmatrix;之后回到主对话框(用之后回到主对话框(用之后回到主对话框(用之后回到主对话框(用ContinueContinue)。这时点)。这时点)。这时点)。这时点OKOK即可。即可。即可。即可。第38页/共58页附录附录 第39页/共58页的的pp矩阵矩阵.而对于观测值而对于观测值X=(x1,xp),其其中中xi=(x1i,xni),i=1,p,的样本相关阵第的样本相关阵第(ij)-元素为元素为X=(X1,Xp)的的相关阵为第相关阵为第(ij)-元素为元素为的的pp矩阵矩阵,其中其中sij为第为第i和第和第j观测的样本相观测的样本相关系数关系数第40页/共58页关于特征值和特征向量关于特征值和特征向量特征方程特征方程|R-l lI|=0的解为特征值的解为特征值l l,这这里里B为一个为一个p维正定方阵维正定方阵.l l通常有通常有p个根个根l l1 l l2 l lp.满足满足(R-l liI)xi=0的向量的向量xi为为l li的特征向量的特征向量.对任意向对任意向量量a有性质有性质第41页/共58页头头m个主成分的累积贡献率个主成分的累积贡献率:这里这里R为为X的样本相关阵的样本相关阵,第第i个特征值个特征值l li=aiRai=V(aix);ai为第为第i个特征个特征向量向量.Cov(aix,ajx)=0.第42页/共58页这里这里a aijij为第为第i i个特征向量的第个特征向量的第j j个分量个分量;第第i i个主成分的载荷平方和为该主成分的个主成分的载荷平方和为该主成分的方差方差,等于其特征值等于其特征值l li i.所选的所选的m m个主成分个主成分对变量对变量x xj j的的总方差贡献总方差贡献为为主成分负荷主成分负荷(载荷载荷,loading):Yi与与Xj的的相关系数相关系数:第43页/共58页第44页/共58页正交因子模型:正交因子模型:X-m m=AF+e em mi=变量变量i的均值的均值e ei=第第i个特殊因子个特殊因子Fi=第第i个公共因子个公共因子aij=第第i个变量在个变量在第第j个因子上的载荷个因子上的载荷不能观测的值满足下列条件:不能观测的值满足下列条件:F和和e e独立独立E(F)=0,Cov(F)=IE(e e)=0,Cov(e e)=Y Y,Y Y是对角矩阵是对角矩阵第45页/共58页F为公共因子向量为公共因子向量,每个公共因子每个公共因子(如如Fi)是对模型中每个变量都起是对模型中每个变量都起作用的因子作用的因子;而而e e为特殊因子向量为特殊因子向量,每个特殊因子每个特殊因子(如如e ei)只对一个变量只对一个变量(第第i个个)起作用起作用.第46页/共58页因子分析的方法在于估计因子分析的方法在于估计S S=AA+Y Y和和Y Y,再分解以得到再分解以得到A.X的协方差阵的协方差阵S S可以可以分解成分解成这里这里l l1 l l2 l lp为为S S的特征值的特征值;而而e1,ep为相应的特征向量为相应的特征向量(e1,ep为主为主成分的系数成分的系数,因此称为主成分法因此称为主成分法).上面分上面分解总是取和数的重要的头几项来近似解总是取和数的重要的头几项来近似.第47页/共58页X的协方差阵的协方差阵S S可以近似为可以近似为(如如Y Y忽略忽略)如如Y Y不忽略不忽略,S S可以近似为可以近似为应用中应用中,S,S可以用样本相关阵可以用样本相关阵R代替代替.第48页/共58页正交模型正交模型X=m m+AF+e e的协的协方差结构方差结构根据前面模型,可得出下根据前面模型,可得出下面结果:面结果:上面上面s sii2=S Sjaij2+y yi2中中,S Sjaij2称为称为共性方共性方差差(公共方差公共方差或或变量共同度变量共同度common variance,communalities),而,而y yi2称为称为特特殊方差殊方差.变量共同度刻画全部公共因子对变量共同度刻画全部公共因子对变量变量Xi的总方差所做的贡献的总方差所做的贡献.第49页/共58页的统计意义就是第的统计意义就是第i个变量与第个变量与第j个公共个公共因子的相关系数因子的相关系数,表示表示Xi依赖依赖Fj的份量的份量,这里这里eij是相应于特征值是相应于特征值l li的特征向量的特征向量ei的第的第j个分量个分量.因子载荷阵中各列元素的平方和因子载荷阵中各列元素的平方和Sj=S Siaij2称为公共因子称为公共因子Fj对对X诸变量的方差诸变量的方差贡献之总和贡献之总和因子载荷因子载荷第50页/共58页除主成分法外还有最大似然法来估计除主成分法外还有最大似然法来估计A,m m和和Y Y(在多元正态分布的假定下在多元正态分布的假定下).).当然当然,还有其他方法还有其他方法(有些互相类似有些互相类似).).第51页/共58页令令T为任意为任意m正交方阵正交方阵(TT=TT=I),则则X-m m=AF+e=e=ATTF+e=Ae=A*F*+e,e,这这里里A A*=AT,F*=TF.因此因此S S=AA+Y Y=ATTA+Y Y=(A*)(A*)+Y Y因此因此,因子载荷因子载荷A只由一个正交阵只由一个正交阵T决决定定.载荷载荷A A*=AT与与A都给出同一个表都给出同一个表示示.由由AA=(A*)(A*)对角元给出的共对角元给出的共性方差性方差,也不因也不因T的选择而改变的选择而改变.第52页/共58页正交变换正交变换T相当于相当于刚体刚体旋转旋转(或反射或反射),因子载荷因子载荷A的正的正交变换交变换AT称为称为因子旋转因子旋转估计的协方差阵或相关阵估计的协方差阵或相关阵,残差阵残差阵,特殊方差及共性方特殊方差及共性方差都不随旋转而变差都不随旋转而变.这里这里“残差阵残差阵”为协方差为协方差阵或相关阵与估计的阵或相关阵与估计的AA+Y Y之差之差.第53页/共58页因子旋转的因子旋转的一个一个准则为最准则为最大方差准则大方差准则.它使旋转后的它使旋转后的因子载荷的总方差达到最因子载荷的总方差达到最大大.如如即要选变换即要选变换T使下式最大使下式最大(计算机循环算法计算机循环算法)第54页/共58页需要由需要由X=AF变成变成F=b bX.或或Fj=b bj1X1+b bjpXp j=1,m,称为称为因子得分因子得分(函数函数).这通常用加权最小二乘法这通常用加权最小二乘法或回归法等来求得或回归法等来求得.第55页/共58页总结总结模型模型X=m m+AF+e e因子分析因子分析的步骤的步骤1根据问题选取原根据问题选取原始变量;始变量;2求其相关阵求其相关阵R,探讨其相探讨其相关性;关性;3从从R求解初始公共因子求解初始公共因子F及因子载荷矩阵及因子载荷矩阵A(主成分主成分法或最大似然法法或最大似然法)4因子因子旋转;旋转;5由由X=AF到到F=bX(因子因子得分函数得分函数)6根据因子得分值进行进根据因子得分值进行进一步分析一步分析.第56页/共58页回到数值例子回到数值例子n n回到我们成绩例子.第57页/共58页

    注意事项

    本文(统计学主成分分析和因子分析.pptx)为本站会员(莉***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开