因子分析与主成分分析讲稿.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《因子分析与主成分分析讲稿.ppt》由会员分享,可在线阅读,更多相关《因子分析与主成分分析讲稿.ppt(26页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、因子分析与主成分分析第一页,讲稿共二十六页哦主成分分析主成分分析每个人都会遇到有每个人都会遇到有很多变量很多变量的数据。的数据。比比如如全全国国或或各各个个地地区区的的带带有有许许多多经经济济和和社社会会变变量量的的数数据;各个学校的研究、教学等各种变量的数据等等。据;各个学校的研究、教学等各种变量的数据等等。这这些些数数据据的的共共同同特特点点是是变变量量很很多多,在在如如此此多多的的变变量量之之中中,有有很很多多是是相相关关的的。人人们们希希望望能能够够找找出出它它们们的的少少数数“代代表表”来对它们进行描述。来对它们进行描述。第二页,讲稿共二十六页哦在多数实际问题中,不同指标之间是有一定
2、相关性。由于指标较多及指标间有一定的相关性,势必增加分析问题的复杂性。因子分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原来指标。同时根据实际需要从中可取几个较少的综合指标尽可能多地反映原来的指标的信息。第三页,讲稿共二十六页哦因子分析是考察多个数值变量间相关性的一种多元统计方法,它是研究如何通过少数几个主成分来解释多变量的方差协方差结构。导出几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间不相关。第四页,讲稿共二十六页哦本章就介绍两种把变量维数降低以便于描述、理解和本章就介绍两种把变量维数降低以便于描述、理解和分析的方法:分析的方法:主成分分析主成分分析(pri
3、ncipal component principal component analysisanalysis)和)和因子分析因子分析(factor analysisfactor analysis)。实际上)。实际上主主成分分析可以说是因子分析的一个特例成分分析可以说是因子分析的一个特例。在引进主成分。在引进主成分分析之前,先看下面的例子。分析之前,先看下面的例子。第五页,讲稿共二十六页哦成绩数据(成绩数据(student.sav)100个个学学生生的的数数学学、物物理理、化化学学、语语文文、历历史史、英语的成绩如下表(部分)。英语的成绩如下表(部分)。第六页,讲稿共二十六页哦 从本例可能提出的问
4、题从本例可能提出的问题目目前前的的问问题题是是,能能不不能能把把这这个个数数据据的的6 6个个变变量量用用一两个综合变量来表示呢?一两个综合变量来表示呢?这一两个综合变量包含有多少原来的信息呢?这一两个综合变量包含有多少原来的信息呢?能能不不能能利利用用找找到到的的综综合合变变量量来来对对学学生生排排序序呢呢?这这一一类类数数据据所所涉涉及及的的问问题题可可以以推推广广到到对对企企业业,对对学学校校进进行分析、排序、判别和分类等问题。行分析、排序、判别和分类等问题。第七页,讲稿共二十六页哦主成分分析主成分分析例例中中的的的的数数据据点点是是六六维维的的;也也就就是是说说,每每个个观观测测值值是
5、是6维维空间中的一个点。我们希望把空间中的一个点。我们希望把6维空间用低维空间表示。维空间用低维空间表示。先先假假定定只只有有二二维维,即即只只有有两两个个变变量量,它它们们由由横横坐坐标标和和纵纵坐坐标标所所代代表表;因因此此每每个个观观测测值值都都有有相相应应于于这这两两个个坐坐标标轴轴的的两两个个坐坐标标值值;如如果果这这些些数数据据形形成成一一个个椭椭圆圆形形状状的的点点阵阵(这在变量的二维正态的假定下是可能的)(这在变量的二维正态的假定下是可能的)那那么么这这个个椭椭圆圆有有一一个个长长轴轴和和一一个个短短轴轴。在在短短轴轴方方向向上上,数数据据变变化化很很少少;在在极极端端的的情情
6、况况,短短轴轴如如果果退退化化成成一一点点,那那只只有有在在长长轴轴的的方方向向才才能能够够解解释释这这些些点点的的变化了;这样,由二维到一维的降维就自然完成了。变化了;这样,由二维到一维的降维就自然完成了。第八页,讲稿共二十六页哦主成分分析主成分分析当当坐坐标标轴轴和和椭椭圆圆的的长长短短轴轴平平行行,那那么么代代表表长长轴轴的的变变量量就就描描述述了了数数据据的的主主要要变变化化,而而代代表表短短轴轴的变量就描述了数据的次要变化。的变量就描述了数据的次要变化。但但是是,坐坐标标轴轴通通常常并并不不和和椭椭圆圆的的长长短短轴轴平平行行。因因此此,需需要要寻寻找找椭椭圆圆的的长长短短轴轴,并并
7、进进行行变变换换,使使得得新新变变量量和椭圆的长短轴平行。和椭圆的长短轴平行。如如果果长长轴轴变变量量代代表表了了数数据据包包含含的的大大部部分分信信息息,就就用用该该变变量量代代替替原原先先的的两两个个变变量量(舍舍去去次次要要的的一维),降维就完成了。一维),降维就完成了。椭椭圆圆(球球)的的长长短短轴轴相相差差得得越越大大,降降维维也也越越有有道理。道理。第九页,讲稿共二十六页哦第十页,讲稿共二十六页哦主成分分析主成分分析对对于于多多维维变变量量的的情情况况和和二二维维类类似似,也也有有高高维维的的椭椭球,只不过无法直观地看见罢了。球,只不过无法直观地看见罢了。首首先先把把高高维维椭椭球
8、球的的主主轴轴找找出出来来,再再用用代代表表大大多多数数数数据据信信息息的的最最长长的的几几个个轴轴作作为为新新变变量;这样,主成分分析就基本完成了。量;这样,主成分分析就基本完成了。注注意意,和和二二维维情情况况类类似似,高高维维椭椭球球的的主主轴轴也也是是互互相相垂垂直直的的。这这些些互互相相正正交交的的新新变变量量是是原原先先变变量量的的线线性性组组合合,叫叫做做主主成成分分(principalcomponent)。第十一页,讲稿共二十六页哦主成分分析主成分分析正正如如二二维维椭椭圆圆有有两两个个主主轴轴,三三维维椭椭球球有有三三个个主主轴轴一一样样,有有几个变量,就有几个主成分。几个变
9、量,就有几个主成分。选选择择越越少少的的主主成成分分,降降维维就就越越好好。什什么么是是标标准准呢呢?那那就就是是这这些些被被选选的的主主成成分分所所代代表表的的主主轴轴的的长长度度之之和和占占了了主主轴轴长长度度总总和和的的大大部部分分。有有些些文文献献建建议议,所所选选的的主主轴轴总总长长度度占占所所有有主主轴轴长长度度之之和和的的大大约约85%即即可可,其其实实,这这只只是是一个大体的说法一个大体的说法;具体选几个,要看实际情况而定。;具体选几个,要看实际情况而定。第十二页,讲稿共二十六页哦 对于我们的数据,对于我们的数据,SPSSSPSS输出为输出为这这里里的的Initial Eige
10、nvalues就就是是这这里里的的六六个个主主轴轴长长度度,又又称称特特征征值值(数数据据相相关关阵阵的的特特征征值值)。头头两两个个成成分分特特征征值值累累积积占占了了总总方方差差的的81.142%。后后面面的的特特征征值值的的贡献越来越少。贡献越来越少。第十三页,讲稿共二十六页哦 特征值的贡献还可以从特征值的贡献还可以从SPSS的所谓碎石图看出的所谓碎石图看出第十四页,讲稿共二十六页哦怎么解释这两个主成分。前面说过主成分是原始六个变怎么解释这两个主成分。前面说过主成分是原始六个变量的线性组合。是怎么样的组合呢?量的线性组合。是怎么样的组合呢?SPSSSPSS可以可以输出下面输出下面的表。的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 因子分析 成分 分析 讲稿
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内