主成分分析与因子分析.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《主成分分析与因子分析.ppt》由会员分享,可在线阅读,更多相关《主成分分析与因子分析.ppt(53页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、主成分分析与因子分主成分分析与因子分析析汇报什么?汇报什么?假定你是一个公司的财务经理,掌握了公司的所假定你是一个公司的财务经理,掌握了公司的所有数据,比如有数据,比如固定资产、流动资金、每一笔借贷固定资产、流动资金、每一笔借贷的数额和期限、各种税费、工资支出、原料消耗、的数额和期限、各种税费、工资支出、原料消耗、产值、利润、折旧、职工人数、职工的分工和教产值、利润、折旧、职工人数、职工的分工和教育程度等等育程度等等。如果让你向上面介绍公司状况,你能够把这些指如果让你向上面介绍公司状况,你能够把这些指标和数字都标和数字都原封不动地摆出去吗原封不动地摆出去吗?当然不能。当然不能。你必须要把各个方
2、面作出高度概括,你必须要把各个方面作出高度概括,用一两个指用一两个指标简单明了地把情况说清楚。标简单明了地把情况说清楚。对众多变量进行降维对众多变量进行降维每个人都会遇到有每个人都会遇到有很多变量很多变量的数据。的数据。比比如如全全国国或或各各个个地地区区的的带带有有许许多多经经济济和和社社会会变变量量的的数数据据;各个学校的研究、教学等各种变量的数据等等。各个学校的研究、教学等各种变量的数据等等。这这些些数数据据的的共共同同特特点点是是变变量量很很多多,在在如如此此多多的的变变量量之之中中,有有很很多多是是相相关关的的,即即有有很很多多重重叠叠信信息息。人人们们希希望望能能够够找找出它们的出
3、它们的少数少数“代表代表”来对它们进行描述。来对它们进行描述。本本章章就就介介绍绍两两种种把把变变量量维维数数降降低低以以便便于于描描述述、理理解解和和分分析析 的的 方方 法法:主主 成成 分分 分分 析析(principal principal component component analysisanalysis)和和因因子子分分析析(factor factor analysisanalysis)。实实际际上上主主成成分分分分析析可可以以说说是是因因子子分分析析的的一一个个特特例例。在在引引进进主主成成分分析之前,先看下面的例子。分分析之前,先看下面的例子。成绩数据(成绩数据(stud
4、ent.sav)100个个学学生生的的数数学学、物物理理、化化学学、语语文文、历历史史、英语的成绩如下表(部分)。英语的成绩如下表(部分)。从本例可能提出的问题从本例可能提出的问题目目前前的的问问题题是是,能能不不能能把把这这个个数数据据的的6 6个个变变量用一两个综合变量来表示呢?量用一两个综合变量来表示呢?这这一一两两个个综综合合变变量量包包含含有有多多少少原原来来的的信信息息呢?呢?能能不不能能利利用用找找到到的的综综合合变变量量来来对对学学生生排排序序呢呢?这这一一类类数数据据所所涉涉及及的的问问题题可可以以推推广广到到对对企企业业,对对学学校校进进行行分分析析、排排序序、判判别别和和
5、分类等问题。分类等问题。主成分分析主成分分析(PrincipalComponentsAnalysis)例例中中的的数数据据点点是是六六维维的的;也也就就是是说说,每每个个观观测测值值是是6维维空空间间中中的的一一个个点点。我我们们希希望望把把6维维空空间间用用低低维维空空间间表表示示。由由于于6维维空空间间无无法法直直接接观观察察,因因此此,我我从从2维维空空间间开开始始解解释释主主成成分分析的原理。分分析的原理。主成分分析原理主成分分析原理当当散散点点呈呈椭椭圆圆状状分分布布时时,代代表表长长轴轴的的变变量量就就描描述述了了数数据据的的主主要要变变化化,而而代代表表短短轴轴的的变变量量就就描
6、描述述了了数据的次要变化。数据的次要变化。但但是是,坐坐标标轴轴通通常常并并不不和和椭椭圆圆的的长长短短轴轴平平行行。因因此此,需需要要寻寻找找椭椭圆圆的的长长短短轴轴,并并进进行行变变换换,使使得得新变量和椭圆的长短轴平行。新变量和椭圆的长短轴平行。如如果果长长轴轴变变量量代代表表了了数数据据包包含含的的大大部部分分信信息息,就就用用该该变变量量代代替替原原先先的的两两个个变变量量(舍舍去去次次要要的的一一维维),降维就完成了。,降维就完成了。椭椭圆圆(球球)的的长长短短轴轴相相差差得得越越大大,降降维维也也越越有有道道理。理。主成分分析的几何解释平移、旋转坐标轴主成分分析的几何解释平移、旋
7、转坐标轴 主成分分析的几何解释平移、旋转坐标轴主成分分析的几何解释平移、旋转坐标轴样本数据的标准化可解决平移问题 根据旋转变换的公式:主成分分析主成分分析对对于于多多维维变变量量的的情情况况和和二二维维类类似似,也也有有高高维维的的椭椭球,只不过无法直观地看见罢了。球,只不过无法直观地看见罢了。首首先先把把高高维维椭椭球球的的主主轴轴找找出出来来,再再用用代代表表大大多多数数数数据据信信息息的的最最长长的的几几个个轴轴作作为为新新变变量量;这这样样,主主成分分析就基本完成了。成分分析就基本完成了。注注意意,和和二二维维情情况况类类似似,高高维维椭椭球球的的主主轴轴也也是是互互相相垂垂直直的的。
8、这这些些互互相相正正交交的的新新变变量量是是原原先先变变量量的的线性组合,叫做主成分线性组合,叫做主成分(principalcomponent)。主成分分析的主成分分析的数学模型数学模型 假设我们所讨论的实际问题中,有p个指标,我们把这p个指标看作p个随机变量,记为X1,X2,Xp,主成分分析就是要把这p个指标的问题,转变为讨论p个指标的线性组合的问题,而这些新的指标F1,F2,Fk(kp),按照保留主要信息量的原则充分反映原指标的信息,并且相互独立。这种由讨论多个指标降为少数几个综合指标的过程在数学上就叫做降维。主成分分析通常的做法是,寻求原指标的线性组合Fi。满足如下的条件:主成分之间相互
9、独立,即无重叠的信息。即主成分之间相互独立,即无重叠的信息。即主成分的方差依次递减,重要性依次递减,即主成分的方差依次递减,重要性依次递减,即每个主成分的系数平方和为每个主成分的系数平方和为1。即。即样本数据的标准化可解决平移问题 根据旋转变换的公式:主成分分析主成分分析正正如如二二维维椭椭圆圆有有两两个个主主轴轴,三三维维椭椭球球有有三三个个主主轴轴一样,有几个变量,就有几个主成分。一样,有几个变量,就有几个主成分。选选择择越越少少的的主主成成分分,降降维维就就越越好好。什什么么是是标标准准呢呢?那那就就是是这这些些被被选选的的主主成成分分所所代代表表的的主主轴轴的的长长度度之之和和占占了了
10、主主轴轴长长度度总总和和的的大大部部分分。有有些些文文献献建建议议,所所选选的的主主轴轴总总长长度度占占所所有有主主轴轴长长度度之之和和的的大大约约85%即即可可,其其实实,这这只只是是一一个个大大体体的的说说法法;具具体体选几个,要看实际情况而定。选几个,要看实际情况而定。对于我们的数据,对于我们的数据,SPSSSPSS输出为输出为这这里里的的InitialEigenvalues就就是是这这里里的的六六个个主主轴轴长长度度,又又称称特特征征值值(数数据据相相关关阵阵的的特特征征值值)。头头两两个个成成分分特特征征值值累累积积占占了了总总方方差差的的81.142%。后后面面的的特特征征值值的的
11、贡贡献献越越来来越越少。少。特征值的贡献还可以从特征值的贡献还可以从SPSS的所谓碎石图看出的所谓碎石图看出因子载荷反映的是主成分与变量间的相关系数。因子载荷反映的是主成分与变量间的相关系数。(因子载荷阵)(因子载荷阵)主成分载荷与因子载荷可以把第一和第二因子可以把第一和第二因子的载荷点出一个二维图以的载荷点出一个二维图以直观地显示它们如何解释直观地显示它们如何解释原来的变量的。这个图叫原来的变量的。这个图叫做载荷图。做载荷图。该图该图左面三个点是数学、物理、化学三科左面三个点是数学、物理、化学三科,右边三个点右边三个点是语文、历史、外语三科。是语文、历史、外语三科。因子分析因子分析(Fact
12、orAnalysis)主要内容一、什么是因子分析一、什么是因子分析二、因子分析模型二、因子分析模型三、因子载荷矩阵中的几个统计特征三、因子载荷矩阵中的几个统计特征四、因子旋转四、因子旋转五、因子得分五、因子得分六、在六、在SPSS上进行因子分析的步骤上进行因子分析的步骤 因子分析(factor analysis)是一种数据简化的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量来表示其基本的数据结构。这几个假想变量能够反映原来众多变量的主要信息。原始的变量是可观测的显在变量,而假想变量是不可观测的潜在变量,称为因子。例如,在企业形象或品牌形象的研究中,消
13、费者可以通过一个有24个指标构成的评价体系,评价百货商场的24个方面的优劣。一、什么是因子分析一、什么是因子分析 但消费者主要关心的是三个方面,即商店的环境、商店的服务和商品的价格。因子分析方法可以通过24个变量,找出反映商店环境、商店服务水平和商品价格的三个潜在的因子,对商店进行综合评价。而这三个公共因子可以表示为:称 是不可观测的潜在因子。24个变量共享这三个因子,但是每个变量又有自己的个性,不被包含的部分 ,称为特殊因子。二、因子分析模型二、因子分析模型 数学模型数学模型 设 个变量,如果表示为注:注:因子分析与回归分析不同,因子分析中的因因子分析与回归分析不同,因子分析中的因子是一个比
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 成分 分析 因子分析
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内