主成分分析与因子分析法ppt课件.ppt
《主成分分析与因子分析法ppt课件.ppt》由会员分享,可在线阅读,更多相关《主成分分析与因子分析法ppt课件.ppt(38页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用主要内容主成分分析法主成分分析法 因子分析法因子分析法附:主成分分析法与因子分析法的区别附:主成分分析法与因子分析法的区别经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用主成分分析法主成分分析法(Principal Components Analysis,PCA)主成分分析法概述主成分分析法概述主成分分析的基本原理主成分分析的基本原理 主成分分析的计算步骤主成分分析的计算步骤 经营者提
2、供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用一、主成分分析概述经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用假定你是一个公司的财务经理,掌握了公假定你是一个公司的财务经理,掌握了公司的所有数据,这包括司的所有数据,这包括众多的变量众多的变量,比如,比如固定资产、流动资金、每一笔借贷的数额固定资产、流动资金、每一笔借贷的数额和期限、各种税费、工资支出、原料消耗、和期限、各种税费、工资支出、原料消耗、产值、利润、折旧、职工人数、职工的分产
3、值、利润、折旧、职工人数、职工的分工和教育程度等等工和教育程度等等。如果让你向上级或有关方面介绍公司状况,如果让你向上级或有关方面介绍公司状况,你能够把这些指标和数字都你能够把这些指标和数字都原封不动地摆原封不动地摆出去吗出去吗?引子经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用当然不能。当然不能。汇报什么?汇报什么?发现在如此多的变量之中,有很多是发现在如此多的变量之中,有很多是相关的。人们希望能够找出它们的相关的。人们希望能够找出它们的少少数数“代表代表”来对它们进行描述。来对它们进行描述。需要把这种有需要
4、把这种有很多变量很多变量的数据进行高的数据进行高度概括,度概括,用少数几个指标简单明了地用少数几个指标简单明了地把情况说清楚。把情况说清楚。经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用主成分分析主成分分析法法(Principal Components Analysis)和因子分析和因子分析法法(Factor Analysis)就就是把变量维数降是把变量维数降低以便于描述、理解和分析的方法。低以便于描述、理解和分析的方法。主成分分析也称为主分量分析,是一种通过降维来主成分分析也称为主分量分析,是一种通过降维来简
5、化数据结构的方法:如何把多个变量化为少数几简化数据结构的方法:如何把多个变量化为少数几个综合变量(综合指标)个综合变量(综合指标),而这几个综合变量可以,而这几个综合变量可以反映原来多个变量的大部分信息,所含的信息又互反映原来多个变量的大部分信息,所含的信息又互不重叠,即它们之间要相互独立,互不相关。不重叠,即它们之间要相互独立,互不相关。这些综合变量就叫因子或主成分,它是不可观测的,这些综合变量就叫因子或主成分,它是不可观测的,即即它不是具体的变量它不是具体的变量,只是几个指标的综合只是几个指标的综合。在引入主成分分析之前,先看下面的例子。在引入主成分分析之前,先看下面的例子。什么是主成分分
6、析法?什么是主成分分析法?经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用成绩数据5353个个学学生生的的数数学学、物物理理、化化学学、语语文文、历历史、英语的成绩如下表(部分)。史、英语的成绩如下表(部分)。经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用从本例可能提出的问题能能不不能能把把这这个个数数据据表表中中的的6 6个个变变量量用用一一两个综合变量来表示呢?两个综合变量来表示呢?这这一一两两个个综综合合变变量量包包含含有有
7、多多少少原原来来的的信信息呢?息呢?经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用事实上,以上问题在事实上,以上问题在平时的平时的研究中,也会经研究中,也会经常遇到。它常遇到。它所涉及的问题可以推广到对企业、所涉及的问题可以推广到对企业、对学校、对区域进行对学校、对区域进行分析、评价、排序和分分析、评价、排序和分类类等。等。比如对比如对n n个个样本样本进行综合评价,可选的描述进行综合评价,可选的描述样样本本特征的指标很多,而这些指标往往存在特征的指标很多,而这些指标往往存在一一定的相关性定的相关性(既不完全独
8、立,又不完全相关)(既不完全独立,又不完全相关),这就给研究带来很大不便。,这就给研究带来很大不便。若选指标太多,若选指标太多,会增加分析问题的难度与复杂性,选指标太会增加分析问题的难度与复杂性,选指标太少,有可能会漏掉对少,有可能会漏掉对样本样本影响较大的指标,影响较大的指标,影响结果的可靠性。影响结果的可靠性。经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用这就需要我们在相关分析的基础上,采这就需要我们在相关分析的基础上,采用主成分分析法找到几个用主成分分析法找到几个新的相互独立新的相互独立的综合指标的综合指
9、标,达到既减少指标数量、又,达到既减少指标数量、又能区分样本间差异的目的。能区分样本间差异的目的。经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用 二、主成分分析的基本原理二、主成分分析的基本原理经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用(一)(一)主成分分析的几何解释主成分分析的几何解释(二)主成分分析的基本思想(二)主成分分析的基本思想经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的
10、金额为消费者购买商品的价款或接受服务的费用(一)主成分分析的几何解释(一)主成分分析的几何解释例例中中数数据据点点是是六六维维的的;即即每每个个观观测测值值是是6 6维维空空间间中中的的一一个个点点。希希望望把把6 6维维空空间间用用低低维维空空间间表表示。示。先先假假定定只只有有二二维维,即即只只有有两两个个变变量量,语语文文成成绩绩(x x1 1)和和数数学学成成绩绩(x x2 2),分分别别由由横横坐坐标标和和纵坐标所代表;纵坐标所代表;每个学生都是二维坐标系中的一个点。每个学生都是二维坐标系中的一个点。经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔
11、偿的金额为消费者购买商品的价款或接受服务的费用因因为为在在实实际际应应用用中中,往往往往存存在在指指标标的的量量纲纲不不同同,所所以以在在计计算算之之前前须须先先消消除除量量纲纲的的影影响响,而而将将原原始始数数据据标标准准化化。为为了了实实现现样样本本数数据据的的标标准准化化,应应求求样样本本数数据据的的平平均均和和方方差差。对对数数据据矩矩阵阵Y Y作作标标准准化化处处理理,即即对对每每一一个指标分量作标准化变换,变换公式为:个指标分量作标准化变换,变换公式为:经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用
12、其中,其中,样本均值:样本均值:样本标准差:样本标准差:经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用原原始始变变量量 经经规规格格化化后后变变为为新新变变量量 ,其均值为零,方差为其均值为零,方差为1 1。对对二二维维空空间间来来讲讲n n个个标标准准化化后后的的样样本本在在二二维维空空间间的的分分布布大大体体为为一一椭椭圆圆形形,该该椭椭圆圆有有一一个个长长轴轴和和一一个个短短轴轴。在在短短轴轴方方向向上上数数据据变变化化很很少少,极极端端的的情情况况下下,短短轴轴如如退退化化成成一一点点,长长轴轴的的方方
13、向向可可以以完完全全解解释释这这些些点点的的变变化化,由由二二维维到到一一维维的的降降维维就自然完成了。就自然完成了。经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用假定语文成绩假定语文成绩(X1)和数学成和数学成绩绩(X2)分别为)分别为标准化后的分数,标准化后的分数,右图为其散点图,右图为其散点图,椭圆倾斜为椭圆倾斜为45度。度。经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用如果将坐标轴如果将坐标轴 X1 和和 X2 旋转旋转
14、45 ,那么点在新坐标,那么点在新坐标系中的坐标(系中的坐标(Y1,Y2)与原坐标()与原坐标(X1,X2)有如下的)有如下的关系:关系:Y1和和Y2均是均是X1 和和 X2的线性组合的线性组合经营者提供商品或者服务有欺诈行为的,应当按照消费者的要求增加赔偿其受到的损失,增加赔偿的金额为消费者购买商品的价款或接受服务的费用在新坐标系中,在新坐标系中,可以发现:虽然可以发现:虽然散点图的形状没散点图的形状没有改变,但新的有改变,但新的随机变量随机变量 Y1 和和 Y2 已经不再相已经不再相关。而且大部分关。而且大部分点沿点沿 Y1 轴散开,轴散开,在在 Y1 轴方向的轴方向的变异较大(即变异较大
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 成分 分析 因子分析 ppt 课件
限制150内