最新多元统计学-2主成分分析精品课件.ppt





《最新多元统计学-2主成分分析精品课件.ppt》由会员分享,可在线阅读,更多相关《最新多元统计学-2主成分分析精品课件.ppt(24页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多元统计学多元统计学-2主成分分析主成分分析1. 基本思想:用较少的变量表示原来的样本;2.目的:是样本数据信息损失最小的原则下,对高维变量进行降维。3.参数估计:一般是求相关矩阵的特征值和相应的特征向量(主成分分析法),取前几个计算主成分。4.应用:应用较少变量来解释各个样本的特征(数据降维、综合平价)。 (1) 基于相关系数矩阵主成分分析。 (2) 主成分分析的目的是简化变量,一般情况下主成分的个数应该小于原始变量的个数。关于保留几个主成分,应该权衡主成分个数和保留的信息。 (3) 如何解释主成分所包含的专业意义。 ppppppppppXuXuXuFXuXuXuFXuXuXuF221122
2、22112212211111 主成分分析数学模型 多个指标降为少数几个综合指标的过程在数学上就叫做降维。主成分分析通常的做法是,寻求原指标的线性组合Fi。2x1x1F2F主成分分析的几何解释平移、旋转坐标轴 主成分分析综合能力主成分分析综合能力 1)贡献率:第i个主成分的方差在全部方差中所占比重 ,称为贡献率 ,反映了原来P个指标多大的信息,有多大的综合能力 。piii1 2)累积贡献率:前k个主成分共有多大的综合能力,用这k个主成分的方差和在全部方差中所占比重来描述,称为累积贡献率。piikii11 我们进行主成分分析的目的之一是希望用尽可能少的主成分F1,F2,Fk(kp)代替原来的P个指
3、标。到底应该选择多少个主成分,在实际工作中,主成分个数的多少取决于能够反映原来变量80%以上的信息量为依据,即当累积贡献率80%时的主成分的个数就足够了。最常见的情况是主成分为2到3个。 根据主成分分析的定义及性质,我们已大体上能看出主成分分析的一些应用。概括起来说,主成分分析主要有以下几方面的应用。 1主成分分析能降低所研究的数据空间的维数。即用研究m维的Y空间代替p维的X空间(mp),而低维的Y空间代替 高维的x空间所损失的信息很少。即:使只有一个主成分Yl(即 m1)时,这个Yl仍是使用全部X变量(p个)得到的。例如要计算Yl的均值也得使用全部x的均值。在所选的前m个主成分中,如果某个X
4、i的系数全部近似于零的话,就可以把这个Xi删除,这也是一种删除多余变量的方法。主成分分析的应用 2. 多维数据的一种图形表示方法。我们知道当维数大于3时便不能画出几何图形,多元统计研究的问题大都多于3个变量。要把研究的问题用图形表示出来是不可能的。然而,经过主成分分析后,我们可以选取前两个主成分或其中某两个主成分,根据主成分的得分,画出n个样品在二维平面上的分布况,由图形可直观地看出各样品在主分量中的地位。 3由主成分分析法构造回归模型。即把各主成分作为新自变量代替原来自变量x做回归分析。主成分分析例子x1-城镇单位在岗职工平均工资(元)x2-各市固定资产投资(万元)x3-各市进口总额(万美元
5、)x4-社会消费品零售总额(万元)x5-各市工业增加值(亿元)x6-财政收入(亿元)。 分析结果规格化特征向量因子1因子2因子3因子4因子5因子6x(1)0.26920.75790.38510.32060.18190.2625x(2)0.4550-0.0469-0.11420.5278-0.5763-0.4088x(3)0.4438-0.1602-0.62470.16740.25630.5417x(4)0.3536-0.57240.66670.0081-0.02560.3196x(5)0.43130.2606-0.0550-0.7482-0.41860.0897x(6)0.4610-0.046
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新 多元 统计学 成分 分析 精品 课件

限制150内