主成分分析完整版PPT课件.ppt
《主成分分析完整版PPT课件.ppt》由会员分享,可在线阅读,更多相关《主成分分析完整版PPT课件.ppt(28页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于主成分分析完整版第一张,PPT共二十八页,创作于2022年6月主成分分析的基本思想主成分分析的基本思想主成分的计算主成分的计算主成分分析的应用主成分分析的应用第二张,PPT共二十八页,创作于2022年6月主成分分析的基本思想主成分分析的基本思想主主成成分分分分析析就就是是把把原原有有的的多多个个指指标标转转化化成成少少数数几几个个代代表表性性较较好好的的综综合合指指标标,这这少少数数几几个个指指标标能能够够反反映映原原来来指指标标大大部部分分的的信信息息(85%以以上上),并并且且各各个个指指标标之之间间保保持持独独立立,避避免免出出现现重重叠叠信信息息。主成分分析主要起着主成分分析主要起
2、着降维降维和和简化数据结构简化数据结构的作用。的作用。1 1 基本思想基本思想第三张,PPT共二十八页,创作于2022年6月主成分分析是把各变量之间互相关联的复杂关系进行简化分析的方法。主成分分析是把各变量之间互相关联的复杂关系进行简化分析的方法。在在社社会会经经济济的的研研究究中中,为为了了全全面面系系统统的的分分析析和和研研究究问问题题,必必须须考考虑虑许许多多经经济济指指标标,这这些些指指标标能能从从不不同同的的侧侧面面反反映映我我们们所所研研究究的的对对象象的的特特征,但在某种程度上存在信息的重叠,具有一定的相关性。征,但在某种程度上存在信息的重叠,具有一定的相关性。主主成成分分分分析
3、析试试图图在在力力保保数数据据信信息息丢丢失失最最少少的的原原则则下下,对对这这种种多多变变量量的的截截面面数数据据表表进进行行最最佳佳综综合合简简化化,也也就就是是说说,对对高高维维变变量量空空间间进进行行降降维维处理。处理。很很显显然然,识识辨辨系系统统在在一一个个低低维维空空间间要要比比在在一一个个高高维维空空间间容容易易得多。得多。第四张,PPT共二十八页,创作于2022年6月(1)基于相关系数矩阵基于相关系数矩阵/协方差矩阵做主成分分析?协方差矩阵做主成分分析?(2)选择几个主成分?选择几个主成分?(3)如何解释主成分所包含的实际意义?如何解释主成分所包含的实际意义?在在力力求求数数
4、据据信信息息丢丢失失最最少少的的原原则则下下,对对高高维维的的变变量量空空间间降降维维,即即研研究究指指标标体体系系的的少少数数几几个个线线性性组组合合,并并且且这这几几个个线线性性组组合合所所构构成成的的综综合合指指标标将将尽尽可可能能多多地地保保留留原原来来指指标标变变异异方方面面的的信信息息。这这些些综综合合指指标标就就称称为为主主成成分。分。要讨论的问题是:要讨论的问题是:第五张,PPT共二十八页,创作于2022年6月2 2 数学模型与几何解释数学模型与几何解释假设我们所讨论的实际问题中,有假设我们所讨论的实际问题中,有p个指标,我们把这个指标,我们把这p个指标看作个指标看作p个随机变
5、量,记为个随机变量,记为X1,X2,Xp,主成分分析就是要把这,主成分分析就是要把这p个个指标的问题,转变为讨论指标的问题,转变为讨论m个新的指标个新的指标F1,F2,Fm(mp),按),按照保留主要信息量的原则充分反映原指标的信息,并且相互独立。照保留主要信息量的原则充分反映原指标的信息,并且相互独立。其中其中第六张,PPT共二十八页,创作于2022年6月这种由讨论这种由讨论多个指标多个指标降为降为少数几个少数几个综合指标的过程在数学上就叫做综合指标的过程在数学上就叫做降维降维。主成。主成分分析通常的做法是,分分析通常的做法是,寻求原指标的线性组合寻求原指标的线性组合Fi。满足如下的条件:满
6、足如下的条件:主成分之间相互独立,即无重叠的信息。即主成分之间相互独立,即无重叠的信息。即主成分的方差依次递减,重要性依次递减,即主成分的方差依次递减,重要性依次递减,即每个主成分的系数平方和为每个主成分的系数平方和为1。即。即第七张,PPT共二十八页,创作于2022年6月主主成成分分分分析析的的几几何何解解释释旋转坐标轴旋转坐标轴旋转变换的目的是为了使得旋转变换的目的是为了使得n个样本点个样本点在在F1轴方向上的离散程度最大,即轴方向上的离散程度最大,即F1的的方差最大,变量方差最大,变量F1代表了原始数据的代表了原始数据的绝大部分信息,在研究某经济问题时,绝大部分信息,在研究某经济问题时,
7、即使不考虑变量即使不考虑变量F2也损失不多的信息。也损失不多的信息。F1与与F2除起了浓缩作用外,还具有除起了浓缩作用外,还具有不相关性。不相关性。F1称为第一主成分,称为第一主成分,F2称为第二主成称为第二主成分。分。第八张,PPT共二十八页,创作于2022年6月主成分的计算主成分的计算先讨论二维情形先讨论二维情形求第一主成分求第一主成分F1和和F2。我们已经把主成分我们已经把主成分F1和和F2 的坐标原点放在平的坐标原点放在平均值均值 所在处,从而使得所在处,从而使得F1和和F2 成为中心化的成为中心化的变量,即变量,即F1和和F2 的样本均值都为零。的样本均值都为零。第九张,PPT共二十
8、八页,创作于2022年6月因此F1可以表示为关键是,寻找合适的单位向量 ,使F1的方差最大。问题的答案是:X的协方差矩阵S 的最大特征根 所对应的单位特征向量即为 。并且 就是F1的方差。第十张,PPT共二十八页,创作于2022年6月同样,同样,F2可以表示为可以表示为寻找合适的单位向量寻找合适的单位向量 ,使,使F2与与F1独立,且使独立,且使F2的方差(除的方差(除F1之外)最大。之外)最大。问题的答案问题的答案是:是:X的协方差矩阵的协方差矩阵S的第二大特征根的第二大特征根 所所对应的单位特征向量即为对应的单位特征向量即为 。并且。并且 就是就是F2的的方差。方差。第十一张,PPT共二十
9、八页,创作于2022年6月其中,其中,aij称为因子载荷量称为因子载荷量因子载荷量:主成分与变量间的相关系数,因子载荷量:主成分与变量间的相关系数,即:因子载荷量的大小和它前面的正负号直接反映了即:因子载荷量的大小和它前面的正负号直接反映了主成分与相应变量之间关系的密切程度和方向。从而可以说明各主主成分与相应变量之间关系的密切程度和方向。从而可以说明各主成分的意义成分的意义第十二张,PPT共二十八页,创作于2022年6月求解主成分的步骤:求解主成分的步骤:1.求样本均值求样本均值 和样本协方差矩阵和样本协方差矩阵S;2.求求S的特征根的特征根求解特征方程求解特征方程 ,其中,其中I是单位矩阵,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 成分 分析 完整版 PPT 课件
限制150内