应用数理统计14主成分分析.ppt





《应用数理统计14主成分分析.ppt》由会员分享,可在线阅读,更多相关《应用数理统计14主成分分析.ppt(45页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、主成分分析 实实际际问问题题中中,同同一一个个总总体体的的p个个指指标标之之间间往往往往存存在在着着相相关关关关系系。主主成成份份分分析析的的主主要要目目的的是是在在这这p个个指指标标中中寻寻找找几几个个相相互互无无关关的的综综合合性性指指标标,使使这这几几个个综综合合性性的的指指标标性性能能反反应应出出原原来来p个指标的信息。这些综合指标就是主成份。个指标的信息。这些综合指标就是主成份。1 基本思想基本思想2 数学模型与几何解数学模型与几何解释释 假设实际问题中有假设实际问题中有p个指标,我们把这个指标,我们把这p个个指标看作指标看作p个随机变量,记为个随机变量,记为x1,x2,xp,主成分
2、分析就是要把这主成分分析就是要把这p个指标的问题,转变为个指标的问题,转变为讨论讨论p个指标的线性组合的问题,而这些新的指个指标的线性组合的问题,而这些新的指标标y1,y2,yk(kp),),按照保留主要信息量按照保留主要信息量的原则充分反映原指标的信息,并且相互无关。的原则充分反映原指标的信息,并且相互无关。这种由讨论多个指标降为少数几个综合指标的这种由讨论多个指标降为少数几个综合指标的过程在数学上就叫做过程在数学上就叫做降维降维。主成分分析通常的做法,是寻求原指标的主成分分析通常的做法,是寻求原指标的线性组合线性组合yi:满足如下的条件:满足如下的条件:(2)主成分之间相互无关,即无重叠的
3、信息主成分之间相互无关,即无重叠的信息。即。即(3)主成分的方差依次递减,重要性依次递减,即主成分的方差依次递减,重要性依次递减,即(1)每个主成分的系数平方和为每个主成分的系数平方和为1(否则其方(否则其方差可能为无穷大),即差可能为无穷大),即主主成成分分分分析析的的几几何何解解释释平移、旋转坐标轴平移、旋转坐标轴oo主主成成分分分分析析的的几几何何解解释释平移、旋转坐标轴平移、旋转坐标轴oo 主主成成分分分分析析的的几几何何解解释释平移、旋转坐标轴平移、旋转坐标轴oo二维空间中主成分的几何意义:二维空间中主成分的几何意义:设有设有n个样品,每个个样品,每个样品有两个观测变量样品有两个观测
4、变量xl和和x2。在由变量。在由变量xl和和x2 所确定所确定的二维平面中,的二维平面中,n个样本点所散布的情况如椭圆状。个样本点所散布的情况如椭圆状。由图可以看出这由图可以看出这n个样本点无论是沿着个样本点无论是沿着xl 轴方向或轴方向或x2轴方向都具有较大的离散性,其离散的程度可以分别轴方向都具有较大的离散性,其离散的程度可以分别用观测变量用观测变量xl 的方差和的方差和x2 的方差定量地表示。显然,的方差定量地表示。显然,如果只考虑如果只考虑xl和和x2 中的任何一个,那么包含在原始数中的任何一个,那么包含在原始数据中的信息将会有较大的损失。据中的信息将会有较大的损失。将将xl 轴和轴和
5、x2轴先平移,再同时按逆时针方向旋转轴先平移,再同时按逆时针方向旋转 角角度,得到新坐标轴度,得到新坐标轴Fl和和F2,则,则 旋转变换的目的是为了使得旋转变换的目的是为了使得n个样品点在个样品点在Fl轴方向上的轴方向上的离散程度最大,即离散程度最大,即yl的方差最大。变量的方差最大。变量yl代表了原始数代表了原始数据的大部分信息,在研究某些实际问题时,即使不考据的大部分信息,在研究某些实际问题时,即使不考虑变量虑变量y2也无损大局。也无损大局。经过上述旋转变换原始数据的经过上述旋转变换原始数据的大部分信息集中到大部分信息集中到Fl轴上,对数据中包含的信息起到轴上,对数据中包含的信息起到了浓缩
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 数理统计 14 成分 分析

限制150内