应用统计学主成分分析课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《应用统计学主成分分析课件.ppt》由会员分享,可在线阅读,更多相关《应用统计学主成分分析课件.ppt(58页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 主成分分析主成分分析v主成分分析:将原来较多的指标简化为少数几个新的综合指标的多元统计方法。v主成分:由原始指标综合形成的几个新指标。依据主成分所含信息量的大小成为第一主成分,第二主成分等等。v主成分与原始变量间的关系:1、主成分保留了原始变量绝大多数信息。2、主成分的个数大大少于原始变量的数目。3、各个主成分之间互不相关。4、每个主成分都是原始变量的线性组合。v主成分分析的运用:1 1、对一组内部相关的变量作简化的描述对一组内部相关的变量作简化的描述 2 2、用来削减回归分析或群集分析、用来削减回归分析或群集分析(Cluster)Cluster)中变量的中变量的数目数目 3 3、用来检查异
2、常点用来检查异常点 4 4、用来作多重共线性鉴定、用来作多重共线性鉴定 5 5、用来做原来数据的常态检定用来做原来数据的常态检定 二、数学模型与几何解释数学模型二、数学模型与几何解释数学模型v假设我们所讨论的实际问题中,有p个指标,我们把这p个指标看作p个随机变量,记为X1,X2,Xp,主成分分析就是要把这p个指标的问题,转变为讨论p个指标的线性组合的问题,而这些新的指标F1,F2,Fk(kp),按照保留主要信息量的原则充分反映原指标的信息,并且相互独立。v这种由讨论多个指标降为少数几个综合指标的过程在数学上就叫做降维。主成分分析通常的做法是,寻求原指标的线性组合Fi。v满足如下的条件:1 1
3、、每个主成分的系数平方和为、每个主成分的系数平方和为1 1。即。即 2 2、主成分之间相互独立,即无重叠的信息。即、主成分之间相互独立,即无重叠的信息。即 3 3、主成分的方差依次递减,重要性依次递减,即、主成分的方差依次递减,重要性依次递减,即F1、F2.Fp分别称为原变量的第一、第二.第p个主成分。数学模型与几何解释几何解释数学模型与几何解释几何解释v为了方便,我们在二维空间中讨论主成分的几何意义:设有n个样品,每个样品有两个观测变量xl和x2,在由变量xl和x2 所确定的二维平面中,n个样本点所散布的情况如椭圆状。由图可以看出这n个样本点无论是沿着xl 轴方向或x2轴方向都具有较大的离散
4、性,其离散的程度可以分别用观测变量xl 的方差和x2 的方差定量地表示。显然,如果只考虑xl和x2 中的任何一个,那么包含在原始数据中的经济信息将会有较大的损失。v如果我们将xl 轴和x2轴先平移,再同时按逆时针方向旋转角度,得到新坐标轴Fl和F2。Fl和F2是两个新变量。平移、旋转坐标轴平移、旋转坐标轴 平移、旋转坐标轴v根据旋转变换的公式:v旋转变换的目的:旋转变换的目的:为了使得n个样品点在Fl轴方向上的离散程度最大,即Fl的方差最大。(变量Fl代表了原始数据的绝大部分信息,在研究某经济问题时,即使不考虑变量F2也无损大局)。经过上述旋转变换原始数据的大部经过上述旋转变换原始数据的大部分
5、信息集中到分信息集中到F Fl l轴上,对数据中包含的信息轴上,对数据中包含的信息起到了浓缩作用。起到了浓缩作用。vFl,F2除了可以对包含在Xl,X2中的信息起着浓缩作用之外,还具有不相关的性质,这就使得在研究复杂的问题时避免了信息重叠所带来的虚假性。二维平面上的个点的方差大部分都归结在Fl轴上,而F2轴上的方差很小。Fl和F2称为原始变量x1和x2的综合变量。F简化了系统结构,抓住了主要矛盾。v由此可概括出主成分分析的几何意义:主成分分析的过程也就是坐标旋转的过程,各主成分表达式就是新坐标系与原坐标系的转换关系,新坐标系中各坐标轴的方向就是原始数据方差最大的方向。v了解了主成分分析的基本思
6、想、数学和几何意义后,问题的关键:1 1、如何进行主成分分析?(主成分分析的方法)、如何进行主成分分析?(主成分分析的方法)基于相关系数矩阵还是基于协方差矩阵做主成分分析。当分析中所选择的经济变量具有不同的量纲,变量水平差异很大,应该选择基于相关系数矩阵的主成分分析。2 2、如何确定主成分个数?、如何确定主成分个数?主成分分析的目的是简化变量,一般情况下主成分的个数应该小于原始变量的个数。关于保留几个主成分,应该权衡主成分个数和保留的信息。3 3、如何解释主成分所包含的经济意义?、如何解释主成分所包含的经济意义?3 3 总体主成分的求解及其性质总体主成分的求解及其性质v矩阵知识回顾:矩阵知识回
7、顾:(1 1)特征根与特征向量)特征根与特征向量A A、若对任意的若对任意的k k阶方阵阶方阵C C,有数字有数字 与向量与向量 满足:满足:,则称,则称 为为C C的特征根,的特征根,为为C C的相应于的相应于 的特的特征向量。征向量。B B、同时,方阵同时,方阵C C的特征根的特征根 是是k k阶方程阶方程 的的根。根。(2 2)任一)任一k k阶方阵阶方阵C C的特征根的特征根 的性质:的性质:(3 3)任一)任一k k阶的实对称矩阵阶的实对称矩阵C C的性质:的性质:A A、实对称矩阵实对称矩阵C C的非零特征根的数目的非零特征根的数目C C的秩的秩B B、k k阶的实对称矩阵存在阶的
8、实对称矩阵存在k k个实特征根个实特征根C C、实对称矩阵的不同特征根的特征向量是正交的实对称矩阵的不同特征根的特征向量是正交的D D、若若 是实对称矩阵是实对称矩阵C C的单位特征向量,则的单位特征向量,则若矩阵若矩阵 ,是由特征向量,是由特征向量 所构成的,则有:所构成的,则有:v主成分分析的目标:主成分分析的目标:1 1、从相关的、从相关的X X1 1,X X2 2,X Xk k,求出相互独立的新综合变量(主成分)求出相互独立的新综合变量(主成分)Y Y1 1,Y,Y2 2Y Yk k。2 2、Y Y(Y Y1 1,Y,Y2 2Y Yk k )所反映信息的含量无遗漏或损失的指标所反映信息
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计学 成分 分析 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内