主成分分析---多元统计分析教学讲义课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《主成分分析---多元统计分析教学讲义课件.ppt》由会员分享,可在线阅读,更多相关《主成分分析---多元统计分析教学讲义课件.ppt(145页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、主成分分析主成分分析-多元统计分析课多元统计分析课件件(人大何晓群人大何晓群)2023/1/13中国人民大学六西格玛质量管理研究中心2第五章第五章 主成分分析主成分分析 目录 上页 下页 返回 结束 5.1 5.1 主成分分析的基本思想与理论主成分分析的基本思想与理论5.2 5.2 主成分分析的几何意义主成分分析的几何意义5.3 5.3 总体主成分及其性质总体主成分及其性质5.4 5.4 样本主成分的导出样本主成分的导出5.5 5.5 有关问题的讨论有关问题的讨论5.6 5.6 主成分分析步骤及框图主成分分析步骤及框图5.7 5.7 主成分分析的上机实现主成分分析的上机实现2023/1/13中
2、国人民大学六西格玛质量管理研究中心3第五章第五章 主成分分析主成分分析 目录 上页 下页 返回 结束 主成分分析主成分分析(principal components analysis)也称主分量)也称主分量分析,是由霍特林(分析,是由霍特林(Hotelling)于于19331933年首先提出的。主成年首先提出的。主成分分析是利用降维的思想,在损失很少信息的前提下把多个分分析是利用降维的思想,在损失很少信息的前提下把多个指标转化为几个综合指标的多元统计方法。通常把转化生成指标转化为几个综合指标的多元统计方法。通常把转化生成的综合指标称之为主成分,其中每个主成分都是原始变量的的综合指标称之为主成分
3、,其中每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,这就使得主成分比线性组合,且各个主成分之间互不相关,这就使得主成分比原始变量具有某些更优越的性能。这样在研究复杂问题时就原始变量具有某些更优越的性能。这样在研究复杂问题时就可以只考虑少数几个主成分而不至于损失太多信息,从而更可以只考虑少数几个主成分而不至于损失太多信息,从而更容易抓住主要矛盾,揭示事物内部变量之间的规律性,同时容易抓住主要矛盾,揭示事物内部变量之间的规律性,同时使问题得到简化,提高分析效率。本章主要介绍主成分分析使问题得到简化,提高分析效率。本章主要介绍主成分分析的基本理论和方法、主成分分析的计算步骤及主成分分析
4、的的基本理论和方法、主成分分析的计算步骤及主成分分析的上机实现。上机实现。2023/1/13中国人民大学六西格玛质量管理研究中心7 目录 上页 下页 返回 结束 5.1.15.1.1 主成分分析的基本思想主成分分析的基本思想3.主成分保留了原始变量绝大多数信息4.各主成分之间互不相关 通过主成分分析,可以从事物之间错综复杂的通过主成分分析,可以从事物之间错综复杂的关系中找出一些主要成分,从而能有效利用大量关系中找出一些主要成分,从而能有效利用大量统计数据进行定量分析,揭示变量之间的内在关统计数据进行定量分析,揭示变量之间的内在关系,得到对事物特征及其发展规律的一些深层次系,得到对事物特征及其发
5、展规律的一些深层次的启发,把研究工作引向深入。的启发,把研究工作引向深入。2023/1/13中国人民大学六西格玛质量管理研究中心8 目录 上页 下页 返回 结束 5.1.25.1.2 主成分分析的基本理论主成分分析的基本理论 设对某一事物的研究涉及个设对某一事物的研究涉及个 指标,分别用指标,分别用 表表示,这个示,这个 指标构成的指标构成的 维随机向量为维随机向量为 。设随。设随机向量机向量 的均值为的均值为 ,协方差矩阵为,协方差矩阵为 。对对 进行线性变换,可以形成新的综合变量,用进行线性变换,可以形成新的综合变量,用 表示,表示,也就是说,新的综合变量可以由原来的变量线性表示,即满也就
6、是说,新的综合变量可以由原来的变量线性表示,即满足下式:足下式:(5.1)(5.1)2023/1/13中国人民大学六西格玛质量管理研究中心9 目录 上页 下页 返回 结束 5.1.25.1.2 主成分分析的基本理论主成分分析的基本理论 由于可以任意地对原始变量进行上述线性变换,由于可以任意地对原始变量进行上述线性变换,由不同的线性变换得到的综合变量由不同的线性变换得到的综合变量 的统计特性也的统计特性也不尽相同。因此为了取得较好的效果,我们总是希不尽相同。因此为了取得较好的效果,我们总是希望望 的方差尽可能大且各的方差尽可能大且各 之间互相独立,由之间互相独立,由于于 =而对任给的常数而对任给
7、的常数 ,有,有2023/1/13中国人民大学六西格玛质量管理研究中心10 目录 上页 下页 返回 结束 5.1.25.1.2 主成分分析的基本理论主成分分析的基本理论 因此对因此对 不加限制时,可使不加限制时,可使 任意增大,问题将变得没任意增大,问题将变得没有意义。我们将线性变换约束在下面的原则之下:有意义。我们将线性变换约束在下面的原则之下:1,即:2 3 3.是是 的一切满足原则的一切满足原则1 1的线性组合中方差最的线性组合中方差最大者;大者;是与是与 不相关的不相关的 所有线性组合中方差最所有线性组合中方差最大者;大者;,是与是与 都不相关的都不相关的 的所有的所有线性组合中方差最
8、大者。线性组合中方差最大者。2023/1/13中国人民大学六西格玛质量管理研究中心11 目录 上页 下页 返回 结束 5.1.25.1.2 主成分分析的基本理论主成分分析的基本理论 基于以上三条原则决定的综合变量基于以上三条原则决定的综合变量 分别分别称为原始变量的第一、第二、称为原始变量的第一、第二、第、第 个主成分。个主成分。其中,各综合变量在总方差中占的比重依次递减,其中,各综合变量在总方差中占的比重依次递减,在实际研究工作中,通常只挑选前几个方差最大的在实际研究工作中,通常只挑选前几个方差最大的主成分,从而达到简化系统结构,抓住问题实质的主成分,从而达到简化系统结构,抓住问题实质的目的
9、。目的。2023/1/13中国人民大学六西格玛质量管理研究中心12 目录 上页 下页 返回 结束 5.25.2 主成分分析的几何意义主成分分析的几何意义 由第一节的介绍我们知道,在处理涉及多个指标问题的时由第一节的介绍我们知道,在处理涉及多个指标问题的时候,为了提高分析的效率,可以不直接对候,为了提高分析的效率,可以不直接对 个指标构成的个指标构成的 维维随机向量随机向量 进行分析,而是先对向量进行分析,而是先对向量 进行线进行线性变换,形成少数几个新的综合变量性变换,形成少数几个新的综合变量 ,使得各综合,使得各综合变量之间相互独立且能解释原始变量尽可能多的信息,这样,变量之间相互独立且能解
10、释原始变量尽可能多的信息,这样,在以损失很少部分信息为代价的前提下,达到简化数据结构,在以损失很少部分信息为代价的前提下,达到简化数据结构,提高分析效率的目的。这一节,我们着重讨论主成分分析的几提高分析效率的目的。这一节,我们着重讨论主成分分析的几何意义,为了方便,我们仅在二维空间中讨论主成分的几何意何意义,为了方便,我们仅在二维空间中讨论主成分的几何意义,所得结论可以很容易地扩展到多维的情况。义,所得结论可以很容易地扩展到多维的情况。2023/1/13中国人民大学六西格玛质量管理研究中心13 目录 上页 下页 返回 结束 5.25.2 主成分分析的几何意义主成分分析的几何意义 设有设有 个样
11、品,每个样品有两个观测变量个样品,每个样品有两个观测变量 ,这样,这样,在由变量在由变量 组成的坐标空间中,组成的坐标空间中,个样品点散布的情况如个样品点散布的情况如带状,见图带状,见图5-15-1。图图5-15-12023/1/13中国人民大学六西格玛质量管理研究中心14 目录 上页 下页 返回 结束 5.25.2 主成分分析的几何意义主成分分析的几何意义 由图可以看出这由图可以看出这 个样品无论沿个样品无论沿 轴方向还是沿轴方向还是沿 轴方向均轴方向均有较大的离散性,其离散程度可以分别用观测变量有较大的离散性,其离散程度可以分别用观测变量 的方差和的方差和 的方差定量地表示,显然,若只考虑
12、的方差定量地表示,显然,若只考虑 和和 中的任何一个,原中的任何一个,原始数据中的信息均会有较大的损失。我们的目的是考虑始数据中的信息均会有较大的损失。我们的目的是考虑 和和 的线性组合,使得原始样品数据可以由新的变量的线性组合,使得原始样品数据可以由新的变量 和和 来刻画。来刻画。在几何上表示就是将坐标轴按逆时针方向旋转在几何上表示就是将坐标轴按逆时针方向旋转 角度,得到新坐角度,得到新坐标轴标轴 和和 ,坐标旋转公式如下:,坐标旋转公式如下:2023/1/13中国人民大学六西格玛质量管理研究中心15 目录 上页 下页 返回 结束 5.25.2 主成分分析的几何意义主成分分析的几何意义 其矩
13、阵形式为:其矩阵形式为:其中,其中,为旋转变换矩阵,由上式可知它是正交阵,为旋转变换矩阵,由上式可知它是正交阵,即满足即满足 2023/1/13中国人民大学六西格玛质量管理研究中心16 目录 上页 下页 返回 结束 5.25.2 主成分分析的几何意义主成分分析的几何意义 经过这样的旋转之后,经过这样的旋转之后,个样品点在个样品点在 轴上的离散程度最轴上的离散程度最大,变量大,变量 代表了原始数据绝大部分信息,这样,有时在研代表了原始数据绝大部分信息,这样,有时在研究实际问题时,即使不考虑变量究实际问题时,即使不考虑变量 也无损大局。因此,经过也无损大局。因此,经过上述旋转变换就可以把原始数据的
14、信息集中到上述旋转变换就可以把原始数据的信息集中到 轴上,对数轴上,对数据中包含的信息起到了浓缩的作用。进行主成分分析的目的据中包含的信息起到了浓缩的作用。进行主成分分析的目的就是找出转换矩阵就是找出转换矩阵 ,而进行主成分分析的作用与几何意义,而进行主成分分析的作用与几何意义也就很明了了。下面我们用遵从正态分布的变量进行分析,也就很明了了。下面我们用遵从正态分布的变量进行分析,以使主成分分析的几何意义更为明显。为方便,我们以二元以使主成分分析的几何意义更为明显。为方便,我们以二元正态分布为例。对于多元正态总体的情况,有类似的结论。正态分布为例。对于多元正态总体的情况,有类似的结论。2023/
15、1/13中国人民大学六西格玛质量管理研究中心17 目录 上页 下页 返回 结束 5.25.2 主成分分析的几何意义主成分分析的几何意义设变量设变量 遵从二元正态分布,分布密度为遵从二元正态分布,分布密度为:令令 为变量为变量 的协方差矩阵,其形式如下:的协方差矩阵,其形式如下:令 则上述二元正态分布的密度函数有如下矩阵形式则上述二元正态分布的密度函数有如下矩阵形式:2023/1/13中国人民大学六西格玛质量管理研究中心18 目录 上页 下页 返回 结束 5.25.2 主成分分析的几何意义主成分分析的几何意义考虑考虑 (为常数),为方便,不妨设为常数),为方便,不妨设上式有如下展开形式:上式有如
16、下展开形式:令令 ,则上面的方程变为:,则上面的方程变为:2023/1/13中国人民大学六西格玛质量管理研究中心19 目录 上页 下页 返回 结束 5.25.2 主成分分析的几何意义主成分分析的几何意义这是一个椭圆的方程,长短轴分别为:这是一个椭圆的方程,长短轴分别为:又令又令 为为 的特征值,的特征值,为相应的标准正交特为相应的标准正交特征向量征向量.则则 为正交阵,为正交阵,有:有:因此有:因此有:2023/1/13中国人民大学六西格玛质量管理研究中心20 目录 上页 下页 返回 结束 5.25.2 主成分分析的几何意义主成分分析的几何意义 与上面一样,这也是一个椭圆方程,且在与上面一样,
17、这也是一个椭圆方程,且在 构成的坐标系中,构成的坐标系中,其主轴的方向恰恰正是其主轴的方向恰恰正是 坐标轴的方向。因为坐标轴的方向。因为 所以,所以,就是原始变量就是原始变量 的两个主成分,它们的方的两个主成分,它们的方差分别为差分别为 ,在,在 方向上集中了原始变量方向上集中了原始变量 的变差,在的变差,在 方向方向上集中了原始变量上集中了原始变量 的变差,经常有的变差,经常有 远大于远大于 ,这样,我们就,这样,我们就可以只研究原始数据在可以只研究原始数据在 方向上的变化而不致于损失过多信息,方向上的变化而不致于损失过多信息,而而 就是椭圆在原始坐标系中的主轴方向,也是坐标轴转换就是椭圆在
18、原始坐标系中的主轴方向,也是坐标轴转换的系数向量。对于多维的情况,上面的结论依然成立。的系数向量。对于多维的情况,上面的结论依然成立。这样,我们就对主成分分析的几何意义有了一个充分的了解。这样,我们就对主成分分析的几何意义有了一个充分的了解。主成分分析的过程无非就是坐标系旋转的过程,各主成分表达主成分分析的过程无非就是坐标系旋转的过程,各主成分表达式就是新坐标系与原坐标系的转换关系,在新坐标系中,各坐式就是新坐标系与原坐标系的转换关系,在新坐标系中,各坐标轴的方向就是原始数据变差最大的方向。标轴的方向就是原始数据变差最大的方向。2023/1/13中国人民大学六西格玛质量管理研究中心21 目录
19、上页 下页 返回 结束 5.35.3 总体主成分及其性质总体主成分及其性质 由上面的讨论可知,求解主成分的过程就是求由上面的讨论可知,求解主成分的过程就是求满足三条原则的原始变量满足三条原则的原始变量 的线性组合的线性组合的过程。本节先从总体出发,介绍求解主成分的的过程。本节先从总体出发,介绍求解主成分的一般方法及主成分的性质,然后介绍样本主成分一般方法及主成分的性质,然后介绍样本主成分的导出。的导出。2023/1/13中国人民大学六西格玛质量管理研究中心22 目录 上页 下页 返回 结束 5.3.15.3.1 总体主成分总体主成分 主成分分析的基本思想就是在保留原始变量尽可能多的信息主成分分
20、析的基本思想就是在保留原始变量尽可能多的信息的前提下达到降维的目的,从而简化问题的复杂性并抓住问题的前提下达到降维的目的,从而简化问题的复杂性并抓住问题的主要矛盾。而这里对于随机变量的主要矛盾。而这里对于随机变量 而言,其协方差而言,其协方差矩阵或相关矩阵正是对各变量离散程度与变量之间的相关程度矩阵或相关矩阵正是对各变量离散程度与变量之间的相关程度的信息的反应,而相关矩阵不过是将原始变量标准化后的协方的信息的反应,而相关矩阵不过是将原始变量标准化后的协方差矩阵。我们所说的保留原始变量尽可能多的信息,也就是指差矩阵。我们所说的保留原始变量尽可能多的信息,也就是指的生成的较少的综合变量(主成分)的
21、方差和尽可能接近原始的生成的较少的综合变量(主成分)的方差和尽可能接近原始变量方差的总和。因此在实际求解主成分的时候,总是从原始变量方差的总和。因此在实际求解主成分的时候,总是从原始变量的协方差矩阵或相关矩阵的结构分析入手。一般地说,从变量的协方差矩阵或相关矩阵的结构分析入手。一般地说,从原始变量的协方差矩阵出发求得的主成分与从原始变量的相关原始变量的协方差矩阵出发求得的主成分与从原始变量的相关矩阵出发求得的主成分是不同的。下面我们分别就协方差矩阵矩阵出发求得的主成分是不同的。下面我们分别就协方差矩阵与相关矩阵进行讨论。与相关矩阵进行讨论。2023/1/13中国人民大学六西格玛质量管理研究中心
22、23 目录 上页 下页 返回 结束 5.3.15.3.1 总体主成分总体主成分(1)(1)从协方差矩阵出发求解主成分从协方差矩阵出发求解主成分引论:设矩阵引论:设矩阵 ,将,将 的特征值的特征值 依大小顺序依大小顺序排列,不妨设排列,不妨设 ,为为 矩阵各特征值对矩阵各特征值对应的标准正交特征向量,则对任意向量,有:应的标准正交特征向量,则对任意向量,有:(5.2)证明:对证明:对 与单位阵与单位阵 进行谱分解,可以写成下面的式子:进行谱分解,可以写成下面的式子:而对任意向量而对任意向量 ,有,有 ,于是有,于是有2023/1/13中国人民大学六西格玛质量管理研究中心24 目录 上页 下页 返
23、回 结束 5.3.15.3.1 总体主成分总体主成分类似的,我们可以得出:类似的,我们可以得出:于是,自然有于是,自然有 2023/1/13中国人民大学六西格玛质量管理研究中心25 目录 上页 下页 返回 结束 5.3.15.3.1 总体主成分总体主成分 证明:由引论知,对于任意常向量证明:由引论知,对于任意常向量 ,有:,有:又又 为标准正交特征向量,于是:为标准正交特征向量,于是:证明:由引论知,对于任意常向量证明:由引论知,对于任意常向量 ,有:,有:又又 为标准正交特征向量,于是:为标准正交特征向量,于是:此时:(5.3)结论:结论:设随机向量设随机向量 的协方差矩阵为的协方差矩阵为
24、,为为 的特征值,的特征值,为矩阵为矩阵 各特征值对应各特征值对应的标准正交特征向量,则第的标准正交特征向量,则第 i个主成分为:个主成分为:结论:结论:设随机向量设随机向量 的协方差矩阵为的协方差矩阵为 ,为为 的特征值,的特征值,为矩阵为矩阵 各特征值对应各特征值对应的标准正交特征向量,则第的标准正交特征向量,则第 i个主成分为:个主成分为:2023/1/13中国人民大学六西格玛质量管理研究中心26 目录 上页 下页 返回 结束 5.3.15.3.1 总体主成分总体主成分 且:令令 ,则有,则有类似的,有类似的,有2023/1/13中国人民大学六西格玛质量管理研究中心27 目录 上页 下页
25、 返回 结束 5.3.15.3.1 总体主成分总体主成分 由以上结论,我们把由以上结论,我们把 的协方差矩阵的协方差矩阵 的非零特的非零特征值征值 对应的标准化特征向量对应的标准化特征向量 分别分别作为系数向量,作为系数向量,分别称为随机向分别称为随机向量量 的第一主成分、第二主成分、的第一主成分、第二主成分、第、第 主成分。主成分。的分量的分量 依次是依次是 的第一主成分、第二主成分、的第一主成分、第二主成分、第、第 主成主成分的充分必要条件是:分的充分必要条件是:(1 1),即,即 为为 阶正交阵;阶正交阵;(2 2)的分量之间互不相关;的分量之间互不相关;(3 3)的的 个分量是按方差由
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 成分 分析 多元 统计分析 教学 讲义 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内