多元课件第七章.ppt
《多元课件第七章.ppt》由会员分享,可在线阅读,更多相关《多元课件第七章.ppt(113页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、北大北大数学学院数学学院应用多元统计分析应用多元统计分析第七章第七章 主成分分主成分分析析1北大北大数学学院数学学院第七章第七章 主成分分主成分分析析目目 录录7.1 总体的主成分总体的主成分7.2 样本的主成分样本的主成分7.3 主成分分析的应用主成分分析的应用2北大北大数学学院数学学院第七章第七章 主成分分主成分分析析 多变量分析多变量分析(Multivariate Analysis)是处是处理多变量理多变量(多指标多指标)的统计问题。的统计问题。多个变量之间常存在相关性,人们希望用多个变量之间常存在相关性,人们希望用较少不相关的变量来代替原来较多且相关的较少不相关的变量来代替原来较多且相
2、关的变量。变量。主成分就是要从原变量的各种线性组合中主成分就是要从原变量的各种线性组合中找出能集中反映原变量信息的综合变量。找出能集中反映原变量信息的综合变量。3北大北大数学学院数学学院第七章第七章7.1 7.1 总体的主成分总体的主成分什么是主成分分什么是主成分分析析 主成分分析是将多个指标化为少数几个综合指标主成分分析是将多个指标化为少数几个综合指标的一种统计分析方法的一种统计分析方法.在实际问题中在实际问题中,研究多指标的问题是经常遇到的问研究多指标的问题是经常遇到的问题题.由于变量个数太多由于变量个数太多,并且彼此之间存在着一定的相并且彼此之间存在着一定的相关性关性,势必增加分析问题的
3、复杂性势必增加分析问题的复杂性.主成分分析就是设法把原来的多个指标重新组合主成分分析就是设法把原来的多个指标重新组合成较少几个新的互不相关的综合变量来代替原来的变成较少几个新的互不相关的综合变量来代替原来的变量量;而且这几个综合变量又能够尽可能多地反映原来而且这几个综合变量又能够尽可能多地反映原来变量的信息变量的信息.利用这种降维的思想利用这种降维的思想,产生了主成分分析、因子产生了主成分分析、因子分析、典型相关分析等统计方法分析、典型相关分析等统计方法.4北大北大数学学院数学学院第七章第七章 7.17.1总体的主成分总体的主成分什么是主成分什么是主成分 设设X=(=(X1,Xp)是是p维随机
4、向量维随机向量,均值向量均值向量E(E(X)=,)=,协差阵协差阵D(D(X)=.)=.考虑它的线性变换考虑它的线性变换:易见易见:(7.1.2)(7.1.1)5北大北大数学学院数学学院第七章第七章 7.17.1总体的主成分总体的主成分什么是主成分什么是主成分 假如我们希望用假如我们希望用Z1 1来代替原来的来代替原来的p个变量个变量X1,Xp,这就要求这就要求Z1 1尽可能多地反映原来尽可能多地反映原来p个个变量的信息变量的信息,这里所说的这里所说的“信息信息”用什么来表达用什么来表达呢呢?最经典的方法是用最经典的方法是用Z1 1的方差来表达的方差来表达.Var(Var(Z1 1)越大越大,
5、表示表示Z1 1包含的信息越多包含的信息越多.由由()()式看出式看出,对对a1 1必须有某种限制必须有某种限制.否则可使否则可使Var(Var(Z1 1).).常用的限制是常用的限制是:a1 1a1 1=1.=1.若存在满足以上约束的若存在满足以上约束的a1 1,使使Var(Var(Z1 1)达达最大最大,Z1 1就称为第一主成分就称为第一主成分(或主分量或主分量).).6北大北大数学学院数学学院第七章第七章 7.17.1总体的主成分总体的主成分什么是主成分什么是主成分 如果第一主成分不足以代表原来如果第一主成分不足以代表原来p个变量的个变量的绝大部分信息绝大部分信息.考虑考虑X的第二个线性
6、组合的第二个线性组合Z2 2.为了有效地代表原变量组的信息为了有效地代表原变量组的信息,Z1 1已体现已体现(反映反映)的信息不希望在的信息不希望在Z2 2中出现中出现,用统计术语来用统计术语来讲讲,就是要求就是要求 Cov(Cov(Z2 2,Z1 1)=)=a2 2a1 1=0.(7.1.3)=0.(7.1.3)于是求于是求Z2 2时时,就是在约束就是在约束a2 2a2 2=1=1和和(7.1.3)(7.1.3)下下,求求a2 2使使Var(Var(Z2 2)达最大达最大,所求之所求之Z2 2称为第二主成称为第二主成分分,类似地可求得第三主成分类似地可求得第三主成分,第四主成分第四主成分,.
7、,.,第第p主成分主成分.7北大北大数学学院数学学院第七章第七章 7.17.1总体的主成分总体的主成分什么是主成分什么是主成分 换言之换言之,若原数据有若原数据有p个变量,则恰好可个变量,则恰好可得到得到p个主成分个主成分:1.每个主成分都是原变量的线性组合每个主成分都是原变量的线性组合;2.不同主成分间互不相关(互相正交)不同主成分间互不相关(互相正交);3.主成分以其方差减少次序排列主成分以其方差减少次序排列:第一主成分具有最大方差第一主成分具有最大方差,第二主成分是与第一主成分正交的原变第二主成分是与第一主成分正交的原变量的线性组合中具有最大方差者量的线性组合中具有最大方差者,其余主成分
8、都有类似的性质其余主成分都有类似的性质.8北大北大数学学院数学学院第七章第七章 7.17.1总体的主成分总体的主成分什么是主成分什么是主成分 或者说或者说,若原变量包含有一定的信息若原变量包含有一定的信息,则则全体主成分包含与原变量相同的信息全体主成分包含与原变量相同的信息.方差反映了变量取值的离散程度,方差方差反映了变量取值的离散程度,方差大小表示了变量包含信息的多少大小表示了变量包含信息的多少.第一主成分包含了尽可能多的信息第一主成分包含了尽可能多的信息,不同的主成分包含的信息互不重复不同的主成分包含的信息互不重复;第二主成分包含除第一主成分外剩余信第二主成分包含除第一主成分外剩余信息中尽
9、可能多的信息息中尽可能多的信息;其余主成分都有类似的性质其余主成分都有类似的性质.9北大北大数学学院数学学院第七章第七章 7.17.1总体的主成分总体的主成分主成分的定义主成分的定义 定义定义 设设X=(=(X1,Xp)为为p维随机向维随机向量量.称称 Zi=aiX 为为X的第的第i 主成分主成分(i=1,2,=1,2,p),),如果如果:aiai=1(=1(i=1,2,=1,2,p););当当i 1 1时时 aiaj=0(=0(j=1,=1,i-1);-1);Var(Var(Zi)=Max Var()=Max Var(X X).).=1,=1,aj=0(=0(j=1,=1,i-1)-1)10
10、北大北大数学学院数学学院第七章第七章 7.17.1总体的主成分总体的主成分主成分的几何意义主成分的几何意义 从代数学观点看主成分就是从代数学观点看主成分就是p个变量的一些个变量的一些特殊的线性组合特殊的线性组合,而从几何上看这些线性组合而从几何上看这些线性组合正是把正是把X1,Xp构成的坐标系旋转产生的新坐构成的坐标系旋转产生的新坐标系标系,新坐标轴使之通过样本变差最大的方向新坐标轴使之通过样本变差最大的方向(或者说具有最大的样本方差或者说具有最大的样本方差).设有设有n个观测个观测,每个观测有每个观测有p个变量个变量X1,Xp,它们的综合指标它们的综合指标(主成分主成分)记为记为Z1 1,Z
11、p.当当p=2时原变量为时原变量为X1,X2.设设(X1,X2)服从二服从二元正态分布元正态分布,则样品点则样品点X(i)=(xi1,xi2)(i=1,2,n)的散布图的散布图(见下面图形见下面图形)在一个椭在一个椭圆内分布着圆内分布着.11北大北大数学学院数学学院第七章第七章 7.17.1总体的主成分总体的主成分主成分的几何意义主成分的几何意义 Z1Z212北大北大数学学院数学学院第七章第七章 7.17.1总体的主成分总体的主成分主成分的几何意义主成分的几何意义 对于二元正态随机向量对于二元正态随机向量,n个点散布在一个椭个点散布在一个椭圆内圆内(当当X1,X2相关性越强相关性越强,这个椭圆
12、就越扁这个椭圆就越扁).若取椭圆的长轴为坐标轴若取椭圆的长轴为坐标轴Z1,椭圆的短轴为椭圆的短轴为Z2,这相当于在平面上作一个坐标变换这相当于在平面上作一个坐标变换,即按逆即按逆时针方向旋转一个角度时针方向旋转一个角度a a,根据旋转变换公式根据旋转变换公式,新老坐标之间有关系新老坐标之间有关系:Z1=Cos a aX1 1+Sin Sin a aX2 2 Z2=-Sin a aX1 1+Cos Cos a aX2 2Z1 Z2 是原变量是原变量X1 1和和X2 2 的特殊线性组合的特殊线性组合.13北大北大数学学院数学学院第七章第七章 7.17.1总体的主成分总体的主成分主成分的几何意义主成
13、分的几何意义 从图上可以看出二维平面上从图上可以看出二维平面上n个点的波动个点的波动(用二个变量的方差和表示用二个变量的方差和表示)大部分可以归结为大部分可以归结为在在Z1方向的波动方向的波动,而在而在Z2 方向上的波动很小方向上的波动很小,可可以忽略以忽略.这样一来这样一来,二维问题可以降为一维了二维问题可以降为一维了,只取第一只取第一 个综合变量个综合变量Z1即可即可,而而Z1是椭圆的长是椭圆的长轴轴.一般情况一般情况,p个变量组成个变量组成p维空间维空间,n个样品点个样品点就是就是p维空间的维空间的n个点个点.对于对于p元正态分布变量来元正态分布变量来说说,找主成分的问题就是找找主成分的
14、问题就是找p维空间中椭球的主维空间中椭球的主轴问题轴问题.14北大北大数学学院数学学院第七章第七章 7.17.1总体的主成分总体的主成分主成分分析的内容主成分分析的内容 主成分分析的计算一般是从原变量的协主成分分析的计算一般是从原变量的协差阵或相关矩阵出发进行差阵或相关矩阵出发进行,包含以下内容:包含以下内容:1.各主成分的构成各主成分的构成;2.各主成分的方差及其在总方差中所占的各主成分的方差及其在总方差中所占的比例比例(贡献率贡献率);3.每个观测在各个主成分下的得分值每个观测在各个主成分下的得分值;4.各主成分与原变量的相关性各主成分与原变量的相关性.15北大北大数学学院数学学院第七章第
15、七章 7.17.1总体的主成分总体的主成分主成分的求法主成分的求法 设设p维随机向量维随机向量X的均值的均值E(E(X)=0,)=0,协差阵协差阵D(D(X)=)=0.0.由定义由定义7.1.1,7.1.1,求第一主成分求第一主成分Z1 1=a1 1X的问题就是求的问题就是求a1 1=(=(a1111,a2121,ap1 1),),使得使得在在a1 1a1 1=1=1下下,Var(,Var(Z1 1)达最大达最大.这是条件极值问题这是条件极值问题,用拉格朗日乘数法用拉格朗日乘数法.令令 (a1 1)=Var()=Var(a1 1X)-()-(a1 1a1 1-1)-1)=a1 1a1 1-(-
16、(a1 1Ipa1 1-1),-1),由由(7.1.4)(见附录见附录(8.3)(8.3)式式)16北大北大数学学院数学学院第七章第七章 7.17.1总体的主成分总体的主成分主成分的求法主成分的求法 因因a1 10,0,故故|-I|=0,|=0,求解求解(7.1.4),(7.1.4),其实就是其实就是求求的特征值和特征向量问题的特征值和特征向量问题.设设=1是是的最的最大特征值大特征值,则相应的单位特征向量则相应的单位特征向量a1 1即为所求即为所求.一般地一般地,求求X的第的第i主成分就是求主成分就是求的第的第i大特征值大特征值对应的单位特征向量对应的单位特征向量.定理定理 设设X=(=(X
17、1,Xp)是是p维随机向量维随机向量,且且D(D(X)=,)=,的特征值的特征值1 12 2p p,a1 1,a2 2,ap为相应的单位正交特征向量为相应的单位正交特征向量,则则X的的第第i主成分为主成分为 Zi=aiX(i=1,2,=1,2,p).).17北大北大数学学院数学学院第七章第七章 7.17.1总体的主成分总体的主成分回顾附录中回顾附录中定理定理7.2 定理定理7.2 设设B是是p阶对称阵阶对称阵,i=chi(B)是是B的的第第i大的特征值,大的特征值,li 是相应于是相应于i的的B的标准化特征的标准化特征向量向量(i1,p),x为任一非零为任一非零p维向量,那么有维向量,那么有右
18、边不等式的等号当右边不等式的等号当x=cl1时成立,左边不等式时成立,左边不等式的等号当的等号当x=clp时成立,这里时成立,这里c是非零常数是非零常数.18北大北大数学学院数学学院第七章第七章 7.17.1总体的主成分总体的主成分回顾附录中回顾附录中定理定理7.2 (2)记记2=(lr+1,lp),即即2是由是由lr+1,lp 张成的空间张成的空间,则则 2且当且当x=clr+1 时达到最大值,这里时达到最大值,这里c非零常非零常数数.19北大北大数学学院数学学院第七章第七章 7.17.1总体的主成分总体的主成分定理的证明定理的证明定理证明定理证明 因因为对称阵,利用附录中定为对称阵,利用附
19、录中定理理7.2的结论的结论(1),可知对任意非零向量可知对任意非零向量a有有且最大值在且最大值在a=a1时达到时达到.故在故在a1a1=1的约的约束条件下束条件下,使得使得达极大值达极大值.20北大北大数学学院数学学院第七章第七章 7.17.1总体的主成分总体的主成分定理的证明定理的证明 根据主成分的定义根据主成分的定义7.1.1,Z1=a1 X为为X的的第一主成分第一主成分.对对r=2,3,p,记记r(ar,ap),利利用附录中的定理用附录中的定理7.2的结论的结论(2)即得即得r且最大值在且最大值在a=ar时达到时达到.21北大北大数学学院数学学院第七章第七章 7.17.1总体的主成分总
20、体的主成分定理的证明定理的证明故在故在arar=1的约束条件下的约束条件下,ar 满足满足且使得且使得达极大值达极大值.根据主成分的定义根据主成分的定义7.1.1,Zr=ar X为为X的第的第r主成分主成分.(证毕证毕)22北大北大数学学院数学学院第七章第七章 7.17.1总体的主成分总体的主成分定理的推论定理的推论 设设Z=(Z1,Z2,Z p)为为p维随机向量,维随机向量,则其分量则其分量Zi(i=1,2,p)依次是依次是X的第的第i主主成分的充分必要条件是:成分的充分必要条件是:Z=AX,A为正交阵;为正交阵;D(Z)=diag(1,2,p),即随机向,即随机向量量Z的协差阵为对角阵;的
21、协差阵为对角阵;12p 0.23北大北大数学学院数学学院第七章第七章 7.17.1总体的主成分总体的主成分主成分的性质主成分的性质 主成分主成分Zi就是以就是以的单位特征向量的单位特征向量ai为系数的为系数的线性组合线性组合,它们互不相关它们互不相关,且方差且方差Var(Zi)=i.记记=(=(ij),=diag(),=diag(1 1,2 2,p p),),其中其中1 12 2p p为为的特征值的特征值,a1 1,a2 2,ap是相应的单位正交特征向量是相应的单位正交特征向量.主成分向量主成分向量Z=(=(Z1 1,Zp),),其中其中 Zi=aiX (i=1,2,=1,2,p)总体主成分有
22、如下性质总体主成分有如下性质:24北大北大数学学院数学学院第七章第七章 7.17.1总体的主成分总体的主成分主成分的性质主成分的性质 (1)(1)D(D(Z)=,)=,即即p个主成分的方差为:个主成分的方差为:Var(Var(Zi)=)=i,且它们是互不相关且它们是互不相关 (2)(2)通常称通常称 为原总体为原总体X的总方差的总方差,该性质说该性质说明原总体明原总体X的总方差可分解为不相关的主的总方差可分解为不相关的主成分的方差和成分的方差和.25北大北大数学学院数学学院第七章第七章 7.17.1总体的主成分总体的主成分主成分的性质主成分的性质 即即p个原变量所提供的总信息个原变量所提供的总
23、信息(总方差总方差)的的绝大部分只须用前绝大部分只须用前m个主成分来代替。这说明个主成分来代替。这说明若前几个主成分集中了大部分信息,则后几个若前几个主成分集中了大部分信息,则后几个主成分的方差都很小,包含的信息也很少主成分的方差都很小,包含的信息也很少.在实际应用时就可用前面较少的几个主成分在实际应用时就可用前面较少的几个主成分来代替原来代替原p个变量来描述数据的变化个变量来描述数据的变化.且存在且存在26北大北大数学学院数学学院第七章第七章 7.17.1总体的主成分总体的主成分主成分的性质主成分的性质 (3)(3)主成分主成分Zk与原始变量与原始变量Xi的相关系数的相关系数 证明证明:Va
24、r(Xi)=ii Var(Zk)=k k Cov(Cov(Xi ,Zk )=Cov()=Cov(eiX,ak X)=ei ak=ei(k k ak)=k k aik (ei是第是第i个元素为个元素为1,其余为其余为0的单位向量的单位向量)27北大北大数学学院数学学院第七章第七章 7.17.1总体的主成分总体的主成分主成分的性质主成分的性质 常把主成分常把主成分Zk与原始变量与原始变量Xi的相关系数称为的相关系数称为因因子负荷量子负荷量(或因子载荷量或因子载荷量).).利用因子载荷量利用因子载荷量,可对可对指标分类指标分类.如果把主成分与原始变量的相关系数如果把主成分与原始变量的相关系数列成表列
25、成表7.17.1的形式,则由相关系数的公式,还可的形式,则由相关系数的公式,还可得出性质得出性质(4)(4)和和(5).(5).表表7.128北大北大数学学院数学学院第七章第七章 7.17.1总体的主成分总体的主成分主成分的性质主成分的性质 因因Xi也可表成也可表成Z1 1,Zp的线性组合的线性组合,且且 Z1 1,Zp相互独立,由回归分析的知识相互独立,由回归分析的知识,Xi 与与 Z1 1,Zp的全相的全相关系数的平方和等于关系数的平方和等于1 1,即表,即表7.17.1中每一行的平方和均中每一行的平方和均为为1.1.事实上事实上,由由 故有故有29北大北大数学学院数学学院第七章第七章 7
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 课件 第七
限制150内