最新十章节典型相关分析ppt课件.ppt
《最新十章节典型相关分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《最新十章节典型相关分析ppt课件.ppt(39页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、十章节典型相关分析十章节典型相关分析10.1 引言v典型相关分析(canonical correlation analysis)是研究两组变量之间相关关系的一种统计分析方法,它能够有效地揭示两组变量之间的相互线性依赖关系。v典型相关分析是由霍特林(Hotelling,1935,1936)首先提出的。二、典型相关变量的性质v1.同一组的典型变量互不相关v2.不同组的典型变量之间的相关性v3.原始变量与典型变量之间的相关系数v4.简单相关、复相关和典型相关之间的关系1.同一组的典型变量互不相关v设x,y的第i对典型变量为ui=aix,vi=biy, i=1,2, ,m则有V(ui)=ai11ai=
2、1,V(vi)=bi22bi=1,i=1,2, ,m(ui,uj)=Cov(ui,uj)=ai11aj=0,1ijm(vi,vj)=Cov(vi,vj)=bi22bj=0,1ijm2.不同组的典型变量之间的相关性v (ui,vi)=i,i=1,2, ,mv记u=(u1,u2, ,um),v=(v1,v2, ,vm),则上述两个性质可用矩阵表示为V(u)=Im,V(v)=Im,Cov(u,v)=或其中=diag(1,2, ,m)。1122111222,Cov,Cov,Cov,01ijijijijijjiju vu vijm a x b yax y b ,mmV IuIv3.原始变量与典型变量之间
3、的相关系数v记A=(a1,a2, ,am)=(aij)pmB=(b1,b2, ,bm)=(bij)qm1111,11,1,1,11121,11,1,11,2122,1,1,ppp qpppp pp p qppppppp qp qp q pp q pp q p q则Cov(x,u)=Cov(x,Ax)=11ACov(x,v)=Cov(x,By)=12BCov(y,u)=Cov(y,Ax)=21ACov(y,v)=Cov(y,By)=22B上述四个等式也可表达为 1111,1,1Cov,Cov,jpijiipikkjkpjjqiji pi p qi p kkjkqjax uaabx vbbi=1,
4、2, ,q,j=1,2, ,m所以 1,1,11,1,1Cov,Cov,jpijp ip i pp i kkjkpjjqijp i pp i p qp i p kkjkqjay uaaby vbb,11,11,1,2,1,2,pqijikkjiiiji p kkjiikkpqijp i kkjp i p iijp i p kkjp i p ikkx uax vby uay vbipjm,4.简单相关、复相关和典型相关之间的关系v当p=q=1时,x与y之间的(惟一)典型相关就是它们之间的简单相关;当p=1或q=1时,x与y之间的(惟一)典型相关就是它们之间的复相关。可见,复相关是典型相关的一个特
5、例,而简单相关是复相关的一个特例。v第一个典型相关系数至少同x(或y)的任一分量与y(或x)的复相关系数一样大,即使所有这些复相关系数都较小,第一个典型相关系数仍可能很大;同样,从复相关的定义也可以看出,当p=1(或q=1)时,x(或y)与y(或x)之间的复相关系数也不会小于 x(或y)与y(或x)的任一分量之间的相关系数,即使所有这些相关系数都较小,复相关系数仍可能很大。三、从相关矩阵出发计算典型相关v有时,x和y的各分量的单位不全相同,我们希望在对各分量作标准化变换之后再作典型相关分析。v记1=E(x),2=E(y), , , 为 的相关矩阵。对x和y的各分量作标准化变换,即令现在来求x*
6、和y*的典型相关变量 ,i=1,2, ,m。111diag,ppD21,1,diag,ppp q p qD11122122RRRRRxy*1*11122xDxyDy,于是因为所以 *111111111111*111122222222*111112112212*111121221121Cov,Cov,Cov,Cov,VVVVyxxDx DD DRyDy DD DRxyDx y DD DRDy x DD DR1111111111111112222111111122222222111111111222211R R R RD DD DD DD DD D1121112222111121111222211
7、11iiiiii aaD DDaDa式中 ,有 。同理式中 ,有 。由此可见, 为x*和y*的第i对典型系数,其第i个典型相关系数仍为i,在标准化变换下具有不变性,这一点与主成分分析有所不同。vx*和y*的第i对典型变量 具有零均值,且与x和y的第i对典型变量ui=aix,vi=biy只相差一个常数。v例10.2.1 设x,y有如下相关矩阵:这里1,1,可以保证 存在。11*2*11122221iiiR R R R aa*1iiaDa*111111111iiiiiia R aa D R Daa a11*2*22211112iiiR R R R bb*2iibD b*222222221iiiii
8、ib R bb D R D bb b*,iia b*,iiiiuva xb y11221211,11RRR,11111122,RR由于11有惟一的非零特征值11=2,故 有惟一非零特征值在约束条件 下,相应于特征值 的特征向量为 。同理,在约束条件 下,111112222122222221111111111,111121111R R R R11111111 11111111122221R R R R221411211/2*12 1a1*111 11a R a*122 11b R b 相应于特征值 的特征向量为 。所以,第一对典型相关变量为其中x*和y*分别是对x和y各分量标准化后的向量。第一个
9、典型相关系数为 。由于1, 1,故1,表明第一个典型相关系数大于两组原始变量之间的相关系数。1122211112R R R R211/2*12 1b11/21/2*112 1,2 1a xxb yy111/2121110.3 样本典型相关v设数据矩阵为则样本协方差矩阵为S可用来作为的估计。当np+q时, 可分别作为 的估计;它们的非零特征值 可用来估计 ;1111111111pqnnnnpnnqxxyyxxyyxyXYxy11122122SSSSS11111112222122211112S S S SS S S S和11111112222122211112 和22212mrrr22212mv相
10、应的特征向量 作为a1,a2, ,am的估计, 作为b1,b2, ,bm的估计。 的正平方根rj称为第j个样本典型相关系数, 称为第j对样本典型相关变量,j=1,2, ,m。将样本(xi,yi),i=1,2, ,n经中心化后代入m对典型变量,即令则称uij为第i个样品xi的第j个样本典型变量得分,称vij为第i个样品yi的第j个样本典型变量得分。由约束条件 可得v同理可得v对每个j,可画出(uij,vij),i=1,2, ,n的散点图,该图也可用来检查是否有异常值出现。12,ma aa12 ,mb bb2jrjj a xb y和1,2, ,1,2,ijjiijjiuvin jmaxxbyy,1
11、1jj a S a =121111111,2,11nnijjiijjjiiujmnnaxxxx aa S a=1,2111,2,1nijivjmn=1,v例10.3.1 某康复俱乐部对20名中年人测量了三个生理指标:体重(x1)、腰围(x2)、脉搏(x3)和三个训练指标:引体向上(y1)、起坐次数(y2)、跳跃次数(y3)。其数据列于表10.3.1。表10.3.1某康复俱乐部的生理指标和训练指标数据编 号x1x2x3y1y2y3119136505162602189375221106031933858121011014162356212105375189354613155586182365641
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新 章节 典型 相关 分析 ppt 课件
限制150内