第十 典型相关分析.pptx
《第十 典型相关分析.pptx》由会员分享,可在线阅读,更多相关《第十 典型相关分析.pptx(51页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2023/3/281 在解决实际问题中,这种方法有广泛的应用。如,在工厂里常常要研究产品的 q个质量指标 和 p 个原材料指标 的相关关系。当然可以用最原始的方法,分别计算两组变量之间的全部相关系数,一共有p*qp*q个简单相关系数,这样又烦琐又不能抓住问题的本质。如果能够采用类似于主成分的思想,分别找出两组变量的各自的某个线性组合,讨论线性组合之间的相关关系,则更简捷。The canonical correlation analysis-CCA第1页/共51页2023/3/282With canonical correlation,we are working with two sets o
2、f variable(e.g.,we might have one set of variables measuring the personality characteristics of high school students and another set of variables measuring their vocational interests).In canonical correlation,we are also trying to re-express and simplify the data.Our goal is to find two linear combi
3、nations of the original variables-one combination from the first set variables and one combination from the second(called canonical variables)-that exhibit the largest possible covariance.From James etcAnalyzing Multivariate Data第2页/共51页2023/3/283From James.Analyzing Multivariate DataIn principal co
4、mponents analysis(PCA),we found that a small number of components could account for much of the variance(i.e.,information)in the entire data set.With canonical correlation,we will find that a few pairs of canonical variates can account for much of the interdependence between two sets of variables.第3
5、页/共51页2023/3/284例:家庭特征与家庭消费之间的关系 为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量:分析两组变量之间的关系。The canonical correlation analysis-CCA第4页/共51页2023/3/285X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00变量间的相关系数矩阵The canonical correlation analys
6、is-CCA第5页/共51页2023/3/286y2y3y1x2x1The canonical correlation analysis-CCA第6页/共51页2023/3/287 典型相关分析的典型相关分析的思想思想:首先分别在每组变量中找出第一对线性组合,使其具有最大相关性,The canonical correlation analysis-CCA第7页/共51页2023/3/288 然后再在每组变量中找出第二对线性组合,使其分别与本组内的第一线性组合不相关,第二对线性组合本身具有次大的相关性。既:u2和v2与u1和v1相互独立,但u2和v2有次大相关性。如此继续下去,直至进行到r步,两
7、组变量的相关性被提取完为止。r min(p,q),可以得到r组变量。The canonical correlation analysis-CCA第8页/共51页2023/3/28910.2 典型相关的数学描述典型相关的数学描述 考虑两组变量的向量 其协方差阵为 其中 1111是第一组变量的协方差矩阵;2222是第二组变量的协方差矩阵;是X X和Y Y的其协方差矩阵。矩阵的分块The canonical correlation analysis-CCA第9页/共51页2023/3/2810 如果我们记两组变量的第一对线性组合为:其中:所以,典型相关分析就是求a a1 1和b b1 1,使 uvu
8、v达到最大。想一想如何求?The canonical correlation analysis-CCA第10页/共51页2023/3/281110.3 10.3 总体总体的典型的典型相关系数相关系数和典型变量和典型变量 在约束条件:下,求a a1 1和b b1 1,使 uvuv达到最大。令The canonical correlation analysis-CCA第11页/共51页2023/3/2812 根据数学分析中条件极值的求法,引入LagrangeLagrange乘数,求极值问题,则可以转化为求 的极大值,其中 和 是 LagrangeLagrange乘数。The canonical c
9、orrelation analysis-CCA不含不含第12页/共51页2023/3/2813将上面的3 3式分别左乘 和 The canonical correlation analysis-CCA注意到第13页/共51页2023/3/2814将 左乘(3 3)的第二式,得 并将第一式代入,得 的特征根是 ,相应的特征向量为等于单位阵特征根定义The canonical correlation analysis-CCA第14页/共51页2023/3/2815将 左乘(3 3)的第一式,并将第二式代入,得 的特征根是 ,相应的特征向量为回顾特征根定义令The canonical correla
10、tion analysis-CCA第15页/共51页2023/3/2816 结论:既是A A又是B B的特征根,和 是相应于A A和B B的特征向量。至此,典型相关分析转化为求A A和B B特征根和特征向量的问题。第一对典型变量提取了原始变量X X与Y Y之间相关的主要部分,如果这部分还不能足以解释原始变量,可以在剩余的相关中再求出第二对典型变量和他们的典型相关系数。The canonical correlation analysis-CCA第16页/共51页2023/3/2817 在剩余的相关中再求出第二对典型变量和他们的典型相关系数。设第二对典型变量为:在约束条件:求使 达到最大的 和 。
11、独立性The canonical correlation analysis-CCA第17页/共51页2023/3/2818例:家庭特征与家庭消费之间的关系 为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量:分析两组变量之间的关系。The canonical correlation analysis-CCA第18页/共51页2023/3/2819X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.3
12、51.00变量间的相关系数矩阵The canonical correlation analysis-CCA第19页/共51页2023/3/2820典型相关分析典型相关系数调整典型相关系数近似方差典型相关系数的平方10.6879480.6878480.0052680.47327220.1868650.1866380.0096510.034919The canonical correlation analysis-CCA第20页/共51页2023/3/2821X X组典型变量的系数U1U2X1(就餐)0.7689-1.4787X2(电影)0.27211.6443Y Y组典型变量的系数V1V2Y1(
13、年龄)0.04911.0003Y2(收入)0.8975-0.5837Y3(文化)0.19000.2956第21页/共51页2023/3/2822典型变量的性质1 1、同一组的典型变量之间互不相关 X组的典型变量之间是相互独立的:Y组的典型变量之间是相互独立的:因为特征向量之间是正交的。故注意正交与独立的关系The canonical correlation analysis-CCA第22页/共51页2023/3/28232 2、不同组的典型变量之间相关性 不同组内一对典型变量之间的相关系数为:同对则协方差为 i,不同对则为零。The canonical correlation analysis
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十 典型相关分析 典型 相关 分析
限制150内