典型相关分析因子分析PPT讲稿.ppt
《典型相关分析因子分析PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《典型相关分析因子分析PPT讲稿.ppt(65页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、典型相关分析因子分析1第1页,共65页,编辑于2022年,星期五要 点o典型相关分析的数学表达方式,假定条件;o典型相关系数的数学含义;o典型变量系数的数学含义;o简单相关,复相关和典型相关的意义;o典型相关的应用2第2页,共65页,编辑于2022年,星期五 一、什么是典型相关分析及基本思想一、什么是典型相关分析及基本思想 通常情况下,为了研究两组变量 的相关关系,可以用最原始的方法,分别计算两组变量之间的全部相关系数,一共有pq个简单相关系数,这样又烦琐又不能抓住问题的本质。如果能够采用类似于主成分的思想,分别找出两组变量的各自的某个线性组合,讨论线性组合之间的相关关系,则更简捷。第3页,共
2、65页,编辑于2022年,星期五 在解决实际问题中,这种方法有广泛的应用。如,在 工 厂 里 常 常 要 研 究 产 品 的q个 质 量 指 标 和p个原材料的指标 之间的相关关系;也可以是采用典型相关分析来解决的问题。如果能够采用类似于主成分的思想,分别找出两组变量的线性组合既可以使变量个数简化,又可以达到分析相关性的目的。第4页,共65页,编辑于2022年,星期五例 家庭特征与家庭消费之间的关系 为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量:分析两组变量之间的关系。第5页,共65页,编辑于2022年,星期五X1X2y1y2y3X11.000.800.260.67
3、0.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00变量间的相关系数矩阵第6页,共65页,编辑于2022年,星期五y2y3y1x2x1第7页,共65页,编辑于2022年,星期五 典型相关分析的思想:首先分别在每组变量中找出第一对线性组合,使其具有最大相关性,第8页,共65页,编辑于2022年,星期五然后再在每组变量中找出第二对线性组合,使其分别与本组内的第一线性组合不相关,第二对本身具有次大的相关性。u2和v2与u1和v1相互独立,但u2和v2相关。如此继续下去,
4、直至进行到r步,两组变量的相关性被提取完为止。rmin(p,q),可以得到r组变量。9第9页,共65页,编辑于2022年,星期五二、典型相关的数学描述典型相关的数学描述 考虑两组变量的向量 其协方差阵为(一)想法 其中11是第一组变量的协方差矩阵;22是第二组变量的协方差矩阵;是X和Y的其协方差矩阵。第10页,共65页,编辑于2022年,星期五 如果我们记两组变量的第一对线性组合为:其中:所以,典型相关分析就是求 1和b b1,使uv达到最大。第11页,共65页,编辑于2022年,星期五(二)典型相关系数和典型变量的求法 在约束条件:下,求a a1 1和和b b1 1,使uv达到最大。令第12
5、页,共65页,编辑于2022年,星期五利用柯西不等式有(参看1.8.4式)13第13页,共65页,编辑于2022年,星期五记m为 12的秩,则记为相应的特征向量为其余的零特征根对应的向量为14第14页,共65页,编辑于2022年,星期五由特征向量可以构成一个正交矩阵T,有,有15第15页,共65页,编辑于2022年,星期五 若取则16第16页,共65页,编辑于2022年,星期五相应的特征向量为 a1和和b1分别构成了第一组变量和第二组变量的分别构成了第一组变量和第二组变量的第一对典型变量的系数。第一对典型变量的系数。17第17页,共65页,编辑于2022年,星期五 第一对典型相关变量提取了原始
6、变量x组和y组之间相关的主要部分,那么这部分的信息不够,则还可以在剩余相关中提取第二对典型变量:在以下的约束条件下:18第18页,共65页,编辑于2022年,星期五 求令则,约束条件等价于19第19页,共65页,编辑于2022年,星期五20第20页,共65页,编辑于2022年,星期五 当取这时uk和vk达到最大值k,称它为第k个典型相关系数,称ak和bk为第k对典型变量系数。21第21页,共65页,编辑于2022年,星期五相应的特征向量为 ak和和bk分别构成了第一组变量和第二组变量的分别构成了第一组变量和第二组变量的第第k对典型变量的系数。对典型变量的系数。22第22页,共65页,编辑于20
7、22年,星期五注有相同的特征根,而可以验证:根据线性代数的思想,下列矩阵23第23页,共65页,编辑于2022年,星期五方法二方法二 根据数学分析中条件极值的求法,引入Lagrange乘数,求极值问题,则可以转化为求 的极大值,其中和是 Lagrange乘数。24第24页,共65页,编辑于2022年,星期五将上面的3式分别左乘和第25页,共65页,编辑于2022年,星期五将左乘(3)的第二式,得并将第一式代入,得 的特征根是 ,相应的特征向量为第26页,共65页,编辑于2022年,星期五将左乘(3)的第一式,并将第二式代入,得 的特征根是 ,相应的特征向量为第27页,共65页,编辑于2022年
8、,星期五结论:既是M1又是M2的特征根,和是相应于M1和M2的特征向量。至此,典型相关分析转化为求M1和M2特征根和特征向量的问题。第一对典型变量提取了原始变量X与Y之间相关的主要部分,如果这部分还不能足以解释原始变量,可以在剩余的相关中再求出第二对典型变量和他们的典型相关系数。第28页,共65页,编辑于2022年,星期五 在剩余的相关中再求出第二对典型变量和他们的典型相关系数。设第二对典型变量为:在约束条件:求使达到最大的和。第29页,共65页,编辑于2022年,星期五例 家庭特征与家庭消费之间的关系 为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量:分析两组变量之间
9、的关系。30第30页,共65页,编辑于2022年,星期五X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00变量间的相关系数矩阵31第31页,共65页,编辑于2022年,星期五典型相关分析典型相关分析典型相典型相关系数关系数调整典型调整典型相关系数相关系数近似方差近似方差典型相关系典型相关系数的平方数的平方10.6879480.6878480.0052680.47327220.1868650.1866380.
10、0096510.034919第32页,共65页,编辑于2022年,星期五X组典型变量的系数U1U2X1(就餐)0.7689-1.4787X2(电影)0.27211.6443Y组典型变量的系数V1V2Y1(年龄)0.04911.0003Y2(收入)0.8975-0.5837Y3(文化)0.19000.2956第33页,共65页,编辑于2022年,星期五三、典型变量的性质1、同一组的典型变量之间互不相关 X组的典型变量之间是相互独立的:组的典型变量之间是相互独立的:Y组的典型变量之间是相互独立的:组的典型变量之间是相互独立的:因为特征向量之间是正交的。故第34页,共65页,编辑于2022年,星期五
11、2、不同组的典型变量之间相关性 不同组内一对典型变量之间的相关系数为:第35页,共65页,编辑于2022年,星期五同对则协方差为i,不同对则为零。36第36页,共65页,编辑于2022年,星期五3、原始变量与典型变量之间的相关系数原始变量相关系数矩阵 X X典型变量系数矩阵第37页,共65页,编辑于2022年,星期五y典型变量系数矩阵第38页,共65页,编辑于2022年,星期五第39页,共65页,编辑于2022年,星期五40第40页,共65页,编辑于2022年,星期五第41页,共65页,编辑于2022年,星期五42第42页,共65页,编辑于2022年,星期五例 家庭特征与家庭消费之间的关系 为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 典型 相关 分析 因子分析 PPT 讲稿
限制150内