典型相关部分优秀课件.ppt
《典型相关部分优秀课件.ppt》由会员分享,可在线阅读,更多相关《典型相关部分优秀课件.ppt(50页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、典型相关部分第1页,本讲稿共50页典型相关分析概述 在一元统计分析中,研究两个随机变量之间的线性相关关系,可用相关系数(成为简单相关系数);研究一个随机变量与一组随机变量之间的线性相关关系,可用复相关系数(称为全相关系数);那么研究两组随机变量之间的线性相关关系呢?典型相关分析是研究两组变量之间相关关系的一种统计分析方法,它能够有效地揭示两组变量之间的相互线性依赖关系,是由Hotelling首先提出的。第2页,本讲稿共50页 在实际应用中,两组变量之间具有相关关系的问题很多。例如:几种主要产品如猪肉、牛肉和鸡蛋的价格(作为第一组变量)和相应这些产品的销售量(作为第二组变量)有相关关系;投资性变
2、量(如劳动者人数、货物周转量、生产建设投资等)与国民收入变量(如工农业国民收入、运输业国民收入、建筑业国民收入等)具有相关关系。第3页,本讲稿共50页 设两组变量 和 ,要研究两组变量的相关关系,一种方法是分别研究 和 之间的相关关系,然后列出相关系数表进行分析,当两组变量较多时,这一做法不仅繁琐,也不易抓住问题的实际;另一种方法采用类似主成分分析的做法,在每一组变量中都选择若干个有代表性的综合指标(变量的线性组合),要求它们之间具有最大相关性,通过研究两组的综合指标之间的关系来反映两组变量之间的相关关系,这种方法就是典型相关分析方法。第4页,本讲稿共50页典型相关分析的基本思想 首先在每组变
3、量中找出变量的线性组合,使其具有最大的相关性,然后再在每组变量中找出第二对线性组合,使其分别于第一对线性组合不相关,而第二对本身具有最大的相关性,如此继续下去,直到两组变量之间的相关性被提取完毕为止。有了这样线性组合的最大相关,则讨论两组变量之间的相关,就转化为只研究这些线性组合的最大相关,从而减少研究变量的个数。第5页,本讲稿共50页总体典型相关 设 和 是两组随机变量,且 ,即有 其中 。典型相关分析需要研究x的线性组合 和 之间的相关关系,其中 和 第6页,本讲稿共50页 现在来计算u与v的相关系数所以,u与v的相关系数第7页,本讲稿共50页 由于对任意非零常数 和 ,有因此,为避免不必
4、要的结果重复,常常限定u与v均为标准化的变量,即附加约束条件也就是第8页,本讲稿共50页于是,我们的问题归结为在上述约束条件下,求 和 ,使得 达到最大。设m为 的秩,则可证明 、秩均为m,且都具有相同的非零特征值 ,而为 相应于 的特征向量,为 相应于 的特征向量。第9页,本讲稿共50页取 ,可知 达到最大值,故称 为第一对典型相关变量第一对典型相关变量,称 为第一个典型第一个典型相关系数相关系数。第一对典型相关变量 提取了原始变量x与y之间相关的主要部分,如果这一部分还显得不够,可以在剩余相关中再求出第二对典型相关变量 ,且 ,,以此类推,取第k对典型相关变量为且 。第10页,本讲稿共50
5、页典型相关变量的性质1.同一组的典型变量互不相关 设x,y的第i对典型变量为 ,则有表明由x组成的第一组典型变量 互不相关,且均有相同的方差1;同样,由y组成的第二组典型变量 也互不相关,且也均有相同方差1第11页,本讲稿共50页2.不同组的典型变量之间的相关性表明不同组的任意两个典型变量,当 时,相关系数为 ;当 时是彼此不相关的。第12页,本讲稿共50页 记 ,则上述性质可用矩阵表示为或其中 。第13页,本讲稿共50页3.原始变量与典型变量之间的相关系数 记 第14页,本讲稿共50页第15页,本讲稿共50页所以,有第16页,本讲稿共50页且第17页,本讲稿共50页4.简单相关、复相关和典型
6、相关之间的关系 当p=q=1时,x与y之间的(惟一)典型相关就是它们之间的简单相关;当p=1或q=1时,x与y之间的(惟一)典型相关就是它们之间的复相关。因此,复相关是典型相关的一个特例,而简单相关是复相关的一个特例。第18页,本讲稿共50页 从第一个典型相关的定义可以看出,第一个典型相关系数至少同x(同y)的任一分量与y(或x)的复相关系数一样大,即使这些复相关系数都很小,第一个典型相关系数仍可能很大。、同样,从复相关的定义也可以看出,当p=1(或q=1)时,x(或y)与y(或x)之间的复相关系数也不会小于x(或y)与y(或x)的任一分量之间的相关系数,即使所有这些相关系数都很小,复相关系数
7、仍可能很大。第19页,本讲稿共50页从相关矩阵出发计算典型相关 有时,x和y的各分量的单位不全相同,我们希望在对各分量作标准化变换之后再作典型相关分析。记 ,为 的相关矩阵。第20页,本讲稿共50页对x和y的各分量作标准化变换,即令现在来求 和 的典型相关变量 。第21页,本讲稿共50页于是,由矩阵 和 具有相同的非零特征值 ,且 分别为 相应于 的特征向量,而 分别为 相应于 的特征向量,则 为 和 的第i对典型变量,他们的第i个典型相关系数仍为 ,其中 ,为x和y的第i对典型系数。由此可见,典型相关系数在标准化变换下具有不变性,这一点与主成分分析有所不同。第22页,本讲稿共50页 和 的第
8、i对典型变量 具有零均值,且与x和y的第i对典型变量 只相差一个常数。这是因为及第23页,本讲稿共50页样本典型相关 在实际应用中,的协方差矩阵或相关矩阵 一般是未知的,应根据样本来进行估计。第24页,本讲稿共50页设数据矩阵为第25页,本讲稿共50页则样本协方差矩阵为式中第26页,本讲稿共50页第27页,本讲稿共50页S可用来作为 的估计。当np+q时,在一般情况下,S是正定矩阵,故一般可认为 ,存在。和 可分别作为和 的估计;它们的非零特征值 可用来估计 ;相应的特征向量 作为 的估计,作为 的估计。的正平方根 称为样本的第j个典型相关系数,和 称为样本的第j对典型相关变量,。第28页,本
9、讲稿共50页将样本 经中心化后代入m对典型变量,即令 ,则称 为第i个样品 的第j个样本典型变量值,称 为第i个样品 的第j个样本典型变量值。由约束条件 可得 同理第29页,本讲稿共50页对每个j,可画出 的散点图,该图也可用来检查是否有异常值出现。第30页,本讲稿共50页典型相关系数的显著性检验 设 。又设S为样本协方差矩阵,且np+q。1.全部总体典型相关系数均为零的检验 考虑假设检验问题:其中 。若检验接受 ,则认为讨论两组变量之间的相关性没有意义;若检验拒绝 ,则认为第一对典型变量是显著的。第31页,本讲稿共50页上述假设检验实际上等价于假设检验问题 成立表明x与y互不相关。似然比检验
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 典型 相关 部分 优秀 课件
限制150内