欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    第10章 典型相关分析.ppt

    • 资源ID:68597724       资源大小:1.70MB        全文页数:117页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第10章 典型相关分析.ppt

    第十章第十章典型相关分析典型相关分析CanonicalCorrelationAnalysis 1.两个随机变量两个随机变量Y与与X简单相关系数简单相关系数2.一个随机变量一个随机变量Y与一组随机变量与一组随机变量X1,X2,Xp多重相关多重相关(复相关系数复相关系数)3.一组随机变量一组随机变量Y1,Y2,Yq与另一组随机变量与另一组随机变量X1,X2,Xp典型相关系数典型相关系数何时采用典型相关分析何时采用典型相关分析 典型相关是简单相关、多重相关的推广;典型相关是简单相关、多重相关的推广;或者说简单相关系数、复相关系数是典型相关或者说简单相关系数、复相关系数是典型相关系数的特例。系数的特例。典型相关典型相关是研究是研究两组变两组变量之间量之间相关性的一种统计分析相关性的一种统计分析方法方法.也是一种降维技术也是一种降维技术.由由Hotelling(1935,1936)最早提最早提出,出,CooleyandLohnes(1971)、Kshirsagar(1972)和和Mardia,Kent,andBibby(1979)推动了它的应用。推动了它的应用。vv什么是典型相关分析?什么是典型相关分析?vv典型相关分析是研究两组变量之间相典型相关分析是研究两组变量之间相关关系的一种多元统计分析方法它关关系的一种多元统计分析方法它借用借用主成分分析降维的思想主成分分析降维的思想,分别对两组变量,分别对两组变量提取主成分,且使两组变量提取的主成分提取主成分,且使两组变量提取的主成分之间的相关程度达到最大,而从同一组内之间的相关程度达到最大,而从同一组内部提取的各主成分之间互不相关,用从两部提取的各主成分之间互不相关,用从两组之间分别提取的主成分的相关性来描述组之间分别提取的主成分的相关性来描述两组变量整体的线性相关关系两组变量整体的线性相关关系典型相关关系研究两组变量之间整体的线典型相关关系研究两组变量之间整体的线性相关关系,它是将每一组变量作为一个性相关关系,它是将每一组变量作为一个整体来进行研究而不是分析每一组变量内整体来进行研究而不是分析每一组变量内部的各个变量所研究的两组变量可以是部的各个变量所研究的两组变量可以是一组为自变量,而另一组变量为因变量;一组为自变量,而另一组变量为因变量;两组变量也可以是同等的地位,但典型相两组变量也可以是同等的地位,但典型相关关系要求两组变量都至少是间隔尺度关关系要求两组变量都至少是间隔尺度 通常情况下,为了研究两组变量通常情况下,为了研究两组变量的的相相关关关关系系,可可以以用用最最原原始始的的方方法法,分分别别计计算算两两组组变变量量之之间间的的全全部部相相关关系系数数,一一共共有有pq个个简简单单相相关关系系数数,这这样样又又烦烦琐琐又又不不能能抓抓住住问问题题的的本本质质。如如果果能能够够采采用用类类似似于于主主成成分分的的思思想想,分分别别找找出出两两组组变变量量的的各各自自的的某某个个线线性性组组合合,讨讨论论线线性性组组合合之之间间的的相相关关关关系系,则则更更简简捷。捷。在在解解决决实实际际问问题题中中,这这种种方方法法有有广广泛泛的的应应用用。如如,在在工工厂厂里里常常常常要要研研究究产产品品的的q个个质质量量指指标标和和p个原材料的指个原材料的指标标之之间间的的相相关关关关系系;也也可可以以是是采采用用典典型型相相关关分分析析来来解解决决的的问问题题。如如果果能能够够采采用用类类似似于于主主成成分分的的思思想想,分分别别找找出出两两组组变变量量的的线线性性组组合合既既可可以以使使变量个数简化,又可以达到分析相关性的目的。变量个数简化,又可以达到分析相关性的目的。例例 家庭特征与家庭消费之间的关系家庭特征与家庭消费之间的关系 为了了解家庭的特征与其消费模式之间的关系。为了了解家庭的特征与其消费模式之间的关系。为了了解家庭的特征与其消费模式之间的关系。为了了解家庭的特征与其消费模式之间的关系。调查了调查了调查了调查了7070个家庭的下面两组变量:个家庭的下面两组变量:个家庭的下面两组变量:个家庭的下面两组变量:分析两组变量之间的关系。分析两组变量之间的关系。分析两组变量之间的关系。分析两组变量之间的关系。X1X2Y1Y2Y3X11.000.800.260.670.34X20.801.000.330.590.34Y10.260.331.000.370.21Y20.670.590.371.000.35Y30.340.340.210.351.00变量间的相关系数矩阵变量间的相关系数矩阵Y2Y3Y1X2X1 典型相关分析的思想:典型相关分析的思想:首先分别在每组变量中找出第一对线性组首先分别在每组变量中找出第一对线性组合,使其具有最大相关性,合,使其具有最大相关性,然后再在每组变量中找出第二对线性组然后再在每组变量中找出第二对线性组合,使其分别与本组内的第一线性组合不相合,使其分别与本组内的第一线性组合不相关,第二对本身具有次大的相关性。关,第二对本身具有次大的相关性。V2和和W2与与V1和和W1相互独立相互独立,但但V2和和W2相关相关.如如此继续下去此继续下去,直至进行到直至进行到r 步步,两组变量的相关性两组变量的相关性被提取完为止被提取完为止.R min(p,q),可以得到可以得到r 组变量组变量.典型相关的数学描述典型相关的数学描述一般地一般地,假设有一组变量假设有一组变量X1,Xp与与Y1,Yq,我们我们要研究这两组变量的相关关系要研究这两组变量的相关关系,如何给两组变量之间的如何给两组变量之间的相关性以数量的描述相关性以数量的描述?当当p p=q q=1=1时时,就是研究两个变量就是研究两个变量X 与与Y 之间的相关关系之间的相关关系.相关系数就是最常见的度量相关系数就是最常见的度量,其定义为其定义为当当p p1,1,q q=1(=1(或或或或 q q1,1,p p=1)=1)时时,p维随机向量维随机向量设设则称则称为为Y与与X1,Xp的的全相关系数全相关系数全相关系数全相关系数,全相关系数用于度量一个随机变全相关系数用于度量一个随机变量量Y与一组随机向量与一组随机向量X1,Xp的相关关系的相关关系.当当p p,q q 11时时,利用主成分分析的思想利用主成分分析的思想,可以把多个变量与多可以把多个变量与多个变量之间的相关化为两个新的综合变量之间的相关个变量之间的相关化为两个新的综合变量之间的相关.也就是也就是求求和和,使得新的综合变量使得新的综合变量和和之间有最大可能的相关之间有最大可能的相关,基于这个思想就产生了典型相关分析基于这个思想就产生了典型相关分析.10.1总体典型相关总体典型相关设设及及为随机向量为随机向量,我们用我们用X 和和Y 的线性组合的线性组合和和之间的相关性来研究两组随机变量之间的相关性来研究两组随机变量X 和和Y 之间的相关性之间的相关性.我们希望找到我们希望找到 和和 ,使使最大最大.由相关系数的定义由相关系数的定义易得出对任意的常数易得出对任意的常数e,f,c和和d,均有均有这说明使得相关系数最大的这说明使得相关系数最大的并不唯一并不唯一.故求综合变量故求综合变量常限定常限定,.于是有以下定于是有以下定义义.定义定义定义定义10.1.110.1.1设设p+q 维随机维随机向量向量的均值向量为的均值向量为0,协方差阵协方差阵 0(不妨设不妨设pq).如果如果存在存在和和使得使得则称则称是是X,Y的的第一组第一组第一组第一组(对对对对)典型相关变量典型相关变量典型相关变量典型相关变量,它们之间的它们之间的相相关系数称为关系数称为第一个典型相关系数第一个典型相关系数第一个典型相关系数第一个典型相关系数.则称则称是是X,Y的的第第第第 k k 组组组组(对对对对)典型相关变量典型相关变量典型相关变量典型相关变量,它们之间的它们之间的相相关系数称为关系数称为第第第第 k k 个典型相关系数个典型相关系数个典型相关系数个典型相关系数(k=2,p).如果存在如果存在使得使得典型相关变量的解法典型相关变量的解法设随机向量设随机向量其中其中(不妨设不妨设pq);E(Z)=0;以及以及D(Z)=1.1.第一对典型相关变量的求法第一对典型相关变量的求法第一对典型相关变量的求法第一对典型相关变量的求法令令则则V,W 的相关系数的相关系数求第一对典型相关变量就等价于求求第一对典型相关变量就等价于求和和使使用拉格朗日乘子法用拉格朗日乘子法,令令(其中其中 1和和 2为拉格朗日乘为拉格朗日乘子子)为求为求 的极大值的极大值,对上式分别关于对上式分别关于 ,求偏导求偏导,并令其为零并令其为零,得得(10.1.(10.1.1)1)再分别用再分别用左乘方程左乘方程(10.1.1)def 得得则方程组则方程组(10.1.1)等价于等价于(10.1.(10.1.2)2)则方程组则方程组(10.1.2)有非零解的充要条件是有非零解的充要条件是(10.1.3)该方程的左端是该方程的左端是 的的p+q次多项式次多项式.求解求解 的高次方程的高次方程(10.1.3),把求得的最大的把求得的最大的 代回方程组代回方程组(10.1.2),再求得再求得 和和 ,从而得出从而得出第一对典型相关变量第一对典型相关变量.具体计算时具体计算时,因因 的高次方程的高次方程(10.1.3)不易解不易解;将其代入方程将其代入方程组组(10.1.2)后还需求解后还需求解(p+q)阶方程阶方程.为了计算上的简便为了计算上的简便,常作以下常作以下变换变换:用用 12 22-1左乘方程组左乘方程组(10.1.2)的第二的第二项项,得得()将上将上()式代入方程组式代入方程组(10.1.2)得第一式得第一式得得:即即再用再用 11-1左乘上式得左乘上式得:的特征根的特征根是是 ,相应的特征向,相应的特征向量为量为将将左乘左乘(10.1.2)的第一式的第一式,并将第二式代入并将第二式代入,得得()再用再用 22-1左乘左乘()式得式得:的特征根的特征根是是 ,相应的特征向,相应的特征向量为量为故求解方程故求解方程(10.1.3)等价于求解方程组等价于求解方程组(10.1.4):(10.1.4)由于由于 110,220,故故 11-10,22-10.结结结结论论论论:2 2既既既既是是是是MM1 1又又又又是是是是MM2 2的的的的特特特特征征征征根根根根,和和和和 是是是是相相相相应应应应于于于于MM1 1和和和和MM2 2的特征向量。的特征向量。的特征向量。的特征向量。至此,典型相关分析转化为求至此,典型相关分析转化为求M1和和M2特特征根和特征向量的问题。征根和特征向量的问题。第第一一对对典典型型变变量量提提取取了了原原始始变变量量X与与Y之之间间相相关关的的主主要要部部分分,如如果果这这部部分分还还不不能能足足以以解解释释原原始始变变量量,可可以以在在剩剩余余的的相相关关中中再再求求出出第第二二对典型变量和他们的典型相关系数。对典型变量和他们的典型相关系数。在剩余的相关中再求出第二对典型变量和他们的典型相关系在剩余的相关中再求出第二对典型变量和他们的典型相关系数数.设第二对典型变量为:设第二对典型变量为:求第二对典型相关变量就等价于求求第二对典型相关变量就等价于求 2和和 2,使使2.2.典型相关变量的一般求法典型相关变量的一般求法典型相关变量的一般求法典型相关变量的一般求法定理定理定理定理10.1.110.1.1设设(不妨设不妨设pq);E(Z)=0,D(Z)=,其中其中记记并设并设p 阶方阵阶方阵的特征值依次为的特征值依次为而而l1,lp为为相应的单位正交特征向量相应的单位正交特征向量.令令为为X 和和Y 的第的第k 对典型相关变量对典型相关变量.k为第为第k个典型相关系数个典型相关系数.例例 家庭特征与家庭消费之间的关系家庭特征与家庭消费之间的关系 为了了解家庭的特征与其消费模式之间的关系。为了了解家庭的特征与其消费模式之间的关系。调查了调查了70个家庭的下面两组变量:个家庭的下面两组变量:分析两组变量之间的关系。分析两组变量之间的关系。X1X2Y1Y2Y3X11.000.800.260.670.34X20.801.000.330.590.34Y10.260.331.000.370.21Y20.670.590.371.000.35Y30.340.340.210.351.00变量间的相关系数矩阵变量间的相关系数矩阵典型相关分析典型相关分析典型相典型相关系数关系数调整典型调整典型相关系数相关系数近似方差近似方差典型相关系典型相关系数的平方数的平方10.6879480.6878480.0052680.47327220.1868650.1866380.0096510.034919X组典型变量的系数组典型变量的系数V1V2X1(就餐)就餐)0.76890.7689-1.4787X2(电影电影)0.27211.64431.6443Y组典型变量的系数组典型变量的系数W1W2Y1(年龄年龄)0.04911.00031.0003Y2(收入收入)0.89750.8975-0.5837Y3(文化文化)0.19000.2956典型变量的性质典型变量的性质1、同一组的典型变量之间互不相关、同一组的典型变量之间互不相关因为特征向量之间是正交的因为特征向量之间是正交的.故故X X组的典型变量之间是相互独立的:组的典型变量之间是相互独立的:组的典型变量之间是相互独立的:组的典型变量之间是相互独立的:Y Y组的典型变量之间是相互独立的:组的典型变量之间是相互独立的:组的典型变量之间是相互独立的:组的典型变量之间是相互独立的:2、不同组的典型变量之间相关性、不同组的典型变量之间相关性不同组内一对典型变量之间的相关系数为不同组内一对典型变量之间的相关系数为同对则协方差为同对则协方差为,不同对则为零。,不同对则为零。3、Vi,Wi 的均值为的均值为0,方差为方差为1.例例 家庭特征与家庭消费之间的关系家庭特征与家庭消费之间的关系 为了了解家庭的特征与其消费模式之间的关系。为了了解家庭的特征与其消费模式之间的关系。调查了调查了70个家庭的下面两组变量:个家庭的下面两组变量:分析两组变量之间的关系。分析两组变量之间的关系。X1X2Y1Y2Y3X11.000.800.260.670.34X20.801.000.330.590.34Y10.260.331.000.370.21Y20.670.590.371.000.35Y30.340.340.210.351.00变量间的相关系数矩阵变量间的相关系数矩阵典型相关分析典型相关分析典型相典型相关系数关系数调整典型调整典型相关系数相关系数近似方差近似方差典型相关系典型相关系数的平方数的平方10.6879480.6878480.0052680.47327220.1868650.1866380.0096510.034919X组典型变量的系数组典型变量的系数V1V2X1(就餐)就餐)0.76890.7689-1.4787X2(电影电影)0.27211.64431.6443Y组典型变量的系数组典型变量的系数W1W2Y1(年龄年龄)0.04911.00031.0003Y2(收入收入)0.89750.8975-0.5837Y3(文化文化)0.19000.2956典型变量的结构(相关系数)典型变量的结构(相关系数)V1V2X10.9866-0.1632X20.88720.4614W1W2Y10.42110.8464Y20.9822-0.1101Y30.51450.3013典型变量的结构(相关系数)典型变量的结构(相关系数)W1W2X10.6787-0.0305X20.61040.0862V1V2Y10.28970.1582Y20.6757-0.0206Y30.35390.0563 两个反映消费的指标与第一对典型变量中两个反映消费的指标与第一对典型变量中V1的相关系数分别为的相关系数分别为0.9866和和0.8872,可以看出,可以看出V1可以作为消费特性的指标,第一对典型变量可以作为消费特性的指标,第一对典型变量中中V1与与Y2之间的相关系数为之间的相关系数为0.9822,可见典型,可见典型变量变量V1主要代表了了家庭收入,主要代表了了家庭收入,V1和和W1的相的相关系数为关系数为0.6879,这就说明家庭的消费与一个,这就说明家庭的消费与一个家庭的收入之间其关系是很密切的;家庭的收入之间其关系是很密切的;第二对典型变量中第二对典型变量中V2与与X2的相关系数为的相关系数为0.4614,可以看出,可以看出V2可以作为文化消费特性的可以作为文化消费特性的指标,第二对典型变量中指标,第二对典型变量中W2与与Y1和和Y3之间的之间的分别相关系数为分别相关系数为0.8464和和0.3013,可见典型变,可见典型变量量W2主要代表了家庭成员的年龄特征和教育主要代表了家庭成员的年龄特征和教育程度,程度,V2和和W2的相关系数为的相关系数为0.1869,说明文,说明文化消费与年龄和受教育程度之间的有关。化消费与年龄和受教育程度之间的有关。求解典型相关系数的步骤求解典型相关系数的步骤1.求求X,Y 变量组的相关阵变量组的相关阵R=2.求矩阵求矩阵A、B3.4.可以证明可以证明A、B有相同的非零特征根有相同的非零特征根5.3.求求A或或B的的i(相关平方相关平方)与与Cov(Vi,Wi),i1,m6.4.求求A、B关于关于i的特征根向量即变量系数的特征根向量即变量系数典型相关系数计算实例典型相关系数计算实例已知已知X、Y的相关阵的相关阵R=试求试求X、Y 的典型相关变量和典型相关系数的典型相关变量和典型相关系数.Cov(X)R11Cov(Y)R22Cov(Y,X)R21Cov(X,Y)R121.求矩阵求矩阵A、BA(66)矩阵矩阵0.5298 0.5298 0.5298 0.5298 0.4586 0.4586 0.4586 0.4586 0.3053 0.3053 0.3053 0.3053 0.3986 0.3986 0.3986 0.3986-0.2919-0.2919-0.2919-0.2919-0.1778-0.1778-0.1778-0.1778-0.0912-0.0912-0.0912-0.0912-0.0701-0.0701-0.0701-0.0701-0.1669-0.1669-0.1669-0.1669-0.1939-0.1939-0.1939-0.1939-0.0007-0.0007-0.0007-0.0007-0.0168-0.0168-0.0168-0.0168 0.2274 0.2274 0.2274 0.2274 0.2739 0.2739 0.2739 0.2739 0.5489 0.5489 0.5489 0.5489 0.0840 0.0840 0.0840 0.0840 0.5238 0.5238 0.5238 0.5238 0.4468 0.4468 0.4468 0.4468 0.0966 0.0966 0.0966 0.0966 0.0376 0.0376 0.0376 0.0376 0.0510 0.0510 0.0510 0.0510 0.3877 0.3877 0.3877 0.3877-0.2523-0.2523-0.2523-0.2523-0.1759-0.1759-0.1759-0.1759-0.0915-0.0915-0.0915-0.0915-0.0979-0.0979-0.0979-0.0979-0.0669-0.0669-0.0669-0.0669-0.0377-0.0377-0.0377-0.0377 0.0061 0.0061 0.0061 0.0061-0.0806-0.0806-0.0806-0.0806 0.0949 0.0949 0.0949 0.0949 0.1421 0.1421 0.1421 0.1421 0.1757 0.1757 0.1757 0.1757-0.0210-0.0210-0.0210-0.0210 0.2171 0.2171 0.2171 0.2171 0.3142 0.3142 0.3142 0.3142 B(55)矩阵矩阵0.26110.2611-0.05600.0560-0.03370.0337-0.05510.0551-0.03120.0312-0.00530.0053 0.55720.55720.10090.10090.00340.0034-0.05430.0543-0.06320.0632-0.08430.0843 0.08590.08590.00130.00130.17430.1743-0.11750.1175-0.00070.0007 0.11830.11830.25500.25500.14900.1490-0.10520.1052 0.13900.13900.35310.35310.29120.29120.55730.55732.求矩阵求矩阵A、B的的(相关系数的平方相关系数的平方)A A、B B有相同的非零特征值有相同的非零特征值B矩阵求矩阵求(典型相关系数的平方典型相关系数的平方)0.26110.2611-0.0560-0.0560-0.0337-0.0337-0.0551-0.0551-0.0312-0.0312-0.0053-0.00530.55720.5572-0.10090.10090.00340.0034-0.0543-0.0543-0.0632-0.0632-0.0843-0.08430.08590.0859-0.00130.00130.17430.1743-0.1175-0.1175-0.0007-0.00070.11830.11830.25500.2550-0.14900.1490-0.1052-0.10520.13900.13900.35310.35310.29120.29120.55730.5573-5个个与典型相关系数与典型相关系数10.764320.543630.261140.125650.0220 3.求求A、B关于关于i的变量系数的变量系数(求解第求解第1典型变量系数典型变量系数)求解第求解第2典型变量系数典型变量系数求解第求解第5典型变量系数典型变量系数 5组组(标准化标准化)典型变量系数典型变量系数(X)V V1 1V V2 2V V3 3V V4 4V V5 5X X1 10.5852 0.5852 0.5852 0.5852-1.1443-1.1443-1.1443-1.1443 0.7823 0.7823 0.7823 0.7823 0.0352 0.0352 0.0352 0.0352-0.8298-0.8298-0.8298-0.8298 X X2 2-0.2175-0.2175-0.2175-0.2175 0.0189 0.0189 0.0189 0.0189 0.6032 0.6032 0.6032 0.6032 0.1289 0.1289 0.1289 0.1289 1.5590 1.5590 1.5590 1.5590 X X3 30.5288 0.5288 0.5288 0.5288 1.6213 1.6213 1.6213 1.6213-0.7370-0.7370-0.7370-0.7370-0.4066-0.4066-0.4066-0.4066-1.1704-1.1704-1.1704-1.1704 X X4 40.1890 0.1890 0.1890 0.1890-0.9874-0.9874-0.9874-0.9874-0.7753-0.7753-0.7753-0.7753 0.1229 0.1229 0.1229 0.1229 0.6988 0.6988 0.6988 0.6988 X X5 5-0.1193-0.1193-0.1193-0.1193-0.0626-0.0626-0.0626-0.0626-0.2509-0.2509-0.2509-0.2509-0.5860-0.5860-0.5860-0.5860 1.0488 1.0488 1.0488 1.0488 X X6 60.1948 0.1948 0.1948 0.1948 0.8108 0.8108 0.8108 0.8108 0.1467 0.1467 0.1467 0.1467 0.9523 0.9523 0.9523 0.9523-0.5140-0.5140-0.5140-0.5140 5组组(标准化标准化)典型变量系数典型变量系数(X)由标准化典型变量系数获得原变量由标准化典型变量系数获得原变量X对对应的粗典型变量系数应的粗典型变量系数粗典型变量系数可由标准典型变量系数与粗典型变量系数可由标准典型变量系数与相应的标准差之比获得。相应的标准差之比获得。5组组(标准化标准化)典型变量系数典型变量系数(Y)WW1 1WW2 2WW3 3WW4 4WW5 5Y Y1 1-0.08380.0838-0.13250.13251.08071.08070.37500.3750-0.03760.0376Y Y2 2-0.08780.08781.26881.26880.07010.07010.24760.2476-0.33420.3342Y Y3 30.21470.2147-0.33010.33010.22180.2218-1.08631.08631.41001.4100Y Y4 40.29200.2920-0.23920.2392-0.57650.57651.33681.3368-0.29420.2942Y Y5 50.76070.7607-0.29950.29950.65320.6532-0.00170.0017-0.69050.6905典型相关系数的特点典型相关系数的特点 1.两变量组的变量单位改变两变量组的变量单位改变,典型相关系数不变典型相关系数不变,但典型变量系数改变但典型变量系数改变(无论原变量标准化与无论原变量标准化与否否,获得的典型相关系数不变获得的典型相关系数不变).2.第一对典则相关系数较两组变量间任一个简第一对典则相关系数较两组变量间任一个简单相关系数或复相关系数之绝对值都大单相关系数或复相关系数之绝对值都大,即即R1max(|Cov(Xi,Yj)|)或或R1max(|Cov(X,Yj)|),R1max(|Cov(Xi,Y)|)10.2样本典型相关系数样本典型相关系数 在实际应用中在实际应用中在实际应用中在实际应用中,总体的协方差矩阵常常是未知的总体的协方差矩阵常常是未知的总体的协方差矩阵常常是未知的总体的协方差矩阵常常是未知的,类似于其他的统计分析方法类似于其他的统计分析方法类似于其他的统计分析方法类似于其他的统计分析方法,需要从总体中抽出一个需要从总体中抽出一个需要从总体中抽出一个需要从总体中抽出一个样本样本样本样本,根据样本对总体的协方差或相关系数矩阵进行根据样本对总体的协方差或相关系数矩阵进行根据样本对总体的协方差或相关系数矩阵进行根据样本对总体的协方差或相关系数矩阵进行估计估计估计估计,然后利用估计得到的协方差或相关系数矩阵进然后利用估计得到的协方差或相关系数矩阵进然后利用估计得到的协方差或相关系数矩阵进然后利用估计得到的协方差或相关系数矩阵进行分析行分析行分析行分析.由于估计中抽样误差的存在由于估计中抽样误差的存在由于估计中抽样误差的存在由于估计中抽样误差的存在,所以估计以后所以估计以后所以估计以后所以估计以后还需要进行有关的假设检验还需要进行有关的假设检验还需要进行有关的假设检验还需要进行有关的假设检验.已知总体已知总体Z 的的n 次观测数据为次观测数据为:于是样本数据阵为于是样本数据阵为若假定若假定ZNp+q(,),则协方差阵则协方差阵 的最大似然估计的最大似然估计为为其中其中令令S矩阵也称为样本协方差阵矩阵也称为样本协方差阵.设设,11为为p阶矩阵阶矩阵.将将S相应剖分为相应剖分为显然显然,Sij(i,j=1,2)是是 ij的无偏估计的无偏估计.下面我们将从样本下面我们将从样本协方差阵协方差阵S出发出发,来讨论两组变量间的相关关系来讨论两组变量间的相关关系.一、样本典型相关变量和典型相关系数一、样本典型相关变量和典型相关系数一、样本典型相关变量和典型相关系数一、样本典型相关变量和典型相关系数计算计算 S 的特征根和特征向量的特征根和特征向量求求M1和和M2的特征根的特征根,对应的特征对应的特征向量向量.则特征向量构成典型变则特征向量构成典型变量的系数量的系数,特征根为典型变量相关系数的平方特征根为典型变量相关系数的平方,二、典型相关系数的显著性检验二、典型相关系数的显著性检验二、典型相关系数的显著性检验二、典型相关系数的显著性检验1.全部总体典型相关系数均为全部总体典型相关系数均为02.部分总体典型相关系数为部分总体典型相关系数为0典型相关分析是否恰当典型相关分析是否恰当,应该取决于两组原变量之应该取决于两组原变量之间是否相关间是否相关,如果两组变量之间毫无相关性而言如果两组变量之间毫无相关性而言,则不则不应该作典型相关分析应该作典型相关分析.用样本来估计总体的典型相关系用样本来估计总体的典型相关系数是否有误数是否有误,需要进行检验需要进行检验.(一一)整体检验整体检验检验的统计量:检验的统计量:(似然比统计量似然比统计量)所以,两边同时求行列式,有所以,两边同时求行列式,有事实上事实上 由于由于 所以若所以若M的的特征根为特征根为,则则(I-M)的特的特征根为征根为(1-).根据矩阵行列式与特征根的根据矩阵行列式与特征根的关系关系,可得:可得:在原假设为真的情况下在原假设为真的情况下,检验的统计量检验的统计量 近近似似服服从从自自由由度度为为pq的的 2分分布布.在在给给定定的的显显著著性性水水平平 下下,如如果果 2 2(pq),则则拒拒绝绝原原假假设设,认认为为至至少少有有一一对对典典型型变变量量之之间间的的相相关关性性显显著著.(二二)部分总体典型相关系数为零的检验部分总体典型相关系数为零的检验当否定当否定H0时时,表明表明X,Y相关相关,进而可得出至少第一进而可得出至少第一个相关系数个相关系数 10,相应的第一对典型相关变量相应的第一对典型相关变量V1,W1可能可能已经提取了两组变量相关关系的绝大部分信息已经提取了两组变量相关关系的绝大部分信息.两组变两组变量余下的部分可认为不相关量余下的部分可认为不相关,这时这时 k0(k=2,p).因此因此在否定在否定H0后后,有必要再检验有必要再检验H0(k):k=0(k=2,p),即第即第k个及以后的所有典型相关系数均为个及以后的所有典型相关系数均为0(k=2,3,p).检验的统计量检验的统计量 近似服从自由度为近似服从自由度为(p-k+1)(q-k+1)的的 2分布分布.在给在给定的显著性水平定的显著性水平 下下,如果如果 2 2(p-k+1)(q-k+1),则则拒绝原假设拒绝原假设H0(k),即第即第k个典型相关系数显著的不等于个典型相关系数显著的不等于0.否则认为否则认为 k=0.对对H0(k)从从k=2开始逐个检验开始逐个检验,知道某个知道某个k0,使使相容时为止相容时为止.这时说明第这时说明第k0个及以后的所有个及以后的所有典型相关系数均为典型相关系数均为0.(三三)样本典型变量的得分值样本典型变量的得分值假设经检验假设经检验,有有r(rp)个典型相关系数显著不等于个典型相关系数显著不等于0,这时可得这时可得r 对典型相关变量对典型相关变量(Vi,Wi)(i=1,r).将样品将样品代入第代入第i 对典型变量中对典型变量中,令令称称(vti,wti)为第为第i个样品个样品Z(t)的第的第i对对样本典型变量的得分值样本典型变量的得分值样本典型变量的得分值样本典型变量的得分值.与原变量间的相关程度和典型与原变量间的相关程度和典型变量系数有关变量系数有关.典型变量与原变量的亲疏关系典型变量与原变量的亲疏关系 原变量与自已的典型变量、原变量与自已的典型变量、原变量与对方的典型变量之原变量与对方的典型变量之 间的相关系数间的相关系数.1985年中国年中国28省市城市男生省市城市男生(1922岁岁)的调查数据。记的调查数据。记形态指标形态指标:身身高高(cm)、坐高、体重、坐高、体重(kg)、胸围、胸围、肩肩宽宽、盆骨宽分别为盆骨宽分别为X1,X2,X6;机能指标机能指标:脉搏脉搏(次次/分分)、收缩压、收缩压(mmHg)、舒张压、舒张压(变音变音)、舒张压舒张压(消消音音)、肺活量、肺活量(ml)分别为分别为Y1,Y2,Y5。现欲研究这两组变量之间的相关。现欲研究这两组变量之间的相关性。性。简单相关系数矩阵简单相关系数矩阵 原变量在典型变量上的负荷原变量在典型变量上的负荷(即原变量与典型变量间的相关系数即原变量与典型变量间的相关系数即原变量与典型变量间的相关系数即原变量与典型变量间的相关系数)V V1 1V V2 2V V3 3V V4 4V V5 5WW1 1WW2 2WW3 3WW4 4WW5 5身身身身 高高高高X X X X1 1 1 10.9050-0.08060.3777-0.14870.08870.7912-0.05940.1930-0.05270.0132坐坐坐坐 高高高高X X X X2 2 2 20.86160.01120.4152-0.03600.24120.75320.00830.2121-0.01280.0357体体体体 重重重重X X X X3 3 3 30.93610.1655-0.0471-0.2933-0.02470.81840.1220-0.0240-0.1039-0.0037胸胸胸胸 围围围围X X X X4 4 4 40.6958-0.3189-0.53820.31910.13540.6083-0.2351-0.27500.11310.0201肩肩肩肩 宽宽宽宽X X X X5 5 5 50.13560.5329-0.0321-0.23760.73890.11850.3929-0.0164-0.08420.1095骨盆骨盆骨盆骨盆宽宽宽宽X X X X6 6 6 60.24330.4412-0.04050.74780.39080.21270.3253-0.02070.26500.0579脉脉脉脉 搏搏搏搏Y Y Y Y1 1 1 1-0.3610-0.06250.37570.16050.0410-0.4130-0.08480.73530.45300.2764收收收收缩压缩压缩压缩压Y Y Y Y2 2 2 20.39630.62320.04950.05080.03320.45330.84520.09680.14330.2240舒舒舒舒张压张压张压张压(音音音音变变变变)Y Y Y Y3 3 3 30.58010.15680.03780.02870.10500.66360.21270.07400.08100.7087舒舒舒舒张压张压张压张压(消音消音消音消音)Y Y Y Y4 4 4 40.50030.0296-0.08370.23390.06770.57230.0401-0.16380.66000.4565肺活量肺活量肺活量肺活量Y Y Y Y5 5 5 50.79940.00940.0685-0.0743-0.04730.91440.01280.1341-0.2098-0.3190负荷矩阵的表达负荷矩阵的表达左上角的矩阵左上角的矩阵X1=0.9050V1-0.0806V2+0.3777V3-0.1487V4+0.0887V5X2=0.8616V1+0.0112V2+0.4152V3-0.0360V4+0.2412V5X6右下角的矩阵右下角的矩阵Y1=-0.4130W1-0.0848W2+0.7353W3+0.4530W4+0.2764W5Y2=0.4533W1+0.8452W2+0.0968W3+0.1433W4+0.2240W5.Y5各典型变量的意义解释各典型变量的意义解释VW

    注意事项

    本文(第10章 典型相关分析.ppt)为本站会员(s****8)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开