欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    典型相关分析因子分析.ppt

    • 资源ID:65363582       资源大小:1.29MB        全文页数:65页
    • 资源格式: PPT        下载积分:30金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要30金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    典型相关分析因子分析.ppt

    第七章典型相关分析1要点o典型相关分析的数学表达方式,假定条件;o典型相关系数的数学含义;o典型变量系数的数学含义;o简单相关,复相关和典型相关的意义;o典型相关的应用2 一、什么是典型相关分析及基本思想一、什么是典型相关分析及基本思想 通常情况下,为了研究两组变量 的相关关系,可以用最原始的方法,分别计算两组变量之间的全部相关系数,一共有pq个简单相关系数,这样又烦琐又不能抓住问题的本质。如果能够采用类似于主成分的思想,分别找出两组变量的各自的某个线性组合,讨论线性组合之间的相关关系,则更简捷。3 在解决实际问题中,这种方法有广泛的应用。如,在工厂里常常要研究产品的q个质量指标 和p个原材料的指标 之间的相关关系;也可以是采用典型相关分析来解决的问题。如果能够采用类似于主成分的思想,分别找出两组变量的线性组合既可以使变量个数简化,又可以达到分析相关性的目的。4例家庭特征与家庭消费之间的关系为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量:分析两组变量之间的关系。5X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00变量间的相关系数矩阵6y2y3y1x2x17 典型相关分析的思想:首先分别在每组变量中找出第一对线性组合,使其具有最大相关性,8 然后再在每组变量中找出第二对线性组合,使其分别与本组内的第一线性组合不相关,第二对本身具有次大的相关性。u2和v2与u1和v1相互独立,但u2和v2相关。如此继续下去,直至进行到r步,两组变量的相关性被提取完为止。rmin(p,q),可以得到r组变量。9二、典型相关的数学描述典型相关的数学描述考虑两组变量的向量 其协方差阵为(一)想法 其中11是第一组变量的协方差矩阵;22是第二组变量的协方差矩阵;是X和Y的其协方差矩阵。10如果我们记两组变量的第一对线性组合为:其中:所以,典型相关分析就是求 1和b b1,使uv达到最大。11(二)典型相关系数和典型变量的求法 在约束条件:下,求a a1 1和和b b1 1,使uv达到最大。令12利用柯西不等式有(参看1.8.4式)13记m为 12的秩,则记为相应的特征向量为其余的零特征根对应的向量为14由特征向量可以构成一个正交矩阵T,有,有15若取则16相应的特征向量为a1和和b1分别构成了第一组变量和第二组变量的分别构成了第一组变量和第二组变量的第一对典型变量的系数。第一对典型变量的系数。17第一对典型相关变量提取了原始变量x组和y组之间相关的主要部分,那么这部分的信息不够,则还可以在剩余相关中提取第二对典型变量:在以下的约束条件下:18求令则,约束条件等价于1920当取这时uk和vk达到最大值k,称它为第k个典型相关系数,称ak和bk为第k对典型变量系数。21相应的特征向量为ak和和bk分别构成了第一组变量和第二组变量的分别构成了第一组变量和第二组变量的第第k对典型变量的系数。对典型变量的系数。22注有相同的特征根,而可以验证:根据线性代数的思想,下列矩阵23方法二方法二 根据数学分析中条件极值的求法,引入Lagrange乘数,求极值问题,则可以转化为求 的极大值,其中和是 Lagrange乘数。24将上面的3式分别左乘和25将左乘(3)的第二式,得并将第一式代入,得 的特征根是 ,相应的特征向量为26将左乘(3)的第一式,并将第二式代入,得 的特征根是 ,相应的特征向量为27结论:既是M1又是M2的特征根,和是相应于M1和M2的特征向量。至此,典型相关分析转化为求M1和M2特征根和特征向量的问题。第一对典型变量提取了原始变量X与Y之间相关的主要部分,如果这部分还不能足以解释原始变量,可以在剩余的相关中再求出第二对典型变量和他们的典型相关系数。28在剩余的相关中再求出第二对典型变量和他们的典型相关系数。设第二对典型变量为:在约束条件:求使达到最大的和。29例家庭特征与家庭消费之间的关系为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量:分析两组变量之间的关系。30X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00变量间的相关系数矩阵31典型相关分析典型相关分析典型相典型相关系数关系数调整典型调整典型相关系数相关系数近似方差近似方差典型相关系典型相关系数的平方数的平方10.6879480.6878480.0052680.47327220.1868650.1866380.0096510.03491932X组典型变量的系数U1U2X1(就餐)0.7689-1.4787X2(电影)0.27211.6443Y组典型变量的系数V1V2Y1(年龄)0.04911.0003Y2(收入)0.8975-0.5837Y3(文化)0.19000.295633三、典型变量的性质1、同一组的典型变量之间互不相关 X组的典型变量之间是相互独立的:组的典型变量之间是相互独立的:Y组的典型变量之间是相互独立的:组的典型变量之间是相互独立的:因为特征向量之间是正交的。故342、不同组的典型变量之间相关性 不同组内一对典型变量之间的相关系数为:35同对则协方差为i,不同对则为零。363、原始变量与典型变量之间的相关系数原始变量相关系数矩阵 X X典型变量系数矩阵37y典型变量系数矩阵3839404142例家庭特征与家庭消费之间的关系为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量:分析两组变量之间的关系。43X1X2y1y2y3X11.000.800.260.670.34X20.801.000.330.590.34y10.260.331.000.370.21y20.670.590.371.000.35y30.340.340.210.351.00变量间的相关系数矩阵44典型相关分析典型相关分析典型相典型相关系数关系数调整典型调整典型相关系数相关系数近似方差近似方差典型相关系典型相关系数的平方数的平方10.6879480.6878480.0052680.47327220.1868650.1866380.0096510.03491945X组典型变量的系数U1U2X1(就餐)0.7689-1.4787X2(电影)0.27211.6443Y组典型变量的系数V1V2Y1(年龄)0.04911.0003Y2(收入)0.8975-0.5837Y3(文化)0.19000.295646典型变量的结构(相关系数)U1U2X10.9866-0.1632X20.88720.4614V1V2Y10.42110.8464Y20.9822-0.1101Y30.51450.301347典型变量的结构(相关系数)V1V2X10.6787-0.0305X20.61040.0862U1U2Y10.28970.1582Y20.6757-0.0206Y30.35390.056348 两个反映消费的指标与第一对典型变量中u1的相关系数分别为0.9866和0.8872,可以看出u1可以作为消费特性的指标,第一对典型变量中v1与Y2之间的相关系数为0.9822,可见典型变量v1主要代表了了家庭收入,u1和 v1的相关系数为0.6879,这就说明家庭的消费与一个家庭的收入之间其关系是很密切的;49第二对典型变量中u2与x2的相关系数为0.4614,可以看出u2可以作为文化消费特性的指标,第二对典型变量中v2与Y1和Y3之间的分别相关系数为0.8464和0.3013,可见典型变量v2主要代表了家庭成员的年龄特征和教育程度,u2和v2的相关系数为0.1869,说明文化消费与年龄和受教育程度之间的有关。504、各组原始变量被典型变量所解释的方差X组原始变量被ui解释的方差比例X组原始变量被vi解释的方差比例y组原始变量被ui解释的方差比例y组原始变量被vi解释的方差比例51被典型变量解释的被典型变量解释的X组原始变量的方差组原始变量的方差被本组的典型变量解释被本组的典型变量解释被对方被对方Y组典型变量解释组典型变量解释比例比例累计比例累计比例典型相关典型相关系数平方系数平方比例比例累计比例累计比例10.88030.88030.47330.41660.416620.11971.00000.03490.00420.420852被典型变量解释的被典型变量解释的Y组原始变量的方差组原始变量的方差被本组的典型变量解释被本组的典型变量解释被对方被对方X组典型变量解释组典型变量解释比例比例累计比例累计比例典型相关典型相关系数平方系数平方比例比例累计比例累计比例10.46890.46890.47330.22190.221920.27310.74200.03490.00950.2315535、简单相关、复相关和典型相关之间的关系若p1且q1,则x和y的典型相关就是简单相关;若p1或q1,则x和y的典型相关就是复相关;54五、样本典型相关系数在实际应用中,总体的协方差矩阵常常是未知的,类似于其他的统计分析方法,需要从总体中抽出一个样本,根据样本对总体的协方差或相关系数矩阵进行估计,然后利用估计得到的协方差或相关系数矩阵进行分析。由于估计中抽样误差的存在,所以估计以后还需要进行有关的假设检验。551、假设有X组和Y组变量,样本容量为n。假设(X1,Y1),(X2,Y2),(Xn,Yn),观测值矩阵为:56572、计算特征根和特征向量求M1和M2的特征根,对应的特征向量。则特征向量构成典型变量的系数,特征根为典型变量相关系数的平方。58 对两组变量x和y进行典型相关分析,采用的也是一种降维技术。我们希望使用尽可能少的典型变量对数,为此需要对一些较小的典型相关系数是否为零进行假设检验。H0经检验被拒绝,则应进一步检验假设。59 典型相关分析的基本思想:首先分别在每组变量中找出第一对线性组合,使其具有最大相关性,然后再在每组变量中找出第二对线性组合,使其分别与本组内的第一线性组合不相关,第二对本身具有最大相关性。如此下去,直至两组变量的相关性被提取完为止。本例想利用我国1999年城镇居民的家庭收入来源和消费性支出的数据了解我国居民消费构成及主要影响因素分析所用的数据来自:中国统计年鉴2000。我国居民消费构成及主要影响因素 60 收入指标:X1可支配收入 X2实际收入 X3国有单位职工收入 X4集体单位职工收入 X5其他经济类型职工收入,X6转移收入 支出指标:Y1消费性支出 Y2食品 Y3衣着 Y4交通和通讯 Y5医疗和保健 Y6娱乐、教育、文化服务 Y7居住 61序号序号典型相关系数典型相关系数典型变量典型变量10.990174U1=0.9989X1+-0.0595X2+0.0776X3+0.0489X4-0.0931X5+0.0074X6V1=1.3263Y1-0.0270Y2-0.0005Y3-0.0769Y4-0.0717Y5-0.2031Y6-0.0219Y20.868704U2=-4.8668X1+0.1264X2+1.9585X3+0.3299X4+1.4095X5+2.6453X6V2=-4.4920Y1+2.5421Y2+1.2480Y3-0.4621Y4+1.0443Y5+0.8610Y6+0.0586Y762由累计贡献率得知,第一组和第二组变量的累计贡献率已达到了97.56%,而且,这两组的系数和方差与其他组相比要大得多.即只需要前两组变量就已经可以解释全部信息的97.56%.在第一对典型变量中,U1主要受可支配收入的影响,V1主要受消费性支出的影响;可见实际收入对消费支出的影响远小于可支配收入的影响。居民消费主要依据其可支配收入而定。第二对典型变量中,U2主要受国有单位职工收入、其他经济类型职工收入和转移收入的影响,V2主要受食品、衣着、医疗和保健的影响。63在此,可见我国集体单位的职工收入还不能够与国有甚至是其他经济类型的单位这职工收入相比,这也从一个侧面放反映了集体单位规模等方面的现状。再有就是我国居民食品和衣着方面的支出仍占了总支出的大部分,反映了我国居民总体收入水平还不够高;其次,医疗保健支出的比例比较大是可喜的,说明我国居民已经可以把部分精力放在了自己身体的调养上来,全国居民的总体健康状况在上升之中。让我们担忧的是在教育方面的支出所占比例太小,不符合现今世界发展对教育程度的要求。科技是第一生产力,如何提高国民的科技文化知识水平是当今的一大重点。在当代激烈的竞争中,没有知识的支撑是不行的。64o在SPSS中可以有两种方法来拟合典型相关分析,第一种是采用Manova过程来拟合,第二种是采用专门提供的宏程序来拟合,第二种方法在使用上非常简单,而输出的结果又非常详细,因此这里只对它进行介绍。该程序名为Canonicalcorrelation.sps,就放在SPSS的安装路径之中,调用方式如下:INCLUDESPSS所在路径Canonicalcorrelation.sps.65

    注意事项

    本文(典型相关分析因子分析.ppt)为本站会员(赵**)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开