《典型相关系数》PPT课件.ppt
《《典型相关系数》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《典型相关系数》PPT课件.ppt(90页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程第七章 典型相关与对应分析n7.1 典型相关分析典型相关分析n7.2 对应分析对应分析STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程n7.1 7.1 典型相关分析典型相关分析n7.1.1 典型相关分析的概念与步骤典型相关分析的概念与步骤n7.1.2 用用INSIGHT模块实现典型相关分析模块实现典型相关分析n7.1.3 用用“分析家分析家”实现典型相关分析实现典型相关分析n7.1.4 用用CANCORR过程实现典型相关分析过程实现典型相关分析STATSTATSTATSTATSASS
2、AS软件与统计应用教程软件与统计应用教程7.1.1 典型相关分析的概念与步骤典型相关分析的概念与步骤1.1.典型相关分析的基本思想典型相关分析的基本思想 典典型型相相关关分分析析采采用用主主成成分分的的思思想想浓浓缩缩信信息息,根根据据变变量量间间的的相相关关关关系系,寻寻找找少少数数几几对对综综合合变变量量(实实际际观观测测变变量量的的线线性性组组合合),用用它它们们替替代代原原始始观观测测变变量量,从从而而将将二二组组变变量量的的关关系系集集中中到到少少数数几几对对综综合合变变量量的的关关系系上上,通通过过对对这这些些综综合合变变量量之之间间相相关关性性的的分分析析,回回答答两两组组原原始
3、始变变量量间间相相关关性性的的问问题题。除除了了要要求求所所提提取取的的综综合合变变量量所所含含的的信信息息量量尽尽可可能能大大以以外外,提提取取时时还还要要求求第第一一对对综综合合变变量量间间的的相相关性最大,第二对次之,依次类推。关性最大,第二对次之,依次类推。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 这这些些综综合合变变量量被被称称为为典典型型变变量量,或或典典则则变变量量,第第1对对典典型型变变量量间间的的相相关关系系数数则则被被称称为为第第1典典型型相相关关系系数数。典典型型相相关关系系数数能能简简单单、完完整整地地描描述述两两组组变变量量间间
4、关关系系的的指指标标。当当两两个个变变量量组组均均只只有有一一个个变变量量时时,典典型型相相关关系系数数即即为为简简单单相相关关系系数数;当当其其中中的的一一组组只只有有一一个个变变量量时时,典典型型相相关关系数即为复相关系数。系数即为复相关系数。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.典型相关系数与典型相关变量典型相关系数与典型相关变量 设设X=(X1,X2,Xp),Y=(Y1,Y2,Yq)是是两两个个随随机机向向量量。利利用用主主成成分分思思想想寻寻找找第第i对对典典型型相相关关变变量量(Ui,Vi):Ui=ai1X1+ai2X2+aipXp
5、=aiXVi=bi1Y1+bi2Y2+biqYq=biYi=1,2,m=min(p,q);称称ai和和bi为为(第第i对对)典典型变量系数或典型权重。型变量系数或典型权重。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 记第一对典型相关变量间的典型相关系数为:记第一对典型相关变量间的典型相关系数为:CanR1=Corr(U1,V1)(使(使U1与与V1间最大相关);间最大相关);第二对典型相关变量间的典型相关系数为:第二对典型相关变量间的典型相关系数为:CanR2=Corr(U2,V2)(与与U1、V1无无关关;使使U2与与V2间间最最大相关)大相关)第第m对
6、典型相关变量间的典型相关系数为:对典型相关变量间的典型相关系数为:CanRm=Corr(Um,Vm)(与与U1,V1,Um1,Vm1无关;无关;Um与与Vm间最大相关)间最大相关)STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.典型相关变量的性质典型相关变量的性质 各各对对典典型型相相关关变变量量所所包包括括的的相相关关信信息息互互不不交交叉叉,且且满满足:足:1)U1,U2,Um互互不不相相关关,V1,V2,Vm互互不不相关,即其相关系数为相关,即其相关系数为STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 2)同同一一
7、对对典典型型相相关关变变量量Ui和和Vi之之间间的的相相关关系系数数为为CanRi,不同对的典型相关变量之间互不相关,即:,不同对的典型相关变量之间互不相关,即:3)Ui和和Vi的均值为的均值为0,方差为,方差为1(i=1,m)。)。4)1 CanR1 CanR2 CanRm 0STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程4.4.典型相关系数的求解步骤典型相关系数的求解步骤 1)求求X,Y变量组的相关阵变量组的相关阵 R=;2)求矩阵求矩阵A=(R11)1R12(R22)1R21和和B=(R22)1R21(R11)1R12,可以证明可以证明A、B有相同的非零
8、特征值;有相同的非零特征值;3)求求A或或B的的特特征征值值i与与CanRi,A或或B的的特特征征值值即即为为典典型相关系数的平方:型相关系数的平方:i=(CanRi)2,i=1,m。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 4)求求A、B关关于于i的的特特征征向向量量。设设ai为为A关关于于i的的特特征征向向量量,bi为为B关关于于i的的特特征征向向量量,则则ai和和bi为为(第第i对对)典典型变量系数。即第型变量系数。即第i对典型相关变量对典型相关变量(Ui,Vi):Ui=aiX*=ai1X1*+ai2X2*+aipXp*Vi=biY*=bi1Y1*
9、+bi2Y2*+biqYq*i=1,2,m=min(p,q);其其中中X*,Y*为为原原变变量量组组的标准化。的标准化。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程5.5.特征根特征根 特特征征根根(eigenvalue)是是方方差差分分析析和和多多元元检检验验的的基基础础,特征根与典型相关系数之间的数量关系为:特征根与典型相关系数之间的数量关系为:上上式式可可以以理理解解为为第第i对对典典型型变变量量表表示示观观测测变变量量总总方方差差作用的指标,它的值越大说明表示作用越大。作用的指标,它的值越大说明表示作用越大。STATSTATSTATSTATSASSA
10、S软件与统计应用教程软件与统计应用教程6.6.典型相关系数的标准误典型相关系数的标准误7.7.典型相关系数的假设检验典型相关系数的假设检验 典典型型相相关关系系数数的的假假设设检检验验包包括括对对全全部部总总体体典典型型相相关关系系数数的的检检验验和和对对部部分分总总体体典典型型相相关关系系数数的的检检验验。对对数数据据的的要求:要求:1)两个变量组均应服从多维正态分布:两个变量组均应服从多维正态分布:(X,Y)Np+q(,2)2)n p+qSTATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(1)全部总体典型相关系数为全部总体典型相关系数为0 H0:CanRi=0
11、,i=1,m H1:至少有一个:至少有一个CanRi 0 检验的似然比统计量为检验的似然比统计量为对于充分大的对于充分大的n,当,当H0成立时,统计量成立时,统计量近似服从自由度为近似服从自由度为pq的的 2分布。分布。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(2)部分总体典型相关系数为部分总体典型相关系数为0 仅对较小的典型相关作检验:仅对较小的典型相关作检验:H0:CanRi=0,i=s,m,2 s m H1:至少有一个:至少有一个CanRi 0其检验的统计量为其检验的统计量为对于充分大的对于充分大的n,当,当H0成立时,统计量成立时,统计量近似服从
12、自由度为近似服从自由度为(p k)(q k)的的 2分布。分布。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程7.1.2 用用INSIGHT模块实现典型相关分析模块实现典型相关分析1.1.实例实例【例例7-1】1985年年中中国国28省省市市城城市市男男生生(1922岁岁)的的调调查查数数据据,见见表表7-1。其其中中6项项形形态态指指标标:身身高高(cm)、坐坐高高、体体重重(kg)、胸胸围围、肩肩宽宽、盆盆骨骨宽宽,分分别别记记为为x1,x2,x6;5项项机机能能指指标标:脉脉搏搏(次次/分分)、收收缩缩压压(mmHg)、舒舒张张压压(变变音音)、舒舒张张
13、压压(消消音音)、肺肺活活量量(ml),分分别别记记为为y1,y2,y5。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程表7-1 城市男生(1922岁)形态与机能调查数据设设表表中中数数据据已已经经存存放放在在数数据据集集Mylib.xtyjn中中,试试分分析析形形态指标和机能指标这两组变量间的相关性。态指标和机能指标这两组变量间的相关性。编号身高x1坐高x2体重x3胸围x4肩宽x5盆骨宽x6脉搏y1收缩压y2舒张压y3舒张压y4肺活量y51173.2893.6260.186.7238.9727.5175.3117.474.661.845082172.0992
14、.8360.3887.3938.6227.8276.7120.177.166.244693171.4692.7859.7485.5938.8327.4675.8121.875.265.443984170.0892.2558.0485.9238.3327.2976.1115.173.861.340685170.6192.3659.6787.4638.3827.1472.9119.477.567.1433916167.9490.9155.9786.6638.1727.1676.2110.968.556.8414117168.8291.356.0785.8737.6126.6777.2113.871
15、57.5390518168.0291.2655.2885.6339.6628.0774.5117.27463.8394319167.8790.9655.7984.9238.226.5374.3112.369.350.2419520168.1591.554.5684.8138.4427.3877.5117.475.363.6403921168.9991.5255.1186.2338.327.1477.7113.372.152.84238STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程2.2.分析设置分析设置 在在INSIGHT模块中打开数据集模块中打开数据集Myl
16、ib.xtyjn。1)选选择择菜菜单单“Analyze”“Multivariate(Y X)(多多元分析)元分析)”,打开,打开“Multivariate(Y X)”对话框;对话框;2)将将6项项形形态态指指标标:x1至至 x6选选为为X变变量量,将将5项项机机能能指指标:标:y1至至 y5选为选为Y变量,如图变量,如图7-1左所示。左所示。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 3)单单击击“Output”按按钮钮,在在打打开开的的对对话话框框中中选选中中“Canonical Correlation Analysis(典典型型相相关关分分析析)”复复
17、 选选 框框,单单 击击 下下 面面 的的“Canonical Correlation Options(典典型型相相关关选选项项)”按按钮钮,打打开开“Canonical Correlation Options”对话框对话框,并按下图右所示设置。并按下图右所示设置。4)三次单击三次单击“OK”按钮,得到分析结果。按钮,得到分析结果。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程3.3.结果分析结果分析(1)典型相关系数典型相关系数 第第1典典型型相相关关系系数数为为0.939573,校校正正值值为为0.908276,标标准准误误差差为为0.026207,典典型
18、型相相关关系系数数的的平平方方为为0.882797;第第2典典型型相相关关系系数数为为0.877842,校校正正值值为为0.842459,标标准准误误差差为为0.051294,典典型型相相关关系系数数的的平平方方为为0.770606,如如图所示。图所示。前前两两个个典典型型相相关关系系数数比比形形态态指指标标和和机机能能指指标标两两组组间间的的任何一个相关系数都大。任何一个相关系数都大。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(2)典型变量所解释的变异典型变量所解释的变异 第第二二部部分分是是的的5个个特特征征根根(Eigenvalues),包包括括:特
19、特征征根根、相相邻邻两两个个特特征征根根之之差差、特特征征根根所所占占方方差差信信息息量量的的比比例例和和累累积积方方差差信信息息量量的的比比例例。从从中中可可以以看看出出,前前两两对对典典型型变变量量所所能能解解释释的的变变异异占占总总变变异异(方方差差)的的91.18%,如如图图7-4所所示示。其其它它三三个个典典型型相相关关变变量量的的作作用用很很小小,一共只解释了总变异的一共只解释了总变异的9%,可以不予考虑。,可以不予考虑。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(3)典型相关系数的检验典型相关系数的检验 用用似似然然比比法法检检验验典典型型相
20、相关关系系数数与与零零的的差差别别是是否否显显著著,其其原原假假设设为为小小于于此此对对典典型型变变量量典典型型相相关关系系数数的的所所有有典典型型相相关关系系数数都都为为0,其其p值值依依次次为为0.0010,0.0509和和0.5089等等等等,如如图图7-5所所示示,说说明明前前两两对对典典型型相相关关系系数数基基本本具具有有显显著著意意义义(在在 0.0509的的显显著著水水平平下下)。因因此此,两两组组变变量量相相关关性性的的研研究究可可转转化化为为研研究究前前两两对对典典型型相相关关变变量量的相关性。的相关性。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计
21、应用教程(4)典型相关结构典型相关结构 典典型型相相关关结结构构(下下图图)分分别别是是各各组组原原始始变变量量与与典典型型变变量量两两两两之之间间的的相相关关系系数数矩矩阵阵。从从相相关关系系数数判判断断,形形态态指指标标中中除除x5(0.0514)、x6(0.2433)外外各各变变量量与与第第一一典典型型 变变 量量 间间 的的 相相 关关 性性 都都 比比 较较 高高,机机 能能 指指 标标 中中 除除 y2(0.0975)外外各各变变量量与与第第一一典典型型变变量量间间的的相相关关性性也也都都比比较高。较高。x5与与第第二二典典型型变变量量间间的的相相关关性性比比较较高高,y2与与第第
22、二二典典型型变量间的相关性比较高。变量间的相关性比较高。y1与前两个典型变量的相关系数为负值。与前两个典型变量的相关系数为负值。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 说说明明,第第一一对对典典型型变变量量对对肩肩宽宽x5和和收收缩缩压压y2的的解解释释作作用不大。用不大。另另外外,从从形形态态指指标标组组的的变变量量和和机机能能指指标标组组的的典典型型变变量量之之间间,以以及及机机能能指指标标组组的的变变量量和和形形态态指指标标组组的的典典型型变变量量之之间间的的相相关关系系数数可可见见,各各组组变变量量与与前前两两对对典典型型变变量量之之间间均有较
23、强的相关。均有较强的相关。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(5)标准化变量的典型相关变量的系数标准化变量的典型相关变量的系数 输输出出结结果果中中还还给给出出标标准准化化变变量量的的典典型型变变量量系系数数,如如图图所示。所示。来来自自机机能能指指标标的的第第一一典典型型变变量量CY1为为(原原始始变变量量的的右右上角带上角带“*”表示为标准化变量表示为标准化变量):CY1=0.071672y1*0.789642y2*+0.567178y3*+0.508332y4*+0.533496y5*容容易易看看出出,CY1主主要要代代表表了了舒舒张张压压变
24、变音音、舒舒张张压压消消音音、肺活量等指标。肺活量等指标。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程 来自形态指标的第一典型变量来自形态指标的第一典型变量CX1为:为:CX1=0.4287x1*0.09696x2*0.16210 x3*+0.93745x4*+0.23498x5*0.18696x6*易知,易知,CX1主要代表了胸围、身高和肩宽等指标。主要代表了胸围、身高和肩宽等指标。关于第二典型变量有:关于第二典型变量有:CY2=0.026533y1*+1.213436y2*0.535038y3*0.186048y4*+0.455870y5*CX2=0.7
25、0270 x1*0.39985x2*+0.84359x3*0.99063x4*0.06829x5*+0.48310 x6*可可见见,CY2代代表表了了收收缩缩压压和和肺肺活活量量等等指指标标;CX2代代表表了了身高、体重、盆骨宽等指标。身高、体重、盆骨宽等指标。STATSTATSTATSTATSASSAS软件与统计应用教程软件与统计应用教程(6)典型冗余分析典型冗余分析 典典型型冗冗余余分分析析(canonical redundancy analysis)表表明明,两两对对典典型型变变量量仍仍不不能能全全面面预预测测配配对对的的那那组组变变量量。来来自自形形态态指指标标的的标标准准方方差差被被
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 典型相关系数 典型 相关系数 PPT 课件
限制150内