数据分析实验报告9 典型相关分析.doc
学号: 100111114 班级: 信息101 姓名: 赵永光 实验九 典型相关分析实验目的和要求 能利用原始数据与相关矩阵、协主差矩阵作相关分析,能根据SAS输出结果选出满足要求的几个典型变量实验要求:编写程序,结果分析实验内容:4.9data examp4_9;input x1-x2 y1-y2;cards; 1 191 155 179 145 2 195 149 201 152 3 181 148 185 149 4 183 153 188 149 5 176 144 171 142 6 208 157 192 152 7 189 150 190 149 8 197 159 189 152 9 188 152 197 15910 192 150 187 15111 179 158 186 14812 183 147 174 14713 174 150 185 15214 190 159 195 15715 188 151 187 15816 163 137 161 13017 195 155 183 15818 186 153 173 14819 181 145 182 14620 175 140 165 13721 192 154 185 15222 174 143 178 14723 176 139 176 14324 197 167 200 15825 190 163 187 150;run;proc cancorr data=examp4_9 corr; var x1-x2; with y1-y2; run;由SAS proc cancorr过程求得样本相关系数矩阵 The SAS System 14:21 Saturday, October 30, 2012 3 The CANCORR Procedure Correlations Among the Original Variables1、变量x1-x2的相关系数矩阵: Correlations Among the VAR Variables x1 x2 x1 1.0000 -0.2094 x2 -0.2094 1.00002、变量y1-y2的相关系数矩阵: Correlations Among the WITH Variables y1 y2 y1 1.0000 0.6932 y2 0.6932 1.00003、变量x1-x2与y1-y2的相关系数矩阵: Correlations Between the VAR Variables and the WITH Variables y1 y2 x1 -0.0108 -0.2318 x2 0.7346 0.7108变量间高度相关。 The SAS System 14:21 Saturday, October 30, 2012 4 The CANCORR Procedure4 典型相关分析的一般结果 Canonical Correlation Analysis Adjusted Approximate Squared Canonical Canonical Standard Canonical Correlation Correlation Error Correlation典型相关系数 校正的典型相关系数 近似的标准误 典型相关系数平方 1 0.787478 0.772383 0.077543 0.620121 2 0.292947 . 0.186607 0.0858185、检验各对典型变量是否显著相关 Test of H0: The canonical correlations in the Eigenvalues of Inv(E)*H current row and all that follow are zero = CanRsq/(1-CanRsq) Likelihood Approximate Eigenvalue Difference Proportion Cumulative Ratio F Value Num DF Den DF Pr > F各对相关系 相邻两特 特征值占 特征值占方差 似然比 值 数特征值 征值之差 方差比例 比例累计值 1 1.6324 1.5385 0.9456 0.9456 0.34727867 7.32 4 42 0.0001 2 0.0939 0.0544 1.0000 0.91418197 2.07 1 22 0.1648第一对典型变量贡献率94.56%。充分反映了两组变量的相互关系。检验假设 检验统计量,为第一、第二自由度由检验结果可知,故只有前两对典型变量显著相关取前两对进行分析即可另外,从对典型变量进行分析求得特征值在方差占比例的累计值(贡献率)为0.9141也可看出,只需要前两对变量即可。以下输出用wilksLambda 等四种方法对典型相关系数为零的假设检验6、求出典型变量及典型相关系数,并解释典型变量的系数和典型结构 Multivariate Statistics and F Approximations S=2 M=-0.5 N=9.5 Statistic Value F Value Num DF Den DF Pr > F Wilks' Lambda 0.34727867 7.32 4 42 0.0001 Pillai's Trace 0.70593888 6.00 4 44 0.0006 Hotelling-Lawley Trace 1.72629023 8.94 4 24.198 0.0001 Roy's Greatest Root 1.63241610 17.96 2 22 <.0001 NOTE: F Statistic for Roy's Greatest Root is an upper bound. NOTE: F Statistic for Wilks' Lambda is exact.The CANCORR Procedure Canonical Correlation Analysis Raw Canonical Coefficients for the VAR Variables第一组变量x1-x3的典型变量的系数(原始变量未标准化)第一典型变量 第二典型变量 V1 V2 x1 0.0091725722 0.1386496154 x2 0.1036642178 0.0151230041第二组变量y1-y3的典型变量的系数(原始变量为标准化) Raw Canonical Coefficients for the WITH Variables第一典型变量 第二典型变量 W1 W2 y1 0.0845052096 0.168128993 y2 0.0459765801 -0.130308033数据未标准化结果,即利用协方差矩阵分析的结果 The SAS System 14:21 Saturday, October 30, 2012 6 The CANCORR Procedure Canonical Correlation Analysis第一组变量x1-x3的典型变量的系数(原始变量标准化后) Standardized Canonical Coefficients for the VAR Variables 第一典型变量 第二典型变量 V1 V2 x1 0.0675 1.0204 x2 1.0120 0.1476 第二组变量y1-y3的典型变量的系数(原始变量标准化后) Standardized Canonical Coefficients for the WITH Variables 第一典型变量 第一典型变量 W1 W2 y1 0.6231 1.2396 y2 0.4616 -1.3083给出的三个特征值, 第一对典型变量主要成年长子的头长、头宽加权主要次子头宽影响第一对典型变量主要表现头宽和头长的相关性。第一对典型相关系数为第二对典型变量及典型相关系数 输出原变量和典型变量间的相关系数 The CANCORR Procedure Canonical Structure 第一组变量x1-x3和典型变量,的相关系数 Correlations Between the VAR Variables and Their Canonical Variables V1 V2 x1 -0.1444 0.9895 x2 0.9978 -0.0660 第二组变量y1-y3和典型变量,的相关系数 Correlations Between the WITH Variables and Their Canonical Variables W1 W2 y1 0.9430 0.3327 y2 0.8935 -0.4491 第一组变量x1-x3和第二组典型变量,的相关系数 Correlations Between the VAR Variables and the Canonical Variables of the WITH Variables W1 W2 x1 -0.1137 0.2899 x2 0.7858 -0.0193 第二组变量y1-y3和第一组典型变量,的相关系数 Correlations Between the WITH Variables and the Canonical Variables of the VAR Variables V1 V2 y1 0.7426 0.0975 y2 0.7036 -0.1316由数据分析得:原变量和第一对变量相关程度高,第二组提取的信息很少,与典型对系数一致。