应用多元分析五:复方差分析1.pdf
1复方差分析(MANOVA)北京师范大学心理学院辛涛MANOVA 是ANOVA的延伸。Why?Type I error,Corr.among DVs,No sig.individual diff.,but diff.of the combination MANOVA 检验关于因变量的线性组合是否存在显著性的组间差异。在MANOVA中,我们寻求关于因变量的线性组合,使得这个新生成的变量的组间变异最大化。复方差分析与方差分析一样,常与实验设计中的因子设计相结合,在这种情形下,MANOVA寻求与每个主效应和交互作用相对应的关于DVs 的线性组合,使之组间变异分别最大化。MANCOVA是ANCOVA的延伸,在MANCOVA中关于一组因变量的线性组合经过了一个(多个)连续性的协变量的校正。通常协变量与因变量相关,但在研究中没有被系统操控,在考察因变量的组间差异之前,你想先剔除因变量中的这部分变异基本的数据形态 两个以上DVs 一个以上的因子 对 MANCOVA,一个或多个 CVs相应的研究问题 与ANOVA一致,只是在MANOVA中因变量的组合代替了单一的因变量;是否存在主效应?在控制其它变量的效应之后,存在具有统计显著性的组间差异吗?控制其它变量的校应包括:其他因子的效应,外在无关变量的控制,协变量的效应 如果因子设计中的各单元的样本数量相等(平衡设计),那么每个因子的效应是独立的。存在交互作用吗?一个自变量对于因变量的线性组合的效应受到另一个自变量的影响。例如,某实验处理可能对男生的效果更好,另一实验处理可能对女生的效果更好。就平衡设计而言,某一交互作用的存在与其他的主效应和交互作用的存在相独立。2 那个DV更重要?如果存在显著的主效应和(或)交互作用,那个因变量在相应自变量的各水平上的差异最大。在MANOVA之后,用ANOVA来确定哪个DV在IV的各水平上的差异更大或更小。另一种方法是采用Roy-Bargman step-down procedure(略)。MANOVA的基本假设 多变量正态分布 假定在因子设计的每个单元中因变量的均值服从正态分布。当最小样本量的单元中的被试数目超过20(30?)时,即使不满足正态分布假设,MANOVA也是稳健的。如果采用单元被试数非常小的非平衡设计,就应引起注意。没有极端值 因变量之间、协变量之间、因变量与协变量之间存在线性关系 非线性关系会降低统计检验力DV的线性组合不能是组间差异最大化 不存在自变量与协变量之间的交互作用 组间的协方差相等 如果是平衡设计,MANOVA对此假设具有稳健性。如果是非平衡设计,采用Boxs M检验(.001)。如果组间协方差不等,那就要看数据:因子单元内的被试数目足够多时,复方差分析基本具有稳健性 如果被试数目非常有限,采用更为严格的标准(用Phillais criterion,而非Wilks criterion)。检验假设ANOVA H0:1=2=.k H0:各组均值相等MANOVA1121p11222p21k2kpk=.=?H0:各组均值向量相等变异分解ANOVA()222()()()()ijyjyijjijjijYGMnYGMYY=+()()()Total ybg ywg ySSSSSS=+3 ANOVA中出现两个IV时,将组间变异分解为:bgDTDTSSSSSSSS=+MANOVA 从矩阵的角度来了解每个被试有多个DV分,在每个设计的单元中都有一个被试反应的矩阵计算离差阵,并将其平方计算组间SSCP矩阵和组内SSCP矩阵求出这些矩阵的行列式,采用这些行列式的比率来检验IV在DV的线性组合上的效应在MANCOVA中,组间和组内SSCP矩阵经过协变量的校正检验统计量 Wilks Lambda一旦找到SSCP矩阵,矩阵的对角线元素代表the sums of squares,非对角线元素代表the cross products矩阵的行列式表示其广义方差我们可以采用这些行列式的值来进行统计检验,人们提出了许多检验的方法,最常用的是Wilks Lambda检验的统计量 Wilks Lambda可以被看成是在总变异中不能被组间变异所解释的比率erroreffecterrorSSS=+其他的检验统计量 Hotellings Trace Wilks Lambda Pillais Trace Roys Largest Root Wilks Lambda,Hotellings Trace and Pillais trace 都是采用综合的组间变异和误差变异来生成检验的统计量的;各自的公式如下(E 代表误差,H 代表假设的效应):Wilks Lambda-|E|/|H+E|-Its the ratio of error to effect plus error.Analogous to 1 R2.4 Hotellings trace Trace(H/E)=C and you look up C in a table to get the F value.It is analogous to an F-test.Very liberal test.Pillais trace Trace(H/(H+E).Analogous to R2.Very conservative Roys Largest Root-(H/(H+E)and it looks for the biggest difference.如何选择?最常用的是Wilks lambda。采用Hotellings Trace,如果严格实验设计,对自变量进行操控不存在内在效度问题如果你的研究设计存在问题(e.g.unbalanced,assumption violation,etc)pillais trace对这些问题具有其稳健性。对DVs的评价如果多变量检验存在统计的显著性进一步进行单因变量ANOVA,但是注意这时你是假定因变量不相关,这也是为什么有时多变量检验显著,单单变量检验不显著的原因之一。Roy-Bargman step down procedure The theoretically most important DV is analyzed as an individual univariate test(DV1).The next DV(DV2),in terms of theoretical importance,is then analyzed using DV1 as a covariate.This controls for the relationship between the two DVs.DV3(in terms of importance)is assessed with DV1 and DV2 as covariates,etc.判别函数分析 告诉你使组间变异最大化的因变量是如何组合的。给你某个因变量在预测组别关系中向对重要性如何 多重比较问题应注意的问题 样本的大小 极端值 检验假设5举例 芝麻街数据