方差分析--SPSS应用.doc
精品文档,仅供学习与交流,如有侵权请联系网站删除实习三 方差分析 (analysis of variance- ANOVA ) 一、目的要求1、掌握方差分析的应用条件2、掌握方差分析的基本思想3、掌握方差分析的用途4、掌握常用方差分析的方法(完全随机设计、随机区组设计方差分析)5、掌握多个样本均数间的两两比较方法(a. 两两比较:SNK法(q检验);b.对照组与各处理组比较:LSD法)。二、完全随机设计的方差分析(One-Way ANOVA)One-Way ANOVA过程用于进行两组及多组样本均数的比较,即完全随机设计(成组设计)的方差分析,如果做了相应选择,还可进行随后的两两比较。 P432第8题:某职业病防治院对某石棉肺患者、可疑患者及非患者进行了用力肺活量(L)测定,结果如下表所示。问三组石棉矿工的用力肺活量有无差别?三组石棉矿工的用力肺活量(L)石棉肺患者可疑患者非患者1.82.32.91.42.13.21.52.12.72.12.12.81.92.62.71.72.531.82.33.41.92.431.82.43.41.83.32.0 3.5建库:1、点击Variable View: 定义分类变量(组别)和应变量(用力肺活量)NameTypeValues组别Numeric1=石棉肺患者, 2=可疑患者,3=非患者用力肺活量Numeric2、点击Data View,输入数据:3、分析过程analyze=>Compare Means=>One-Way ANOVADependent List框:选入 用力肺活量Factor 框:选入 组别 单击Option 框: 选入 Descriptive 和 Homogeneity-of-variance 单击Continue 单击 Post Hoc框:选入S-N-K 和 Games-Howell单击ok钮界面说明:【Dependent List框】(选入应变量)选入需要分析的变量,可选入多个结果变量(应变量)。【Factor框】(因素,即选入一个分类变量)选入需要比较的分组因素,只能选入一个。【Contrasts钮】(线性组合比较,如检验均数之间差异大小的关系,均数间的线性趋势等)【Post Hoc钮】(各组均数的多重比较)弹出Post Hoc Multiple Comparisons(多重比较)对话框,用于选择进行各组间两两比较的方法,有:Equal Variances Assumed复选框组 一组当各组方差齐时可用的两两比较方法,共有14中种这里不一一列出了,其中最常用的为LSD和S-N-K法。 Equal Variances Not Assumed复选框组 一组当各组方差不齐时可用的两两比较方法,共有4种,其中以Games-Howell法较好。 Significance Level框 定义两两比较时的显著性水平,默认为0.05。【Options钮】弹出Options对话框,用于定义相关的选项,有:Statistics复选框组 选择一些附加的统计分析项目,有统计描述(Descriptive)和方差齐性检验(Homogeneity-of-variance)。 Means plot复选框 用各组均数做图,以直观的了解它们的差异。 Missing Values单选框组 定义分析中对缺失值的处理方法,可以是具体分析用到的变量有缺失值才去除该记录(Excludes cases analysis by analysis),或只要相关变量有缺失值,则在所有分析中均将该记录去除(Excludes cases listwise)。默认为前者,以充分利用数据。结果解释:1、描述统计量用力肺活量 Descriptives NMeanStd. DeviationStd. Error95% Confidence Interval for MeanMinimumMaximum Lower BoundUpper Bound 1111.791.2023.06101.6551.9271.42.1292.311.1833.06112.1702.4522.12.63113.082.2926.08822.8853.2782.73.5Total312.400.6000.10782.1802.6201.43.52.方差齐性检验结果:F=2.852 , P=0.075。P>0.05,说明方差齐。Test of Homogeneity of Variances用力肺活量Levene Statisticdf1df2Sig.2.852228.0753、完全随机设计的方差分析结果ANOVA用力肺活量 Sum of SquaresdfMean SquareFSig.Between Groups9.26624.63384.544.000Within Groups1.53428.055 Total10.80030 上表的标题内容翻译如下:离均差平方和SS自由度均方MSF值P值组间变异9.26624.63384.544.000组内变异1.53428.055总变异10.80030上面实际上是一个典型的方差分析表。给出了单因素方差分析的结果,可见F=84.544,P=0.000。因此可认为三组石棉矿工的用力肺活量不全相同。故需做两两比较。4.两两比较的结果:(方差齐时用) 用力肺活量 组别NSubset for alpha =0 .05123Student-Newman-Keuls(a,b)1111.791292.3113113.082Sig.1.0001.0001.000Means for groups in homogeneous subsets are displayed.aUses Harmonic Mean Sample Size = 10.241.bThe group sizes are unequal. The harmonic mean of the group sizes is used. Type I error levels are not guaranteed.上表是用S-N-K法进行两两比较的结果,简单的说,在表格的纵向上各组均数按大小排序,然后在表格的横向上被分成了若干个亚组,不同亚组间的P值小于0.05,而同一亚组内的各组均数比较的P值则大于0.05。从上表可见,可认为三组石棉矿工的用力肺活量均不相同(P<0.05)。5、两两比较的结果:(方差不齐时用) Post Hoc Tests Multiple ComparisonsDependent Variable: 用力肺活量 (I) 组别(J) 组别Mean Difference (I-J)Std. ErrorSig.95% Confidence IntervalLower BoundUpper BoundGames-Howell12-.5202(*)0.08630.000-0.741-0.33-1.2909(*)0.10730.000-1.565-1.01721.5202(*)0.08630.0000.30.7413-.7707(*)0.10730.000-1.046-0.495311.2909(*)0.10730.0001.0171.5652.7707(*)0.10730.0000.4951.046*The mean difference is significant at the .05 level.P432第9题:为研究愤怒应激对大鼠下丘脑单胺类神经递质的影响,某研究者观察了24只大白鼠,按完全随机设计的方法分成三组,分别测定血清中多巴基斯胺含量(ummol/L),资料如下。问三组血清中多巴基斯胺含量的测定结果有无差别?血清中多巴基斯胺含量测定结果(ummol/L)ABC103.0553.0249.3194.836.3845.7788.2354.9445.0791.0652.2234.9285.2851.7939.38105.6744.1742.8 86.4440.6937.02110.0641.2633.9 建库:1、点击Variable View: 定义分类变量(组别)和应变量(用力肺活量)NameTypeValues组别Numeric1=A, 2=B,3=C多巴基斯胺含量Numeric2、点击Data View,输入数据:3、分析过程analyze=>Compare Means=>One-Way ANOVADependent List框:选入 多巴基斯胺含量Factor 框:选入 组别 单击Option 框: 选入 Descriptive 和 Homogeneity-of-variance 单击Continue 单击 Post Hoc框:选入S-N-K 和 Games-Howell单击ok钮结果解释:1、描述统计量多巴基斯胺含量 Descriptives NMeanStd. DeviationStd. Error95% Confidence Interval for MeanMinimumMaximum Lower BoundUpper Bound 1895.57389.501653.3593487.6302103.517385.28110.062846.80886.997362.4739440.958852.658736.3854.943841.02135.573551.9705536.361645.680933.949.31Total2461.134626.009045.3090750.151972.117233.9110.062.方差齐性检验结果:F=2.36 , P=0.119。P>0.05,说明方差齐。Test of Homogeneity of Variances多巴基斯胺含量Levene Statisticdf1df2Sig.2.362210.1193、完全随机设计的方差分析结果ANOVA多巴基斯胺含量 Sum of SquaresdfMean SquareFSig.Between Groups14366.65527183.328126.5350.000 Within Groups1192.1622156.77Total15558.81723上表的标题内容翻译如下:离均差平方和SS自由度均方MSF值P值组间变异14366.65527183.328126.5350.000 组内变异1192.1622156.77总变异15558.81723上面实际上是一个典型的方差分析表。给出了单因素方差分析的结果,可见F=126.535,P=0.000。因此可认为三组血清中多巴基斯胺含量的测定结果不全相同。故需做两两比较。4.两两比较的结果:(方差齐时用) 多巴基斯胺含量 组别NSubset for alpha = .0512Student-Newman-Keuls(a)3(C)841.02132(B)846.80881(A)895.5738Sig.0.1391.000Means for groups in homogeneous subsets are displayed.aUses Harmonic Mean Sample Size = 8.000.上表是用S-N-K法进行两两比较的结果,简单的说,在表格的纵向上各组均数按大小排序,然后在表格的横向上被分成了若干个亚组,不同亚组间的P值小于0.05,而同一亚组内的各组均数比较的P值则大于0.05。从上表可见,可认为A组与B组、A组与C组血清中多巴基斯胺含量的测定结果不相同(P<0.05),B组与C组血清中多巴基斯胺含量的测定结果相同(P=0.139)。作业格式(1)题意分析:计量资料完全随机设计三个样本均数的比较,用完全随机设计方差分析。(2)建立假设、确定检验水准H0: 1=2=3H1: 各总体均数不等或不全相等=0.05(3)计算统计量F值经方差齐性检验,F=2.36 , P=0.119。P>0.05,说明方差齐。经SPSS计算得,完全随机设计的方差分析统计量F=126.535,P=0.000。(4)确定P值,作统计推断因P=0.000<0.05,按a=0.05检验水准,拒绝H0,接受H1,差别有统计学意义,尚可认为三组血清中多巴基斯胺含量的测定结果不全相同。 (5)多样本均数的两两比较(S-N-K法):经S-N-K法进行两两比较,结果为:可认为A组与B组、A组与C组血清中多巴基斯胺含量的测定结果不相同(P<0.05),A组血清中多巴基斯胺含量均高于B组和C组;B组与C组血清中多巴基斯胺含量的测定结果相同(P=0.139)。二、随机区组设计的方差分析P433第10题:为研究注射不同剂量雌激素对大白鼠子宫重量的影响,取4窝不同种系的大白鼠,每窝3只,随机地分配到3个组内接受不同剂量的激素注射,然后测定其子宫重量,结果见下表。问注射不同剂量的雌激素对大白鼠子宫重量是否有影响?group种系(区组变量)子宫重量11108124613701443211122264239624653114232116331343498建库:1、点击Variable View: 定义分类变量(组别)和应变量(用力肺活量)NameTypeValues组别Numeric1=0.25, 2=0.50,3=0.75大白鼠种系1=A, 2=B,3=C, 4=D子宫重量Numeric2、点击Data View,输入数据:3、分析过程analyze=>General linear Model =>Univariate (单变量分析)Dependent Variable框:选入 子宫重量Fixed Factor(s)框:选入 组别 和 大白鼠种系 单击Model 框: 单击 Build Term 选入 main effects单击Custom 选入 Descriptive 和 大白鼠种系 单击Continue 单击 Post Hoc框:选入 “组别” 选中“S-N-K 和 Games-Howell”单击Continue单击 Options框:选入 Descriptive Statistics单击ok钮界面说明:【Dependent Variable框】 选入需要分析的变量(应变量),只能选入一个,而且只能为定量变量。这里我们的应变量为 子宫重量,将他选入即可。【Fixed Factor(s)框】 固定因素,说的通俗一些,就是绝大多数要分析的因素都应该往里面选。这里我们要分析的是“大白鼠种系”和“组别”两个变量,把他们选入Fixed Factors框。即选入一个或多个分类(组)变量。固定因素指的是在样本中它所有可能的取值都出现了,比如“组别”,只可能有1、2、3这三个值,并且都出现了,就被称作固定效应;而相对应的随机效应的因素指的是所有可能的取值在样本中没有都出现,或不可能都出现,如本例中的“大白鼠种系”,实际上总体中当然不可能只有这4个种系,因此要用样本中“大白鼠种系”的情况来推论总体中“大白鼠种系”未出现的那些取值的情况时就会存在误差,因此被称为随机因素。我这里让“大白鼠种系”也选入固定框是基于下面的事实:这样做统计分析的结论是完全相同的。【Random Factors框】即随机因素,用于选入随机因素。只有在应用随机效应模型或混合效应模型时才用到。【Covariate框】用于选入协方差分析时的协变量(与应变量有关的定量变量)。协方差分析时才用。【WLS Weight框】即用于选入最小二乘法权重系数。仅用于加权最小二乘分析。【Model钮】 单击后出现一个对话框,用于设置在模型中包含哪些主效应和交互因子,默认情况为Full factorial,即分析所有的主效应和交互作用。我们这里没有交互作用可分析,所以要改一下,否则将做不出结果来。选择右侧的custom单选项,这时中部的Build Term下拉列表框就变黑可用,该框用于选择进入模型的因素交互作用级别,即是分析主效应、两阶交互、三阶交互、还是全部分析。这里我们只能分析主效应:选择main,再用黑色箭头将“组别”和“大白鼠种系”选入右侧的model框中。该对话框中还有两个元素:左下方的Sum of squares框用于选择方差分析模型类别,有1型到4型四种,如果你搞不清他们之间的区别,使用默认的3型即可;中下部有个Include intercept in model复选框,用于选择是否在模型中包括截距,不用改动,默认即可。【Contrast钮】:用于因素内水平间差值比较。弹出Contrast对话框,用于对精细趋势检验和精确两两比较的选项进行定义,在这里,该对话框比单因素方差分析的时候还要专业,使用频率也更少。【Plots钮】选择交互效应轮廓分布图形。用于指定用模型的某些参数作图,制作均值轮廓图(Profile Plot)。轮廓图是线图,用于比较边际均值,表明因变量在因素变量每个水平上的边际均值的估计值,如果指定了协变量,则该均值是经过协变量调整的均值。因变量做纵轴,因素变量做横轴。 做单因素分析时,轮廓图表明该因素各水平的因变量的均值;做双因素分析时,指定一个因素做横轴变量,另一个因素变量的每个水平产生不同的线。双因素或多因素轮廓图中,相互平行的线表明在该因素间无交互效应;不平行的线表明因素间存在交互效应;Factors框中为主对话框中所选因素变量名;Horizontal Axis横坐标框:指定横坐标变量;若看该变量各个水平的因变量均值分布,单击Add,将该因素选入Plots框中。Separate Lines分线框:如果想看两个因素变量组合的各个单元格中因变量均值分布,或想看两个因变量间是否存在交互效应,在Separate Lines框中放入一个因素变量,按Add按钮,将自动生成的图形表达式送入Plot框中,分线框中的变量的每个水平将在图中是一条线。Separate Plot分图框:如果在Factor框中还有因素变量,按照上述方法,将其送入Separate Plot框中,按Add,将自动生成的图形表达式送入Plot框中。分图变量的每个水平生成一张线图。【Post Hoc钮】该按钮弹出的两两比较对话框和单因素方差分析中的一模一样,不再重复。本题对“组别”作两两比较,方法为S-N-K法。【Save钮】将模型拟合时产生的中间结果或参数保存为新变量供继续分析时用,可保存的指标有预测值(Predicted Values)、残差(Residual)、诊断用指标(Diagnostics)等。【Options钮】(完全随机设计方差分析用)定义选项,可以定义输出指标的估计边际均数、并做所选择的两两比较,还有其他一些输出,如常用描述指标、方差齐性检验(完全随机设计方差分析用)等。注: 以上操作过程中,未选择方差齐性检验,因为在Univariate过程中,模型中只要有2个以上因素,就不会给出方差齐性检验的结果。所以,如果需要对处理组及配伍组做方差齐性检验,可以先在One-Way-ANOVA过程分别尝试。本例:A、B、C三组子宫重量方差齐性检验结果子宫重量 Test of Homogeneity of VariancesLevene Statisticdf1df2Sig.40029.6824个种系子宫重量方差齐性检验结果子宫重量 Test of Homogeneity of Variances Levene Statisticdf1df2Sig.49038.699本例结果解释:1、描述统计量Descriptive StatisticsDependent Variable: 子宫重量分组大白鼠种系MeanStd. DeviationN0.25A108.00.1B46.00.1C70.00.1D43.00.1Total66.7530.03740.5A112.00.1B64.00.1C96.00.1D65.00.1Total84.2523.72640.75A142.00.1B116.00.1C134.00.1D98.00.1Total122.5019.6214TotalA120.6718.5833B75.3336.3503C100.0032.1873D68.6727.6833Total91.1733.103122、方差分析结果Tests of Between-Subjects EffectsDependent Variable: 子宫重量 SourceType III Sum of SquaresdfMean SquareFSig.Corrected Model11618.833(a)52323.76732.0640.000Intercept99736.33199736.331376.2010.000group6503.16723251.58344.8670.000种系5115.66731705.22223.5290.001Error434.833672.472Total11179012Corrected Total12053.6711aR Squared = .964 (Adjusted R Squared = .934)上表的标题内容翻译如下:变异来源III型方差SS自由度均方MS统计量FP值校正的模型11618.833(a)52323.76732.0640.000截距99736.33199736.331376.2010.000分组6503.16723251.58344.8670.000种系5115.66731705.22223.5290.001误差434.833672.472合计11179012校正的合计12053.6711以上方差分析结果,首先是所用方差分析模型的检验,F=32.064,P<0.05,因此所用的模型有统计学意义,可以用它来判断模型中系数有无统计学意义;第二行是截距,它在我们的分析中没有实际意义,忽略即可;第三行是变量“分组”,是我们真正要分析的“三个不同剂量”的影响,它的F=44.867,P=0.000<0.05,差异有统计学意义,可认为三种不同剂量的雌激素对大白鼠子宫重量有影响。第四行是变量“四个种系”,可见它也有统计学意义,不过我们关心的不是他。由于可认为三种不同剂量的雌激素对大白鼠子宫重量有影响故需做两两比较。3.两两比较的结果:(方差齐时用) 子宫重量 分组NSubset123Student-Newman-Keuls(a,b)0.25466.750.5484.250.754122.5Sig.1.000 1.000 1.000 Means for groups in homogeneous subsets are displayed. Based on Type III Sum of Squares The error term is Mean Square(Error) = 72.472.aUses Harmonic Mean Sample Size = 4.000bAlpha = .05上表是用S-N-K法进行两两比较的结果。从上表可见,三种不同剂量的雌激素对大白鼠子宫重量的影响均不相同(P<0.05),0.75剂量影响最大,其次是0.50剂量组,影响最小者为0.25剂量组。【精品文档】第 15 页