《SPSS第6章方差分析课件.pptx》由会员分享,可在线阅读,更多相关《SPSS第6章方差分析课件.pptx(62页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、6.1 方差分析的基本原理方差分析的基本原理一、方差分析的目的一、方差分析的目的前面讲的平均数差异的显著性检验,是对两个平均前面讲的平均数差异的显著性检验,是对两个平均数的比较。数的比较。然而,在实际工作中,往往还需要对两个以上平均然而,在实际工作中,往往还需要对两个以上平均数进行比较。数进行比较。在比较多组平均数的时候,常用方差分析综合性地在比较多组平均数的时候,常用方差分析综合性地确定几个平均数差异的显著性。确定几个平均数差异的显著性。方差分析的基本功能就在于它对多组平均数差异的方差分析的基本功能就在于它对多组平均数差异的显著性进行检验的作用。显著性进行检验的作用。二、方差分析的逻辑基础二
2、、方差分析的逻辑基础 (一一) 方差分析的基本原理方差分析的基本原理为研究三种不同教材的质量,抽取三个实验班分别为研究三种不同教材的质量,抽取三个实验班分别使用其中一种教材,而对其它因素加以控制。经一使用其中一种教材,而对其它因素加以控制。经一段实验后进行测试,取得三种实验处理的数据如下段实验后进行测试,取得三种实验处理的数据如下表。表。XjXt表表12-1 某校使用三种实验教材后的测验成绩某校使用三种实验教材后的测验成绩从上表可知,三种不同实验教材的教学效果不完全从上表可知,三种不同实验教材的教学效果不完全一致,表现在三个不同实验处理组的平均数之间存一致,表现在三个不同实验处理组的平均数之间
3、存在差异;同时,同一实验组内部的在差异;同时,同一实验组内部的5名样本的反应变名样本的反应变量也存在差异。量也存在差异。我们可以将三个实验组的所有我们可以将三个实验组的所有15名样本分数的差异名样本分数的差异分为两部分:实验组间的差异(称为组间差异)和分为两部分:实验组间的差异(称为组间差异)和实验组内的差异(称为组内差异)。实验组内的差异(称为组内差异)。65707580X=71X=75X=70Xt t=7277组间差异是由于不同实验组的实验处理不同造成的,组间差异是由于不同实验组的实验处理不同造成的,而组内差异是由于实验中一些希望加以控制的非实而组内差异是由于实验中一些希望加以控制的非实验
4、因素和一些未被有效控制的未知因素造成的,它验因素和一些未被有效控制的未知因素造成的,它们统统被认为是误差因素。们统统被认为是误差因素。如果实验数据的总变异主要是由实验因素造成的,那如果实验数据的总变异主要是由实验因素造成的,那么在总差异中组间差异将占较大比例,组内差异只占么在总差异中组间差异将占较大比例,组内差异只占较小比例,这时有充分理由认为不同教材的教学效果较小比例,这时有充分理由认为不同教材的教学效果不同;反之,如果总变异主要是由误差因素造成的,不同;反之,如果总变异主要是由误差因素造成的,那么就只能认为三种教材的教学效果无显著差异。那么就只能认为三种教材的教学效果无显著差异。三、以三、
5、以F检验来推断几个平均数差异的显著性检验来推断几个平均数差异的显著性(一)总平方和可以分解成组间平方和及组内平方和(一)总平方和可以分解成组间平方和及组内平方和例:三组不同学龄的学生识记同一组词汇,见下表。例:三组不同学龄的学生识记同一组词汇,见下表。由于多种因素的影响,学生的分数是参差不齐的,由于多种因素的影响,学生的分数是参差不齐的,在分析各组平均数差异原因或寻找影响差异的主要在分析各组平均数差异原因或寻找影响差异的主要因素时,可以将每个分数与总平均数之间的差异分因素时,可以将每个分数与总平均数之间的差异分成两部分。成两部分。这两部分差异主要是由两类不同的因素所引起,一这两部分差异主要是由
6、两类不同的因素所引起,一类是由实验者操纵的已知的实验因素(三种不同学类是由实验者操纵的已知的实验因素(三种不同学龄)所引起,表现在各小组平均数之间的差异;另龄)所引起,表现在各小组平均数之间的差异;另一类是由偶然因素所引起,表现在各组内部每个分一类是由偶然因素所引起,表现在各组内部每个分数与小组平均数之间的差异。数与小组平均数之间的差异。如果组间差异和组内差异都以其相应的离差平方和如果组间差异和组内差异都以其相应的离差平方和来表示,则它们的关系为:来表示,则它们的关系为: 总平方和总平方和=组间平方和组间平方和+组内平方和组内平方和() ()tjjtXXXXXX某个分数与总平均数的离差,等于这
7、个分数与本组某个分数与总平均数的离差,等于这个分数与本组平均数的离差加上本组平均数与总平均数的离差。平均数的离差加上本组平均数与总平均数的离差。某一小组中某一小组中n个分数与总平均数的离差平方和为:个分数与总平均数的离差平方和为:22()() ()tjjtX XX XXXk组的离差平方和为:组的离差平方和为:222()()()tjjtXXXXnXX总平方和总平方和组内平方和组内平方和组间平方和组间平方和于是上式的关系为:于是上式的关系为:SSt=SSw+SSb组内差异由于实验误差组内差异由于实验误差造成,记为造成,记为SSEE表示误差。表示误差。SSw=SSE组间离差平方和组间离差平方和组内离
8、差平方和组内离差平方和组间差异由于实验处理组间差异由于实验处理效应造成,记为效应造成,记为SSAA表示处理表示处理SSb=SSA (二)总自由度可分解成组间自由度及组内自由度(二)总自由度可分解成组间自由度及组内自由度组间自由度:组间自由度: dfb=k-1组内自由度:组内自由度: dfw=N-k 总自由度:总自由度: dft=N-1dft=dfb+dfw(三)在方差分析中,应分别求其均方(三)在方差分析中,应分别求其均方(MS)组间方差又称作组间均方,以组间方差又称作组间均方,以MSb表示表示 MSb =SSb /dfb dfb=k-1组内方差又称作组内均方,以组内方差又称作组内均方,以MS
9、w表示表示 MSw =SSw /dfw dfw=N-k总均方以总均方以MSt表示表示 MSt =SSt /dft dft=N-1组间与组内方差的组间与组内方差的F比值为:比值为:bwM SFM S(四)在方差分析中,用(四)在方差分析中,用F检验来检验组间与组内方差是否相检验来检验组间与组内方差是否相等。如果组间与组内方差相等,即等。如果组间与组内方差相等,即F比值等于或接近比值等于或接近1,表明,表明各组平均数无显著性差异;如果各组平均数无显著性差异;如果F值很大,值很大,F值大到超过值大到超过F抽抽样分布上某种显著性水平的临界值,则应拒绝组间与组内方样分布上某种显著性水平的临界值,则应拒绝
10、组间与组内方差无显著性差异的零假设,而接受组间与组内方差有显著性差无显著性差异的零假设,而接受组间与组内方差有显著性差异的备择假设。这时,只能作出各组平均数有显著性差异差异的备择假设。这时,只能作出各组平均数有显著性差异的结论。的结论。这一结论是说,分组所依据的因素对实验结果有重要影响,这一结论是说,分组所依据的因素对实验结果有重要影响,或者说,实验者所操纵的实验因素的作用较大。或者说,实验者所操纵的实验因素的作用较大。四、方差分析四、方差分析 (ANOVA)的一些基本概念的一些基本概念(一)概念(一)概念又称变异数分析或又称变异数分析或F检验,其目的是推断两组或多组检验,其目的是推断两组或多
11、组资料的总体均数是否相同,检验两个或多个样本均资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义。数的差异是否有统计学意义。(二)功能(二)功能分析实验数据中不同来源的变异对总变异的贡献大分析实验数据中不同来源的变异对总变异的贡献大小,从而确定实验因素对反应变量是否存在显著影小,从而确定实验因素对反应变量是否存在显著影响。响。(三)种类(三)种类单因素方差分析单因素方差分析两因素方差分析两因素方差分析(四)方差分析中的虚无假设和备译假设(四)方差分析中的虚无假设和备译假设方差分析要检验的虚无假设方差分析要检验的虚无假设H0: k个处理的效应全部相等并均为个处理的效应全部相等并
12、均为0备择假设备择假设H1 : k个处理中至少有一个处理的效应不为个处理中至少有一个处理的效应不为0。如果如果MSb显著大于显著大于MSw,我们就有充分理由拒绝处理,我们就有充分理由拒绝处理效应为效应为0的的H0。 F=MSb /MSw 如果如果F1,说明数据的总变异中处理效应引起的变,说明数据的总变异中处理效应引起的变异所占比例小于或等于实验误差引起的变异;异所占比例小于或等于实验误差引起的变异;当当F1,且落入,且落入F分布的否定域,即当统计量分布的否定域,即当统计量FF(dfl,df2)时,表明实验数据的变异主要由处时,表明实验数据的变异主要由处理效应造成。理效应造成。(五)方差分析的基
13、本条件(五)方差分析的基本条件1、总体服从正态分布。对不能确定总体是否为正态、总体服从正态分布。对不能确定总体是否为正态的样本资料,应进行总体分布的正态性检验(用卡方的样本资料,应进行总体分布的正态性检验(用卡方检验),当检验表明其所来自的总体不是正态时,应检验),当检验表明其所来自的总体不是正态时,应对数据进行正态转换,或使用非参数方法。对数据进行正态转换,或使用非参数方法。2、变异的可加性。数据的总变异可以被分解成意义、变异的可加性。数据的总变异可以被分解成意义明确、彼此相互独立的几个不同来源的部分。明确、彼此相互独立的几个不同来源的部分。3、各处理内的方差一致。各实验处理内的、各处理内的
14、方差一致。各实验处理内的方差彼此方差彼此无显著性差异无显著性差异,这是方差分析的,这是方差分析的最为重要最为重要的前提。的前提。单因素方差分析也称作一维方差分析。它检验由单单因素方差分析也称作一维方差分析。它检验由单一因素影响的一个(或几个相互独立的)因变量,一因素影响的一个(或几个相互独立的)因变量,由因素各水平分组的均值之间的差异,是否具有统由因素各水平分组的均值之间的差异,是否具有统计意义,并可以进行两两间均值的比较,称做组间计意义,并可以进行两两间均值的比较,称做组间均值的多重比较。均值的多重比较。研究研究3个组(分别接受了个组(分别接受了3种不同的教学方法)在英种不同的教学方法)在英
15、语成绩上是否有显著性差异。语成绩上是否有显著性差异。分组变量group英语成绩1、2、3代表3种教学方法应当应当特别特别注意,不注意,不能把三种教学方法能把三种教学方法定义为三个变量,定义为三个变量,而应定义成一个分而应定义成一个分组变量的三个水平。组变量的三个水平。选择分析分析菜单下的均值比较均值比较下单因素方差分析单因素方差分析选项,则打开单因素方差分析单因素方差分析对话框。2单击按钮5单击OK按钮1选择变量英语3选择分组变量group4单击按钮自由度平方和均方F值P值组间组内总A AN NO OV VA A英语1280.4442640.2224.917.0231953.16715130.
16、2113233.61117Between GroupsWithin GroupsTotalSum ofSquaresdfMean SquareFSig.P= 0.023,小于,小于0.05,大于大于0.01。根据输出的根据输出的P值小于值小于0.05,大于,大于0.01,可以看出,在,可以看出,在0.05水平上,否定水平上,否定H0假设,三种教学方法对英语成假设,三种教学方法对英语成绩均数有显著性意义。绩均数有显著性意义。结论是,三种教学方法对英语成绩的变化作用不同。结论是,三种教学方法对英语成绩的变化作用不同。单击Options按钮,则打开Options对话框。输出描述性统计量要求进行方差齐
17、性检验要求绘制均值分布图D De es sc cr ri ip pt ti iv ve es s英语673.166713.702805.5941458.786587.546954.0089.00671.500012.421765.0711658.464284.535854.0092.00690.16676.968982.8450782.853297.480279.0099.001878.277813.791753.2507571.419385.136354.0099.00123TotalNMeanStd. DeviationStd. ErrorLower BoundUpper Bound95%
18、 Confidence Interval forMeanMinimumMaximum2220123:H 各样本的总体方差相等,即方差齐性。 从显著性概率值(sig.=0.301)知,P0.05,不能否定H0,说明各组的方差没有显著性差异,即方差具有齐性。T Te es st t o of f H Ho om mo og ge en ne ei it ty y o of f V Va ar ri ia an nc ce es s英语1.304215.301LeveneStatisticdf1df2Sig. 如果结论是否定H0,说明各组的方差有显著性差异,即方差不齐方差不齐。两种办法,近似F检验1
19、23groupgroup70.0075.0080.0085.0090.0095.00Mean of Mean of 英英语语通过上面的步骤,只能判断一个变量的不同水平是否对观测变量产生显著影响。如果想进一步了解究竟是哪个组和其他组有显著的均值差别,就需要在多个样本均数间两两比较。 H0:1=2= k 总体均数全相等全相等。当F检验的结论为拒绝拒绝H0,接受H1时,只说明多个总体均数不全不全相同相同。若想进一步了解哪些两个总体均数不等,就需要进行多个样本均数间的两两比较,称为 多重比较多重比较。H1:总体均数不全相等不全相等。注意:不要将H1理解为总体均数全不相等全不相等。注意注意:不要用两两比
20、较t检验。单击Post Hoc按钮,则打开Post Hoc对话框。最常用的有:最常用的有:LSD:最小显著差法;:最小显著差法;S-N-K 检验,即q检验检验。方差齐时方差不齐时M Mu ul lt ti ip pl le e C Co om mp pa ar ri is so on ns sDependent Variable: 英语1.666676.58815.804-12.375615.7090-17.00000*6.58815.021-31.0423-2.9577-1.666676.58815.804-15.709012.3756-18.66667*6.58815.013-32.709
21、0-4.624417.00000*6.58815.0212.957731.042318.66667*6.58815.0134.624432.7090(J) group231312(I) group123LSDMeanDifference(I-J)Std. ErrorSig.Lower BoundUpper Bound95% Confidence IntervalThe mean difference is significant at the .05 level.*. 英英 语语671.5000673.1667690.1667.8041.000group213Sig.Student-Newma
22、n-KeulsaN12Subset for alpha = .05Means for groups in homogeneous subsets are displayed.Uses Harmonic Mean Sample Size = 6.000.a. 教法教法1和教法和教法2之间没有显著差异(教法之间没有显著差异(教法1和教法和教法2的均值的均值在同一列中出现),教法在同一列中出现),教法3与教法与教法1、教法、教法3与教法与教法2之间之间差异显著。差异显著。123groupgroup70.0075.0080.0085.0090.0095.00Mean of Mean of 英英语语英语
23、673.1667671.5000690.16671878.2778123TotalNMeanStd. Deviation问题的提出例:某教育部门决定对英语教学进行测试,分别选择北京、天津、上海、重庆4个直辖巿的班级进行测试对象,应用3种不同的教学方案。经过一个学期的教学,在不同地区使用不同教学方案各个班级的英语平均分如下所示,试分析不同地区、不同教学方案对英语成绩平均分的影响是否有显著差异。在这个例子中,教学方案有3种,这是一个自变量;另外,地区类型有4种,这是第二个自变量;这两个因素对英语成绩的影响。打开单因变量多因素方差分析对话框打开单因变量多因素方差分析对话框(1)选择分析分析菜单下的一
24、般线性模型一般线性模型下单因变量多因素方差分析单因变量多因素方差分析选项(2)从左侧列表框中选择因变量,调入右侧的“Dependent Variable:”文本框中。本例选“英语成绩”。(3)从左侧列表框中选择自变量,调入右侧的“Fixed Factor(s):”文本框中。本例选“地区类型”、“教学方案”。(4)这是一个无重复实验问题。单击“Model”按钮,弹出“Univariate:Model”对话框。图中“Specify Model”选项区有两个选项,它们的含义为:Full factorial(全模型,分析所有因素的主效应和交互效应):这是系统的默认值。由于本例题是无重复实验,不存在分析
25、交互效应问题,所以不选择此项。Custom用户自定义模型。单击Custom,激活“Build Term(s)”选项区,同时,左侧的“Factor & Covariates:”列表框中的变量也被激活,并且在变量名后面注明“(F)”因素变量或“(C)”协变量。效应选择:单击“Build Term(s)”选项区中的列表框,出现一个下拉列表。Interaction:交互效应分析;Main effects:主效应分析。选择所要分析的变量,例如“教学方案”和“地区类型”,将它们调入右侧的“Model:”文本框中。“Sum of squares:”选项是选择平方和的处理方法。系统的默认值为“TYPE ”,它
26、的适用面比较宽,接受默认值。“Include intercept in model:”(把截距项包括在模型中)选项系统的默认值,一般接受系统默认值。单击“Continue”按钮,回到主对话框。(5)单击“Options”按钮,弹出“Univariate:Options”对话框。将“Factor(s) and Factor Interactions:”在此列表框中的两个变量调入右侧的列表框中,单击“Continue”按钮,回到主对话框中。在“Display”选项区中,选择“Homogeneity tests”(做方差齐性检验)选项。(6)单击“Post Hoc”按钮,弹出“Univariate:
27、Post Hoc”对话框。在上半部的两个选项中选择要对因素的水平做两两对比的变量。例如,可以依据需要,把两个变量或其中的一个变量,从左侧选项区中调入右侧选项区。这时,下半部的选项区被激活。这表明,必须先选上半部,才能选择下半部。在“Equal Variances Assumed”选项区中,选择“LSD”选项,用最小显著性差异方法两两检验各水平效果均值是否有显著差异。在“Equal Variances Not Assumed”选项区中选择“Tamhanes T2”(方差不相等的、没有正态分布假设的前提)选项。单击“Continue”按钮回到主对话框。(7)单击“OK”按钮,输出结果。T Te e
28、s st ts s o of f B Be et tw we ee en n- -S Su ub bj je ec ct ts s E Ef ff fe ec ct ts sDependent Variable: 英语成绩5815.667a51163.13332.919.000105656.3331105656.3332990.274.0003503.00031167.66733.047.0002312.66721156.33332.726.001212.000635.333111684.000126027.66711SourceCorrected ModelIntercept地区类型教学方案
29、ErrorTotalCorrected TotalType III Sumof SquaresdfMean SquareFSig.R Squared = .965 (Adjusted R Squared = .936)a. 看地区类型、教学方案这两行。方差分析结果M Mu ul lt ti ip pl le e C Co om mp pa ar ri is so on ns sDependent Variable: 英语成绩22.33*4.853.00410.4634.2114.00*4.853.0282.1225.8847.00*4.853.00035.1258.88-22.33*4.853
30、.004-34.21-10.46-8.334.853.137-20.213.5424.67*4.853.00212.7936.54-14.00*4.853.028-25.88-2.128.334.853.137-3.5420.2133.00*4.853.00021.1244.88-47.00*4.853.000-58.88-35.12-24.67*4.853.002-36.54-12.79-33.00*4.853.000-44.88-21.1222.3314.862.752-49.5094.1614.0014.579.949-56.3284.3247.0013.984.159-20.63114
31、.63-22.3314.862.752-94.1649.50-8.3315.007.996-80.7764.1024.6714.430.658-45.6594.98-14.0014.579.949-84.3256.328.3315.007.996-64.1080.7733.0014.138.395-35.52101.52-47.0013.984.159-114.6320.63-24.6714.430.658-94.9845.65-33.0014.138.395-101.5235.52(J) 地区类型上海天津重庆北京天津重庆北京上海重庆北京上海天津上海天津重庆北京天津重庆北京上海重庆北京上海天津
32、(I) 地区类型北京上海天津重庆北京上海天津重庆LSDTamhaneMeanDifference(I-J)Std. ErrorSig.Lower BoundUpper Bound95% Confidence IntervalBased on observed means.The mean difference is significant at the .05 level.*. 地区类型多重比较结果。M Mu ul lt ti ip pl le e C Co om mp pa ar ri is so on ns sDependent Variable: 英语成绩-16.50*4.203.008
33、-26.78-6.22-34.00*4.203.000-44.28-23.7216.50*4.203.0086.2226.78-17.50*4.203.006-27.78-7.2234.00*4.203.00023.7244.2817.50*4.203.0067.2227.78-16.5014.110.638-63.0130.01-34.0014.967.179-83.0015.0016.5014.110.638-30.0163.01-17.5014.003.593-63.6128.6134.0014.967.179-15.0083.0017.5014.003.593-28.6163.61(J) 教学方案BCACABBCACAB(I) 教学方案ABCABCLSDTamhaneMeanDifference(I-J)Std. ErrorSig.Lower BoundUpper Bound95% Confidence IntervalBased on observed means.The mean difference is significant at the .05 level.*. 教学方案多重比较结果。
限制150内