方差分析 精选课件.ppt
关于方差分析 第一页,本课件共有77页第九章第九章 方差分析方差分析(ANOVA)第二页,本课件共有77页方差分析又称为变异分析(方差分析又称为变异分析(analysis of variance,ANOVA),是由斯内德克(),是由斯内德克(George Waddel Snedecor)提出的一种方法。)提出的一种方法。方差分析通过对方差分析通过对多组平均数多组平均数多组平均数多组平均数的的差异差异进行显著性进行显著性检验,分析实验数据中检验,分析实验数据中不同来源不同来源不同来源不同来源的的变异变异对总变异影对总变异影响的大小。响的大小。第三页,本课件共有77页t t检验法适用于样本平均数与总体平均数及两样本平均检验法适用于样本平均数与总体平均数及两样本平均数间的差异显著性检验数间的差异显著性检验,但在生产和科学研究中经常但在生产和科学研究中经常会遇到比较会遇到比较 多个处理优劣的问题,多个处理优劣的问题,即需进行多个平均即需进行多个平均数间的差异显著性检验数间的差异显著性检验(K3)(K3)。这时,若仍采用。这时,若仍采用t t检验法就检验法就不适宜了。这是因为:不适宜了。这是因为:第四页,本课件共有77页 1、检验过程烦琐、检验过程烦琐 例如,一试验包含例如,一试验包含5个处理,采用个处理,采用t检验法要进行检验法要进行10次两两平次两两平均数的差异显著性检验;若有均数的差异显著性检验;若有k个处理,则要作个处理,则要作 k(k-1)/2次类次类似的检验。似的检验。第五页,本课件共有77页2、无统一的试验误差,误差估计的精确性和检验的灵敏性低、无统一的试验误差,误差估计的精确性和检验的灵敏性低 对同一试验的多个处理进行比较时,应该有一个统一的试验误差对同一试验的多个处理进行比较时,应该有一个统一的试验误差的估计值。若用的估计值。若用 t 检验法作两两比较,由于每次比较需计算检验法作两两比较,由于每次比较需计算一个一个s,故使得各次比较误差的估计不统一,同时没有充分,故使得各次比较误差的估计不统一,同时没有充分利用资料所提供的信息而使误差估计的精确性降低,从而降利用资料所提供的信息而使误差估计的精确性降低,从而降低检验的灵敏性。低检验的灵敏性。第六页,本课件共有77页 例如,试验有例如,试验有5个处理个处理,每个处理,每个处理 重复重复 6次,共有次,共有30个观个观测值。进行测值。进行t检验时,每次只能利用两个处理共检验时,每次只能利用两个处理共12个观测个观测值估计试验误差值估计试验误差,误差自由度为,误差自由度为 2(6-1)=10;若利用整个试;若利用整个试验的验的30个观测值估计试验误差个观测值估计试验误差,显然估计的精确性高,且误,显然估计的精确性高,且误差自由度为差自由度为5(6-1)=25。可见,在用。可见,在用t检法进行检验时检法进行检验时,由于,由于估计误差的精确性低,误差自由度小,使检验的灵敏性降低,估计误差的精确性低,误差自由度小,使检验的灵敏性降低,容易掩盖差异的显著性。容易掩盖差异的显著性。第七页,本课件共有77页3、这种两两比较会随着样本组数的增加而加大犯、这种两两比较会随着样本组数的增加而加大犯型错误型错误的概率的概率用用t 检验法进行检验法进行4个处理平均数间的差异显著性检验,若两两比个处理平均数间的差异显著性检验,若两两比较推断正确的概率为较推断正确的概率为95%,则所有比较都正确的概率为则所有比较都正确的概率为0.956=0.74,则降低了推断的可靠性。则降低了推断的可靠性。第八页,本课件共有77页几个常用术语几个常用术语:1、试验指标试验指标(experimental index)为衡量试验结果的好坏或处理效应的高低为衡量试验结果的好坏或处理效应的高低,在试验中具体测,在试验中具体测定的性状或观测的项目称为试验指标。由于试验目的不同定的性状或观测的项目称为试验指标。由于试验目的不同,选择的试验指标也不相同。选择的试验指标也不相同。第九页,本课件共有77页2、试验因素试验因素(experimental factor)试验中所研究的影响试验指标的因素叫试验因素。试验中所研究的影响试验指标的因素叫试验因素。当试验中考察的因素只有一个时,称为当试验中考察的因素只有一个时,称为单因素试验单因素试验;若同时研究两个或两个以上的因素对试验指标的影响时,则若同时研究两个或两个以上的因素对试验指标的影响时,则称为称为两因素或多因素试验两因素或多因素试验。试验因素常用大写字母。试验因素常用大写字母A、B、C、等表示。等表示。第十页,本课件共有77页 3、因素水平因素水平(level of factor)试验因素所处的某种特定状态或数量等级称为试验因素所处的某种特定状态或数量等级称为因素水平因素水平,简,简称称水平水平。第十一页,本课件共有77页4、试验处理试验处理(treatment)事先设计好的实施在试验单位上的具体项目叫试验处事先设计好的实施在试验单位上的具体项目叫试验处理,简称处理。理,简称处理。在单因素试验中,实施在试验单位上的具体项目就在单因素试验中,实施在试验单位上的具体项目就是试验因素的某一水平。进行单因素试验时,试验是试验因素的某一水平。进行单因素试验时,试验因素的一个水平就是一个处理。因素的一个水平就是一个处理。在多因素试验时,试验因素的一个水平组合就是一在多因素试验时,试验因素的一个水平组合就是一个处理。个处理。第十二页,本课件共有77页5 5、重复重复(repetition)(repetition)在试验中,将一个处理实施在两个或两个以上的试验单在试验中,将一个处理实施在两个或两个以上的试验单位上,称为处理的重复数。位上,称为处理的重复数。第十三页,本课件共有77页第一节第一节 方差分析的基本原理及步骤方差分析的基本原理及步骤第十四页,本课件共有77页一、方差分析的基本原理:综合的一、方差分析的基本原理:综合的F F检验检验(一)综合的虚无假设与部分虚无假设(一)综合的虚无假设与部分虚无假设1.1.综合的虚无假设综合的虚无假设样本所归属的总体的平均数相等,即样本所归属的总体的平均数相等,即 HH0 0:1 1=2 2=3 32.2.此为部分虚无假设此为部分虚无假设 组间的虚无假设组间的虚无假设第十五页,本课件共有77页(二)方差的可分解性(可加性)(二)方差的可分解性(可加性)1.1.可加性可加性方差分析作为一种统计方法,是把实验数据方差分析作为一种统计方法,是把实验数据的总变异分解为若干个不同来源的分量。因而它的总变异分解为若干个不同来源的分量。因而它所依据的基本原理是所依据的基本原理是变异变异变异变异的的可加性可加性。第十六页,本课件共有77页即每一个数据与数据的总体平均数差的平方和,可以分解为即每一个数据与数据的总体平均数差的平方和,可以分解为每一组每一组数据各自的离差平方和数据各自的离差平方和与由与由各组数据的平均数组成的一组数据各组数据的平均数组成的一组数据的离差平方和的离差平方和两部分。前者表达的是两部分。前者表达的是组内差异组内差异,即每组数据中各,即每组数据中各个数据之间的差异,也就是个数据之间的差异,也就是个体差异个体差异,表达的是,表达的是抽样误差或随抽样误差或随机误差程度机误差程度;后者表达的是;后者表达的是组间差异组间差异,即,即各组各组平均数之间的平均数之间的差异差异,表达的是实验操纵的差异程度,实验操纵即指自变量的,表达的是实验操纵的差异程度,实验操纵即指自变量的操纵,这两部分差异之间相互独立。操纵,这两部分差异之间相互独立。第十七页,本课件共有77页可用公式表示为:可用公式表示为:SST=SSB+SSw如:欲观察某因素的三个水平对被试是否产生相同的影响:如:欲观察某因素的三个水平对被试是否产生相同的影响:组一:组一:A、A、A、A、A水平一水平一 组二:组二:B、B、B、B、B水平二水平二 组三:组三:C、C、C、C、C水平三水平三 总组:总组:A、A、A、A、A、B、B、B、B、B、C、C、C、C、C第十八页,本课件共有77页2.总体变异的构成总体变异的构成 总体变异总体变异 组间变异:组间变异:组内变异:组内变异理论上要求齐性,实际计算取其组内变异:组内变异理论上要求齐性,实际计算取其均值均值第十九页,本课件共有77页3.3.方差的基本公式方差的基本公式一般总体方差称方差,样本方差称均方一般总体方差称方差,样本方差称均方能使变量发生变异的原因很多,这些原因我们都将其称为变能使变量发生变异的原因很多,这些原因我们都将其称为变异因素或变异来源。异因素或变异来源。第二十页,本课件共有77页方差分析就是发现各类方差分析就是发现各类变异因素相对重要性变异因素相对重要性的一种方法的一种方法方差分析的思路就是:方差分析的思路就是:把整个试验(设有把整个试验(设有 k k 个总体)的样本资料个总体)的样本资料作为一个整体来考虑作为一个整体来考虑。把整个试验的总变异按照变异的来源分解成不同因素的变异把整个试验的总变异按照变异的来源分解成不同因素的变异。由。由于方差等于平方和除以自由度,因此总方差分解成各因素的于方差等于平方和除以自由度,因此总方差分解成各因素的方差,就是将方差,就是将形成总方差的平方和和自由度分解为各因素的平形成总方差的平方和和自由度分解为各因素的平方和和自由度方和和自由度。然后对各个因素的方差作出数量上的估计,。然后对各个因素的方差作出数量上的估计,从而发现各个因素的方差的相对重要程度。从而发现各个因素的方差的相对重要程度。第二十一页,本课件共有77页从总方差中除去各可控因素所引起的方差后,剩余方差从总方差中除去各可控因素所引起的方差后,剩余方差又可以准确地估计试验误差,作为统计假设检验的依据又可以准确地估计试验误差,作为统计假设检验的依据因此,方差分析可以帮助我们抓住试验的主要矛盾和技术关键,因此,方差分析可以帮助我们抓住试验的主要矛盾和技术关键,发现主要的变异来源,从而抓住主要的、实质性的东西。发现主要的变异来源,从而抓住主要的、实质性的东西。第二十二页,本课件共有77页4.4.平方和的剖分平方和的剖分第二十三页,本课件共有77页第二十四页,本课件共有77页第二十五页,本课件共有77页第二十六页,本课件共有77页第二十七页,本课件共有77页SS(sum of squares)表示平方和)表示平方和SST(the sum of squares total)总平方和,一个试验中的总变异。)总平方和,一个试验中的总变异。SSB(sum of squares between groups)组间平方和,表示)组间平方和,表示由于不同的实验处理而造成的变异。(主试)由于不同的实验处理而造成的变异。(主试)SSW(sum of squares within group)试验误差造成的变异。)试验误差造成的变异。(被试)(被试)第二十八页,本课件共有77页 SST=SSB+SSW总变异总变异=组间变异组间变异+组内变异组内变异总变异(总变异(SST)是将所有被试的数值作为一个整体考虑到的)是将所有被试的数值作为一个整体考虑到的结果,是用所有被试的因变量的值计算出来的。结果,是用所有被试的因变量的值计算出来的。组间变异(组间变异(SSB)主要是因为接受不同的实验处理而造成)主要是因为接受不同的实验处理而造成的各组之间的变异。用两个平均数的离差表示。的各组之间的变异。用两个平均数的离差表示。组内变异(组内变异(SSW)指组内各被试因变量的差异范围。)指组内各被试因变量的差异范围。第二十九页,本课件共有77页5.5.组间方差(组间均方)与组内方差(组内均方)组间方差(组间均方)与组内方差(组内均方)第三十页,本课件共有77页6.自由度的分解自由度的分解在计算处理间平方和时,各处理均数在计算处理间平方和时,各处理均数 要受要受 这一条件的约束,故处理间自由度为处理数这一条件的约束,故处理间自由度为处理数减减1,即,即k-1。处理间自由度记为。处理间自由度记为dfB,即,即dfB=k-1。在计算处理内平方和时,每组自由度为在计算处理内平方和时,每组自由度为n-1,共有共有k组,组,故处理内自由度故处理内自由度k(n-1),处理内自由度记为处理内自由度记为dfW,即,即dfW=k(n-1)=kn-k。第三十一页,本课件共有77页第三十二页,本课件共有77页7 7、方差分析、方差分析方差之间的差异分析用方差之间的差异分析用F F检验,因此,组间与组内方差的分检验,因此,组间与组内方差的分析也用析也用F F检验。方差分析关注的是组间均方是否显著大检验。方差分析关注的是组间均方是否显著大于组内均方。因此,常用作单侧检验。于组内均方。因此,常用作单侧检验。第三十三页,本课件共有77页kjkj 表明数据的总变异基本上是有不同的实验处理造表明数据的总变异基本上是有不同的实验处理造成的(不同的实验处理间存在显著差异)成的(不同的实验处理间存在显著差异)表明数据的总变异基本上是有实验误差和个体误表明数据的总变异基本上是有实验误差和个体误差造成的,与不同的实验处理关系不大(不同的实验处差造成的,与不同的实验处理关系不大(不同的实验处理间不存在显著差异)。理间不存在显著差异)。第三十四页,本课件共有77页二、方差分析的基本假设二、方差分析的基本假设1 1总体总体正态正态正态正态分布分布2 2各实验处理是随机的且相互各实验处理是随机的且相互独立独立独立独立(一般情况下都(一般情况下都能满足)能满足)3 3各实验处理内各实验处理内方差一致方差一致方差一致方差一致(需要进行检验)(需要进行检验)最为重要的假定最为重要的假定第三十五页,本课件共有77页三、方差齐性检验三、方差齐性检验1.1.哈特莱最大哈特莱最大F F比率法比率法找出要比较的组内方差的最大值与最小值。最大方差与最找出要比较的组内方差的最大值与最小值。最大方差与最小方差无显著差异即为方差齐性。小方差无显著差异即为方差齐性。第三十六页,本课件共有77页四、方差分析的基本步骤四、方差分析的基本步骤第三十七页,本课件共有77页(一)提出假设(一)提出假设(二)选择检验统计量并计算(二)选择检验统计量并计算 1分解平方和分解平方和 总平方和总平方和SST 组间平方和组间平方和SSB 组内平方和组内平方和SSW第三十八页,本课件共有77页 2分解自由度分解自由度df总自由度:总自由度:dfT=nk-1组间自由度:组间自由度:dfB=k-1组内自由度组内自由度:dfW=nk-k组内自由度组内自由度的的计算计算(1)不同实验处理人数相同时)不同实验处理人数相同时每组自由度每组自由度n1-1,n2-1,n3-1nk-1组内自由度组内自由度n1-1+n2-1+n3-1+nk-1,因为,因为n1=n2=n3=nk,所以为,所以为K(n-1)(2)不同实验处理人数不相同时)不同实验处理人数不相同时每组自由度每组自由度n1-1,n2-1,n3-1nk-1组内自由度组内自由度 n1-1+n2-1+n3-1+nk-1第三十九页,本课件共有77页 3计算方差计算方差MSMSB=SSB/dfB和和 MSW=SSW/dfW 4 4计算计算F F值值F=MSB/MSW(三)作出统计结论(三)作出统计结论1.1.显著性水平显著性水平2.2.临界水平临界水平F F值值3.3.比较推论比较推论第四十页,本课件共有77页(四)陈列方差分析表(四)陈列方差分析表变异(差变异(差异)来源异)来源平方和平方和(SS)自由度自由度(df)均方均方(MS)Fp组间组间SSBdfB=k-1MSBFp组内组内SSWdfW=nk-kMSW总变异总变异SSTdfT=nk-1MST第四十一页,本课件共有77页例:研究人员采用四种不同的心理治疗方案,对每个志愿参例:研究人员采用四种不同的心理治疗方案,对每个志愿参加治疗的患者进行心理治疗。他们用录音机记录了每个被加治疗的患者进行心理治疗。他们用录音机记录了每个被试在一段时间中所讲的词数。由于录音的困难每种方案记试在一段时间中所讲的词数。由于录音的困难每种方案记录的人数各不相同,原始数据见表录的人数各不相同,原始数据见表1 1。问这几种方案是否有。问这几种方案是否有差异?差异?第四十二页,本课件共有77页序号序号治疗方案治疗方案X1X2X3X4130 90050 250018 32488 7744274 547638 144456 313678 6084346 211666 435634 115660 3600458 336462 384424 57676 5776562 384444 193666 4356638 144458 336452 2704780 6400计算表1第四十三页,本课件共有77页1 1提出假设提出假设H0:1234H1:至少有两个总体平均数不等至少有两个总体平均数不等2选择检验统计量并计算选择检验统计量并计算假定四组记录数据是从四个正态总体中抽出的独立样本,假定四组记录数据是从四个正态总体中抽出的独立样本,对多个独立样本平均数的差异进行显著性检验,应采用对多个独立样本平均数的差异进行显著性检验,应采用完全随机设计的方差分析。完全随机设计的方差分析。第四十四页,本课件共有77页第四十五页,本课件共有77页(1)(1).计算平方和:计算平方和:组间平方和组内平方和总平方和第四十六页,本课件共有77页(2)(2)计算自由度计算自由度组间自由度组内自由度总自由度第四十七页,本课件共有77页(3)(3)计算方差计算方差组间方差 组内方差(4)(4)(4)(4)计算值计算值计算值计算值 第四十八页,本课件共有77页3 3 3 3做统计决断做统计决断做统计决断做统计决断,列方差分析表列方差分析表列方差分析表列方差分析表变异变异来源来源平方和平方和自由度自由度方差方差F F 值值概率概率组间组间变异变异2850.43950.13.77*P F 0.05(dfB,dfW)=3.48,p0.05。存在显著差异。存在显著差异。第五十六页,本课件共有77页4.4.列出方差分析表列出方差分析表第五十七页,本课件共有77页二、各实验处理组样本容量不同二、各实验处理组样本容量不同例:研究人员采用四种不同的心理治疗方案,对每个志愿参例:研究人员采用四种不同的心理治疗方案,对每个志愿参加治疗的患者进行心理治疗。他们用录音机记录了每个被加治疗的患者进行心理治疗。他们用录音机记录了每个被试在一段时间中所讲的词数。由于录音的困难每种方案记试在一段时间中所讲的词数。由于录音的困难每种方案记录的人数各不相同,原始数据见表录的人数各不相同,原始数据见表1 1。问这几种方案是否。问这几种方案是否有差异?有差异?第五十八页,本课件共有77页1 1提出假设提出假设H0:1234H1:至少有两个总体平均数不等至少有两个总体平均数不等2选择检验统计量并计算选择检验统计量并计算假定四组记录数据是从四个正态总体中抽出的独立样本,对多个假定四组记录数据是从四个正态总体中抽出的独立样本,对多个独立样本平均数的差异进行显著性检验,应采用完全随机设计独立样本平均数的差异进行显著性检验,应采用完全随机设计的方差分析。的方差分析。第五十九页,本课件共有77页第六十页,本课件共有77页(1)(1).计算平方和:计算平方和:组间平方和组内平方和总平方和第六十一页,本课件共有77页(2)(2)计算自由度计算自由度组间自由度组内自由度总自由度第六十二页,本课件共有77页(3)(3)计算方差计算方差组间方差 组内方差(4)(4)(4)(4)计算值计算值计算值计算值 第六十三页,本课件共有77页3 3做统计决断做统计决断,列方差分析表列方差分析表变异变异来源来源平方和平方和自由度自由度方差方差F F 值值概率概率组间组间变异变异2850.43950.13.77*P0.05组内组内变异变异4786.519251.9总变异总变异7636.922表93 四组记录数据的完全随机设计方差分析表第六十四页,本课件共有77页三、利用样本统计量进行方差分析三、利用样本统计量进行方差分析适用范围:分析资料没有原始数据,只有适用范围:分析资料没有原始数据,只有si2、ni,平均平均数等。数等。适用原始公式求解适用原始公式求解第六十五页,本课件共有77页第六十六页,本课件共有77页第三节第三节 随机区组设计的方差分析随机区组设计的方差分析第六十七页,本课件共有77页含义:所谓区组是指把从同一总体中随机抽取的被试按含义:所谓区组是指把从同一总体中随机抽取的被试按条件相同的原则区分成各个组,使每个组内的被试尽量条件相同的原则区分成各个组,使每个组内的被试尽量保持同质,让每个组均接受所有的各种实验处理,每种保持同质,让每个组均接受所有的各种实验处理,每种实验处理在各个区组中重复的次数相等实验处理在各个区组中重复的次数相等,这种设计也称这种设计也称为为被试内设计被试内设计。对这样获得的多个相关样本的平均数进行。对这样获得的多个相关样本的平均数进行的显著性检验,叫随机区组设计的方差分析。的显著性检验,叫随机区组设计的方差分析。第六十八页,本课件共有77页作用:能考虑个体的影响(即区组效应),可作用:能考虑个体的影响(即区组效应),可将其从组内效应中分离出来。因此,总平方和将其从组内效应中分离出来。因此,总平方和被分解为被分解为组间平方和组间平方和、区组平方和区组平方和、误差项平方误差项平方和和。欠缺:若不能保证同一区组内尽量同质,导致更欠缺:若不能保证同一区组内尽量同质,导致更大误差出现。大误差出现。第六十九页,本课件共有77页每个区组内被试的分配方法:每个区组内被试的分配方法:一个被试作为一个区组,所有被试都要接受各种实验处一个被试作为一个区组,所有被试都要接受各种实验处理;理;每一区组内被试的人数是实验处理数的整数倍;每一区组内被试的人数是实验处理数的整数倍;区组以一个团体为单位,每个单位都接受各种实验处理;区组以一个团体为单位,每个单位都接受各种实验处理;区组效应:区组间的平方和就表示区组效应,实际上,区组平方区组效应:区组间的平方和就表示区组效应,实际上,区组平方和与求组间平方和实质上是相同的,只是符号表示不同而已。和与求组间平方和实质上是相同的,只是符号表示不同而已。区组差异的显著性检验:一般来说没有必要进行,但若要考察区组差异的显著性检验:一般来说没有必要进行,但若要考察区组设计是否必要,则可进行。区组设计是否必要,则可进行。F F=MSMSB B/MS/MSE E 。第七十页,本课件共有77页与随机区组设计方差分析的不同之处:与随机区组设计方差分析的不同之处:总方差的构成:总方差的构成:SST=SSB+SSW=SSB+SSR+SSE 组内方差的构成:组内方差的构成:SSW=SSR+SSE(SSE为残差)为残差)SSR区组平方和区组平方和 SSE=SST-SSB-SSR第七十一页,本课件共有77页组内自由度组内自由度 dfR=n-1 dfE=dfT dfB-dfR=(N-1)-(K-1)-(n-1)=N-K-n+1第七十二页,本课件共有77页第七十三页,本课件共有77页第四节第四节 事后检验事后检验第七十四页,本课件共有77页如果方差分析的结果是多组平均数之间差异显著,这时需要如果方差分析的结果是多组平均数之间差异显著,这时需要做进一步比较,确定在哪些实验处理组之间存在显著差异、做进一步比较,确定在哪些实验处理组之间存在显著差异、而哪些实验处理组之间不存在显著差异,这就是事后检验而哪些实验处理组之间不存在显著差异,这就是事后检验(post hoc test)。这个统计分析过程也被称为事后多重比较)。这个统计分析过程也被称为事后多重比较(multiple comparison procedures)。)。第七十五页,本课件共有77页第五节方差分析的spss实现第七十六页,本课件共有77页2022/12/10感谢大家观看第七十七页,本课件共有77页