第九章双因素和多因素方差分析课件.ppt
第九章双因素和多因素方差分析第1页,此课件共54页哦学习目标n掌握:两因素交叉分组(有重复观察值、无重复观察值)资料的方差分析方法。n熟悉:多因素试验线性模型和不同变异来源期望均方构成。n了解:缺失数据的估计原理及方差分析方法。第2页,此课件共54页哦讲授内容n第一节 双因素方差分析概述n第二节 不同实验类型的双因素方差分析n第三节 多因素试验的方差分析n第四节 缺失数据的估计n第五节 数据变换第3页,此课件共54页哦第一节 双因素方差分析概述v一、双因素试验汇中的几个基本概念1、主效应(main effect):各实验因素相对独立的效应,该效应水平的改变会造成因素效应的改变,如包装方式对果汁销售量的影响。2、互作效应(interaction):两个或多个实验因素的相互作用而产生的效应。第4页,此课件共54页哦3、无交互作用的双因素方差分析或无重复双因素方差分析(Two-factor without replication):两个因素对试验结果。两个因素对试验数据的影响。4、有交互作用的双因素方差分析或可重复双因素方差分析(Two-factor with replication):如果两个因素对试验数据的单独影响外,两个因素的搭配还会对结果产生一种新的影响。第5页,此课件共54页哦二、双因素交叉分组试验设计的描述n(一)双因素试验的数据描述n(二)观测值的描述n(三)平方和与自由度的分解n(四)平方和的简便计算公式n(五)各项均方的计算第6页,此课件共54页哦(一)试验数据的描述第7页,此课件共54页哦(二)观测值的描述v对于上表中的每一个观测值可用线性统计模型描述表示随机误差水平的交互效应第水平和因素的第表示因素水平的处理效应第表示因素水平的处理效应第表示因素均数表示所有观测值的总平其中ijkijjiijkijjiijkiBiAjBiAy第8页,此课件共54页哦(三)平方和与自由度的分解n 1、平方和的分解 总平方和SST被分解为A因素所引起的平方和SSA、B因素所引起的平方和SSB、AB交互作用所引起的平方和SSAB、误差平方和SSe第9页,此课件共54页哦A因素误差平方和B因素误差平方和AB交互作用误差平方和随机误差项平方和2b1jjByyanSS2a1iiAyybnSSa1b12AByyyynijjiijSSa1b1n12ijijkyySSeijk)(第10页,此课件共54页哦v2、平方和的分解与平方和相应的自由度分别为:总自由度:dfT=abn-1vA因素处理间自由度:dfA=a-1vB因素处理间自由度:dfB=b-1v交互作用自由度:dfAB=(a-1)(b-1)v处理内自由度:dfe=ab(n-1)vdfT=dfA+dfB+dfAB+dfe第11页,此课件共54页哦(四)平方和的简便计算方式a1b1n12ijkTCySSijkABBATa1b1n1a1b12ij2ijkSSSSSSSSyn1ySSeijkijCybn1a1i2iASSb1j2jBCyan1SSa1b12AByyyynijjiijSS第12页,此课件共54页哦(五)各项均方的计算1bBBBBSSdfSSMS1abnSSdfSSMSTTTT1-aAAAASSdfSSMS)(1-nabeeeeSSdfSSMS1-b1-aBBBAAAASSdfSSMS第13页,此课件共54页哦第二节 不同实验类型的双因素方差分析n一、固定模型(一)重复试验时的双因素方差分析1、观察值的线性统计模型 2、提出假设ba.,2,1j;.,2,1i0H0H0H,0H0H,0HijA3ij03iA2i02iA1i01,其中):(,):(:;.,21k;.,21j;.,21iyjkijijiijknba,其中第14页,此课件共54页哦3、检验统计量的计算 在F检验时,A因素、B因素和互作效应的检验统计量均以MSe做分母:FA=MSA/MSe FB=MSB/MSe FAB=MSAB/MSe 用F分布的上尾检验,拒绝域为FF4、均方期望ainMSE12j2B1ba)(aiiAanMSE1221b)(2e)(MSEaiijAbanMSE122B)1)(1)((第15页,此课件共54页哦v(二)无重复实验时的双因素方差分析1、观测值的描述2、提出假设的随机变量,分布为相互独立且服从正态;,其中2jib1jja1iijijiijk0N00;.,21j;.,21iyba0H,0H0H,0HiA2i02iA1i01:第16页,此课件共54页哦3、检验统计量的计算 在F检验时,A因素、B因素的检验统计量均以MSe做分母 FA=MSA/MSe FB=MSB/MSe 用F分布的上尾检验,拒绝域为FF第17页,此课件共54页哦(三)交互作用的判断vTukey提供的方法进行因素间是否存在交互作用的判断vP150第18页,此课件共54页哦n二、随机模型1、观察值的线性统计模型 2、提出假设;.,21k;.,21j;.,21iyjkijijiijknba,其中ba.,2,1j;.,2,1i0H0H0H,0H0H,0H2A32032A22022A1201,其中:,:第19页,此课件共54页哦v3、检验统计量的计算 在F检验时,A因素、B因素主效应的检验统计量是以MSAB做分母;互作效应的检验统计量以MSe做分母 FA=MSA/MSAB FB=MSB/MAB FAB=MSAB/MSe 用F分布的上尾检验,拒绝域为FF 注意:检验统计量的分母与统计量的第二自由度与固定效应不同第20页,此课件共54页哦v4、均方期望222Bann)(MSE222bnn)(AMSE2e)(MSE22Bn)(AMSE第21页,此课件共54页哦v三、混合模型(以A为固定因素、B为随机因素为例)v在混合模型中,A、B因素的效应为非可加性,为固定效应,为随机效应v对A做检验时用随机模型,对B及AB交互效应做检验时用固定模型。vP177ijij第22页,此课件共54页哦v例1:随机选择4个小麦品种,施以三种肥料,小区产量列于下表,该问题属于哪种模型?从方差分析的结果可得出什么结论?肥料种类小麦品种不同条件下小区产量/kg(NH4)2SO4NH4NO3Ca(NO3)2121.118.019.4224.022.021.7314.213.312.3431.531.427.5第23页,此课件共54页哦题解v解:本题影响产量的因素包括肥料种类和小麦品种。该问题属于混合模型中无重复的两因素分组交叉分析。iy jy肥料种类小麦品种不同条件下小区产量/kg(NH4)2SO4NH4NO3Ca(NO3)2121.118.019.419.5224.022.021.722.57314.213.312.313.27431.531.427.530.1322.721.1820.23第24页,此课件共54页哦变差来源平方和自由度均方统计量F小麦品种442.173147.39115.02*肥料种类12.4726.244.87误差7.6961.28总和462.3311小麦品种间差异极显著,肥料间无显著差异。第25页,此课件共54页哦v例2:用两种不同的饲料添加剂A和B,以不同比例搭配饲养大白鼠,每一种饲料添加剂取4个水平,每一处理设两个重复。大白鼠增重结果列于下表。请进行统计分析,并回答下列问题。添加剂B添加剂A不同条件下大白鼠增量/g1234132,3628,2218,1623,21226,2429,3327,2317,19333,3930,2433,3723,27439,4331,3528,3236,34第26页,此课件共54页哦v该实验有可能属于哪几种模型?前提是什么?v如果认为是随机模型,设置重复与不设重复对分析结果有无影响?v若实验本身是固定模型,但分析时误认为随机模型,对结论有何影响?若不设重复,又有何影响?第27页,此课件共54页哦v题解:(1)该实验可能属于固定模型、随机模型、混合模型。取决于添加剂本身的性质,即添加剂的效果能否严格重复。v(2)分析:固定模型下:iy jy ajaiB123413425172224.522531251824.7533627352530.7544133303534.75342926.752528.69第28页,此课件共54页哦变差来源平方和自由度均方统计量FA592.3753197.45824.68*B365.3753121.79215.22*AB425.125947.2365.904*误差128168总和1510.87531查F分布表:78.3)16,9(;54.2)16,9(;29.5)6,3(;24.3)6,3(99.095.099.095.0FFFF所以FA、FB、FC均达极显著,所以大白鼠增重与添加剂A、B及其交互作用都有显著关系。第29页,此课件共54页哦v随机模型下:v查F分布表:vFA显著但未达极显著,FB不显著,FAB极显著。v所以大白鼠增重与A、AB的交互作用有显著关系。v综合上面可知,随机模型和固定模型对主效应的认识不同;若不设重复,对固定模型,统计检验无法进行。*18.4ABAAMSMSF58.2ABBBMSMSF*904.5eABABMSMSF99.6)9,3(;86.3)9,3(99.095.0FF第30页,此课件共54页哦第三节 多因素试验的方差分析v一、观测值的描述 假设在一个试验中,A因素有a个水平,B因素有b个水平,C因素有c个水平,每个因素有n次重复,那么观测值的线性统计模型为 n.,21lc.,21kb.,21j.,21iyijklijkikjkijkjiijkl,;,;,;,a第31页,此课件共54页哦A1 A2 A3B1B2B3A1 A2 A3B2B3B1 (a)无交互效应无交互效应 (b)有交互效应有交互效应 图中每条曲线代表图中每条曲线代表B因素的一个水平。若各曲线平行或近似平行因素的一个水平。若各曲线平行或近似平行,可认为无交互效应,否则为有交互效应。以上只是一种直观的判断,可认为无交互效应,否则为有交互效应。以上只是一种直观的判断,在多因素方差分析的过程中,我们对交互作用的有无也可进行统计,在多因素方差分析的过程中,我们对交互作用的有无也可进行统计检验。检验。交互效应交互效应第32页,此课件共54页哦H01:i=0,i=1,2,aH02:j=0,j=1,2,bH03:()ijij=0,i=1,2,=0,i=1,2,a,j=1,2,a,j=1,2,b b备择假设为备择假设为:H HA A:上述各参数中至少有一个不为上述各参数中至少有一个不为0 0。(这实际上是三个备择假设这实际上是三个备择假设。)零假设零假设第33页,此课件共54页哦方差分析的基本思想仍是总变差分解:方差分析的基本思想仍是总变差分解:即:即:SST =SSA +SSB +SSAB +SSe自由度:自由度:abn-1 a-1 b-1 (a-1)(b-1)ab(n-1)总变差分解总变差分解第34页,此课件共54页哦均方数学期望 aiiAAabnaSSEMSE1221)1()(bjjBBbanbSSEMSE1221)1()(aibjijABABbanbaSSEMSE1122)()1)(1()1)(1()(2)1()(nabSSEMSEee第35页,此课件共54页哦 检验两个主效应及一个交互效应的下述三个统计量中,分检验两个主效应及一个交互效应的下述三个统计量中,分母全部采用母全部采用MSe即可。即可。检验检验H01,H02,H03的统计量分别为:的统计量分别为:检验检验H01,H02,H03的统计量的统计量,eAAMSMSF eBBMSMSF eABABMSMSF 从前述的各均方期望可知,只有当各从前述的各均方期望可知,只有当各H0成立时,上述三个分子才成立时,上述三个分子才是是 2的无偏估计量,此时各统计量均服从的无偏估计量,此时各统计量均服从F分布;若某个分布;若某个H0不成立,则相不成立,则相应的分子将有偏大的趋势,从而使对应的统计量也有偏大的趋势,因此可用应的分子将有偏大的趋势,从而使对应的统计量也有偏大的趋势,因此可用F分布上单尾分位数进行检验。分布上单尾分位数进行检验。第36页,此课件共54页哦各效应的估计值各效应的估计值.yy.yiia.yy.jj.)(.xxxxjiijji其中其中i=1,2 a,j=1,2,b。第37页,此课件共54页哦计算公式aibjnkijkTabnSS1112.2yyaiiAabnbnSS12.2.yy1bjjBabnanSS12.2.yy1aibjijSTabnnSS112.2.yy1STTeBASTABSSSSSSSSSSSSSS,第38页,此课件共54页哦计算排列如下表:计算排列如下表:表中最下一行是各列的平均,最右一列是各行的表中最下一行是各列的平均,最右一列是各行的平均平均.y,y,yjiij计算步骤第39页,此课件共54页哦变差来源平方和自由度均方统计量F主效应A主效应B交互效应AB误差 总和 方差分析表方差分析表第40页,此课件共54页哦 把计算所得结果填入上表后,再根据各把计算所得结果填入上表后,再根据各F统计量的自由度查出其统计量的自由度查出其F0.95及及F0.99分位数,并将分位数,并将F计算值与相应分位数相比,大于计算值与相应分位数相比,大于F0.95则在统计量则在统计量F右上角标一个右上角标一个“*”号;大于号;大于F0.99则再加一个则再加一个“*”号。最后用一句话号。最后用一句话对上述方差分析的结果加以总结,即哪些主效应或交互效应达到显著或对上述方差分析的结果加以总结,即哪些主效应或交互效应达到显著或极显著水平,哪些不显著极显著水平,哪些不显著 F测验第41页,此课件共54页哦 如果如果MSAB小于或约等于小于或约等于MSe,即,即FAB小于或约等于小于或约等于1,说明此说明此时交互作用不存在时交互作用不存在,在这种情况下也可把,在这种情况下也可把MSAB和和MSe合并在一起合并在一起(即把即把平方和和自由度都合并平方和和自由度都合并)作为作为2 2的估计量,这样可以提高检验的的估计量,这样可以提高检验的精确度。具体计算公式如下精确度。具体计算公式如下 ABeABeedfdfSSSSSM交互作用不存在交互作用不存在 然后可用作统计量然后可用作统计量FA和和FB的分母,对两个主效应进行统计检验。的分母,对两个主效应进行统计检验。注意查表时分母自由度要相应改变。注意查表时分母自由度要相应改变。第42页,此课件共54页哦原料种类(A)温 度(B)3035401414923251113252462226182475950404338333682214183355350433847445533262930例3 选择最适发酵条件 第43页,此课件共54页哦 本题中显然温度是一个因素,原料种类是另一个因素本题中显然温度是一个因素,原料种类是另一个因素。这两个因素各有三个水平。由于它们的影响都是可控制。这两个因素各有三个水平。由于它们的影响都是可控制、可重复的,因此都是、可重复的,因此都是固定因素。固定因素。在同样温度、原料下在同样温度、原料下所做的几次实验应视为所做的几次实验应视为重复重复,它们之间的差异是由随机误,它们之间的差异是由随机误差所造成的差所造成的。固定因素固定因素第44页,此课件共54页哦.yi j i123 134.518.251823.58 24937.515.534 345.25462739.42 42.9233.9220.12.yj各处理平均数 第45页,此课件共54页哦发酵实验方差分析表 变差来源平方和自由度均方F原料A温度BAB误差1554.183150.50808.821656.5022427777.091575.25202.2161.3512.67*25.68*3.30*总和7170.0035 第46页,此课件共54页哦查查F分 布 表,得:分 布 表,得:F0.9 5(2,2 7)F0.9 5(2,3 0)=3.3 1 6,F0.99(2,27)F0.99(2,30)=5.390,F0.95(4,27)F0.95(4,30)=2.690,F0.99(4,27)F0.99(4,30)=4.018,FFA A,F,FB B均达极显著,标上均达极显著,标上“*”,F FABAB只达显著,标上只达显著,标上“*”。因此酒精产量不仅与原料和温度的关系极显著,与它们的交互作。因此酒精产量不仅与原料和温度的关系极显著,与它们的交互作用也有显著关系。即对不同原料应选用不同的发酵温度。用也有显著关系。即对不同原料应选用不同的发酵温度。F测验第47页,此课件共54页哦 在固定效应模型中,若各在固定效应模型中,若各F F统计量有达到显著或极统计量有达到显著或极显著水平时,常常还需要在各处理间进行多重比较,以选显著水平时,常常还需要在各处理间进行多重比较,以选出所需要的条件组合。出所需要的条件组合。各处理间进行多重比较各处理间进行多重比较 如果有交互作用存在,则一般需要把所有如果有交互作用存在,则一般需要把所有abab个水平个水平组合放在一起比。比较的方法仍与单因素方差分析相组合放在一起比。比较的方法仍与单因素方差分析相同,最常用同,最常用Duncan法。法。第48页,此课件共54页哦 当交互作用存在时,对固定模型若不设置重复,则无法把当交互作用存在时,对固定模型若不设置重复,则无法把SSAB与与SSe分分开,这样将无法进行任何统计检验。因此在固定模型中有交互作用时,开,这样将无法进行任何统计检验。因此在固定模型中有交互作用时,不设置重复的试验是无意义时。不设置重复的试验是无意义时。对固定模型来说,结论只能适用于参加实验的几个水平,不对固定模型来说,结论只能适用于参加实验的几个水平,不能任意推广到其他水平上去。能任意推广到其他水平上去。几点注意事项:几点注意事项:第49页,此课件共54页哦二、平方和与自由度的分解(P179)三、检验统计量的计算 在各种模型中,要特别注意统计量F的计算一定要根据因素的性质来决定。对于固定因素主效应做检验时用随机模型,对随机因素主效应做检验时用固定模型。四、各均方的数学期望第50页,此课件共54页哦v由于由于FAB F0.99(2,22),FB=14.21 F0.99(2,22),因因此两因素(饮料与窝别)的主效应均达极显著此两因素(饮料与窝别)的主效应均达极显著水平。交互效应显然不显著。水平。交互效应显然不显著。第52页,此课件共54页哦v四、方差分析的规律总结一、假设(1)对于固定效应A的假设:(2)对于随机效应B的假设:二、平方和与自由度的分解平方和的分解根据线性统计模型计算自由度的分解规律如下:每一组因素主效应的自由度为该因素的水平减1,每一交互作用的自由度是产生交互作用各因素的自由度的乘积,误差自由度是各因素水平与重复数减1的乘积0:0:210都等于不是所有的iAaHH0H0H2A20:;:第53页,此课件共54页哦v三、均方期望的推演方法(一)对均方期望做规律性规定 方差分析中均方数学期望的推导是选择合适检验统计量的前提。以多因素实验为例,均方期望的规律性做如下规定:ijklijkikjkijkjiijkly第54页,此课件共54页哦