概率论与数理统计(茆诗松)第二版课后第八章习题参考答案.docx
第八章方差分析与回归分析本章前三节研究方差分析,讨论多个正态总体的比拟,后两节研究回归分析.讨论两个变量之间的相 关关系.§8.1 方差分析8.1.1 问题的提出上一章讨论了单个或两个正态总体的假设检验,这里讨论多个正态总体的均值比拟问题.通常为了研究某一因素对某项指标的影响情况,将该因素在多种情形下进行抽样检验,作出比拟.一 般将该因素称为一个因子,所检验的每种情形称为水平.在每个水平下需要考察的指标都分别构成一个总 体,比拟它们的总体均值是否相等.对每一个总体都分别抽取一个样本,样本容量称为重复数.如果只对一个因子中的多个水平进行比拟,称为单因子方差分析,对多个因子的水平进行比拟,称为 多因子方差分析.本章只进行单因子方差分析.例 在饲料养鸡增肥的研究中,现有三种饲料配方:A,A,A3,为比拟三种饲料的效果,特选24只相似 的雏鸡随机均分为三组,每组各喂一种饲料,6()天后观察仑们的重量.实验结果如下表所示:饲料4A,A鸡重/g1073 1009 1060 1001 1002 1012 1009 10281107 10929901109 1090 1074 1122 1(X)11093 1029 1080 1021 1022 1032 1029 1048在此例中,就是要考察饲料对鸡增重的影响,需要比拟三种饲料对鸡增肥的作用是否相同.这里,饲 料就是一个因子,三种饲料配方就是该因子的三个水平,每种饲料喂养的雏鸡60天后的重量分别构成一 个总体,这里共有3个总体,每一个总体抽取样本的重发数都是8,比拟这3个总体的均值是否相等.8.1.2 单因子方差分析的统计模型设因子A有r个水平,”在每个水平下需要考察的指标都构成一个总体,即有r个总体, 分别记为匕,工,对每一个总体都分别抽取一个样本,首先考虑重复数相等的情形,设重复数都是 m,总体Y的样本匕, 丫,,丫,. i= 1,2,,.作出以下假定: I11 uim(1)每一个总体都服从正态分布,即yN(U,02), i = l,2,L ,r;ii i(2)各个总体的方差都相等,即。2=02=L=。2,都记为。2;2r(3)各个总体及抽取的样本相互独立,即 ,相互独立,1,2,,r, j= 1,2,,m.需要比拟它们的总体均值是否相等,即检验的原假设与备择假设为H : |i = R = = p vs H :,口不全相等,0 I 2rI I 2r如果H,成立,就可以认为这厂个水平下的总体均值相同,称为因子A不显著;反之,如果H。不成立,就 称为因子A显著.在水平4下的样品看.与该水平下的总体均值匕之差7二刀-匕为随机误差.由于5N储,。2), 因此随机误差£.N(0,o2).对所有个水平下的总体均值求平均,即 y、 1 y1u=_(u + n +l+u ) = _ZiPr 2r r i称为总均值.每个水平4下的总体均值匕与总均值N之差%=匕- N称为该水平Aj下主效应.显然所有 主效应a i之和等于0,c=l得J入故总均的的最大似然估计为令关于Gk的偏导数等于°,有(二 !£2(y _ a)yma i = 0 , fc= 1,2, r,叫 2。.为 k m白灯7得a y - = y - H ,故主效应a.的最大似然估计为d=F- y, i=i,2,,r,相应,k m 月k1i ««-j=i第i个水平下的总体均值H的最大似然估计为=H+a = Y. iii i-令关于。2的偏导数等于0,有。1"= -1,+ _!_VV( -|i-a)2=0,3(0 2)2 oT 2c ,乙yy ii=l J = l,1 斤,2人 i ££_ , s得。-=一乙乙(y -U-a)-,故误差的方差。 的最大似然估计为0 2二一4J(y _y)-=y.由于n y «m n y *1 nt=l;=i" i=j = sE(S) = (n - r)a 2,可知02不是。2的无偏估计,修偏得的无偏估计。£= e= MS .eMH - f e二.置信区间对总均值H,误差的方差。2及第i个水平下的总体均值U给出置信区间. i第i个水平卜息体均值H的点估计为P =Y = Y ,因试验数据Y Ai = 1,2, , r, j= 1,2,m) ii i- m yyj=i相互独立且都服从正态分布W(P,o2),那么有pN(U,_),即*' i TYlN(0, 1),但。未知,用"二 岸二替换.由于生 X2(几-r)旦S与尸相互独立,那么根据X2分布的定义可得 V n- r02e j.- if n - r),- if n - r),故第i个水平下总体均值匕的置信度为I-a的置信区间是10总均值U的点估计为0 = F = _L££ y ,因数据y ,( i=l,2,,r, j= 1, 2,,砌相互独立且都服 n ij91=1 J = l从正态分布N,。2),有厂服从正态分布,且IE国4比叫)=我£ .衿”i=l J = l1=1 J = 1i=lVar(r)= _LSZ Var(y ) = _!_?£ 02 =_L. na2 =磔r=l 户 1n2F=1 j =rv.得 YN(U,:5,即ny-uMO, 1),但。未知,用"二替换.由于£=X2(n-r)且S与P相互独立,那么根据(分布的定义可得 (J 2en- r) t(n- r),故总均值U的置信度为1 -a的置信区间是ApeY± t (n- r)-U.22 册s误差的方差。2的点估计为二e ,且SeX2(n-r),故误差的方差。2的置信度为1 -。的置信n- r a2区间是Q2 eQ2 e| (n- r)aA2(n - r)c/21,1 |X2 (九-r)L匕/2X2 (n-r)1*2 (n-r)a/2 II l-a/2例 由前面的鸡饲料对鸡增重问题的数据给出总均值u ,误差的方差O 2及三个水平下总体均值H 1,口2, L 的点估计和置信区间(a = 0.05).解:前面已检验知因子显著,那么三个水平下总体均值u ,N川的点估计为 = 1024,25,1 2 317718,正 T 8585P =Y =j = 1073.125,1 2.m8八 五 T 8354P =Y 2 =1044.25 ,3m8总均值N的点估计为T 25133向产二二 ; 1047.2083,n 2411误差的方差。2的点估计为sG2 =二 MS = 1343.6131, n- r eJI 343.6131=1997.2992, 1051.20081,置信度为0.95的置信区间是|i e 7 ±t (21 )-1 =(1024.25 ± 2.0796x1 L 。975 小n eY ± t(21) = 1073.125 ± 2.0796 x 343 6131 = 1 ()46.1742, 11(X).0758,22.0.975 7m我H G7 ± t (21)1 = 1044.25±2.0796x V1343 613 = 1Q17.2992, 1071.20081 ,U日匕%533.0.975 诟H=1047.2083 ± ? 0796x V1343 6131 =031,6482, 1062.7684,724H2G Se9OUL 0.975S I 28215 875. X2 (21)'U54789().02528215.8751=7952861 2743.96081.-40229-U 8.1.6 重复数不等的情形如果每个水平下试验次数不全相等,称为重复数不等的情形,其检验方法与在重复数相等的情形下类 似,只是在对数据的表述和处理上有几点区别.数据设第i个水平A,下的重复数为所取得的样本为工,丫,1_, i=l,2,,厂显然重复数总数i iimj为 n, /ri) + m2 + + mr= n.二.总均值总均值|i是各水平下总体均值口的以频率之为权数的加权平均,即 i np = Ar +l + 2h 二_!_£机匕 n I n 2n r n » *rLi=l三.主效应约束条件第i个水平下主效应a = H - N,那么满足 i iEma =£m|i-n|i = 0. i ii i(=1i=l四.模型 单因子方差分析在重复数不等的情形下,统计模型为V= p + a + £ , i= 1,2,L, r, j = l,2,L, m;y i O'iE ma =0; i=i *f£相互独立,且都服从MO.。2).检验 H0: at = a2 = = ar = 0 vs H): 4, 4,不全等于 0.12五.平方和的计算 记T=乙 y, Y =-*- = 一乙y , T= Y = T , Y二一二一乙y =_ mY ,i y i- m m yy i n n y n ««,j = li ij«li = > j=>f=>i«l J !i »1那么各平方和的计算公式为s =£工(Y -7)2 = 2 Z丫2-同2=2苫匕-11,Tyvv ns =ZS(r -n2-片” =£血丫?-八丫?二A&i i-i i-m n fi=ls=s -s 二尔y m i=l i例 某食品公司对一种食品设计了四种新包装,为了考察哪种包装最受顾客欢迎,选了 10个地段繁华程度 相似、规模相近的商店做试验,其中两种包装各指定两个商店销售,另两种包装各指定三个商店销售.在试验期 内各店货架排放的位置、空间都相同,营业员的促销方法也基本相同,经过一段时间,记录其销售量数据,见下 表包装类型销售量数据A 12 18& 14 123A3 19 17A424 30在显著水平a = 0.0i下检验这四种包装对销售量是否有显著影响.解:假设 H0: al = a2 = ay = ai=0 vs H 1: q , q , q , q 不全等于 0,统计量入四.二MsiR( e ee显著水平a = 0.01, n= 10, r= 4,-l,n- r),右侧拒绝域 W= />/(99(3, 6) = />9.78,销售量数据计算表因子水平销售量数据%m iTiT“m I I,Y2 y j=iA 12 1:2J30450468A 14 1:13339507509A,19 12135710831091424 3(25414581476总和1018034983544计算可得r T2 11S J_-_T2 =3498-XI802 =258 ,a rnnTCTi=l iS = 匕-£匕=3544 - 3498 = 46, eij 171i = l j=i=l i13方差分析表来源平方和自由度均方和尸比因子258误差4636 7.66678611.2174总和3049有 F 比 /= 11.2174 6 W,故拒绝H。,接受H,可以认为这四种包装对销售量有显著影响, 并且检验的 p值p=PF2 11.2174 = 1 - 0.9929 = 0.0071 <a = 0.01. 由于因子显著,那么四个水平下总体均值四,四,四的点估计为 )234_7 3° =g Y = Ar _r 15,>'1 m 2|£ = y =_Zlf % 19 , 33-"l 33_7 54 crp =Y =Ar =27 , 4 4m 2总均值N的点估计为.T 180 1O|1- Y - = 18,n 'To"误差的方差。2的点估计为 s6 = e = MS = 7.6667 , n- r e置信度为0.99的置信区间是lielV ±t (6)1 = U5± 3.7074 X 7-6667 = 7.7413, 22.2587J ,=13 ± 3.7074 x2日工产(1,。为5 标V2R ef7 ± t33-0.995R ef7 ± t33-0.995=7.0733, 18.9267,=19±3.7074x 767 = 13,0733, 24.9267,n eY ± t (6) Q I = 27 ± 3.7074 x 7,6667 = 19.7413, 34.2587,4 事 0.995 后"72Rey±t (6)3= 18士 3.7074 x /"7= 14.7538, 21.2462, 0.995 品VI002Se s_4646 1 =12.4801,68.07751.|X2 (6) X2 (6)18.5476 0.6757)0.9950.00514§8.2多重比拟上一节是将多个总体作为一个整体进行检验.如果检验结果是因子A显著,那么可以认为各水平下的均 值匕不全相等,但却不能直接说明匕中哪些可以认为相等,哪些可以认为不等.这一节是对各个匕两两之 间进行比拟,对U,也就是效应差a.-a作出估计、检验.* J1 j效应差的置信区间效应差 a-a = HH 的点估计为7 - P .因 y N(U ,。2),( j = ,2,,r, k= 1,2,.» m),那么1 J i jj. , 流 ii=Sv N(h,3,Y =J_£y N(U,B,a m, kJ i %» % kJ j ,且当iHj时,P与P相互独立,可得Y- r NW -U,(J_+-L)O2),(r -r )-(n -p)_fE )MO, 1),(Y-R)a I + 但。未知,用旌信替换.由于且S,与/相互独立,那么根据t分布的定义可得(y - y)-(n-p)j ; ;-t(n - r),L+_Lm m故效应差a a = 口 - 口的置信度为1 - a的置信区间是 i j i JH - R eY -Y ±t (n-r)-o+ -!d.i j i- 1-82m m例 由前面的鸡饲料对鸡增重问题的数据给出各效应差”匕的点估计和置信区间(a =0.05).解:因机=巾3 = & n= 24,8194 =1024.25,8r-3,有Tr = 2 =8585= 1073.125, 88354= 1044.25, 8那么各效应差U - N的点估计分别为1 JP =Y - Y = 1024.25 - 1073.125 = -48.875 ,P - R =Y - Y = 1024.25 - 1044.25 = -20 , I 3!3-N ” =Y -Y =1073.125-1044.25 = 28.875;23231528215.87521= 36.6553,有£(2l)-o I+ = 2.0796 义 36.6553 x 0.5 = 38.1142 ,0.975m m那么各效应差UN中置信度为0.95的置信区间分别是R - R e7 - Y ±t (21) o.I 21-2-0.9751+ _ = -48.875 ± 38.1142 = -86.9892,- 10.7608,8 8R -H GIF - Y ±t (21)-=-20 ± 38.1142 = -58.1142, 18.1142),|i -|i G|Y - Y ±t (21) .a I-+-I = (28.875 ± 38.1142J = -9.2392, 66.9892.232-3-0.975丫 88例 由前面的食品包装对销售量影响问题的数据给出各效应差日Nj的点估计和置信区间(a = 0.01).解:因 血=2,机2 = 3,机3 = 3,机4 = 2,n= 10, r-4,有T 30T 39T 57r =_l=_=15, y = 2 =13, r =_ = _=19, rT 54 _J_= 27 ,3- m 3那么各效应差四-n的点估计分别为i Jn -n =y -y =15-13 = 2, n -n = y -y = 15- i9 = -4, I 21-2-131-3-P -n =Y -Y = 15-27 = -12 , n -|1 =Y -Y = 13- 19 = -6,n =y -y = 13-27 = -14 , n - n =y -P = 19-27 =-8;因/ 二借=27689,有£ (6) o = 3.7074 x 2.7689 = 10.2653 ,那么各效应差 u -P 的置信0.995i j度为0.99的置信区间分别是N-u 日rI 21-Y ±t20.995(6)-a L+J = 2±l0.2653x 0.9129 = -7.3709,11.3709,12 30.995-Y ±t (6)-a=-4 ± 10.2653 x 0.9129 = -13.3709,5.3709,0.995-Y ±t (6) a= -12± 10.2653 x 1 = -22.2653,- 1.73471 ,N -P eF232-Y ±t (6) a0.995L+L = 1-6 ± 10.2653x0.8165 = -14.3816, 2.3816, 3H -P e(F - Y ±t (6)-aA2-4-0.995 = 1-I4± 10.2653 x 0.9129 = -23.3709, - 4.6291 J ,R-|i GF -7 ±t (6) a4-0.995f+ 1 = -8 ± 10.2653x0.9129 = -17.3709,1.3709.168.2.2 多重比拟问题对各个口两两之间进行比拟,也就是检验任意两个水平A与A下的总体均值是否相等,即检验假设1 jH y : |1 = |1 vsH y : |1 * |1 , i.j = 1, 2, r.0 i j i j对于每一个假设“?可以采取上一章两个正态总体的均值比拟方法进行检验,但这里需要同时检验0。2二工1 个这种假设.设需要同时检验k个假设每一个假设的显著水平是a,即在打,成立的条件下,接 00受Hi的概率为1 - a,但在所有k个假设Hi都成立的条件下,要同时接受所有假设Hi的概率就可能远000小于1-a.事实上,此时对每一个假设Hi,拒绝Hi的概率为a,而对所有k个假设i = l,2,L,k,000至少拒绝其中一个Hi的概率最大时可能到达ka,即同时接受所有假设Hi的概率就可能只有lka.00可见,需要同时检验多个假设时,一般不应逐个检验每一个假设,而是采用多重比拟方法同时检验多个假设.多重比拟方法,就是针对所有假设,构造一个统一的拒绝域,再逐个进行比拟.这里,需要检验假设Hy : n =|1 vsHy : n * , 1 <i<i<r,o i j1 i j在Hg成立的条件卜.,P与?不应相差太大.对每一个假设“炉,拒绝域可以取为WU=|广-F |nc,0i- >0i- > i/其中c是常数.对所有的假设Hu,统一的拒绝域取为w= Uw片 U(|F -7 IC .yor j y分成重复数相等与不等两种场合进行讨论.8.2.3 重复数相等场合的T法重复数相等时,,水平是平等的,由对称性,可以要求所有的,相等,记为c,即统一的拒绝域为W = U| y - y |> c = max | P - P | 2 c) = (maxY- minY 之 c).一. J / E" ' '-,/ 3 *'a 2因丫 , (i= 1, 2, r, j= 1, 2, , m)相互独立且都服从正态分布w,。2),有p N(|i,).当yi«-«, ma 2所有的假设Hu都成立时,即N = P = = 1 = 口,有PN(U,),那么012r小Wly-nWJ).o/m但o未知,用"=但o未知,用"=替换.由于±X2()且S,与工相互独立,那么根据»分布的定义可得后17统一的拒绝域w的形式可改写为W = max Y - miny2 c二iMMr ' Isfcr rH ¥- -R c max t - min <->y d际 isisr。/诉:y_ u y_ u max Y- min Y其中Q = max -min,=: 产> 1是从分布为£(1)的总体中抽取容量为的样本所得的Isisr G14 区 rG /fm最大与最小顺序统计量之差(极差),称之为t化极差统计量,其分布记为q(J显然,t化极差统计量 Q的分布q(r,£)只与水平个数以及£分布的自由度人有关,而与参数4。?及重复数血无关.分布q(r,)的准确形式比拟复杂,通常采用随机模拟方法得到其分位数/_/,)对于给定的容量 r及自由度力,随机模拟方法是60) 随机生成个标准正态分布N(O, 1)随机数x,x,-,xr,将这个随机数按由小到大的顺序排列, 得到其最小随机数x和最大随机数x(r);0 随机生成1个自由度为力的X?分布X2(4)随机数y;X - X 计算q二山:曲 重复(1)至(3)步N次,得到t化极差统计量Q的N个观测值,只要N非常大(如IO4或105次), 就可得q(r,)的各种分位数, .。(二彳)的近似值当显著水平为a时,拒绝域W= > C =Q>q (r,/),有q (r, /)=。,可得 C即; i e - e许c =q (r,f ) °1-a再逐个将丫 - 7与c比拟,得出每一机加浮否有显著差异的结论.步骤:假设Hu: p = |i o iHH,1 wi<jwr,y -a统计量Q = max I I业ry -a统计量Q = max I I业rY - max Y - min Y-min i/ _ =归始产a 'aW 二显著水平,右侧拒绝域aW 二显著水平,右侧拒绝域Q>q ( r,f),1-a eA计算。二q (,/)二,逐个将| P -P |与c比拟,得出结论. l-a e Qmt- j-例由前面的鸡饲料对鸡酒重影响问题的数据对各因子作多重比拟(a = 0.05).解:假设 Hu:四=U VS1 <t</<3,0 i j1 i jmax统计量Q - maxIM切Y -minV / , min I, = o/Jm iSJ<ra/vm显著水平 a = 0.()5, r=3, fe=n-r=2,右侧拒绝域 IV= Q > q ()95(3, 21) = Q > 3.57,18因 2 8,於后二百笋二 366553,有c = 3.57二 46.2658 ,由于I P-丫 1 = 11024.25-1073.1251 = 48.875 >c,故口 与1有显著差异; 1.2.12Y -Y | = |1024.25-1044.251 = 20<c,故.与口 没有显著差异; I-3-13Y -Y 1 = 11073.125-1044.251 = 28.875 <c,故.与.没有显著差异;2.3-23824重复数不等场合的S法重复数不等时,因(Y -Y )-(1 -R)j i i N(), 1), 丫 m m但。未知,用小= 后但。未知,用小= 后替换由于X2(n-)且S与F, P相互独立,那么根据£分布的定义可得CT 2当所有的假设Hu都成立时,口叩Y -7= n,有(F -?)2(52从而统一的拒绝域可以取为max F可以证明,以山” r - 1e当显著水平为a时,拒绝域w二卜N C2(rTj),有/ (r-l,/)=,I (f-l)OA2 J'-a,-«e (f - 12可得c = o V(r- 1)/ a(r- I,/),19 检验所有水平下的总体均值是否相等,也就是检验所有主效应a 是否全等于0.这样单因子方差分析在重 复数相等的情形下,统计模型为y = |1 + a +£ ,i=l,2,L,匚 j = h2,L, nv,y i ijT a = 0; i = l f E相互独立,且都服从N(0,CJ2). ' y检验的原假设与备择假设为H():=ar=()vs H ): % , Q?,, 不全等于8.1.3 平方和分解一.试验数据对于r个总体下的试验数据V.,r, j=l,2,-, m,记7;表示第i个总体下试验数据总和,V表示第i个总体下样本均值,二rm表示总的样本容量,T表示总的试验数据总和,P表示总的样本均 值,即T , r=f=_!_£y , i=l,2,r, i 血 m jji y n rm yr t=l t=l j=li=l j=li=l用P作为L的点估计,P作为卜i的点估计.又记表示第i个总体下随机误差平均值,u表示总的随机误 v 1i-差平均值,即9 =, i = 1,2, , r, » m Uj=i干4功% 4讯 i=l j=lt=l显然有p = u +,'y=h+t.X- X b在单因子方差分析中通常将试验数据及基本计算结果写成表格形式因子水平试验数据和和的平方平方和AYV.YTT2Xy2111121 m11u&1 11 1Y.22 iL11T211T22i i2j1 I1A1y.Y1Y1TiTi”2rrr2rmrrrjETsr T2i i=l邺2y i=l J = 1因此步骤:假设 Hi/:U=P vs1 <i</< r,0 i j1 i jJmaxF(于行)2 统计量F =即当一=,maxr叶. 白尸(r - "J(一)。( +J(R y显著水平a,右侧拒绝域W=,?=jf (r-lj),II"aeI (r-DffJ逐个将I P 一厂I与c.比拟,得出结论.i- j- y例由前面的食品包装对销售量影响问题的数据对各因子作多重比拟(a = 0.01).解:假设vs H y : H * R , 1 <j</<4,o i j i jJmaxF(Y - y)2统计量F = -里工=max1|yU F(r-1, / ),(T) ist<js4 (r- 121+ 1 Im f显著水平a = 0.01, r=4, f = n-r=6,右侧拒绝域W=仍之方加6) 二 (尸之9.78,因 血=巾4 = 2, m, = my = 3,(f=后二肾2.7689,有 c = 2.7689 x43x9.78 = 14.9981 ,由于| P-P | = |15-13| = 2<c ,故H与U没有显著差异;i- 2-1212|F-F | = |15-19| = 4<c ,故U与N没有显著差异;3-1313I V-Y | = |15-27| = 12<c,故N与口没有显著差异;4.144I7 -F I = |i3-i9| = 6<c ,故心与人没有显著差异; 2-3-2323IV -y | = |13-27| = 14>C,故也与L有显著差异: 2-4-2424|F - 7 | = |19-27| = 8<c,故七与没有显著差异.3.4.343420§8.3方差齐性检验在单因子方差分析统计模型中,总是假设各个水平下的总体方差都相等,Upa2 = a2=L=O2 = O2,I 2r称之为方差齐性.但方差齐性不一定自然成立,需要对其进行检验,检验的原假设与备择假设为H : a2 = a2 = l= a2 vs H ,: 02,02,1,02不全相等, 012rI 2r称为方差齐性检验.各水平下的总体方差分别是以该水平下的样本方差S2作为点估计,以由S2,S2,L,S?构成的函数 iiI 2 r作为检验的统计量.分成重复数相等与不等两种场合进行讨论.8.3.1 重复数相等场合的Hartley检验法重复数相等时,样本方差各水平是平等的,以r个水平下样本方差S2,1,2, l ,1)的最大值与最小值之比作为检验的统计量H i即max(S2, S2, l, S2minS2, S2, L, S2) 12r在方差齐性成立的条件下,统计量H的分布只与水平个数厂及样本方差S?的自由度/二血-1有关, i记为分布的准确形式比拟复杂,通常采用随机模拟方法得到其分位数显然有且H的观测值越接近1,方差齐性越应该成立,因此拒绝域取为W=H>Hi_a(rJ).步骤:假设 H: a2 = a2 = l= a2 Vs H ,: O2,o、l,O2不全相等,0】2rI 2r统计量H =max S 2, S 2, S 2 l 2 r ,minS2, S2, L, S2) 12r显著水平a,右侧拒绝域lV=H>H|_a(r,/), 计算H,并作出判断.这称之为Hartley检验法.例 由前面的鸡饲料对鸡增重影响问题的数据采用Hartley检验法进行方差齐性检验(。=0.05).解:假设 H : 0 2 = 02=02 VS H :。2,。2,。2 不全相等,° I 231123统计量H =maxS2, S2, S2I2_minS2, S2, S2)12 3显著水平 a = 0.05,且 r=3,右侧拒绝域 W= Hn 乜.。,7) 二 (Hn 6.94,根据试验数据计算表,可得194 ,T =81T =8585, T21= 8354, £力= h = 丫 2= 8728984, 3j8398024 ,9230355,2£Ij 3 2jj=lj=l22S2= 1 (8398m/i 81942 '78S2= 1 (9230”4858522 78S2= 1 (8728./ 83542378) = 759.9286,) = 2510.9821 ,) = 759.9286 ,2510.9821 ;可得 H = 33042 C W,759.9286故拒绝H。,接受H,可以认为三个水平下的总体方差满足方差齐性.重复数不等场合大样本情形的Bartlett检验法重复数不等时,样本方差S2 = 1 (Y - Y)2 = 1 1 %-mJ = 1,Er-7? , i= 1,2,-,r,Ii 机一 1ij i, DI - 1 I y H- I771 - 1 I y 7711i六 i LJ = « i LJ=I iJ用C 一杯)2=£丫2-£为第i个水平下的偏差平方和,««> y mj=lj=l if =m -1为其自由度, i iQ 有 S2 = -T, 1 z£q =E£(y-p)2二s,itei=l t=l j=lf =m - r = n - r=f,<=i»=i那么组内偏差均方和S1rMS:亍十不:/£中工代.e e hle i=li=l e即MS.等于样本方差S2, S2,l_, S2以各自自由度所占比例为权数的加权算术平均,而相应的加权几何平均记为GMS即T7 4GMS =1 (S2)4.以MSe与GMS。之商的一个函数作为检验统计量.可以证明,大样本情形,在方差齐性成立的条件下, B=Jen MSe = l f ln(MS ) - S / ln($2) x 2(r-1),C其中常数C = 1 +由于算术平均必大于等于几何平均,即MS NGMS ,当且仅当所有S2都相等时等号成立,即8的观 °e;23测值越小,方差齐性越应该成立,因此拒绝域取为W=Bn X 2 (r-1). "a24步骤:假设 H: Q2 = Q2 =L= Q 2 VS H .: 0 2,02,L,02 不全相等, 0 I 2rI 2rf MSpT, f; , C = 1 +1统计量B = In&XMrT),其中 GMS ="(S2立C GMSe i显著水平a,右侧拒绝域W:82X2 (r-D), i-a计算B,并作出判断.这称之为Bartlett检验法.它适用于每一个样本容量机都不小于5的情形,在重复数相等或不等时, 都可采用.例 由前面的鸡饲料对鸡增重影响问题的数据采用BarUett检验法进行方差齐性检验(a = 0.05).解:假设 H : O2 = CT2 = Q2 VS H :。2,0 2,0 2 不全相等, 01231123f MSm 2,C=l+ 1统计量, B=iln其中 GMS = 11(52)4 'DC GMSe «显著水平a = 0.05,且r=3,右侧拒绝域W= 842二Bn5.9915,0.95根据试验数据计算表,可得S2= 759.9286, S2= 2510.9821, S?= 759.9286,m - =1, /= n - r = 21» MS = 1343.6131, ee, f . MS 21 . 1343.6131 4 可得 B= g Ine_ =In= 3.8363c W,C GMS 1.0635 1131.8696故拒绝Ho,接受H1,可以认为三个水平下的总体方差满足方差齐性.833重复数不等场合小样本情形的修正Bartlett检验法但Bartlett检验法只能适用于每一个样本容量机都不小于5的情形.当样本容量小于5时,Box提出 了修正Bartle