概率论与数理统计(茆诗松)第二版课后第八章习题参考答案.docx
《概率论与数理统计(茆诗松)第二版课后第八章习题参考答案.docx》由会员分享,可在线阅读,更多相关《概率论与数理统计(茆诗松)第二版课后第八章习题参考答案.docx(48页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第八章方差分析与回归分析本章前三节研究方差分析,讨论多个正态总体的比拟,后两节研究回归分析.讨论两个变量之间的相 关关系.8.1 方差分析8.1.1 问题的提出上一章讨论了单个或两个正态总体的假设检验,这里讨论多个正态总体的均值比拟问题.通常为了研究某一因素对某项指标的影响情况,将该因素在多种情形下进行抽样检验,作出比拟.一 般将该因素称为一个因子,所检验的每种情形称为水平.在每个水平下需要考察的指标都分别构成一个总 体,比拟它们的总体均值是否相等.对每一个总体都分别抽取一个样本,样本容量称为重复数.如果只对一个因子中的多个水平进行比拟,称为单因子方差分析,对多个因子的水平进行比拟,称为 多因
2、子方差分析.本章只进行单因子方差分析.例 在饲料养鸡增肥的研究中,现有三种饲料配方:A,A,A3,为比拟三种饲料的效果,特选24只相似 的雏鸡随机均分为三组,每组各喂一种饲料,6()天后观察仑们的重量.实验结果如下表所示:饲料4A,A鸡重/g1073 1009 1060 1001 1002 1012 1009 10281107 10929901109 1090 1074 1122 1(X)11093 1029 1080 1021 1022 1032 1029 1048在此例中,就是要考察饲料对鸡增重的影响,需要比拟三种饲料对鸡增肥的作用是否相同.这里,饲 料就是一个因子,三种饲料配方就是该因子
3、的三个水平,每种饲料喂养的雏鸡60天后的重量分别构成一 个总体,这里共有3个总体,每一个总体抽取样本的重发数都是8,比拟这3个总体的均值是否相等.8.1.2 单因子方差分析的统计模型设因子A有r个水平,”在每个水平下需要考察的指标都构成一个总体,即有r个总体, 分别记为匕,工,对每一个总体都分别抽取一个样本,首先考虑重复数相等的情形,设重复数都是 m,总体Y的样本匕, 丫,,丫,. i= 1,2,,.作出以下假定: I11 uim(1)每一个总体都服从正态分布,即yN(U,02), i = l,2,L ,r;ii i(2)各个总体的方差都相等,即。2=02=L=。2,都记为。2;2r(3)各个
4、总体及抽取的样本相互独立,即 ,相互独立,1,2,,r, j= 1,2,,m.需要比拟它们的总体均值是否相等,即检验的原假设与备择假设为H : |i = R = = p vs H :,口不全相等,0 I 2rI I 2r如果H,成立,就可以认为这厂个水平下的总体均值相同,称为因子A不显著;反之,如果H。不成立,就 称为因子A显著.在水平4下的样品看.与该水平下的总体均值匕之差7二刀-匕为随机误差.由于5N储,。2), 因此随机误差.N(0,o2).对所有个水平下的总体均值求平均,即 y、 1 y1u=_(u + n +l+u ) = _ZiPr 2r r i称为总均值.每个水平4下的总体均值匕
5、与总均值N之差%=匕- N称为该水平Aj下主效应.显然所有 主效应a i之和等于0,c=l得J入故总均的的最大似然估计为令关于Gk的偏导数等于,有(二 !2(y _ a)yma i = 0 , fc= 1,2, r,叫 2。.为 k m白灯7得a y - = y - H ,故主效应a.的最大似然估计为d=F- y, i=i,2,,r,相应,k m 月k1i -j=i第i个水平下的总体均值H的最大似然估计为=H+a = Y. iii i-令关于。2的偏导数等于0,有。1= -1,+ _!_VV( -|i-a)2=0,3(0 2)2 oT 2c ,乙yy ii=l J = l,1 斤,2人 i _
6、 , s得。-=一乙乙(y -U-a)-,故误差的方差。 的最大似然估计为0 2二一4J(y _y)-=y.由于n y m n y *1 nt=l;=i i=j = sE(S) = (n - r)a 2,可知02不是。2的无偏估计,修偏得的无偏估计。= e= MS .eMH - f e二.置信区间对总均值H,误差的方差。2及第i个水平下的总体均值U给出置信区间. i第i个水平卜息体均值H的点估计为P =Y = Y ,因试验数据Y Ai = 1,2, , r, j= 1,2,m) ii i- m yyj=i相互独立且都服从正态分布W(P,o2),那么有pN(U,_),即* i TYlN(0, 1
7、),但。未知,用二 岸二替换.由于生 X2(几-r)旦S与尸相互独立,那么根据X2分布的定义可得 V n- r02e j.- if n - r),- if n - r),故第i个水平下总体均值匕的置信度为I-a的置信区间是10总均值U的点估计为0 = F = _L y ,因数据y ,( i=l,2,,r, j= 1, 2,,砌相互独立且都服 n ij91=1 J = l从正态分布N,。2),有厂服从正态分布,且IE国4比叫)=我 .衿”i=l J = l1=1 J = 1i=lVar(r)= _LSZ Var(y ) = _!_? 02 =_L. na2 =磔r=l 户 1n2F=1 j =r
8、v.得 YN(U,:5,即ny-uMO, 1),但。未知,用二替换.由于=X2(n-r)且S与P相互独立,那么根据(分布的定义可得 (J 2en- r) t(n- r),故总均值U的置信度为1 -a的置信区间是ApeY t (n- r)-U.22 册s误差的方差。2的点估计为二e ,且SeX2(n-r),故误差的方差。2的置信度为1 -。的置信n- r a2区间是Q2 eQ2 e| (n- r)aA2(n - r)c/21,1 |X2 (九-r)L匕/2X2 (n-r)1*2 (n-r)a/2 II l-a/2例 由前面的鸡饲料对鸡增重问题的数据给出总均值u ,误差的方差O 2及三个水平下总体
9、均值H 1,口2, L 的点估计和置信区间(a = 0.05).解:前面已检验知因子显著,那么三个水平下总体均值u ,N川的点估计为 = 1024,25,1 2 317718,正 T 8585P =Y =j = 1073.125,1 2.m8八 五 T 8354P =Y 2 =1044.25 ,3m8总均值N的点估计为T 25133向产二二 ; 1047.2083,n 2411误差的方差。2的点估计为sG2 =二 MS = 1343.6131, n- r eJI 343.6131=1997.2992, 1051.20081,置信度为0.95的置信区间是|i e 7 t (21 )-1 =(10
10、24.25 2.0796x1 L 。975 小n eY t(21) = 1073.125 2.0796 x 343 6131 = 1 ()46.1742, 11(X).0758,22.0.975 7m我H G7 t (21)1 = 1044.252.0796x V1343 613 = 1Q17.2992, 1071.20081 ,U日匕%533.0.975 诟H=1047.2083 ? 0796x V1343 6131 =031,6482, 1062.7684,724H2G Se9OUL 0.975S I 28215 875. X2 (21)U54789().02528215.8751=795
11、2861 2743.96081.-40229-U 8.1.6 重复数不等的情形如果每个水平下试验次数不全相等,称为重复数不等的情形,其检验方法与在重复数相等的情形下类 似,只是在对数据的表述和处理上有几点区别.数据设第i个水平A,下的重复数为所取得的样本为工,丫,1_, i=l,2,,厂显然重复数总数i iimj为 n, /ri) + m2 + + mr= n.二.总均值总均值|i是各水平下总体均值口的以频率之为权数的加权平均,即 i np = Ar +l + 2h 二_!_机匕 n I n 2n r n *rLi=l三.主效应约束条件第i个水平下主效应a = H - N,那么满足 i iEm
12、a =m|i-n|i = 0. i ii i(=1i=l四.模型 单因子方差分析在重复数不等的情形下,统计模型为V= p + a + , i= 1,2,L, r, j = l,2,L, m;y i OiE ma =0; i=i *f相互独立,且都服从MO.。2).检验 H0: at = a2 = = ar = 0 vs H): 4, 4,不全等于 0.12五.平方和的计算 记T=乙 y, Y =-*- = 一乙y , T= Y = T , Y二一二一乙y =_ mY ,i y i- m m yy i n n y n ,j = li ijli = j=f=il J !i 1那么各平方和的计算公式
13、为s =工(Y -7)2 = 2 Z丫2-同2=2苫匕-11,Tyvv ns =ZS(r -n2-片” =血丫?-八丫?二A&i i-i i-m n fi=ls=s -s 二尔y m i=l i例 某食品公司对一种食品设计了四种新包装,为了考察哪种包装最受顾客欢迎,选了 10个地段繁华程度 相似、规模相近的商店做试验,其中两种包装各指定两个商店销售,另两种包装各指定三个商店销售.在试验期 内各店货架排放的位置、空间都相同,营业员的促销方法也基本相同,经过一段时间,记录其销售量数据,见下 表包装类型销售量数据A 12 18& 14 123A3 19 17A424 30在显著水平a = 0.0i下
14、检验这四种包装对销售量是否有显著影响.解:假设 H0: al = a2 = ay = ai=0 vs H 1: q , q , q , q 不全等于 0,统计量入四.二MsiR( e ee显著水平a = 0.01, n= 10, r= 4,-l,n- r),右侧拒绝域 W= /(99(3, 6) = /9.78,销售量数据计算表因子水平销售量数据%m iTiT“m I I,Y2 y j=iA 12 1:2J30450468A 14 1:13339507509A,19 12135710831091424 3(25414581476总和1018034983544计算可得r T2 11S J_-_T
15、2 =3498-XI802 =258 ,a rnnTCTi=l iS = 匕-匕=3544 - 3498 = 46, eij 171i = l j=i=l i13方差分析表来源平方和自由度均方和尸比因子258误差4636 7.66678611.2174总和3049有 F 比 /= 11.2174 6 W,故拒绝H。,接受H,可以认为这四种包装对销售量有显著影响, 并且检验的 p值p=PF2 11.2174 = 1 - 0.9929 = 0.0071 1 m 2| = y =_Zlf % 19 , 33-l 33_7 54 crp =Y =Ar =27 , 4 4m 2总均值N的点估计为.T 1
16、80 1O|1- Y - = 18,n To误差的方差。2的点估计为 s6 = e = MS = 7.6667 , n- r e置信度为0.99的置信区间是lielV t (6)1 = U5 3.7074 X 7-6667 = 7.7413, 22.2587J ,=13 3.7074 x2日工产(1,。为5 标V2R ef7 t33-0.995R ef7 t33-0.995=7.0733, 18.9267,=193.7074x 767 = 13,0733, 24.9267,n eY t (6) Q I = 27 3.7074 x 7,6667 = 19.7413, 34.2587,4 事 0.
17、995 后72Reyt (6)3= 18士 3.7074 x /7= 14.7538, 21.2462, 0.995 品VI002Se s_4646 1 =12.4801,68.07751.|X2 (6) X2 (6)18.5476 0.6757)0.9950.005148.2多重比拟上一节是将多个总体作为一个整体进行检验.如果检验结果是因子A显著,那么可以认为各水平下的均 值匕不全相等,但却不能直接说明匕中哪些可以认为相等,哪些可以认为不等.这一节是对各个匕两两之 间进行比拟,对U,也就是效应差a.-a作出估计、检验.* J1 j效应差的置信区间效应差 a-a = HH 的点估计为7 - P
18、 .因 y N(U ,。2),( j = ,2,,r, k= 1,2,. m),那么1 J i jj. , 流 ii=Sv N(h,3,Y =J_y N(U,B,a m, kJ i % % kJ j ,且当iHj时,P与P相互独立,可得Y- r NW -U,(J_+-L)O2),(r -r )-(n -p)_fE )MO, 1),(Y-R)a I + 但。未知,用旌信替换.由于且S,与/相互独立,那么根据t分布的定义可得(y - y)-(n-p)j ; ;-t(n - r),L+_Lm m故效应差a a = 口 - 口的置信度为1 - a的置信区间是 i j i JH - R eY -Y t
19、(n-r)-o+ -!d.i j i- 1-82m m例 由前面的鸡饲料对鸡增重问题的数据给出各效应差”匕的点估计和置信区间(a =0.05).解:因机=巾3 = & n= 24,8194 =1024.25,8r-3,有Tr = 2 =8585= 1073.125, 88354= 1044.25, 8那么各效应差U - N的点估计分别为1 JP =Y - Y = 1024.25 - 1073.125 = -48.875 ,P - R =Y - Y = 1024.25 - 1044.25 = -20 , I 3!3-N ” =Y -Y =1073.125-1044.25 = 28.875;232
20、31528215.87521= 36.6553,有(2l)-o I+ = 2.0796 义 36.6553 x 0.5 = 38.1142 ,0.975m m那么各效应差UN中置信度为0.95的置信区间分别是R - R e7 - Y t (21) o.I 21-2-0.9751+ _ = -48.875 38.1142 = -86.9892,- 10.7608,8 8R -H GIF - Y t (21)-=-20 38.1142 = -58.1142, 18.1142),|i -|i G|Y - Y t (21) .a I-+-I = (28.875 38.1142J = -9.2392,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率论 数理统计 茆诗松 第二 课后 第八 习题 参考答案
限制150内