数理统计课件 52-2 两因素方差分析.pdf
二、两因素等重复试验的方差分析 二、两因素等重复试验的方差分析 在上面的讨论中,由于只对 A,B 两个因素的每一种组合水平进行了一次试验,所以不能分析 A,B 两因素间是否存在交互作用的影响.下面讨论在每一组合水平 在上面的讨论中,由于只对 A,B 两个因素的每一种组合水平进行了一次试验,所以不能分析 A,B 两因素间是否存在交互作用的影响.下面讨论在每一组合水平(,)ijA B下等重复试验情形的方差分析问题.设有两个因素 A 和 B,因素 A 有下等重复试验情形的方差分析问题.设有两个因素 A 和 B,因素 A 有r个不同水平个不同水平12,rA AA?,因素 B有,因素 B有s个不同水平个不同水平12,sB BB?,在每一种组合水平,在每一种组合水平(,)ijA B 下重复试验 下重复试验t次,测得试验数据为次,测得试验数据为ijkX(1,2,ir=?,1,2,js=?,1,2,kt=?).将它们列成表(表 5.12).表 5.12 ).将它们列成表(表 5.12).表 5.12 1B 2B sB 1(0.03)A 2(0.04)A?3(0.05)A 11111211,tXXX?21121221,tXXX?11121,rrr tXXX?12112212,tXXX?22122222,tXXX?21222,rrr tXXX?1 11 21,ssstXXX?2 12 22,ssstXXX?12,rsrsrstXXX?假定假定ijkX服从正态分布服从正态分布2(,)ijN (1,2,ir=?,1,2,js=?,1,2,kt=?),且所有),且所有ijkX相互独立,相互独立,ij 可以表示为 可以表示为 ijijij=+,1,2,ir=?,1,2,js=?其中 其中111rsijijrs =,11()siijjs=,1jr=1ri=()ij ,()ijijij=.因素 B 因素 A 容易证明下列各式成立 容易证明下列各式成立 10rii=,10sjj=,10riji=,10sijj=,1,2,1,2,ir js=?从而得两因素等重复试验方差分析的数学模型为 从而得两因素等重复试验方差分析的数学模型为 ijkijijijkX=+=+,2(0,)ijkN ,(5.18),(5.18)1,2,1,2,1,2,ir js kt=?=?,其中,其中ijk 相互独立,相互独立,i 称为因素称为因素A在水平在水平iA 的效应,的效应,j 称为因素 B在水平称为因素 B在水平jB的效应,的效应,ij 称为因素称为因素,A B在组合水平在组合水平(,)ijA B 的交互作用效应.因此,要判断因素 A,B 以及 A 与 B 交互作用 AB 的影响是否显著,分别等价于检验假设 的交互作用效应.因此,要判断因素 A,B 以及 A 与 B 交互作用 AB 的影响是否显著,分别等价于检验假设 01121112:0:,rrHH =?中至少有一个不为 0.中至少有一个不为 0.02121212:0:,ssHH=?中至少有一个不为 0.中至少有一个不为 0.031311:0,1,2,1,2,.:,ijrsHir jsH=?=?中至少有一个不为0的问题.为了导出上述三个假设检验的统计量,仍采取离差平方和分解的办法.令 中至少有一个不为0的问题.为了导出上述三个假设检验的统计量,仍采取离差平方和分解的办法.令 1111rstijkijkXXrst=,11tijijkkXXt=i i,111stiijkjkXXst=ii ii,111rtjijkikXXrt=i ii i 于是有 于是有 TQ=2111()rstijkijkXX=111()()rstijijkXXXX=+iii iiii i 2()()ijijijijkXXXXXX+iiiii iiiiii i 22111111()()rstrstijijkijkXXXX=+iii iiii i 22111111()()rstrstijijijijkijkijkXXXXXX=+iiiii iiiiii i BABAEQQQQ+(5.19)其中 (5.19)其中 2211112211112B1112112111()(),()(),()(),(),rstrAiiijkirstsBjjijkirstijAijijkrsijijijrstijEijkijkQXXstXXQXXrtXXQXXXXtXXXXQXX=+=+=+=+=i ii iiiiiii iiiii iiiii ii iiiiiii iiiii iiii (5.20)称 (5.20)称AQ为因素 A 引起的离差平方和,为因素 A 引起的离差平方和,BQ为因素为因素B引起的离差平方和,引起的离差平方和,BAQ为因素为因素A与与B的交互作用的交互作用A B引起的离差平方和,引起的离差平方和,EQ为误差平方和.令 为误差平方和.令 1111rstijkijkrst =,1ijt=i i1tk=ijk,11siijjs =iiiiii,11rjijir =i iii ii 则可得 则可得 21212B112111()()()()riAiisjBjirsijijAijijrstijEijkijkQstQrtQtQ=+=+=i iiiii iiiii iiiii iiii (5.21)(5.21)22122122B112()(1),()(1),()(1)(1),()(1).rAiisBjirsAijijEE QrstE QsrtE QrstE Qrs t=+=+=+=+=+=+=(5.22)令 (5.22)令 1AAQQr,AQ称为因素 A 引起的平均离差平方和,称为因素 A 引起的平均离差平方和,1BBQQs,BQ称为因素 B 引起的平均离差平方和,称为因素 B 引起的平均离差平方和,BB(1)(1)AAQQrs=,BAQ称为因素 A 与 B 的交互作用引起的平均离差平方和,称为因素 A 与 B 的交互作用引起的平均离差平方和,(1)EEQQrs t=,EQ称为平均离差平方和.于是 称为平均离差平方和.于是 221(),1rAiistE Qr =+=+221(),1sBjjrtE Qs =+=+22B11(),(1)(1)rsAijijtE Qrs =+=+2().EE Q=当 当01H成立时,成立时,()AE Q()EE Q,否则,否则,()AE Q()EE Q;当;当02H成立时,成立时,()BE Q()EE Q,否则,否则()BE Q()EE Q;当;当03H成立时,成立时,()A BE Q()EE Q,否则有,否则有()A BE Q()EE Q,令,令 AAEQFQ=,BBEQFQ=,BBAAEQFQ=,则当,则当010203,HHH不成立时,不成立时,B,ABAFFF都有偏大的趋势,因此都有偏大的趋势,因此B,ABAFFF可分别作为检验假设可分别作为检验假设010203,HHH的统计量,下面导出的统计量,下面导出,ABFF及及BAF的概率分布.在的概率分布.在0102,HH和和03H都成立的条件下,有离差平方和分解公式(5.20)得 都成立的条件下,有离差平方和分解公式(5.20)得 22111111()()rstrstTijkijkijkijkQXX =2211()()rsijijstrt=+iii iiii i 2211111()()rsrstijijijijkijijkt=+iiii iiiiii ii,上式两边同除以,上式两边同除以2 后,左边后,左边21TQ 是自由度为是自由度为1rst 的的2 变量,而右边各项的自由度分别是:变量,而右边各项的自由度分别是:21AQ 的自由度为的自由度为1r ;21BQ 的自由度为的自由度为1s;21A BQ 的自由度为的自由度为(1)(1)rs ;21EQ 的自由度为的自由度为(1)rs t .由于右边各项自由度之和等于左边.由于右边各项自由度之和等于左边2 变量的自由度,故由柯赫伦因子分解定理知:变量的自由度,故由柯赫伦因子分解定理知:221(1)AQr ,221(1)BQs ,221(1)(1)A BQrs,221(1)EQrs t ,且它们相互独立.从而由 F 分布的定义知当,且它们相互独立.从而由 F 分布的定义知当0102,HH和和03H成立时 成立时 AAEQFQ=服从自由度为(服从自由度为(1r,(1)rs t)的 F 分布;)的 F 分布;=BBEQFQ服从自由度为(服从自由度为(1s,(1)rs t)的 F 分布;)的 F 分布;BBAAEQFQ=服从自由度为(服从自由度为((1)(1)rs ,(1)rs t)的 F 分布.给定的显著性水平)的 F 分布.给定的显著性水平,查 F 分布表可得,查 F 分布表可得 1,(1)F rrs t,1,(1)F srs t 和 和(1)(1),(1)Frsrs t 的值,由一次抽样后所得的样本值算得 的值,由一次抽样后所得的样本值算得 AF,BF和和BAF的值.若 的值.若 1,(1)AFF rrs t,则拒绝,则拒绝01H,则认为因素 A 对试验结果有显著影响,否则,接受,则认为因素 A 对试验结果有显著影响,否则,接受01H,即认为因素 A 对试验结果无显著影响.若 ,即认为因素 A 对试验结果无显著影响.若 1,(1)BFF srs t,则拒绝,则拒绝02H,则认为因素 B 对试验结果有显著性影响,否则,接受,则认为因素 B 对试验结果有显著性影响,否则,接受02H,即认为因素 B 对试验结果无显著影响.若 ,即认为因素 B 对试验结果无显著影响.若 B(1)(1),(1)AFFrsrs t 则拒绝 则拒绝03H,则认为因素 A 与 B 的交互作用对试验结果有显著性影响,否则,接受,则认为因素 A 与 B 的交互作用对试验结果有显著性影响,否则,接受03H,即认为因素 A 与 B 的交互作用对试验结果无显著影响.将整个分析过程列成双因素方差分析表如下(见表 5.13).,即认为因素 A 与 B 的交互作用对试验结果无显著影响.将整个分析过程列成双因素方差分析表如下(见表 5.13).表 5.13 方差来源 离差平方和 自由度 平均离差平方和F 值 显著性 表 5.13 方差来源 离差平方和 自由度 平均离差平方和F 值 显著性 因素 A 因素 A AQ 1r 1AAQQr=AAEQFQ=因素 B 因素 B BQ 1s 1BBQQs=BBEQFQ=交互作用交互作用A B BAQ (1)(1)rs(1)(1)A BA BQQrs=BBAAEQFQ=误差 误差 EQ (1)rs t (1)EEQQrs t=总和 总和 TQ 1rst 表中离差平方和 表中离差平方和 AQ,BQ,BAQ,EQ,TQ也可用如下公式计算,令 也可用如下公式计算,令 111rstijkijkTX=,21PTrst=,21111()rstijkijkUXst=,21111()srtijkjikVXrt=,21111()rstijkijkRXt=,2111rstijkijkWX=,则可得,则可得,ABQUP QVP=BAQRUVP=+,ETQWR QWP=.(5.23).(5.23)例 5.6 例 5.6 考察合成纤维中对纤维弹性有影响的两个因素,收缩率 A和总拉伸倍数 B.A 和 B 各取 4 种水平,每种组合水平重复试验两次,得数据见表 5.14 考察合成纤维中对纤维弹性有影响的两个因素,收缩率 A和总拉伸倍数 B.A 和 B 各取 4 种水平,每种组合水平重复试验两次,得数据见表 5.14 表 5.14 460(表 5.14 460(1B)520()520(2B)580()580(3B)640()640(4B)0(0(1A)4()4(2A)8()8(3A)12()12(4A)71,73 73,75 76,73 75,73 72,73 76,74 79,77 73,72 75,73 78,77 74,75 70,71 77,75 74,74 74,73 69,69)71,73 73,75 76,73 75,73 72,73 76,74 79,77 73,72 75,73 78,77 74,75 70,71 77,75 74,74 74,73 69,69 试问收缩率和总拉伸率倍数分别对纤维弹性有无显著影响?收缩率与总拉伸倍数之间的交互作用是否影响显著?(试问收缩率和总拉伸率倍数分别对纤维弹性有无显著影响?收缩率与总拉伸倍数之间的交互作用是否影响显著?(0.05)解 依题意有0.05)解 依题意有4rs=,2t=.,ABFF和和BAF值的计算按如下双因素方差分析表进行(表 5.15).由值的计算按如下双因素方差分析表进行(表 5.15).由 0.05,查 F 分布表0.05,查 F 分布表0.050.05(3,16)3.24,(9,16)2.54FF=比较知 比较知 0.0517.53.24(9,16)AFF=,0.052.13.24(3,16)BFF=,故合成纤维收缩率对弹性有显著影响,总拉伸倍数对弹性无显著影响,而收缩率和总拉伸倍数的交互作用对弹性有显著影响.,故合成纤维收缩率对弹性有显著影响,总拉伸倍数对弹性无显著影响,而收缩率和总拉伸倍数的交互作用对弹性有显著影响.因 素 B 因 素 A 表 5.15 方差 来源 离差平 方和 自由度 均方误差 F 值 显著性 表 5.15 方差 来源 离差平 方和 自由度 均方误差 F 值 显著性 拉伸 率 A 总拉伸倍数 B 交互作用AB 误差 总和 70.594 8.594 79.531 21.500 180.2191 3 3 9 16 31 拉伸 率 A 总拉伸倍数 B 交互作用AB 误差 总和 70.594 8.594 79.531 21.500 180.2191 3 3 9 16 31 223.531AS=22.865BS=28.837A BS=21.344ES=17.5AF=2.1BF=B6.6AF=*