第八章-单因素试验结果的统计分析--《试验设计与统计分析》课件.ppt
第八章第八章 单因素试验结果的统计分析单因素试验结果的统计分析单单因素因素试验试验指指仅仅研究一个供研究一个供试试因素若干因素若干处处理理间间的的效效应应是否有是否有显显著差异的著差异的试验试验.按试验设计的类型单因素试验可分为:按试验设计的类型单因素试验可分为:顺序排列试验顺序排列试验单因素完全随机试验单因素完全随机试验单因素随机区组试验单因素随机区组试验拉丁方试验拉丁方试验 v第一节第一节 对比和间比试验的统计分析对比和间比试验的统计分析(自学自学)v第二节第二节 完全随机试验设计的统计分析完全随机试验设计的统计分析v完全随机设计完全随机设计:是所有的处理和重复小区在:是所有的处理和重复小区在整个试验空间完全随机排列的设计方法。整个试验空间完全随机排列的设计方法。v只满足试验设计三项基本原则中的只满足试验设计三项基本原则中的重复重复和和随随机机排列两项原则。排列两项原则。如:如:k=5,n=3的完全随机排列示意图的完全随机排列示意图 C E C B D A D E A C E B A D B常用于温室和盆栽试验以及处理内变异相差较大的遗传试验常用于温室和盆栽试验以及处理内变异相差较大的遗传试验等。等。可用三套可用三套(15张张)小纸片,即小纸片,即3张张A、3张张B.3张张E,混匀,混匀后摆成后摆成3排,每排摆排,每排摆5张,从而完成随机。张,从而完成随机。根据每一根据每一处处理的重复次数或重复的理的重复次数或重复的设计设计方法方法不同不同,又分又分为为:组组内内观观察察值值数目相等;数目相等;组组内内观观察察值值数目不等的完全随机数目不等的完全随机试验试验;组组内又可分内又可分为亚组为亚组的完全随机的完全随机试验试验一、一、组内观察值数目相等的完全随机试组内观察值数目相等的完全随机试验设计的统计分析验设计的统计分析组组内内观观察察值值数目相等的完全随机数目相等的完全随机试验试验是各处理是各处理重复次数相等的试验。重复次数相等的试验。设有设有k个处理,每处理均有个处理,每处理均有n个重复观察个重复观察值,共设值,共设kn个观察值;其资料的数据结构模个观察值;其资料的数据结构模式类型见式类型见第第7章表章表7.1。其试验结果的方差分。其试验结果的方差分析方法列于表析方法列于表8.1。处处理理重复观察值重复观察值(xij,i=1,2,k;j=1,2,n)总和总和Ti平均平均1x11x12x1nT12x21x22x2nT2ixi1xi2xinTikxk1xk2xknTkT=xij=x表表7.1 k个个处处理每理每处处理理n个重复个重复观观察察值值的完全随机的完全随机试验试验数据符号表数据符号表变变异来源异来源DFSSMS F期望均方期望均方固定模型固定模型 随机模型随机模型处处理理间间误误 差差总变总变异异表表8.1 组组内内观观察察值值数目相等的完全随机数目相等的完全随机试验试验的方差分析的方差分析例例8.1研究研究6种棉花种子包衣种棉花种子包衣剂对剂对棉花生棉花生长长的影响,的影响,设设TW1为对为对照。采用盆栽照。采用盆栽试验试验,各种,各种子包衣子包衣剂处剂处理播种理播种5盆,完全随机盆,完全随机设计设计。出苗。出苗一定一定时时期后期后测测定棉花苗高(定棉花苗高(cm),其),其结结果如果如下。下。试检验试检验各种子包衣各种子包衣剂剂与与对对照的棉花平均苗照的棉花平均苗高差异高差异显显著性及各种子包衣著性及各种子包衣剂剂棉花平均苗高棉花平均苗高间间的差异的差异显显著性。著性。解:解:已知:已知:处处理数理数k=6,重复次数,重复次数n=5,共有,共有kn=65=30个个观观察察值值。1、自由度及平方和的分解、自由度及平方和的分解 总自由度总自由度 dfT=nk 1=6 5 1=30 1=29 处理自由度处理自由度 dft=k 1=6 1=6 1=5 误差自由度误差自由度dfe=dfT dft=29 5=24 或或 dfe=n(k 1)=6(5 1)=24 1=23矫正数矫正数 2、F 检验检验和列方差分析表和列方差分析表统计统计假假设设HO:1=2=6;HA:i不不“全相等全相等”(即至少有一个不等号即至少有一个不等号)将上述将上述计计算的各算的各项项自由度、平方和、均方自由度、平方和、均方结结果果,按按变变异来源列出方差分析表异来源列出方差分析表(表表8.5)。表表8.3 种子包衣种子包衣剂对剂对棉花苗高影响的方差分析表棉花苗高影响的方差分析表变变异来源异来源 DFSSMSFF0.05F0.01P处处理理间间544.463 8.8926 164.070*2.62 3.909.6910-18误误 差差241.300 0.0542总变总变异异29 45.763FF0.01,故,故P0.01;表明种子包衣;表明种子包衣剂处剂处理理间间差异极差异极显显著著,即即6种棉花种子包衣种棉花种子包衣剂对剂对棉花棉花苗高的影响有极苗高的影响有极显显著差异。著差异。3、处处理平均数的多重比理平均数的多重比较较当各当各处处理平均数与理平均数与对对照相比照相比较时较时,一般采,一般采用最小用最小显显著差数法(著差数法(LSD法)。当法)。当处处理理间间相相互比互比较时较时,常采用新复极差法(,常采用新复极差法(SSR法)。法)。种子包衣种子包衣剂剂平均数平均数(cm)与与对对照的差异照的差异TW524.481.96*TW223.761.24*TW623.641.12*TW323.120.6*TW1(CK)22.52 TW420.66 1.86*然后,然后,计计算算处处理平均数于与理平均数于与对对照平均数的照平均数的差数,差数,检验检验各种子包衣各种子包衣剂剂与与对对照的差异照的差异显显著性著性结结果列于表果列于表8.6。表表8.4 种子包衣种子包衣剂处剂处理的棉花苗高与理的棉花苗高与对对照相比的差异照相比的差异显显著性著性新复极差法新复极差法(SSR法法)计算平均数标准误。计算平均数标准误。根据根据显显著水平著水平、误误差自由度差自由度=24和两极差和两极差间间所包含的平均数的个数所包含的平均数的个数p(秩次距),(秩次距),p=2,3,4,5,6查查SSR表,表,查查得得临临界界SSR0.05(24,p)和和SSR0.01(24,p)值值;再计算最小显著极差再计算最小显著极差 表表8.5 种子包衣种子包衣剂对剂对棉花苗高影响的棉花苗高影响的LSR值值p23456SSR0.052.923.073.153.223.28SSR0.013.964.144.244.334.39LSR0.050.3040.3200.3280.3350.341LSR0.010.4120.4310.4420.4510.457用标记字母法表示新复极差法多重比较的用标记字母法表示新复极差法多重比较的结果。结果。表表8.6 6种子包衣种子包衣剂对剂对棉花苗高的影响新复极差棉花苗高的影响新复极差检验结检验结果果种子包衣种子包衣剂剂平均数平均数(cm)差异差异显显著性著性5%1%TW524.48a ATW223.76 b BTW623.64 b BTW323.12 c CTW1(CK)22.52 d DTW420.66 e E4、试验结论试验结论试验结论试验结论1 由由LSD法法显显著性比著性比较结较结果(表果(表8.4)表)表明,种子包衣明,种子包衣剂剂TW5、TW2、TW6和和TW3均比均比对对照照TW1极极显显著的促著的促进进了棉花的生了棉花的生长长,TW4比比对对照照TW1极极显显著的抑制了棉花的生著的抑制了棉花的生长长 试验结论试验结论2 由新复极差检验结果(表由新复极差检验结果(表8.6)表明,)表明,种子包衣剂种子包衣剂TW5促进棉花生长的效果极显著的高促进棉花生长的效果极显著的高于于TW2、TW6、TW3、TW1和和TW4;种子包衣;种子包衣剂剂TW2和和TW6促进棉花生长的效果极显著高于促进棉花生长的效果极显著高于TW3、TW1和和TW4,TW2和和TW6间无显著差异;间无显著差异;TW3促进棉花生长的效果极显著高于促进棉花生长的效果极显著高于TW1和和TW4;TW1促进棉花生长的效果极显著高于促进棉花生长的效果极显著高于TW4。自由度及平方和分解的差异自由度及平方和分解的差异总变异自由度总变异自由度 dfT=ni 1 误差自由度误差自由度 矫正值矫正值 C=T2/ni总平方和总平方和 处理平方和处理平方和 误差平方和误差平方和 平均数多重比较的计算差异平均数多重比较的计算差异平均数标准误平均数标准误 上式的上式的nA和和nB系两个相比系两个相比较较的平均数的的平均数的样样本容量。但亦可先算得各本容量。但亦可先算得各ni的平均数的平均数n0。则平均数标准误则平均数标准误 平均数差数标准误平均数差数标准误 解:解:已知:品种数已知:品种数k=5,各品种重复次数,各品种重复次数n1=n2=6,n3=5,n4=n5=4。自由度与平方和的分解自由度与平方和的分解总自由度总自由度 dfT=ni 1=25-1=24品种间自由度品种间自由度 dft=k 1=5-1=4误差自由度误差自由度 dfe=dfT dft=24 4=20矫正数矫正数总平方和总平方和 品种间平方和品种间平方和 误差平方和误差平方和 SSe=SSTSSt=267.7576 150.0863 =117.6713平均数平均数间间多重比多重比较较比较各品种平均株高间有无显著差异比较各品种平均株高间有无显著差异,宜采宜采用新复极差检验作多重比较。用新复极差检验作多重比较。计算出平均重复次数计算出平均重复次数 计算平均数标准误计算平均数标准误查查出出=0.05与与=0.01的的临临界界SSR值值,乘以,乘以,即得各最小即得各最小显显著极差,所得著极差,所得结结果列入表果列入表8.9。表表8.9 棉花品种株高新复极差棉花品种株高新复极差检验检验的的LSR值值p2345SSR0.052.95 3.10 3.18 3.25SSR0.014.02 4.22 4.33 4.40LSR0.053.213 3.376 3.463 3.540 LSR0.014.378 4.596 4.716 4.792 结结果用果用标记标记字母法列于表字母法列于表8.12。表表8.10 5个棉花品种株高的新复极差个棉花品种株高的新复极差检验结检验结果果 品种品种平均数平均数(cm)差异差异显显著性著性5%1%D34.0a AA30.0 b ABB29.0 bc BE27.4 bc BC26.3 c B试验结论试验结论表表8.10试试验验结结果果表表明明,D品品种种的的平平均均株株高高显显著著高高于于其其他他供供试试品品种种的的平平均均株株高高,极极显显著著高高于于B、E和和C品品种种的的平平均均株株高高;A品品种种的的平平均均株株高高显显著著高高于于C品品种种,但但A品品种种与与B、E品品种种之之间间差差异异不不显显著著。可可以以认认为为D品品种种生生长长速速度度最最快快,A品品种种生生长长速速度度居居中中,C品品种种生生长长较较慢。慢。三、三、组组内又可分内又可分为亚组为亚组的完全随机的完全随机试验试验的的统计统计分析分析单单因素完全随机因素完全随机试验试验,如果,如果设设若干个若干个组组,每每组组又分又分为为若干个若干个亚组亚组,而每个,而每个亚组亚组内又内又具有若干个具有若干个观观察察值值,称,称为组为组内又可分内又可分为亚为亚组组的完全随机的完全随机试验试验,其,其测测定定结结果果简简称称为为系系统统分分组资组资料。料。这这种种试验设计试验设计也称也称为为巢式巢式设设计计(Nested design)。)。12 1m 12ml1 m2 212 u12 v12 n12 1m 12ml1 m2 212 n1 1m l1 m 12 n地块地块 株株样点样点 枝条枝条数次分析数次分析 叶片叶片土样分析土样分析 果树病害果树病害表表8.11 二级系统分组资料的模式二级系统分组资料的模式(i=1,2,l;j=1,2,m;k=1,2,n)组组(i)亚组亚组(j)观察值观察值(xijk)亚亚 组组组组总和总和(Tij)平均平均 总和总和(Ti)平均平均112 mx111,x121,x1m1,x112,x122,x1m2,x11nx12n x1mnT11T12T1mT1 l12 mxl11,xl21,xlm1,xl12,xl22,xlm2,xl1nxl2n xlmnTl1Tl2TlmTlT=S SxT1、组组内又可分内又可分为亚组为亚组的完全随机的完全随机试验试验的数据模式的数据模式2、线线性可加模型和期望均方性可加模型和期望均方分解上述数据的线性数学模型为:分解上述数据的线性数学模型为:xijk=+i+d dij+ijk i=i 为组效应为组效应(或处理效应或处理效应)N N(0(0,2 2)d dij=ij i为亚组效应为亚组效应 N N(0(0,d d2 2)ijk=xijk-ij 为随机误差为随机误差 N N(0(0,2 2)当由样本估计时,相应的数学模型为:当由样本估计时,相应的数学模型为:分别是分别是、i、d dij 和和 ijk的估值的估值表表 8.12 二级系统分组资料的方差分析和期望均方二级系统分组资料的方差分析和期望均方变异来源变异来源DFMSEMS固定模型固定模型随机模型随机模型组组 间间组内亚组间组内亚组间误误 差差l-1l(m 1)lm(n 1)St2=SSt/(l1)Sm(l)2=SSm(l)/l(m1)Se2=SSe/lm(n1)2 2+n d d2 2+mn 2 2 2 2+n d d2 2 2 2 2 2+n d d2 2+mn 2 2 2 2+n d d2 2 2 2总总 变变 异异 lmn 13 3、组组组组内又可分内又可分内又可分内又可分为亚组为亚组为亚组为亚组的完全随机的完全随机的完全随机的完全随机试验试验试验试验的方差分析方法的方差分析方法的方差分析方法的方差分析方法自由度及平方和的分解自由度及平方和的分解总总自由度自由度 dfT=lmn-1组间组间自由度自由度 dft=l-1组组内内亚组间亚组间自由度自由度 dfm(l)=l(m-1)误误差自由度差自由度 dfe=lm(n-1)矫正数矫正数 F检验检验首先检验首先检验H0:d d2=0(即检验各亚组间效应方差是否即检验各亚组间效应方差是否显著存在显著存在)F=sm(l)2/se2 具具df1 1=l(m 1),df2=lm(n 1)然然后后检检验验H0:i=(固固定定模模型型时时;检检验验各各组组间间有有无不同效应无不同效应);或或H0:2=0(随随机机模模型型时时;即即检检验验各各组组间间效效应应方方差是否显著存在差是否显著存在)i)i)当被当被H0:d d2=0被被否定时否定时 F=st2/sm(l)2 具具df1 1=l 1,df2=l(m 1)ii)ii)当被当被H0:d d2=0 被被接受时接受时 F=st2/se2 具具df1 1=l 1,df2=l(mn 1)se2为为sm(l)2与与se2合并均方合并均方多重比较多重比较若若进进行行组组内内亚组间亚组间平均数的多重比平均数的多重比较较,自,自由度由度=dfe,则则平均数平均数标标准准误为误为:若若进进行行组间组间平均数的多重比平均数的多重比较较,则则平均数平均数标标准准误误和自由度分和自由度分别为别为:例例8.5 用用A,B,C,D等等4种油菜种子包种油菜种子包衣衣剂处剂处理油菜品种理油菜品种农杂农杂62的种子,研究油的种子,研究油菜种子包衣菜种子包衣剂剂的的对对油菜生油菜生长长的影响。各种的影响。各种子包衣子包衣剂处剂处理播种理播种3盒,采用完全随机盒,采用完全随机设计设计。播种后播种后20d测测定苗高定苗高(cm),每盒每盒测测定定5株株,结结果果如表如表8.13所示。所示。试试比比较较不同种子包衣不同种子包衣剂对剂对油油菜平均苗高的影响有无菜平均苗高的影响有无显显著差异。著差异。种子包衣种子包衣剂剂 种子盒号种子盒号苗高测定值(cm)xijkTij.Ti.AA16.5 7.3 7.2 6.5 6.0 33.5 6.7 A27.3 6.0 6.5 6.4 6.1 32.3 6.5 A36.2 5.7 7.0 6.5 6.9 32.3 6.5 98.1 6.5 BB16.3 5.1 6.0 5.8 6.0 29.2 5.8 B26.2 5.5 5.2 6.0 5.7 28.6 5.7 B35.1 5.7 6.2 5.5 5.4 27.9 5.6 85.7 5.7 CC16.5 8.4 6.5 7.2 6.8 35.4 7.1 C26.5 6.8 7.0 7.2 7.4 34.9 7.0 C37.0 6.7 7.5 6.3 6.9 34.4 6.9 104.7 7.0 DD15.0 5.2 5.5 5.1 5.6 26.4 5.3 D25.5 5.0 4.8 4.9 5.7 25.9 5.2 D34.8 5.4 5.0 4.5 5.8 25.5 5.1 77.8 5.2 T.366.3 表表8.13 种子包衣种子包衣剂对剂对油菜苗高的影响油菜苗高的影响结结果果解:本例属于解:本例属于单单因素因素组组内又可分内又可分为亚组为亚组的的完全随机完全随机试验资试验资料,料,处处理数理数 l=4,每,每处处理重理重复盒数复盒数m=3,每盒重复,每盒重复观测观测次数次数n=5,共有,共有lmn=435=60个个观测值观测值。计计算各算各项项自由度与平方和自由度与平方和总自由度总自由度 dfT=lmn-1=435 1=59种子包衣剂间自由度种子包衣剂间自由度 dft=l-1=4 1=3种子包衣剂内盒间自由度种子包衣剂内盒间自由度 dfm(l)=l(m-1)=4(3 1)=8误差(个体间误差(个体间)自由度自由度dfe=lm(n 1)=43(5 1)=48矫正数矫正数 C=T2/lmn=366.32/60=2236.2515总平方和总平方和SST=x2 C=(6.52+7.32+4.52+5.82)-2236.2615=2277.25 2236.2615=40.9885种子包衣剂间平方和种子包衣剂间平方和 种子包衣剂内盒间的平方和种子包衣剂内盒间的平方和误差(个体间误差(个体间)平方和平方和F检验检验首先检验首先检验H0:d d2=0(即检验各亚组间效应方差是否显著存在即检验各亚组间效应方差是否显著存在)说明同一种子包衣剂内各盒间平均苗高无显著差异。说明同一种子包衣剂内各盒间平均苗高无显著差异。再检验种子包衣剂间效应差异显著性:再检验种子包衣剂间效应差异显著性:要要将将sm(l)2、se2合并合并用用 se2作分母,即:作分母,即:FF0.01(3,56)=4.15,推断推断:不同种子包衣剂平均苗高间有不同种子包衣剂平均苗高间有极显著差异。极显著差异。检验结检验结果果见见方差分析表(表方差分析表(表8.14)。)。变变异来源异来源 自由度自由度 平方和平方和均方均方F值值F0.05F0.01P种子包衣种子包衣剂间剂间329.2738 9.757946.65*2.77 4.153.03E-15种子包衣种子包衣剂剂内盒内盒间间80.5427 0.0678 F0.05,表明各供,表明各供试试品种的品种的产产量有量有显显著差异,需要著差异,需要进进行多重比行多重比较较。4、多重比较、多重比较各品种各品种产产量平均数与量平均数与对对照的差异照的差异显显著性比著性比较较(LSD法法):小区平均产量的平均数差异标准误小区平均产量的平均数差异标准误查查t值值表表dfe=12时时,t0.05(12)=2.179,t0.01(12)=3.055 表表8.29 小麦品种平均小麦品种平均产产量与量与标标准品种的准品种的LSD法法检验结检验结果果品种品种小区平均小区平均产产量(量(kg)差异差异A226.84*A124.41.6A323.40.6A423.40.6A5(ck)22.8各品种平均数间的多重比较各品种平均数间的多重比较(新复极差检验新复极差检验法法)小区平均产量的平均数标准误小区平均产量的平均数标准误根据根据dfe=12,查,查SSR表,计算新复极差检验表,计算新复极差检验的的LSR值列入表值列入表8.20。表表8.30 小麦品种产量新复极差检验的小麦品种产量新复极差检验的LSR值值p2345SSR0.053.083.233.333.36SSR0.014.324.554.684.76LSR0.052.272.382.452.47LSR0.013.183.353.453.50表表8.31 小麦品种小麦品种产产量的新复极差量的新复极差检验结检验结果果品种品种小区平均产量小区平均产量(kg/20m2)差异差异显显著性著性5%1%A226.8aA A124.4 b AB A323.4 b B A423.4 b B A5(CK)22.8 b B5、试验结论试验结论表表8.29试验结试验结果表明果表明,A2品种的品种的产产量极量极显显著著高于高于对对照照A5,其余品种皆与,其余品种皆与对对照无照无显显著差著差异。异。表表8.31试验结试验结果表明果表明,A2品种品种产产量量显显著高于著高于其他品种的其他品种的产产量,极量,极显显著地高于著地高于A3、A4、A5品种的品种的产产量;量;A1、A3、A4、A5品种品种产产量量间间无无显显著差异。著差异。二、二、拉丁方的拉丁方的线线性模型与期望均方性模型与期望均方 i表示横行效应表示横行效应;j表示纵行效应表示纵行效应,(t)表表示处理效应。示处理效应。ij(t)是独立的随机误差、并作是独立的随机误差、并作正态分布正态分布。如果处理与纵行或横行区组有。如果处理与纵行或横行区组有交互作用存在,则交互作用与误差相混杂,交互作用存在,则交互作用与误差相混杂,不能得到确切的误差估计,难以进行确切不能得到确切的误差估计,难以进行确切的检验。不过,只要土壤差异不太大,一的检验。不过,只要土壤差异不太大,一般可假定不存在互作。般可假定不存在互作。变变异来源异来源DF固定模型固定模型随机模型随机模型横行横行间间k-1纵纵行行间间k-1处处理理间间k-1试验误试验误差差(k-1)(k-2)表表8.32 拉丁方拉丁方设计设计的期望均方的期望均方本章学习要点本章学习要点1、掌握单因素随机区组设计的统计分析方法,、掌握单因素随机区组设计的统计分析方法,了解拉丁方设计的统计分析方法了解拉丁方设计的统计分析方法2、比较单因素完全随机和单因素随机区组在、比较单因素完全随机和单因素随机区组在设计和分析上的异同设计和分析上的异同