试验设计与分析园艺 方差分析.pptx
《试验设计与分析园艺 方差分析.pptx》由会员分享,可在线阅读,更多相关《试验设计与分析园艺 方差分析.pptx(109页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第一节 方差分析的基本原理一、方差分析的数学模型 二、方差分析的一般步骤 三、多重比较第1页/共109页假设测验:一个或两个样本平均数的比较。方差分析:3个和3个以上样本平均数的比较。方差分析:按变异来源将总变异分解为不同的部分,并利用各变异原因在总变异中的相对重要程度进行统计分析的方法。方差分析测验的依据:在扣除了各种试验原因所引起的变异后,所剩下的变异提供了试验误差的无偏估计。方差分析也是通过将处理的表面效应与其误差进行比较进行统计推断,其度量变异程度的方式为样本方差。各种类型方差分析的基本原理和步骤相同。第2页/共109页如:以A、B、C、D等 4种药剂处理水稻种子,其中A为对照,每处理
2、各得4个苗高观察值(cm),其结果见下表。药剂药剂苗高观察值苗高观察值 A18,21,20,1318B20,24,26,2223C10,15,17,1414D28,27,29,3229 总总=21第3页/共109页一、方差分析的数学模型以单因素完全随机设计试验资料为例 假设有k个处理,n次重复,共有nk个观察值。处理处理观察值观察值xij总和总和T 平均平均A1x11x12x1jx1nT1A2x21x22x2jx2nT2 Aixi1xi2xijxinTi Akxk1xk2xkjxknTk.总和总和T总总第4页/共109页xij表示第i个处理的第j个观察值(i1,2,k;j1,2,n)xij可以
3、表示为xijiij,其中,i为第i个处理观察值总体平均数;ij为试验误差,ij之间相互独立并且服从正态分布N(0,2)。第5页/共109页如果令 ,i i-那么,xiji ij,其中,为全部观察值总体平均数,i为第i个处理的处理效应,表示处理i对试验结果产生的影响。有:。xiji ij叫做单因素完全随机设计试验资料的数学模型。在这个模型中,每一个观察值xij可以表示为总平均数、处理效应i、试验误差ij之和。第6页/共109页如:以A、B、C、D等 4种药剂处理水稻种子,其中A为对照,每处理各得4个苗高观察值(cm),其结果见下表。药剂药剂苗高观察值苗高观察值 A18,21,20,1318B20
4、,24,26,2223C10,15,17,1414D28,27,29,3229 总总=21第7页/共109页二、方差分析的一般步骤1、自由度与平方和的分解由于方差是平方和除以自由度的商,所以要将全部观察值的总变异分解为各个来源的变异,首先要将总自由度和总平方和分解为各个变异来源的相应部分。因此,自由度与平方和的分解是进行方差分析的第一步。第8页/共109页(1)总平方和的分解我们通过恒等变换来分解总平方和。对第i个处理的平方和,有:第9页/共109页由于所以对于全部k个处理总平方和总平方和 =组内(误差)平方和组内(误差)平方和+处理平方和处理平方和 SST =SSe +SSt第10页/共10
5、9页由于所以矫正数矫正数C第11页/共109页(2)总自由度的分解总自由度:在计算总平方和时,资料中的kn个观察值的离均差()要受到 这个条件的约束,所以总自由度等于全部观察值的个数减1,即kn1,记为dfTkn1。处理间自由度:在计算处理间平方和时,k个处理的平均数离均差()要受到 这个条件的约束,所以处理间自由度等于处理的个数减1,即k1,记为dftk1。第12页/共109页处理内自由度:在计算处理内平方和时,kn个离均差()要受到k个条件的约束,即 (i1,2,k),所以处理内自由度等于全部观察值的个数减k,即knk,记为dfeknkk(n1)。由于kn1knkk1k(n1)(k1)所以
6、,dfTdftdfe。第13页/共109页各项平方和除以各自的自由度便得到总均方(方差)、处理间均方(方差)和处理内均方(方差):MSTsT2SST/dfTMStst2SSt/dftMSese2SSe/dfe 处理内均方也称误差均方,是多个总体或处理所提供的处理内变异(或误差)的平均值。注意:总均方一般不等于处理间均方与处理内均方之和。第14页/共109页如:以A、B、C、D等 4种药剂处理水稻种子,其中A为对照,每处理各得4个苗高观察值(cm),其结果见下表。试分解其自由度和平方和。药剂药剂苗高观察值苗高观察值A18,21,20,13B20,24,26,22C10,15,17,14D28,2
7、7,29,32应用举例第15页/共109页(1)总自由度的分解:总自由度:dfT=(nk1)=(44)1=15药剂间自由度dft=(k1)=41=3药剂内自由度dfe=k(n1)=4(41)=12药剂药剂 苗高观察值苗高观察值总和总和Ti 平均平均 A18 21 20 137218B20 24 26 229223C10 15 17 145614D28 27 29 3211629T总总=336 =21第16页/共109页(2)总平方和的分解:总平方和:药剂间平方和:药剂内平方和:第17页/共109页(3)各项均方MSTsT2602/15=40.13MStst2504/3=168.00MSese2
8、98/12=8.17 第18页/共109页2、F分布与F测验F值:从一个平均数为、方差为2的正态总体中,随机抽取两个独立样本,分别计算出其均方s12和s22,将s12和s22的比值定义为F:F(df1,df2)s12/s22。F分布:此F值具有s12的自由度df1和s22的自由度df2。如果在给定的df1和df2下,按上面的方法从正态总体中进行一系列抽样,就可以得到一系列的F值而作成F分布。第19页/共109页F曲线:F分布是具有平均数F1和取值区间为0,)的一组曲线,而某一特定曲线的形状仅决定于参数df1和df2。在df11或df12时,F分布曲线是严重倾斜成反J型,当df13时,曲线转为偏
9、态。第20页/共109页F概率:F分布曲线下一定区间的概率可从附表5中查出,表中所列出的是各种df下右尾概率0.05和0.01时的临界F值。如df13,df212时,F0.053.49,F0.015.95,表示以n14(df13)、n213(df212)在一个正态总体中连续抽样,则所得F值大于3.49的概率仅有5%,大于5.95的概率仅有1%。第21页/共109页F测验:附表6的数值设计是专供测验s12的总体方差12是否显著大于s22的总体方差22而设计的。H0:1222,HA:1222,这时,Fs12/s22。如果所得FF0.05或F0.01,那么H0发生的概率小于等于0.05或0.01,应
10、该在0.05或0.01水平上否定H0,接受HA;如果所得FF0.05或F0.01,那么H0发生的概率大于0.05或0.01,应该接受H0。F测验需具备条件:变数x遵循正态分布N(,2);s12 和s22 彼此独立。第22页/共109页在方差分析中,F测验经常用于比较两个事物变异大小,检测某项因素的效应或方差是否真实存在。在计算F值时,总是将要测验的那一项变异因素(如不同品种)的均方作分子,而以另一项变异(如试验误差)的均方作分母。如果所得F1,就没必要查表即可确定P0.05,应接受H0。F测验用于比较两个事物变异大小时,如比较两种施肥量的增产情况,要注意的是,计算F值时必须以较大的均方作分子,
11、否则所得的F值都会小于1,表现为无差异。第23页/共109页测定东方红3号小麦的蛋白质含量10次,均方s121.621;测定农大139小麦的蛋白质含量5次,均方s220.135。问东方红3号的蛋白质含量的变异是否大于农大139?H0:1222,东方红3号的蛋白质含量的变异和农大139一样大,HA:1222。显著水平取0.05,df19,df24时,F0.056.00。F1.621/0.13512.01。此时,FF0.05,即P0.05。所以,否定H0,接受HA,即东方红3号的蛋白质含量的变异大于农大139。应用举例第24页/共109页应用举例在分解自由度和平方和时的举例中,药剂处理间均方MSt
12、2168.00,药剂处理内均方MSe28.17,自由度df13,df212。问药剂间变异是否显著大于药剂内变异?H0:t2e2,HA:t2e2,显著水平0.05,F0.053.49;0.01,F0.015.95。F168.00/8.1720.56。此时,FF0.01F0.05。所以,否定H0,接受HA,即药剂间变异显著大于药剂内变异,说明不同药剂对水稻苗高具有不同效应。第25页/共109页方差分析法:在以上举例中,通过对一组处理的重复试验数据的总平方和与总自由度的分解,计算出处理间均方和处理内均方(误差均方),并通过FMSt/MSe测验处理间所表示出的差异是否真实(大于试验误差),这种测验方法
13、就是方差分析法。其中H0:t2e2,或ABCD,HA:t2e2,或A、B、C、D间存在差异(不一定它们都不相等,可能部分不等)。第26页/共109页我们可以根据以上分析列出方差分析表:变异来源变异来源dfSSMSF显著显著F值值药剂处理间药剂处理间3504 168.00 20.56*F0.05(3,12)3.49药剂处理内药剂处理内12988.17F0.01(3,12)5.95总变异总变异15602第27页/共109页三、多重比较多重比较:是指一个试验中k个处理平均数间可能有k(k1)/2个比较,亦称为复式比较。在上面的举例中,我们通过F测验推断不同药剂处理对水稻苗高有不同效应,即处理间存在显
14、著差异。但我们的试验目的不仅在于知道一组处理间有无实质性差异,更重要的是知道哪些处理间存在真实差异,所以还需要进一步做处理平均数间的比较。第28页/共109页通过方差分析后进行平均数间的多重比较,不同于处理间两两单独比较。因为:(1)误差由多个处理内的变异合并计算,自由度增大了,因而比较的精确度也增大了(2)由于F测验显著,证实处理间总体上有真实差异后再做两两平均数的比较,不大会像单独比较时那样将个别偶然性误差误测验为真实差异。(3)这种在F测验基础上再做的平均数间多重比较称为Fisher氏保护下的多重比较。第29页/共109页如果没有F测验保护,4个处理进行两两比较,显著水平取0.05,4个
15、处理间有6个比较,若处理间总体上无差异,那么每一个比较被误判为有差异的概率为0.05。这样,6个比较中至少有一个被误判的概率为10.9560.2649。如果有10个处理,10.95450.9006。因而,尽管单个比较的显著水平为0.05,但从试验总体上来说(至少有一个误判的概率)还是很大的,这说明通过F测验进行保护是非常必要的。第30页/共109页多重比较的方法:最小显著差数法(LSD法)复极差法(q法)Duncan氏新复极差法(SSR法)第31页/共109页(1)最小显著差数法(LSD法)最小显著差数法(least significant difference,简称LSD法),实质上是第五章
16、的t 测验。其基本程序是:(1)在处理间的F测验为显著的前提下,计算出显著水平为的最小显著差数LSD;(2)任何两个平均数的差数(),如其绝对值 LSD,即为在水平上差异显著;反之,则为在水平上差异不显著。第32页/共109页已知:若|t|t,即为在水平上显著。因此,最小显著差数为:当两样本的容量n相等时:在方差分析中,se2有了更精确的数值 MSe(自由度增大)第33页/共109页应用举例试以LSD法测验不同药剂处理的水稻苗高平均数间的差异显著性。已知F20.56为显著,MSe8.17,dfe12,所以由附表4,df 12时,t0.05=2.179,t0.01=3.055所以,LSD0.05
17、=2.1792.02=4.40 cmLSD0.01=3.0552.02=6.17 cm第34页/共109页将不同药剂处理的苗高平均数两两比较,差数大于4.40cm为差异显著;大于6.17cm为差异极显著。,差异显著;,差异极显著;,差异极显著;,差异显著 ,差异极显著;,差异不显著第35页/共109页LSD法的缺点:LSD法的t测验是根据两个样本平均数差数(k2)的抽样分布提出的,但是一组处理是同时抽取k(k3)个样本的结果。当k2时,H0的接受区仅是以样本平均数差数为中心的一个区间。当k3时,共有k(k1)/2个比较,应该有k(k1)/2个H0接受区,但LSD法只给出了一个,显然有较大的偏差
18、,增大了犯第一类错误(弃真)的概率。在重大试验的多重比较中,一般不用LSD法;当多个处理都和一个对照(CK)比较时才用。第36页/共109页(2)复极差法(q法)为了克服LSD法的缺点,统计学家Student-Newman-Keul提出了q测验或称复极差测验。q测验方法是将一组k个平均数由大到小排列后,根据待比较的两个处理平均数所处的位置(即所比较的两个处理平均数的差数是几个平均数间的极差)分别确定最小显著极差LSR值的。第37页/共109页q测验所依据的是极差分布抽样原理,其各个比较都可保证同一个显著水平。LSRq(,df,p)*SE其中,2pk,p是所比较的两个平均数的极差范围内所包含的平
19、均数个数,SE为平均数的标准误。可见,在每一个显著水平下有k1个LSR值。第38页/共109页应用举例试对不同药剂处理的水稻苗高平均数作q测验。查附表8,当df12时,p2,3,4的q值,并计算LSR值,见下表。第39页/共109页由于 ,当p2时 ,差异显著;,差异显著;,差异不显著。当p3时 ,差异极显著;,差异极显著。当p4时 ,差异极显著。pq0.05q0.01LSR0.05LSR0.0123.084.324.406.1833.775.045.397.2144.205.506.017.87第40页/共109页(3)新复极差法 在使用复极差法时,不同p值下的最小显著极差变化幅度比较大。为
20、此,Duncan提出了新复极差法,又称最短显著极差法(shortest significant ranges,SSR)。该方法与q法相似,区别在于计算最小显著极差LSR值时不查q值表,而是查SSR表,所得最小显著极差值随着k增大通常比q测验时减小。查得SSR(,p)后,有 LSRSE*SSR(,p)第41页/共109页应用举例试对不同药剂处理的水稻苗高平均数作新复极差测验。当p2时 ,差异显著;,差异显著;,差异不显著。当p3时 ,差异极显著;,差异极显著。当p4时 ,差异极显著。pSSR0.05SSR0.01LSR0.05LSR0.0123.084.324.40 6.1833.234.554
21、.62 6.5143.334.684.76 6.69第42页/共109页(4)多重比较结果的表示方法 列梯形表法:将全部平均数从大到小排列,计算出各平均数间的差数,达到显著差异的在差值的右上角标注“*”号,达到极显著差异的标注“*”号,差异不显著的不标。优点:直观缺点:篇幅较大 处理处理 平均数平均数差差 异异C AB D2915*11*6*B239*5*A184C14第43页/共109页划线法:将平均数按大小顺序排列,以第一个平均数为标准与以后的各个平均数比较,在平均数下面把差异不显著的平均数用横线连起来,依次以第2、k1个平均数为标准按上述方法进行。如上面资料在0.01水平下平均数差异显著
22、性结果(q法):该方法直观、简单方便,所占篇幅较少。第44页/共109页标记字母法首先将平均数按大小顺序排列;然后在最大平均数上标注字母a;将该平均数与以下各平均数相比,凡差异不显著的都标a,直到与之差异显著的平均数标b。再以标b的平均数为标准,与上方各个比它大的平均数相比,凡差异不显著的都标b,直到与之差异显著的平均数。第45页/共109页再以标b的最大平均数为标准,与以下各平均数相比,凡差异不显著的都标b,直到与之差异显著的平均数标c。如此重复下去,直到最小的平均数有了标记字母并且与其上方平均数进行了比较为止。这样,凡是有一个相同标记字母的就表示差异不显著,无相同字母的表示差异显著。在实际
23、应用时,用小写字母表示0.05的显著水平(差异显著),用大写字母表示0.01的显著水平(差异极显著)。第46页/共109页应用举例试对上面举例结果作字母标记。处理处理平均数平均数(cm)差异显著性差异显著性0.050.01D29B23 A18 C14 abccAABCCB第47页/共109页(5)多重比较方法的选择 以上三种多重比较方法各有优点与不足,几点选择原则:(1)凡与对照或预定的对象比较,一般可选用LSD法;(2)根据否定一个正确的H0和接受一个不正确的H0的相对重要性来决定。当k2时,三种方法的显著尺度完全相同。当k3时,三种方法的显著尺度不相同,LSD法最低,SSR法次之,q法最高
24、。对试验结论事关重大或者有严格要求的,宜选用q测验,一般试验可采用SSR测验。第48页/共109页总结方差分析的基本步骤是:(1)将资料总变异的自由度和平方和分解为各变异原因的自由度和平方和,并计算其均方;(2)计算均方比,进行F测验,以明确各变异因素的相对重要程度;(3)对各平均数进行多重比较。第49页/共109页第二节 单因素试验的方差分析一、完全随机设计试验资料的方差分析 二、随机区组设计试验资料的方差分析 三、拉丁方设计试验资料的方差分析 第50页/共109页单因素试验是指整个试验中只变更、比较一个试验因素的不同水平,其它试验因素均严格控制一致的试验。这是一种最基本的、最简单的试验方案
25、,其试验目的很明确,就是为了考察该因素不同水平对试验指标的影响。如在将育成的若干新品种与原有的品种进行比较以测定其改良的程度,此时,品种就是试验的唯一处理因素,各个新品种和原有品种为处理的不同水平。在试验过程中,除品种不同外,其它环境条件和栽培措施都应严格控制一致。第51页/共109页一、完全随机设计试验资料的方差分析完全随机设计试验是指每一个供试单位都有同等机会(等概率)接受所有可能处理的试验设计方法,没有局部控制,但要求在尽可能一致的环境中进行,一般用于实验室培养和温室的花盆培养。它用于估算试验误差的自由度最多,统计显著性要求的F值最小。第52页/共109页(1)处理内观察值数目相等的资料
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 试验设计与分析园艺 方差分析 试验 设计 分析 园艺
限制150内