田间试验与统计分析.ppt
《田间试验与统计分析.ppt》由会员分享,可在线阅读,更多相关《田间试验与统计分析.ppt(70页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章第三章 方差分析方差分析Chapter 3 ANOVA(Analysis of Variance)方差分析是判断方差分析是判断多组数据(多组数据(K3)之间平均数差异是之间平均数差异是否显著的一种假设测验方法。否显著的一种假设测验方法。2个样本平均数可用个样本平均数可用 t 或或U测验测验的方法来评定其差数的显著性。如果有的方法来评定其差数的显著性。如果有K个平均数,且个平均数,且K3,若仍然用两两比较的方法来测验,则需要作,若仍然用两两比较的方法来测验,则需要作K(K-1)/2次测次测验,如果验,如果K10,则需要,则需要45次测验,不但测验程序繁琐,而次测验,不但测验程序繁琐,而且在
2、理论上,其显著水平已经扩大了。因此,对于多样本平且在理论上,其显著水平已经扩大了。因此,对于多样本平均数的假设测验,需采用一种更为合适的统计方法,即方差均数的假设测验,需采用一种更为合适的统计方法,即方差分析法(分析法(Fisher,1923)。)。第三章第三章 方差分析方差分析方差是平方和除以自由度的商。方差是平方和除以自由度的商。方差分析是将总变异分裂为各个因素的相应变异,作方差分析是将总变异分裂为各个因素的相应变异,作出其数量估计,从而发现各个因素在变异中所占的重要程出其数量估计,从而发现各个因素在变异中所占的重要程度,而且除了可控制因素所引起的变异后,其剩余变异又度,而且除了可控制因素
3、所引起的变异后,其剩余变异又可提供试验误差的准确而无偏的估计,作为统计假设测验可提供试验误差的准确而无偏的估计,作为统计假设测验的依据。的依据。第三章第三章 方差分析方差分析例如,若有例如,若有5组数据要比较,则共需要比较组数据要比较,则共需要比较(54)/2=10次。次。若若H0正确,每次接受的概率为正确,每次接受的概率为1,10次都接受的概率次都接受的概率为,因此,为,因此,=1,即犯第一类错误的概率为,这显然,即犯第一类错误的概率为,这显然是不能接受的。是不能接受的。本章主要内容:本章主要内容:第一节第一节 方差分析的基本原理和方法。方差分析的基本原理和方法。第二节第二节 单向分组资料的
4、方差分析。单向分组资料的方差分析。第三节第三节 两向分组资料的方差分析。两向分组资料的方差分析。第三章第三章 方差分析方差分析第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法1.自由度和平方和的分解自由度和平方和的分解2.F分布分布(F Distribution)3.多重比较多重比较(multiple comparisons)4.方差分析的基本假定方差分析的基本假定5.数据转换数据转换第三章第三章 方差分析方差分析1、自由度和平方和的分解、自由度和平方和的分解 设有设有K组样本,每样本均具有组样本,每样本均具有n个观察值,则该资料共有个观察值,则该资料共有nk个观察值,数据如下表
5、。个观察值,数据如下表。组别组别12in总和总和平均平均均方均方1.J.kX11X12X1jX1nX21X22X2jX2nXi1Xi2XijXinX1nX2nXjnXknT1T2TiTk表表 每组具每组具n个观察值的个观察值的k组样本的符号表组样本的符号表第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法Xij,i=1,2,k,j=1,2,n。总变异是总变异是nk个观察值的变异,故其自由度为个观察值的变异,故其自由度为nk1,平方和,平方和SST为:为:式中,式中,C 称为矫正数。称为矫正数。总平方和总平方和(SST)第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法总
6、平方和总平方和SST组内平方和组内平方和SSe处理平方和处理平方和SSt总平方和总平方和SST的计算:的计算:组内的变异为各组内观察值与组平均数的相差,故每组组内的变异为各组内观察值与组平均数的相差,故每组具有具有n1个自由度,平方和为个自由度,平方和为 ,而总共有,而总共有k 组资料,组资料,故组内自由度为故组内自由度为k(n1),而组内平方和),而组内平方和SSe为:为:第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法 上述总变异的自由度和平方和可分解为组间和组内两个上述总变异的自由度和平方和可分解为组间和组内两个部分。组间变异即部分。组间变异即k个平均数的变异,故其自由度为
7、个平均数的变异,故其自由度为k1,平方和平方和 SSt 为:为:因此,上述资料的自由度和平方和的分解式为:因此,上述资料的自由度和平方和的分解式为:总自由度组间自由度总自由度组间自由度 组内自由度组内自由度 (nk-1)()(k1)+k(n-1)总平方和组间平方和总平方和组间平方和 组内平方和组内平方和第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法均方的计算:均方的计算:第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法方差分析表方差分析表变异来源平方和SS自由度DF均方MSF值处理间SStK-1St2St2/Se2处理内/误差SSeK(n-1)Se2总变异SSTn
8、k-1第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法例1:测定东小麦品种东方红3号的蛋白质含量()10次,得其平均数为,方差为;测定农大139号的蛋白质含量5次,得其平均数为,方差为。试测验东方红3号小麦蛋白质含量的变异是否比农大139为大。假设假设:H0:1222;HA:1222。显著水平显著水平:0.05,DF1=9,DF2=4时,F0.05,(9,4)。推断:推断:此F,所以,P0.05接受接受HA,即东方红,即东方红3号小麦蛋白质含量的变异大于农大号小麦蛋白质含量的变异大于农大139。第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法分析分析:两样本分别来自
9、于两个不同的总体,总体方差均为未知,不能假设1222。可采用近似t 分布两尾测验的方法。假设假设:H0:12;HA:12。显著水平显著水平:。回顾t测验法:东方红3:均数:,方差:,n1=10农大139:均数:,方差:,n2=5计算;计算;两个样本的样本容量不同,需转换自由度。推断:推断:接受HA,否定H0,即两品种蛋白质含量有极显著差异。在12时的t 测验,如果两个样本的样本容量相同n1=n2=n,则在t 测验时,可不必进行自由度的转换,可直接取自由度为n1。查表查表,t0.05,11。计算值|t|=5.98 t0.05,11,故计算t值;例2:以A、B、C、D4种药剂处理水稻种子,其中A为
10、对照,每处理得4个苗高观察值,结果如下表,试进行自由度和平方和的分解,并测验药剂间变异是否显著大于药剂内变异?表水稻不同药剂处理的苗高假设假设:H0:1222;HA:1222。显著水平显著水平:0.05,DF1=3,DF2=12时,F0.05,(3,12)。药剂ABCD19232113212427202018191522252722总和76927296T336平均数1923182421第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法自由度分解:自由度分解:总变异自由度总变异自由度44115 药剂间自由度药剂间自由度413 药剂内自由度药剂内自由度4(41)12平方和分解:平方和分
11、解:SST=222 SSt=104 SSe=SST-SSt=222-104=118均方:均方:ST2 St2=104/3=Se2=118/12=其中,其中,Se2为为4种药剂内变异的合并种药剂内变异的合并均方,是试验误差的估计值;药剂均方,是试验误差的估计值;药剂均方均方St2则为试验误差加上不同药剂则为试验误差加上不同药剂对苗高的效应。对苗高的效应。第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法推断推断:接受:接受HA,即测验药剂间变异显著地大,即测验药剂间变异显著地大于药剂内变异,不同药剂对水稻苗高具有不于药剂内变异,不同药剂对水稻苗高具有不同效应。同效应。查表查表5(F值
12、表)值表):自由度(自由度(3;12)第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法F.05;F.01变异平方和自由度均方处理间104334.67误差118129.83总变异2221514.8方差分析表方差分析表平方和平方和 自由度自由度 均方均方 F FSSt=104 3 St2=104/3=34.67 St2/Se2SSe=SST-SSt=118 12 Se2=118/12=SST=222 15 ST2变异来源自由度DF平方和SS 均方MSF值处理间K-1SStSt2=SSt/df1F=St2/Se2误差K(n-1)SSeSe2=Sse/df2总变异nk-1SST第一节第一
13、节 方差分析的基本原理和方法方差分析的基本原理和方法2.F分布分布F Distribution第一节第一节 方差分析的基本原理和方法方差分析的基本原理和方法 此此F值具有值具有S12的自由度的自由度1和和S22的自由度的自由度2。如果我们在。如果我们在给定的给定的1和和2下进行一系列抽样,就可得到一系列的下进行一系列抽样,就可得到一系列的F值,值,这一系列的这一系列的F值呈值呈F分布。理论统计研究证明,分布。理论统计研究证明,F分布具有平分布具有平均数均数F1和取值区间为【和取值区间为【0,】的一组曲线,而某一特】的一组曲线,而某一特定的曲线的形状则仅决定于参数定的曲线的形状则仅决定于参数1和
14、和2。1 1或或12时,时,F分布曲线呈反向分布曲线呈反向“J”型;当型;当13时,时,曲线呈偏态。曲线呈偏态。定义:在一个平均数为,方差为的正态总体中,随机抽取两个独立样本,并求得其均方S12和S22,我们将这两个两个均方的比值均方的比值定义为F。F Distribution15,2411,2512,25012345670.20.40.60.81.0因自由度不同的F分布曲线F Distribution当当1 1或或12时,时,F分布曲线呈反向分布曲线呈反向“J”型;型;当当13时,曲线呈偏态。时,曲线呈偏态。f(F)FF分布下一定区间的概率可从已制成的统计表查出。附表5系各种v1和v2下右尾
15、概率和时的临界F值(一尾概率表)。如查附表5,v1=3,v2=12时,F,F,即表示如以v1=3(n1=4)、v2=12(n2=13)在一正态总体中进行连续抽样,则所得F值大于的仅有5%,而大于的仅有1%。所以附表5的数值实际是专供测验S12的总体方差12是否显著大于S22的总体方差22而用的。(H0:1222;HA:1222)。在作F则验时,应以取大值的均方(S12)作分子、取小值的均方(S22)作分母计算F值。若所得FF或F。则该F值即为在或水平上显著,应否定H0,接受HA;若所得FF,则接受H0。F Distribution在方差分析的体系中,F测验某项变异因素的效应或方差是否真实存在。
16、所以在计算F值时,总是将要测验的那一项变异因素的均方作分子,而以另一项变异因素(如试验误差项)的均方作分母。这个问题与方差分析的模型和各项变异来源的期望均方有关。在此测验中,如果作分子的均方小于作分母的均方,则F1;此时不必查F表即可确定P0.05,应接受H0。F F 测验需具备:测验需具备:(1)变数x 遵循正态分布N(,2)(2)S12和S22彼此独立两个条件。当资料不符合这些条件时,需作适合转换。F Distribution3.多重比较多重比较(multiple comparisons)在上例中,接受了在上例中,接受了HA,仅是指出了东方红,仅是指出了东方红3号小麦蛋白号小麦蛋白质含量的
17、变异大于农大质含量的变异大于农大139的。但是,是否各个平均数彼此间的。但是,是否各个平均数彼此间都有显著差异呢?还是仅有一部分平均数间有显著差异而另都有显著差异呢?还是仅有一部分平均数间有显著差异而另一部分平均数间没有显著差异?仅根据上述分析结果是无法一部分平均数间没有显著差异?仅根据上述分析结果是无法确定的。要明确各个平均数彼此间的差异显著性,还必须对确定的。要明确各个平均数彼此间的差异显著性,还必须对各平均数进行多重比较。各平均数进行多重比较。、最小显著差数测验法、最小显著差数测验法、最小显著极差测验法、最小显著极差测验法 (1)Duncans新复极差测验法(新复极差测验法(Duncan
18、,1955)(2)q测验测验、比较方法的选择、比较方法的选择 3.1 最小显著差数测验法最小显著差数测验法 least significant difference,简称,简称LSD法。法。用此法测验多个平均数时,首先算得平均数差数用此法测验多个平均数时,首先算得平均数差数的标准误:的标准误:式中,式中,Se2为方差分析时的误差均方值,为方差分析时的误差均方值,n为样本容量。然后为样本容量。然后查查t表得表得Se2所具有自由度下两尾概率值为所具有自由度下两尾概率值为的临界的临界t值值t,计算,计算得最小显著差数:得最小显著差数:若两个平均数的差数若两个平均数的差数LSD,即为在,即为在水平上显
19、著。水平上显著。multiple comparisons例3:以A、B、C、D4种药剂处理水稻种子,各药剂处理后的苗高平均数依次为19、23、18、24cm,作多重比较。假设:假设:H0:B=A,C=A,D=A;HA:BA,CA,DA。显著水平:显著水平:multiple comparisons药剂ABCD19232113212427202018191522252722总和76927296T336平均1923182421已经算得Se2,A为对照。SS DF MS F F 118 12 DF12时,时,显著水平:显著水平:查查t分布表分布表,t,可以看出,只有可以看出,只有XD与对照在上有显著差
20、异,其余两个药与对照在上有显著差异,其余两个药剂和对照无显著差异。剂和对照无显著差异。平均数A19B23C18D24multiple comparisons SS DF MS F F 118 12 注:注:用用LSD法测验多个样本的所有平均数间的差异显法测验多个样本的所有平均数间的差异显著性是不合理的,因为著性是不合理的,因为LSD 实质是实质是t测验。测验。3.2 3.2 最小显著极差测验法最小显著极差测验法 least significant ranges,简称,简称LSR法。此法的特点是法。此法的特点是不同平均数间的比较采用不同的显著差数标准不同平均数间的比较采用不同的显著差数标准,克服
21、了克服了LSD法的局限性,可用于多样本平均数间的差异显著性比法的局限性,可用于多样本平均数间的差异显著性比较。这里主要介绍两种类型:较。这里主要介绍两种类型:(1)Duncans新复极差测验法新复极差测验法(Duncan,1955)又称最短显著极差(又称最短显著极差(Shortest significant ranges,SSR)。)。式中,式中,SE为平均数的标准误;为平均数的标准误;Se2为误差均方,为误差均方,n为样本容量。为样本容量。multiple comparisons 查查SSR表,查得表,查得Se2所具有自由度下,所具有自由度下,P2,3,k 时的时的SSR值,其中值,其中P为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 田间试验 统计分析
限制150内