生统方差分析.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《生统方差分析.pptx》由会员分享,可在线阅读,更多相关《生统方差分析.pptx(177页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、一、为什么要学习方差分析?一、为什么要学习方差分析? 第四章学习的t 测验方法,只适于比较只有两个试验处理的平均数间差异是否显著。对于多个处理平均数间的差异显著性比较(或差异显著性测验),如仍采用 t 测验方法,就会表现出下列一些问题: 第1页/共177页 若进行5个处理平均数间的差异显著性比较,则需进行C25=10次t 测验,无效假设分别为:H0:1= 2 , 1= 3 , 1= 4 , 1= 5; 2= 3 , 2= 4 , 2= 5;3= 4 , 3= 5; 4= 5 ,因此,计算量非常大。1.计算工作量大第2页/共177页 两个样本平均数比较采用t测验,=0.05时,犯第一类错误的概率
2、为0.05,推断的可靠性为1- =0.95。 若对5个处理采用10次 t 测验,10次测验中都不犯一类错误的概率为0.9510=0.5987,即10次推断总的可靠性降到0.5987,总的犯一类错误的概率上升到(1-0.5987)=0.4013。2.2.推断的可靠性降低 ,犯第一类错误的概率增大第3页/共177页3.无统一误差且误差估计值偏高使检验真实差异的灵敏度降低有5个处理,每处理重复4次,共有20个观察值,作 t 测验每次只利用8个观察值,误差自由度为2(4-1)=6,若利用全部观察值估计试验误差,误差自由度为5(4-1)=15。自由度越小,误差估计值越大,检验灵敏度越低;自由度越大,误差
3、估计值越小,检验灵敏度越高。第4页/共177页 因此对多个处理平均数进行差异显著性因此对多个处理平均数进行差异显著性测验,不宜采用测验,不宜采用t测验,而需采用一种新的测验,而需采用一种新的统计方法统计方法方差分析法(方差分析法(analysis of variance)。)。第5页/共177页1、方差:度量一组资料的变异程度。2、方差分析基本思路: 将k个样本的观察值作为一个整体考虑,把观察值总变异分解成不同变异来源分量,进而获得不同变异来源所属总体方差的估计值均方。通过计算均方之适当比值,测验假设H0:1= 2= k是否成立,进而确定多个处理平均数间是否存在显著差异。二、方差分析的基本思路
4、二、方差分析的基本思路第6页/共177页三、方差分析的作用方差分析有助于发现影响生物某性状发生变异的各种因素在总变异中所占的比重大小。从而分清主要因素与次要因素,指导生产和试验。1、在单因素试验中,可以分辨出最优水平。2、在多因素试验中,可以分辨出最优水平组合。第7页/共177页第一节 方差分析基本原理与步骤一、 数学模型与基本假定二、 平方和与自由度的分解三、 F检验四、 多重比较第8页/共177页一、数学模型与基本假定 假设某单因素试验有k个处理,n次重复,完全随机设计,则共有nk个观察值,其数据结构和符号如表5.1所示。第9页/共177页表5-1 k个处理n次重复完全随机观察值符号表.2
5、1xxxxxxkiite第10页/共177页方差分析的线性数学模型ijiijxijiijiikixk则上式可写为:若令:11), 0(N2ij01ki第11页/共177页由于ij相互独立且服从正态分布N(0,2),所以各处理Ai(i=1,2,k)观察值所属总体亦应呈正态分布,即AiN(i ,2)。尽管各处理所在总体的平均数 i i 不一定相等,但总体方差2则必须假定是相等的。ijiijx第12页/共177页 用样本符号表示观察值的数学模型 每个观察值的变异包含处理间变异和处理内变异两部分。.)(.).(.iijiijiijiijiijiijxxxxetxxxxxxxetxx移项第13页/共17
6、7页 单因素完全随机试验资料的数学模型包含有以下几个基本假定: 效应的可加性(additivity) 分布的正态性(normality) 方差的同质性(homogeneity) 方差分析这三个基本假定也是进行其它类型方差分析的前提。iijiijiijxxxxet)xx(第14页/共177页二、平方和与自由度的分解iijiijiijxxxxet)xx(分。变异的处理内方差两部处理方差和度量处理内异的差分解为度量处理间变即把度量总变异的总方。异分量资料的变异程度所以用方差来度量各变点,因为样本方差有许多优第15页/共177页nkxxxxSSijijT222.)(nk个观察值的变异构成了整个资料的总
7、变异,总变异的平方和等于各个观察值与总平均数的离差平方和,它反映了全部样本观察值间总的变异程度。1 1、总变异平方和与自由度、总变异平方和与自由度dfdfT T=nk-1=nk-1第16页/共177页2 2、处理间处理间平方和与自由度平方和与自由度 处理间平方和指各处理的平均数与总平均数的离差平方和的和,它反映重复n次的各处理平均数 的总变异程度。即nkxxnknxnxnkxxnxxnSSiiiiiit2.2.22.22.2.2.2)(1)()()(.ixdft=k-1第17页/共177页3 3、处理内处理内平方和与自由度平方和与自由度 处理内平方和处理内平方和SSi指各处理内的n个观察值与其
8、相应平均数 的离差平方和,它反映了同一处理内重复观察值间的变异程度。处理1(第一组):处理2(第二组):处理k(第k组):nxxxxSSnxxxxSSnxxxxSSkkjkkjkjjjj2.222.22222222.1212111) .(.)(.)( .ix第18页/共177页 由于同一处理内各观察值的差异是由由于同一处理内各观察值的差异是由偶然因素造成的,因而,偶然因素造成的,因而,SSSS1 1、SSSS2 2、 、SSSSk k实际上都属于随机误差平方和,将其合实际上都属于随机误差平方和,将其合并得全试验资料处理内变异的平方和:并得全试验资料处理内变异的平方和:tTinkijinkijk
9、niijkeSSSSnkxnxnkxxnxxxxSSSSSSSS).().() .(.22.2122.1221121第19页/共177页各处理内自由度:各处理内自由度: 处理处理1 (1 (第第1 1组组) ):dfdf1 1=n-1=n-1 处理处理2 (2 (第第2 2组组) ):dfdf2 2=n-1=n-1 处理处理k (k (第第k k组组) ):dfdfk k=n-1=n-1整个资料处理内总自由度为:整个资料处理内总自由度为:dfdfe e=df=df1 1+df+df2 2+df+dfk k=k(n-1)=(nk-1)-(k-1)=k(n-1)=(nk-1)-(k-1)dfdfe
10、 e=df=dfT T-df-dft t第20页/共177页tTetTetitTijTdfdfdfSSSSSSkdfCxnSSnkdfCxSSnk;1;11;x.C2.22则令第21页/共177页于是, 处理间均方: 处理内均方: 总变异均方:TTTTeeeettttdfSSSMSdfSSSMSdfSSSMS222注意etTMSMSMS222212kessss .).(2222121kesssks 第22页/共177页【例5-1】有一水稻施肥的盆栽试验,设5个处理:和系分别施用两种不同的氨水,施碳酸氢铵,施尿素,不施氮肥。每处理各4盆(每盆纯氮相同),共54=20盆,随机放置于同一盆栽场。其稻
11、谷产量(克/盆)列于表5-2。请分析这五种施肥处理之间是否存在显著差异。第23页/共177页表5-2水稻施肥盆栽试验的产量结果(g/盆).ix.x第24页/共177页 如果以离均差形式表示20个观察值xij的各种变异,就得以下结果: 总变异 xxij 处理间变异.xxi误差项变异. iijxx -2.3 3.7 1.7 -0.30.7 -2.3 -5.3 -0.34.7 1.7 -1.3 3.75.7 6.7 6.7 1.7-5.3 -4.3 -10.3 -5.30.7 0.7 0.7 0.7-1.8 -1.8 -1.8 -1.8 2.2 2.2 2.2 2.2 5.2 5.2 5.2 5.2
12、 -6.3 -6.3 -6.3 -6.3-3 3 1 -12.5 -0.5 -3.5 1.52.5 -0.5 -3.5 1.50.5 1.5 1.5 -3.51 2 -4 1SST=402.2dft=19SSt=301.2dft=4SSe=101.0dfe=15第25页/共177页总总变异处理间变异和试验误差变异处理间变异和试验误差例例5-15-1的处理数的处理数k=5k=5,每一处理观察值个数,每一处理观察值个数n=4n=4根据单因素完全随机试验资料的数学模型.)(iijiijiijxxxxetxx例5-1 平方和与自由度的分解第26页/共177页各变异来源平方和计算 矫正数:总变异:处理间
13、变异:处理内变异:0 .1012 .3012 .4022 .3014)8098108(2 .4022130248 .1383345526.2222.222222tTeitijTSSSSSSCCnxSSCCxSSnkxC第27页/共177页各项变异来源自由度计算 总变异自由度: 处理间变异自由度: 处理内变异自由度:15) 14(5) 1(4151191201nkdfkdfnkdfetT第28页/共177页总变异:处理间变异:处理内变异:73.6150 .10130.7542 .30116.21192 .402222eeeettttTTTTdfSSSMSdfSSSMSdfSSSMS各变异来源的均
14、方 本研究目的就是想明确5 5种施肥处理对水稻产量的效应是否存在显著差异。第29页/共177页三、F检验(一)EMSe=2 方差分析的一个基本假定是要求各处理观察值所在总体的方差相等。即 222212kn学习第三章时我们知道,样本方差是总体方差的无偏估计值。即的无偏估计都是2222221,SkiSSS 第30页/共177页 统计学已证明,各 的合并均方 (以各处理内的自由度n-1为权的加权平均数)也是2的无偏估计量,且估计的精确度更高。很容易推证处理内均方MSe就是各 样本方差 的合并均方。 2iS2eS2iS2121222222112212()(1)(1)iijiekeekkkekxxSSS
15、SSSSSSSMSdfk nk ndfdfdfdf Sdf Sdf SSdfdfdf 2eEMS即第31页/共177页(二)EMSt= 试验中各处理所属总体的本质差异体现在处理效应 的差异上。我们把 称为处理效应方差,它反映了各处理观察值所属总体的平均数i i的变异程度大小。 22ni2221)(1kkii第32页/共177页 因为各 未知,所以无法求得 的确切值,只能通过试验结果中各处理均数的差异去估计。 然而, 并非 的无偏估计。 i221.).(2kxxi第33页/共177页 因为各处理均数间的差异来源于两方面:一是各处理所在总体i i本质不同,二是平均数的抽样误差。统计学已证明: 所以
16、处理间总均方MSMSt t实际上是 的无偏估计。它一般比误差均方MSMSe e来得大。估计。的无偏是处理间均方 )(1.).(222nkxxi22n即 EMSt =22n第34页/共177页 因为 2 , 分别是误差均方MSe和处理间均方MSt的数学期望(mathematical expectation ),所以又称它们为期望均方,简记为EMS(expected mean squares)。 22n第35页/共177页(三)F 检验 当处理效应的方差 =0,亦即各处理观测值所在总体的平均数 i ( (i=1,2,,k)相等时(即 1 = =2 = = = =k ),处理间均方MSt与处理内均方
17、相同,都是误差方差2的估计值。2第36页/共177页 F检验就是通过对MSt 与MSe的比较来推断 是否为零,即 是否相等。统计学已证明,在 =0的条件下, MSt / MSe服从自由度df1=k-1与df2=k(n-1)的F分布。 i212(,)12 ,1, (1)tdf dfeMSFdfkdfk nMS2附表4 4列出了检验MSMSt t所代表的总体方差是否显著比F F值越大,对应的右尾概率越小。第37页/共177页。,MSMS,F,FFetdfdf应存在显著差异即处理效的总体方差总体方差显著大于代表的把握推断我们以水平上显著值在则若实际计算的%9505. 0),(05. 021 这种利用
18、F分布计算概率来推断一个总体方差是否显著大于另一个总体方差的假设测验称F检验。这种F检验是一尾检验。第38页/共177页.,0121222222是否相等也即是否为来推断由前已述及ketnnMSMSF 所以F检验的无效假设是 备择假设是kAkHH 21210:而且在进行F检验时,把被检验因素的均方作分子,误差均方作分母。分母项的选择以期望均方所决定。第39页/共177页这里误差均方这里误差均方.73.73系五种处理内变异系五种处理内变异的合并均方,它是表的合并均方,它是表5-25-2资料的试验误差的资料的试验误差的估计;处理间均方估计;处理间均方75.375.3则是试验误差与不则是试验误差与不同
19、施肥处理效应对产量共同作用的结果。同施肥处理效应对产量共同作用的结果。222)(;)(nMSEMSEte例5-1,我们计算了处理间均方:误差均方:73. 6MS3 .75MSet第40页/共177页 表5-1资料的方差分析表变异来源变异来源 DF SS MS F 处理间处理间 k-1 SSt MSt MSt/MSe 处理内处理内 k(n-1) SSe MSe 总变异总变异 kn-1 SST第41页/共177页表5-2资料方差分析表变异来源变异来源 dfSSMSFF0.05 F0.01处理间处理间处理内处理内415301.2101.075.36.7311.18* 3.06 4.89总变异总变异1
20、9402.2 上述F测验表明,FF0.01,则P0.01,所以否定H0,接受HA,即5种施肥处理对水稻产量的效应存在极显著差异。第42页/共177页四、 多重比较(multiple comparisons) F检验只是对所有处理整体上是否存在显著差异的测验,并不能提供任何两个平均数是否存在显著性差异的具体信息。要明确各个处理平均数彼此间的差异显著性,还必须对各个平均数作相互比较,这种多个处理平均数两两间的相互比较称为多重比较。第43页/共177页(一)、最小显著差数法(LSD) 最小显著差数法的实质是在最小显著差数法的实质是在F测验显著测验显著前提下两个样本平均数相比较的前提下两个样本平均数相
21、比较的t测验。测验。nMS2nSnSS;Sxxte2j2iXXXXjijiji1、计算平均数差数的标准误;、计算平均数差数的标准误;2、计算出显著水平下的最小显著差数、计算出显著水平下的最小显著差数LSD。jiexx)df(StLSD第44页/共177页3 3、将任意两个处理平均数差的绝对值与LSDLSD相比较。表示差异不显著表示差异极显著表示差异显著djidjidjistxxstxxstxx05. 001. 005. 0第45页/共177页对【例5-1】用法测验各处理平均数与对照的差异显著性。由前面的分析可知:MSe=6.73 ; n =4盆)克(834. 14)73. 62(nMSe2Sj
22、ixx查查t值表,当值表,当dfe=15时,时,t0.05,15=2.131 t0.01,15=2.947 故:故:LSD0.05=2.1311.834=3.90(克克/盆盆) LSD0.01=2.947 1.834=5.40(克克/盆盆)第46页/共177页五种施肥效果的多重比较表(LSD法) 推断推断:施氨水施氨水2显著高于不施氮肥;施碳铵、显著高于不施氮肥;施碳铵、尿素、氨水尿素、氨水1均极显著高于不施氮肥。均极显著高于不施氮肥。LSD0.05=3.9LSD0.01=5.4第47页/共177页LSD法的特点 LSD是在F测验保护下的两两平均数间的t测验,避免了检验工作量大和无统一误差及误
23、差估计值过高的问题; 但LSD没有考虑相互比较的平均数大小排列上的秩次,所有平均数间比较,都采用同一个标准,使得秩次大的平均数间比较的标准偏小,容易否定无效假设,增大犯I型错误的概率。第48页/共177页(二)、最小显著极差法 最小显著极差(Least significant range)法: 把平均数的差数看成极差,根据极差范围内包含的处理数k的不同而采用不同的检验尺度。即不同平均数间比较采用不同的检验尺度,称为最小显著极差LSR, k 。常用的有新复极差法和q测验法。第49页/共177页 新复极差法 新复极差法(new multiple range method),是D. B. Dunca
24、n(1955)提出的,故又称Duncan法,还称SSR (shortest significant ranges)法。xkdfsSSRLSRe),(nMSsex),(kdfeSSR q测验法xkdfsqLSRe),(),(kdfeqnMSsex q测验法(复极差法)是Student-Newman-Keul基于极差的抽样分布理论提出的,有时又称SNK测验或NK测验。第50页/共177页 1、新复极差测验法(SSR)第一:计算单个平均数的标准误nMSsex第二:查SSR表,计算最小显著极差值LSR,Kx)k ,df(k ,SSSRLSRe第三:以各个k值下的LSR为显著尺度,测验各平均数两极差的显
25、著性。第51页/共177页 试以法测验例5-1五个处理两两平均数间的差异显著性。由前面的分析可知:MSe=6.73, n=4,故)/(297. 1473. 6盆gnMSesx当dfe=15时,由SSR值表,查出k=2,3,4,5的SSR0.05和SSR0.01的值,并由LSR,kSSR ,k 计算出相应的最小显著极差LSR于下表。xs第52页/共177页 K 2 3 4 5 SSR0.05 3.01 3.16 3.25 3.31 SSR0.01 4.17 4.35 4.46 4.55 LSR0.05 3.90 4.10 4.22 4.29 LSR0.01 5.41 5.64 5.78 5.90
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 方差分析
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内