《方差分析㈠》PPT课件.ppt
《《方差分析㈠》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《方差分析㈠》PPT课件.ppt(33页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章第五章 方差分析(一)方差分析(一)n第一节第一节 方差分析原理方差分析原理n (一个性质、两个分布、三个假定)(一个性质、两个分布、三个假定)n第二节第二节 单向分组数据单向分组数据n (各组观察值个数有相同和不相同之分)(各组观察值个数有相同和不相同之分)n第三节第三节 多向分组数据多向分组数据 n (含两向分组、三向分组实例)(含两向分组、三向分组实例)n第四节第四节 三个假定与数据转换三个假定与数据转换*n (正态性、可加性、同质性)(正态性、可加性、同质性)第五章要点提示第五章要点提示 方差分析是本课程的重点,它与试验研究联系最为密切。学习时方差分析是本课程的重点,它与试验研究
2、联系最为密切。学习时要从完全随机设计(单向分组)的试验数据着手,结合显著性检验的知识,要从完全随机设计(单向分组)的试验数据着手,结合显著性检验的知识,深刻理解方差分析原理的全部内涵,即一个性质、两个分布和深刻理解方差分析原理的全部内涵,即一个性质、两个分布和 三个假定三个假定(某些情况下作数据转换的必要性);(某些情况下作数据转换的必要性);区分区分LSR法多重比较与法多重比较与t-test的的异同点;异同点;重点掌握单因素随机区组和拉丁方试验结果的方差分析法,重点掌握单因素随机区组和拉丁方试验结果的方差分析法,能熟练地运用字母法标记多重比较结果。能熟练地运用字母法标记多重比较结果。涉及教材
3、内容:第六章第一、二、五节,第十二章第五、六、七节。涉及教材内容:第六章第一、二、五节,第十二章第五、六、七节。作业布置:作业布置:教材教材第六章第四节内容自习第六章第四节内容自习;教材教材P150 P150 T1、T3、T4、T12、T13、T14、T21、T22 、T23 ,教材教材P325 P325 T7、T8、T13。第一节第一节 方差分析原理方差分析原理 方差分析方差分析(analysis of variance),缩缩写词原为写词原为ANOVA,现在也用现在也用AOV。它是对多个样本平均数进行假设测它是对多个样本平均数进行假设测验的方法验的方法,因为对三个以上的平均数差因为对三个以
4、上的平均数差异进行比较时异进行比较时,采用只能就一个或两个采用只能就一个或两个样本平均数差异进行显著性测验的方法样本平均数差异进行显著性测验的方法已不敷应用,例如:已不敷应用,例如:例例5.1 某水产研究所为了比较某水产研究所为了比较 k=4种种不同配合饲料对鱼的饲喂效果,选取了不同配合饲料对鱼的饲喂效果,选取了条件基本相同的鱼条件基本相同的鱼20尾,随机分成尾,随机分成4组组,投喂不同饲料,一个月后每个处理各得投喂不同饲料,一个月后每个处理各得n=5个增重观察值个增重观察值,且且T=550.8,=27.54,试予分析。试予分析。解解 本例本例需要分析两个方面的问题需要分析两个方面的问题:鱼经
5、不同饲料投喂后增重是否鱼经不同饲料投喂后增重是否 有显著差异(即存在本质差别)?有显著差异(即存在本质差别)?若有显著差异的话若有显著差异的话,在哪些饲料之间在哪些饲料之间?饲料饲料 鱼鱼 的的 增增 重重(10g)Ttt A131.9 27.9 31.8 28.4 35.9155.931.18 A224.8 25.7 26.8 27.9 26.2 131.426.28A322.1 23.6 27.3 24.9 25.8123.724.74A427.0 30.8 29.0 24.5 28.5 139.827.96 如果按第三章的方法如果按第三章的方法,直接进行显著直接进行显著性检验性检验,就要
6、就要孤立地对以下孤立地对以下6个两两差数个两两差数做做t-test,即:即:顺序顺序 t t24.74 t26.28 t A1 31.18 A4 27.96 A2 26.28 A3 24.74 第一节第一节 方差分析原理方差分析原理 把一份完整的原始数据部分地撇开,把一份完整的原始数据部分地撇开,孤立地对两两差数进行孤立地对两两差数进行t-test,其消极后其消极后果佛克伦这样描述过:果佛克伦这样描述过:从同一总体中抽样从同一总体中抽样,每次抽两个样本每次抽两个样本得得1和和2后求算后求算 t 值值,若指定它超过某若指定它超过某值的概率为值的概率为5%的话的话,该值就是两尾表中该值就是两尾表中
7、查得的临界值查得的临界值 t0.05 再以相同的样本容再以相同的样本容量每次抽三个样本量每次抽三个样本,用用最大的样本和最大的样本和最小的样本求算最小的样本求算 t 值值,此时它超过此时它超过“t0.05”的概率上升到的概率上升到14.3%(即即“t0.05”=t)继续以相同的容量每次抽继续以相同的容量每次抽四个样本四个样本,仍以仍以最大的和最大的和最小的求算最小的求算t 值值,则则上升到上升到26.5%(即即“t0.05”=t0.265)以以此此类推类推5个样本个样本40%以上。以上。比如本例针对药剂比如本例针对药剂A1与药剂与药剂A3的两两差的两两差数数6.44(最大最大 最小最小)进行的
8、进行的t-test:F=S大大2/S小小2=41.67/415.97/4 F Se2=(SS1+SS2)/(1+2 S 1-2=Se2(1/n1+1/n2 t=(1-2)(1-2)S1-2 =6.44 1.70=3.8 “t 由由于于撇撇开开A、B孤孤立立地地进进行行,否否定定HO的把握不到的把握不到80%。饲料饲料鱼鱼 的的 增增 重重(10g)TttSS A131.9 35.9155.931.1841.67 A224.8 26.2 131.426.28 5.43A322.1 25.8123.724.7415.97A427.0 28.5 139.827.9622.33第一节第一节 方差分析原
9、理方差分析原理一、数据整理一、数据整理 根据方差分析的先决条件,在根据方差分析的先决条件,在“三个三个假定假定”成立的前提下,对右表继续整理:成立的前提下,对右表继续整理:C=T 2/nk=550.8 2SST=(Y)2 =Y 2 C 2 2 dfT=nk 1=5 4 1=19二、平方和、自由度的分解二、平方和、自由度的分解Y=(Yt)+(t )两边同时平方,得两边同时平方,得:(Y)2=(Y t)2+(t )2 +2(Y t)(t )由同一处理重复观察值的由同一处理重复观察值的累加:累加:(Y)2=(Yt)2+(t )2 +2(t )(Y t)=0(Y)2=(Y t)2+n(t )2再把全部
10、处理观察值的再把全部处理观察值的累加,得:累加,得:(Y)2=(Yt)2+n(t)2即:即:SST =(组内组内)SSe+(组间组间)SSt 其中其中 SSt=n(t)2=Tt 2/n C =(155.9 2+131.4 2+123.7 2+139.8 2)/5 于是于是SSe =SST SSt=199.67 =SS1+SS2+SS3+SS4 =dft=k 1=3 dfe=dfT dft=193 =df1+df2+df3+df4=4+4+4+4=16饲料饲料鱼鱼 的的 增增 重重(10g)TttSS A131.9 35.9155.931.1841.67 A224.8 26.2 131.426.
11、28 5.43A322.1 25.8123.724.7415.97A427.0 28.5 139.827.9622.33第一节第一节 方差分析原理方差分析原理三、列三、列ANOVA表,进行表,进行F-test 变异来源变异来源 DF SS MS F F 处理处理 3 114.27 38.09 7.13*误差误差 16 85.4 5.34 总总 19 199.67 (F值右上角标一个值右上角标一个*达到达到0.05,标两个标两个*达到达到0.01)这里进行的这里进行的F-test与第三章与第三章(Ho:大大2 小小2)的相同之处是都做右尾测验的相同之处是都做右尾测验,查的是同一张查的是同一张F临
12、界值表;不同之处是固定用误差方差临界值表;不同之处是固定用误差方差Se 2作作分母分母(Ho:t2 e2),而不论其相对大小。而不论其相对大小。显然显然,F值越大值越大,说明处理效应引起的数据说明处理效应引起的数据变变异不仅在量的方面所占比重较大异不仅在量的方面所占比重较大,而且相对而且相对于于误差引起的变异来讲显得越重要、越突出误差引起的变异来讲显得越重要、越突出;本本例例F-test结果显示极显著结果显示极显著,表明原始数据的总表明原始数据的总变变异主要由不同的饲料种类引起异主要由不同的饲料种类引起,各处理之间各处理之间至至少有两个存在着少有两个存在着(极极)显著差异。显著差异。以上一、二
13、、三就是创建的方差分析法,其以上一、二、三就是创建的方差分析法,其原理归纳如下原理归纳如下:平方和与自由度的可加性;平方和与自由度的可加性;SST 综合了全部观察值的变异量综合了全部观察值的变异量,它汇总了它汇总了各变异来源各变异来源(SOV)导致原始数据和全试验平均导致原始数据和全试验平均数数()出现差异的分量出现差异的分量,包括包括可控因素分量和可控因素分量和误差分量两类误差分量两类;“可加性可加性”证实前者就是观察证实前者就是观察值按可控因素分组后算得的组间平方和值按可控因素分组后算得的组间平方和(可控可控因素可以是试验因素因素可以是试验因素,也可以是象单位组那样也可以是象单位组那样的其
14、它系统因素的其它系统因素)。试验设计有几个可控因素试验设计有几个可控因素,数据就会有几种数据就会有几种可能的分组方式可能的分组方式,也就可以算出几个组间也就可以算出几个组间SS,而而本属于组内本属于组内SS的误差分量在平方和分解时总是的误差分量在平方和分解时总是由由SST 减去所有可控因素减去所有可控因素SS得到得到,因此它又被称因此它又被称为为“剩余平方和剩余平方和”。自由度的剖分与平方和的剖分一一对应自由度的剖分与平方和的剖分一一对应。依据依据F分布进行整体测验;分布进行整体测验;只确定可控因素分量和误差分量的相对只确定可控因素分量和误差分量的相对重要程度是否达到显著水平。重要程度是否达到
15、显著水平。第一节第一节 方差分析原理方差分析原理四、多重比较四、多重比较 R.A.Fisher 创建的方差分析法并没有明确创建的方差分析法并没有明确(极极)显著差异究竟存在于哪些显著差异究竟存在于哪些“组平均数组平均数”之间之间,F值值(极极)显著所包含的信息只有通过显著所包含的信息只有通过对对C2n=k(k-1)/2个两两差数进行多次连续性个两两差数进行多次连续性测验才能完全揭露出来,这就是多重比较。测验才能完全揭露出来,这就是多重比较。多重比较不论用哪一种方法多重比较不论用哪一种方法,区别于多区别于多 次孤立的次孤立的 t-test 或者说体现其或者说体现其“连续性连续性”特征特征之处有两
16、个之处有两个,一是必须使用同一个共用的标一是必须使用同一个共用的标准误准误,记为记为“SE”),本例本例SEMSe/n 5.345=1.033(10g);二是所依据的抽样分二是所依据的抽样分布由计算布由计算MSe即即Se2的自由度的自由度dfe决定决定,并根据并根据两两差数秩次距两两差数秩次距“k”的不同而有所修正。如的不同而有所修正。如本例本例k=2、3、4,测验时依据测验时依据dfe=16的的 t 分分布并在布并在k=3和和4时修正为时修正为SSR分布如右。分布如右。顺序顺序 t t24.74 t26.28 t A1 31.18 A4 27.96 A2 26.28 A3 =16,k=2 S
17、SR=t2=16,k=3=16,k=4 第一节第一节 方差分析原理方差分析原理 附表附表6 列出了各自由度对应的列出了各自由度对应的t 分布曲线分布曲线再按再按9 种秩次距修正出来的种秩次距修正出来的SSR分布当两尾分布当两尾概率取概率取0.05和和0.01时临界值,记为时临界值,记为SSR和和SSR,其中其中k=2的那一条因为实际就是的那一条因为实际就是 t分布曲线压缩横坐标刻度所得分布曲线压缩横坐标刻度所得,所以表中列所以表中列出的出的SSR和和SSR就分别等于附表就分别等于附表3所列所列t0.05 和和t的的2 倍倍;其它其它k3的的SSR分布随分布随着着P的递增的递增,对对 t 分布的
18、修正幅度加大分布的修正幅度加大,因此因此表中列出的表中列出的SSR和和SSR也就随之递增。也就随之递增。多重比较测验两两差数的显著性时不是多重比较测验两两差数的显著性时不是将它除以将它除以SE转换成转换成SSR(也是标准化变量也是标准化变量!)后再与后再与SSR0.05 和和SSR0.01 比大小比大小,而是先将而是先将SSR和和SSR乘以乘以SE算出算出“显著尺显著尺”LSR,再将它们直接和相应秩次距的两两差数比再将它们直接和相应秩次距的两两差数比大小大小,超过超过LSR标标*,超过超过LSR0.01 标标*。顺序顺序 t t24.74 t26.28 t A1 31.18 6.44*4.9*
19、3.22*A4 27.96 ns 1.68 ns A2 26.28 1.54 ns A3 =16,k=2 SSR=t2=16,k=3=16,k=4 第一节第一节 方差分析原理方差分析原理 按照两两差数在三角梯形表中的排列规按照两两差数在三角梯形表中的排列规律,本例多重比较过程列表如下:律,本例多重比较过程列表如下:LSR=SE SSR LSR=SE SSR 顺序顺序 t t24.74 t26.28 t A1 31.18 6.44*4.9*3.22*A4 27.96 3.22 ns 1.68 ns A2 26.28 1.54 ns A3 kSSR0.05SSR0.01LSR0.05LSR0.01
20、2 3.00 4.13 3.099 4.2663 3.15 4.34 3.254 4.4834 3.23 4.45 3.337 4.597 综合包括多重比较在内的方差分析综合包括多重比较在内的方差分析全过程,其原理可归纳为:全过程,其原理可归纳为:一个性质一个性质(SS、DF的可加性的可加性)两个分布两个分布(F分布和分布和SSR分布分布)本例根据本例根据SSR分布进行的多重比较分布进行的多重比较叫叫新复极差测验新复极差测验,简称简称SSR-test。因为因为不能缺少不能缺少 F-test 显著的前提,属于显著的前提,属于Fishers protected multipe comparison
21、s.此前产生的此前产生的复极差测验复极差测验(简称简称q-test、又又称称SNK测验测验)却可以不经过却可以不经过F-test,原因原因是是q-test算算LSR时要改查时要改查q 值表值表(附表附表7),所依据的所依据的q分布是按极差抽样分布原理分布是按极差抽样分布原理要保证各比较都是同一显著水平要保证各比较都是同一显著水平,因因而对而对 t 分布修正幅度随秩次距分布修正幅度随秩次距k的递增的递增而加大的速度要比而加大的速度要比SSR分布快分布快,所以秩所以秩次距次距k3 时时q和和q0.01 比相应的比相应的SSR和和SSR大。大。第二节第二节 单向分组数据单向分组数据 单向分组数据指观
22、察值仅按一个方单向分组数据指观察值仅按一个方位位(试验材料试验材料)随机地分成若干组,然后随机地分成若干组,然后各组给以不同处理,即同组供试单位受各组给以不同处理,即同组供试单位受相同处理,不同组受不同处理,这样所相同处理,不同组受不同处理,这样所得的全部观察值在设计上称为得的全部观察值在设计上称为完全随机完全随机试验数据试验数据调查结果也属此类。调查结果也属此类。一、各组观察值个数相等一、各组观察值个数相等 例例5.2 抽测抽测 5个不同品种个不同品种(k=5)各各5头母猪头母猪(n=5)的窝产仔数,结果如右表的窝产仔数,结果如右表所示,所示,T=265,试检验不同品种的母猪试检验不同品种的
23、母猪平均窝产仔数差异是否显著。平均窝产仔数差异是否显著。品种品种产仔数观察值产仔数观察值(头)(头)Ttt 1 8 13 12 9 95110.2 2 7 8 10 9 7418.2 313 14 10 11 126012 413 9 8 8 10489.6 512 11 15 14 136513 1、数据整理、数据整理 C=T 2/nk=265 2/25=2809SST=(Y)2 =Y 2 C =82+132+132 2809 =136dfT=nk 1=5 5 1=24第二节第二节 单向分组数据单向分组数据2、平方和、自由度的分解、平方和、自由度的分解SSt=n(t)2=Tt 2 =(51
24、2+41 2+60 2+48 2+65 2)/5 2809于是于是 SSe =SST SSt=136 dft=k 1=4 dfe=dfT dft=244=203、列、列ANOVA表,进行表,进行F-test 假设是假设是Ho:t2 e2 而不是而不是Ho:t2=e2 (和和 Ho:1=2=3=4=5效果一样)效果一样)SOV DF SS MS F F *误差误差 20 62.8 3.14 总总 24 1364、多重比较、多重比较 SE=MSe 再根据附表再根据附表6的的SSR进而算得显著尺:进而算得显著尺:K SSR0.05 SSR0.01 LSR0.05 LSR22.95 4.02 33.1
25、0 4.22 品种品种产仔数观察值产仔数观察值(头)(头)Ttt 1 8 13 12 9 95110.2 2 7 8 10 9 7418.2 313 14 10 11 126012 413 9 8 8 10489.6 512 11 15 14 136513第二节第二节 单向分组数据单向分组数据本例的多重比较结果以三角梯形表表述如下:本例的多重比较结果以三角梯形表表述如下:t 0.01 t 8.2 t 9.6 t 10.2 t 13.0 A*12.0 A*1.8 10.2 AB 9.6 AB 8.2 B t 12.0 第二节第二节 单向分组数据单向分组数据本例的多重比较结果以三角梯形表表述如下:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 方差分析 方差分析 PPT 课件
限制150内