【教学课件】第六章方差分析.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《【教学课件】第六章方差分析.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第六章方差分析.ppt(122页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章第六章 方差分析方差分析第一节第一节 方差分析的基本原理方差分析的基本原理第二节第二节 多重比较多重比较第三节第三节 方差分析的线性模型与期望均方方差分析的线性模型与期望均方第四节第四节 单向分组资料的方差分析单向分组资料的方差分析第五节第五节 两向分组资料的方差分析两向分组资料的方差分析第六节第六节 方差分析的基本假定和数据转换方差分析的基本假定和数据转换第一节第一节 方差分析的基本原理方差分析的基本原理 所谓所谓方差分析方差分析(analysis of variance)(analysis of variance),是关于是关于k(k3)个样本个样本平均数的假设测验方法,是将总变异剖
2、分为各个变异来源的平均数的假设测验方法,是将总变异剖分为各个变异来源的相应部分,从而发现各变异原因在总变异中相对重要程度的相应部分,从而发现各变异原因在总变异中相对重要程度的一种统计分析方法。一种统计分析方法。假设测验的依据是假设测验的依据是:扣除了各种试验原因所引起的扣除了各种试验原因所引起的变异后的剩余变异提供了试验误差的无偏估计变异后的剩余变异提供了试验误差的无偏估计 。这里采用均方来度量试验处理产生的变异和误差引起的这里采用均方来度量试验处理产生的变异和误差引起的变异变异.方差方差是平方和除以自由度的商。是平方和除以自由度的商。一、自由度和平方和的分解一、自由度和平方和的分解 设有设有
3、k组数据,每组皆具组数据,每组皆具n个观察值,则该资料共有个观察值,则该资料共有nk个观个观察值,其数据分组如表察值,其数据分组如表6.1。表表6.1 每每组组具具n个个观观察察值值的的k 组组数据的符号表数据的符号表组别组别观察值观察值(yij,i=1,2,k;j=1,2,n)总总和和平均平均均方均方1y11y12y1jy1nT12y21y22y2jy2nT2iyi1yi2yijyinTikyk1yk2ykjyknTk 在表在表6.1中,总变异是中,总变异是nk个观察值的变异,故其自由度个观察值的变异,故其自由度v=nk1,而其平方和,而其平方和SST则为:则为:(61)其中的其中的C称为矫
4、正数:称为矫正数:(62)对于第对于第 i 组的变异,有组的变异,有从而总变异从而总变异(61)可以剖分为可以剖分为:(63)即即 总平方和总平方和=组内组内(误差误差)平方和平方和+处理平方和处理平方和 组间变异由组间变异由k个个 的变异引起,故其自由度的变异引起,故其自由度 v=k1,组组间平方和间平方和 SSt 为:为:组内变异为各组内观察值与组平均数的变异,故每组具有组内变异为各组内观察值与组平均数的变异,故每组具有自由度自由度 v=n1和平方和和平方和 ;而资料共有;而资料共有k 组,故组组,故组内自由度内自由度 v=k(n1),组内平方和组内平方和 SSe 为:为:(65)(64)
5、因此,得到表因此,得到表6.1类型资料的自由度分解式为:类型资料的自由度分解式为:(66)总自由度总自由度DFT=组间自由度组间自由度DFt+组内自由度组内自由度DFe 求得各变异来源的自由度和平方和后,进而可得求得各变异来源的自由度和平方和后,进而可得:(67)例例6.1 以以A、B、C、D 4种药剂处理水稻种子,其中种药剂处理水稻种子,其中A为对照,每处理各得为对照,每处理各得4个苗高观察值个苗高观察值(cm),其结果如表,其结果如表6.2,试分解其自由度和平方和。试分解其自由度和平方和。表表6.2 水稻不同水稻不同药剂处药剂处理的苗高理的苗高(cm)(cm)药剂药剂苗高苗高观观察察值值总
6、和总和Ti 平均平均 A18 21 20 137218B20 24 26 229223C10 15 17 145614D28 27 29 3211629T=336 =21 根据根据(66)进行总自由进行总自由度的剖分:度的剖分:总变异自由度总变异自由度DFT=(nk1)=(44)1=15 药剂间自由度药剂间自由度DFt=(k1)=41=3 药剂内自由度药剂内自由度DFe=k(n1)=4(41)=12根据根据(63)进行总平方和的剖分:进行总平方和的剖分:或或 或或 药剂药剂A内:内:药剂药剂B内:内:药剂药剂C内:内:药剂药剂D内:内:所以所以 进而可得均方:进而可得均方:二、二、F分布与分布
7、与F测验测验 在一个平均数为在一个平均数为 、方差为、方差为 的正态总体中,随机抽的正态总体中,随机抽取两个独立样本,分别求得其均方取两个独立样本,分别求得其均方 s12 和和 s22,将,将 s12 和和 s22 的比值定义为的比值定义为F:(68)此此F值具有值具有s12 的自由度的自由度 v1 和和 s22 的自由度的自由度 v2。所谓所谓F F分布分布,就是在给定的,就是在给定的 v1 和和 v2 下按上述方法从正下按上述方法从正态总体中进行一系列抽样,就可得到一系列的态总体中进行一系列抽样,就可得到一系列的F 值而作成值而作成一个分布。一个分布。F分布下一定区间的概率可从已制成的统计
8、表查出。分布下一定区间的概率可从已制成的统计表查出。F分布曲线特征:分布曲线特征:(1)具有平均数)具有平均数 =1(2)取值区间为)取值区间为0,;(3)某一特定曲线的形)某一特定曲线的形状则仅决定于参数状则仅决定于参数 v1和和 v2。在在 v1=1或或 v1=2时,时,F分布分布曲线是严重倾斜成反向曲线是严重倾斜成反向J型;型;当当 v13时,曲线转为偏态时,曲线转为偏态(图图6.1)。图图6.1 F分布曲线分布曲线(随(随v1和和v2的不同而不同)的不同而不同)F测验需具备条件:测验需具备条件:(1)变数变数y遵循正态分布遵循正态分布N(,),(2)s12 和和 s22 彼此独立彼此独
9、立。另外,在另外,在F 测验中,如果作分子的均方小于作分母的测验中,如果作分子的均方小于作分母的均方,则均方,则F0.05,应接受,应接受H0。例例6.2 测定东方红测定东方红3号小麦的蛋白质含量号小麦的蛋白质含量10次,得均方次,得均方 s12=1.621;测定农大;测定农大139小麦的蛋白质含量小麦的蛋白质含量5次,得均方次,得均方 s22=0.135。试测验东方红。试测验东方红3号小麦蛋白质含量的变异是否比号小麦蛋白质含量的变异是否比农大农大139为大。为大。假设假设H0:东方红小麦总体蛋白质含量的变异和农大:东方红小麦总体蛋白质含量的变异和农大139一样,即一样,即 ,对,对 。显著水
10、平显著水平 =0.05,v1=9,v2=4时,时,F0.05=6.00。测验计算测验计算:F=1.621/0.135=12.01 此此FF0.05,即,即PF0.01F0.05 。推断:否定推断:否定 ,接受,接受 ;即药剂间;即药剂间变异显著地大于药剂内变异,不同药剂对水稻苗高是具有不变异显著地大于药剂内变异,不同药剂对水稻苗高是具有不同效应的。同效应的。例例6.1和例和例6.3的分析结果可以归纳在一起,列出方差的分析结果可以归纳在一起,列出方差分析表,如表分析表,如表6.3所示。所示。表表6.3 水稻水稻药剂处药剂处理苗高方差分析表理苗高方差分析表变变异来源异来源DFSSMSF显显著著F值
11、值药剂处药剂处理理间间 3504168.0020.56F 0.05(3,12)=3.49 药剂处药剂处理内理内(误误差差)12 98 8.17F 0.01(3,12)=5.95总总15602第二节第二节 多重比较多重比较 所谓所谓多重比较(多重比较(multiple comparisonsmultiple comparisons)是指一个试验是指一个试验中中k个处理平均数间可能有个处理平均数间可能有k(k1)/2个比较,亦称为个比较,亦称为复式复式比较比较。多重比较有多种方法,本节将介绍常用的三种:多重比较有多种方法,本节将介绍常用的三种:最小显著差数法最小显著差数法 复极差法复极差法(q法法
12、)Duncan氏新复极差法氏新复极差法一、最小显著差数法一、最小显著差数法 最小显著差数法最小显著差数法(least significant difference,简称,简称LSD法法),法实质上是第五章的法实质上是第五章的t 测验。测验。其程序是:其程序是:(1)在处理间的)在处理间的F测验为显著的前提下,计算出显著水测验为显著的前提下,计算出显著水平为平为 的最小显著差数的最小显著差数 ;(2)任何两个平均数的差数)任何两个平均数的差数(),如其绝对值,如其绝对值 ,即为在水平上差异显著;反之,则为在水平上差异不显著。,即为在水平上差异显著;反之,则为在水平上差异不显著。已知:已知:若若|
13、t|,即为在即为在 水平上显著。水平上显著。因此,最小显著差数为:因此,最小显著差数为:(69)当两样本的容量当两样本的容量n相等时,相等时,在方差分析中,上式的在方差分析中,上式的se2有了更精确的数值有了更精确的数值 MSe(因(因为此自由度增大),因此为此自由度增大),因此(69)中中 的为:的为:(610)例例6.4 试以试以LSD法测验法测验表表6.2资料各种药剂处理的苗高平资料各种药剂处理的苗高平均数间的差异显著性。均数间的差异显著性。由由(例例6.3)计算得计算得F=20.56为显著,为显著,MSe=8.17,DFe=12,故故 由附表由附表4,v=12时,时,t0.05=2.1
14、79,t0.01=3.055故故 LSD0.05=2.1792.02=4.40(cm)LSD0.01=3.0552.02=6.17(cm)然后将各种药剂处理的苗高与对照苗高相比,差数大然后将各种药剂处理的苗高与对照苗高相比,差数大于于4.40cm为差异显著;大于为差异显著;大于6.17cm为差异极显著。为差异极显著。二、二、q法法 q测验是测验是Student-Newman-Keul基于极差的抽样分布理论基于极差的抽样分布理论提出来的,或称复极差测验,有时又称提出来的,或称复极差测验,有时又称SNK测验或测验或NK测验。测验。q法是将一组法是将一组k个平均数由大到小排列后,根据所比较的个平均数
15、由大到小排列后,根据所比较的两个处理平均数的差数是几个平均数间的极差分别确定最小两个处理平均数的差数是几个平均数间的极差分别确定最小显著极差值显著极差值 的。的。q测验因是根据极差抽样分布原理的,其各个比较都可测验因是根据极差抽样分布原理的,其各个比较都可保证同一个保证同一个 显著水平。显著水平。q测验尺度值构成为:测验尺度值构成为:(611)(612)式中式中2pk,p是所有比较的平均数按大到小顺序排列所是所有比较的平均数按大到小顺序排列所计算出的两极差范围内所包含的平均数个数计算出的两极差范围内所包含的平均数个数(称为称为秩次距秩次距)。SE为平均数的标准误,可见在每一显著水平下该法有为平
16、均数的标准误,可见在每一显著水平下该法有k1个尺度值。个尺度值。平均数比较时,尺度值随秩次距的不同而异。平均数比较时,尺度值随秩次距的不同而异。例例6.5 试对表试对表6.2资料的各平均数作资料的各平均数作q测验。测验。由由6.1资料得:资料得:查附表查附表7 q值表,当值表,当DF=12时时,p=2,3,4的的 值,并值,并由由(611)计算出尺度值计算出尺度值 ,列于表,列于表6.4。pq0.05q0.01LSR0.05LSR0.0123.084.324.406.1833.775.045.397.2144.205.506.017.87表表6.4 表表6.2资料资料 值的计算值的计算(q测验
17、测验)由表由表6.2可知可知,=29cm,=23cm,=18cm,=14cm。:由此可得到由此可得到-当当p=2时时,=6(cm)5水平上水平上显显著;著;=5(cm)5水平上水平上显显著;著;=4(cm)不不显显著。著。当当p=3时时,=11(cm)1水平上水平上显显著;著;=9(cm)1水平上水平上显显著。著。当当p=4时时,=15(cm)1水平上水平上显显著。著。三、新复极差法三、新复极差法新复极差法新复极差法是是D.B.Duncan(1955)基于不同秩次距基于不同秩次距p下下的最小显著极差变幅比较大而提出的,又称的最小显著极差变幅比较大而提出的,又称最短显著极差最短显著极差法法(sh
18、ortest significant ranges(shortest significant ranges,SSR SSR )。查得查得 后,有后,有(613)此时,在不同秩次距此时,在不同秩次距p下,平均数间比较的显著水平下,平均数间比较的显著水平按两两比较是按两两比较是 ,但按,但按p个秩次距则为保护水平个秩次距则为保护水平 例例6.6 试对表试对表6.2资料的各平均数作新复极差测验。资料的各平均数作新复极差测验。已知已知 =29cm,=23cm,=18cm,=14cm,MSe=8.17,查附表查附表8,得值,由,得值,由(613)算得在算得在p=2,3,4时的值时的值(表表6.5),即为
19、测验不同,即为测验不同p时的平均数间极差显著性的尺度值。时的平均数间极差显著性的尺度值。pSSR0.05SSR0.01LSR0.05LSR0.0123.084.324.406.1833.234.554.626.5143.334.684.766.69表表6.5 表表6.2资料资料LSR值的计算值的计算(新复极差测验新复极差测验)当当p=2时,时,=6(cm)5水平显著;水平显著;=5(cm)5水平显著;水平显著;=4(cm)不显著。不显著。当当p=3时,时,=11(cm)1水平上显著;水平上显著;=9(cm)1水平上显著。水平上显著。当当p=4时,时,=15(cm)1水平上显著。水平上显著。结论
20、:表结论:表6.2资料的资料的4个处理的苗高,除处理个处理的苗高,除处理A与与C差异差异不显著外,其余处理间均达显著差异,本例结果与上面介绍不显著外,其余处理间均达显著差异,本例结果与上面介绍的的q测验法相同,但测验法相同,但q法的法的 要比新复极差法的要比新复极差法的 大。大。四、多重比较结果的表示方法四、多重比较结果的表示方法(一一)列梯形表法列梯形表法(二二)划线法划线法(三三)标记字母法标记字母法 将全部平均数从大到小顺次排列,然后算出各平将全部平均数从大到小顺次排列,然后算出各平均数间的差数。凡达到均数间的差数。凡达到 =0.05水平的差数在右上角水平的差数在右上角标一个标一个“*”
21、号,凡达到号,凡达到 =0.01水平的差数在右上角水平的差数在右上角标两个标两个“*”号号,凡未达到凡未达到 =0.05水平的差数则不予水平的差数则不予标记。若以列梯形表法表示,则成表标记。若以列梯形表法表示,则成表6.6。(一一)列梯形表法列梯形表法处处理理平均数平均数()差差 异异 14 18 23D2915*11*6*B239*5*A184C14表表6.6 表表6.2资料的差异显著性资料的差异显著性(新复极差测验新复极差测验)优点优点:十分直观,:十分直观,缺点缺点:占篇幅较大,特别是处理平均数较多时。:占篇幅较大,特别是处理平均数较多时。(二二)划线法划线法 将平均数按大小顺序排列,以
22、第将平均数按大小顺序排列,以第1个平均数为标准与以后个平均数为标准与以后各平均数比较,在平均数下方把差异不显著的平均数用横线各平均数比较,在平均数下方把差异不显著的平均数用横线连接起来,依次以第连接起来,依次以第2,k1个平均数为标准按上述方法个平均数为标准按上述方法进行。这种方法称划线法。下面就是表进行。这种方法称划线法。下面就是表6.2资料用划线法标出资料用划线法标出0.01水平下平均数差异显著性结果水平下平均数差异显著性结果(q法法)。29cm(D)23cm(B)18cm(A)14cm(C)优点优点:直观、简单方便,所占篇幅也较少。:直观、简单方便,所占篇幅也较少。(三三)标记字母法:标
23、记字母法:(1)将全部平均数从大到小依次排列。)将全部平均数从大到小依次排列。(2)在最大的平均数上标上字母)在最大的平均数上标上字母a;将该平均数与以下;将该平均数与以下各平均数相比,相差不显著的,都标上字母各平均数相比,相差不显著的,都标上字母a,直至某一个,直至某一个与之相差显著的平均数则标以字母与之相差显著的平均数则标以字母b(向下过程向下过程),(3)再以该标有)再以该标有b的平均数为标准,与上方各个比它大的平均数为标准,与上方各个比它大的平均数比,凡不显著的也一律标以字母的平均数比,凡不显著的也一律标以字母b(向上过程向上过程);再以该标有再以该标有b的最大平均数为标准,与以下各未
24、标记的平均的最大平均数为标准,与以下各未标记的平均数比,凡不显著的继续标以字母数比,凡不显著的继续标以字母b,直至某一个与之相差显,直至某一个与之相差显著的平均数则标以字母著的平均数则标以字母c。(4)如此重复进行下去,直至最小的一个平均数有了)如此重复进行下去,直至最小的一个平均数有了标记字母且与以上平均数进行了比较为止。标记字母且与以上平均数进行了比较为止。(5)这样各平均数间,凡有一个相同标记字母的即为)这样各平均数间,凡有一个相同标记字母的即为差异不显著,凡没有相同标记字母的即为差异显著。差异不显著,凡没有相同标记字母的即为差异显著。在实际应用时,可以小写字母表示在实际应用时,可以小写
25、字母表示 =0.05显著水平,显著水平,大写字母表示大写字母表示 =0.01显著水平。显著水平。(1)在表)在表6.7上先将各平均数按大小顺序排列,并在行上先将各平均数按大小顺序排列,并在行上标上标a。(2)由于)由于 与与 呈显著差异,故呈显著差异,故 上标上标b。(3)然后以)然后以 为标准与为标准与 相比呈显著差异,故标相比呈显著差异,故标c。(4)以)以 为标准与为标准与 比,无显著差异,仍标比,无显著差异,仍标c。同理,可进行同理,可进行4个在个在1水平上的显著性测验,结果列水平上的显著性测验,结果列于表于表6.7。例例6.7 试对例试对例6.6测验结果作出字母标记。测验结果作出字母
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学课件 教学 课件 第六 方差分析
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内