第五章方差分析精选文档.ppt
《第五章方差分析精选文档.ppt》由会员分享,可在线阅读,更多相关《第五章方差分析精选文档.ppt(75页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章 方差分析本讲稿第一页,共七十五页第一节第一节 方差分析的基本原理方差分析的基本原理 k(k3)个样本平均数的假设测验方法,即方个样本平均数的假设测验方法,即方差分析差分析(analysis of variance)方差分析就是将总变异剖分为各个变异来方差分析就是将总变异剖分为各个变异来源的相应部分,从而发现各变异原因在总源的相应部分,从而发现各变异原因在总变异中相对重要程度的一种统计分析方法。变异中相对重要程度的一种统计分析方法。一、自由度和平方和的分解一、自由度和平方和的分解设有设有k组数据,每组皆具组数据,每组皆具n个观察值,则该个观察值,则该资料共有资料共有nk个观察值,其数据分
2、组如表个观察值,其数据分组如表 本讲稿第二页,共七十五页本讲稿第三页,共七十五页总变异是总变异是nk个观察值的变异,故其自由度个观察值的变异,故其自由度 ,而其平方和,而其平方和 则为:则为:本讲稿第四页,共七十五页总平方和总平方和=组内组内(误差误差)平方和平方和+处理平方和处理平方和组间变异由组间变异由k个个 的变异引起,故其自由度的变异引起,故其自由度 ,组间平方和为组间平方和为 :本讲稿第五页,共七十五页组内变异为各组内观察值与组平均数的变组内变异为各组内观察值与组平均数的变异,故每组具有自由度异,故每组具有自由度和平方和和平方和 ;资料共有资料共有 组,故组内自由度组,故组内自由度
3、组内平方和组内平方和 为:为:本讲稿第六页,共七十五页表中类型资料的自由度分解式为:表中类型资料的自由度分解式为:总自由度总自由度DFT=组间自由度组间自由度DFt+组内自由度组内自由度DFe (组内均方也称误差均方)组内均方也称误差均方)本讲稿第七页,共七十五页例例5.1 以以A、B、C、D 4种药剂处理水稻种药剂处理水稻种子,其中种子,其中A为对照,每处理各得为对照,每处理各得4个苗高个苗高观察值观察值(cm),其结果如表,其结果如表5.2,试分解其自,试分解其自由度和平方和。由度和平方和。本讲稿第八页,共七十五页表表5.2 水稻不同药剂处理的苗高水稻不同药剂处理的苗高(cm)本讲稿第九页
4、,共七十五页总自由度的剖分:总自由度的剖分:总变异自由度总变异自由度DFT=(nk-1)=(4 4)-1=15药剂间自由度药剂间自由度DFt=(k-1)=4-1=3药剂内自由度药剂内自由度DFe=k(n-1)=4(4-1)=12总平方和的剖分:总平方和的剖分:本讲稿第十页,共七十五页或 本讲稿第十一页,共七十五页以上药剂内均方以上药剂内均方系系4种药剂内变异的合并均方值,它是表种药剂内变异的合并均方值,它是表5.2资料的试验误差估计;药剂间均方资料的试验误差估计;药剂间均方则是不同药剂对苗高效应的变异。则是不同药剂对苗高效应的变异。本讲稿第十二页,共七十五页二、二、F分布与分布与F测验测验若所
5、得若所得FF0.05或或F0.01,则则H0发发生的概率小于等生的概率小于等于于0.05或或0.01,应该应该在在=0.05或 =0.01水平上否定水平上否定H0,接受,接受HA;若所得;若所得FF0.05或或FF0.01,则则H0发发生的概率大于生的概率大于0.05或或0.01,应应接受接受H0。本讲稿第十三页,共七十五页F分布曲线(随分布曲线(随 和和 的不同而不同)的不同而不同)本讲稿第十四页,共七十五页在方差分析的体系中,在方差分析的体系中,F测验可用于检测某测验可用于检测某项变异因素的效应或方差是否真实存在。项变异因素的效应或方差是否真实存在。所以在计算所以在计算F值时,总是将要测验
6、的那一项值时,总是将要测验的那一项变异因素的均方作分子,而以另一项变异变异因素的均方作分子,而以另一项变异(例如试验误差项例如试验误差项)的均方作分母。的均方作分母。如果作分子的均方小于作分母的均方,则如果作分子的均方小于作分母的均方,则F1;此时不必查;此时不必查F表即可确定表即可确定P0.05,应,应接受接受H0。F测验需具备:测验需具备:(1)变数变数y遵循正态分布遵循正态分布N(,),(2)和和 彼此独立两个条件。彼此独立两个条件。本讲稿第十五页,共七十五页例例5.2 测定东方红测定东方红3号小麦的蛋白质含量号小麦的蛋白质含量10次,得均方次,得均方 =1.621;测定农大;测定农大1
7、39小麦的小麦的蛋白质含量蛋白质含量5次,得均方次,得均方 =0.135。试测验。试测验东方红东方红3号小麦蛋白质含量的变异是否比农号小麦蛋白质含量的变异是否比农大大139为大。为大。本讲稿第十六页,共七十五页假设假设H0:东方红小麦总体蛋白质含量的变:东方红小麦总体蛋白质含量的变异和农大异和农大139一样,即一样,即H0:=,对,对HA:。显著水平取。显著水平取 =0.05,=9,=4时,时,F0.05=6.00。测验计算测验计算:此此FF0.05,即,即P0.05。推断:否定推断:否定H0,接受,接受HA,即东方红,即东方红3号小麦号小麦蛋白质含量的变异大于农大蛋白质含量的变异大于农大13
8、9。本讲稿第十七页,共七十五页表表5.3 水稻药剂处理苗高方差分析表水稻药剂处理苗高方差分析表本讲稿第十八页,共七十五页第二节第二节 多重比较多重比较 处理平均数间的比较处理平均数间的比较 一个试验中一个试验中k个处理平均数间可能有个处理平均数间可能有k(k-1)/2个比较,因而这种比较是复式比较亦称为个比较,因而这种比较是复式比较亦称为多重比较(多重比较(multiple comparisons)。)。这种在这种在F测验基础上再做的平均数间多重比测验基础上再做的平均数间多重比较称为较称为Fisher氏保护下的多重比较氏保护下的多重比较(Fishers protected multiple c
9、omparisons)。本讲稿第十九页,共七十五页一、最小显著差数法一、最小显著差数法 最小显著差数法最小显著差数法(least significant difference,简称,简称LSD法法),LSD法实质上是第四章的法实质上是第四章的t测验。测验。程序是:程序是:处理间的处理间的F测验为显著测验为显著 计算出显著水平为计算出显著水平为 的最小显著差数的最小显著差数 任何两个平均数的差数任何两个平均数的差数(),如其绝对值,如其绝对值 ,即为在,即为在 水平上差异显著。水平上差异显著。反之,则为在反之,则为在 水平上差异不显著。水平上差异不显著。本讲稿第二十页,共七十五页已知:已知:若若
10、|t|,即为在即为在 水平上显著。水平上显著。最小显著差数为:最小显著差数为:当两样本的容量当两样本的容量n相等时,相等时,本讲稿第二十一页,共七十五页在方差分析中,上式的在方差分析中,上式的 有了更精确的数有了更精确的数值值MSe。为:为:例例5.4 试以试以LSD法测验表法测验表5.2资料各种药资料各种药剂处理的苗高平均数间的差异显著性。剂处理的苗高平均数间的差异显著性。本讲稿第二十二页,共七十五页由由(例例5.3)计算得计算得F=20.56为显著,为显著,MSe=8.17,DFe=12,故故 由附表由附表4,12时,时,t0.05=2.179,t0.01=3.055 LSD0.05=2.
11、1792.02=4.40(cm);LSD0.01=3.0552.02=6.17(cm)将各种药剂处理的苗高与对照苗高相比,将各种药剂处理的苗高与对照苗高相比,差数大于差数大于4.40cm为差异显著;大于为差异显著;大于6.17cm为差异极显著。为差异极显著。本讲稿第二十三页,共七十五页二、二、q 法法 基于极差的抽样分布理论基于极差的抽样分布理论Student-Newman-Keul提出了提出了q测验或称复极差测验,有时又测验或称复极差测验,有时又称称SNK测验或测验或NK测验。测验。q测验方法是将一组测验方法是将一组k个平均数由大到小排个平均数由大到小排列后,根据所比较的两个处理平均数的差列
12、后,根据所比较的两个处理平均数的差数是几个平均数间的极差分别确定最小显数是几个平均数间的极差分别确定最小显著极差值的。著极差值的。其尺度值构成为:其尺度值构成为:本讲稿第二十四页,共七十五页式中式中2pk,p是所有比较的平均数按大到是所有比较的平均数按大到小顺序排列所计算出的两极差范围内所包小顺序排列所计算出的两极差范围内所包含的平均数个数含的平均数个数(称为秩次距称为秩次距),SE为平均数的标准误,为平均数的标准误,例例5.5 试对表试对表5.2资料的各平均数作资料的各平均数作q测验。测验。本讲稿第二十五页,共七十五页由由5.1资料得:资料得:查附表查附表7 q值表,当值表,当DF=12时,
13、时,p=2,3,4 的值,并由的值,并由(511)计算出尺度值计算出尺度值 ,列于,列于表表5.4。本讲稿第二十六页,共七十五页由表由表6.2可知,可知,=29cm,=23cm,=18cm,=14cm。由此可得到。由此可得到 本讲稿第二十七页,共七十五页三、新复极差法三、新复极差法 新复极差法,又称最短显著极差法新复极差法,又称最短显著极差法(shortest significant ranges,SSR)在不同秩次距在不同秩次距p下,平均数间比较的显著水下,平均数间比较的显著水平按两两比较是平按两两比较是 ,但按,但按p个秩次距则为保个秩次距则为保护水平护水平 。本讲稿第二十八页,共七十五页
14、例例5.6 试对表试对表5.2资料的各平均数作新复极资料的各平均数作新复极差测验。差测验。查附表查附表8,得,得 值,由值,由(513)算得在算得在p=2,3,4时的时的 值值(表表5.5),即为测验不同,即为测验不同p时的时的平均数间极差显著性的尺度值。平均数间极差显著性的尺度值。本讲稿第二十九页,共七十五页表表5.5 表表5.2资料资料LSR值的计算值的计算(新复极差测验新复极差测验)本讲稿第三十页,共七十五页结论:表结论:表5.2资料的资料的4个处理的苗高,除处理个处理的苗高,除处理A与与C差异不显著外,其余处理间均达显著差异不显著外,其余处理间均达显著差异,本例结果与上面介绍的差异,本
15、例结果与上面介绍的q测验法相同,测验法相同,但但q法的法的 要比新复极差法的要比新复极差法的 大。大。本讲稿第三十一页,共七十五页四、多重比较结果的表示方法四、多重比较结果的表示方法(一一)列梯形表法列梯形表法 本讲稿第三十二页,共七十五页(二二)划线法划线法 0.01水平下平均数差异显著性结果水平下平均数差异显著性结果(q法法)本讲稿第三十三页,共七十五页(三三)标记字母法标记字母法 首先将全部平均数从大到小依次排列。首先将全部平均数从大到小依次排列。然后在最大的平均数上标上字母然后在最大的平均数上标上字母a;并将该平均数与以下各平均数相比,凡相差不显著的,都标上字母并将该平均数与以下各平均
16、数相比,凡相差不显著的,都标上字母a,直至某一个与之相差显著的平均数则标以字母直至某一个与之相差显著的平均数则标以字母b(向下过程向下过程),再以该标有再以该标有b的平均数为标准,与上方各个比它大的平均数比,的平均数为标准,与上方各个比它大的平均数比,凡不显著的也一律标以字母凡不显著的也一律标以字母b(向上过程向上过程);再以该标有再以该标有b的最大平均数为标准,与以下各未标记的平均数比,凡的最大平均数为标准,与以下各未标记的平均数比,凡不显著的继续标以字母不显著的继续标以字母b,直至某一个与之相差显著的平均数则标以字母,直至某一个与之相差显著的平均数则标以字母c。如此如此重复进行下去,直至最
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五章 方差分析精选文档 第五 方差分析 精选 文档
限制150内