方差分析的基本原理精选PPT.ppt
《方差分析的基本原理精选PPT.ppt》由会员分享,可在线阅读,更多相关《方差分析的基本原理精选PPT.ppt(119页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于方差分析的基本原理第1页,讲稿共119张,创作于星期二1、u或或t 检验过程烦琐检验过程烦琐 例如,一试验包含例如,一试验包含5个处理,采用个处理,采用t检验法要检验法要进行进行 =10次两两平均数的差异显著性检验;次两两平均数的差异显著性检验;若有若有k个处理,则要作个处理,则要作 =k(k-1)/2 次类似的次类似的检验。检验。第2页,讲稿共119张,创作于星期二2、无统一的试验误差,误差估计的准确性、无统一的试验误差,误差估计的准确性和检验的灵敏性低和检验的灵敏性低(1)(1)t 检验要进行两两比较,每次仅用检验要进行两两比较,每次仅用2 2个样本信息估个样本信息估计总体方差,误差估
2、计的计总体方差,误差估计的准确性低准确性低(2)k个处理平均值的自由度为个处理平均值的自由度为k(n-1),而,而t 检验查检验查t值值的自由度为的自由度为2(n-1),从而,从而降低了检验的灵敏性降低了检验的灵敏性两两比较合并均方两两比较合并均方:k 个样本合并均方个样本合并均方:第3页,讲稿共119张,创作于星期二3、t检验增大犯检验增大犯错误的概率错误的概率 t 检验时对具有不同秩次的平均数采用同一个检验时对具有不同秩次的平均数采用同一个t,会增大犯会增大犯 错误的概率,降低推断的可靠性。错误的概率,降低推断的可靠性。2个平均数比较:个平均数比较:=0.055个平均数比较:个平均数比较:
3、=1-(1-0.05)10=0.401310个平均数比较:个平均数比较:”=1-(1-0.05)45=0.9006第4页,讲稿共119张,创作于星期二因此,多个平均数的差异显著性检验不宜用因此,多个平均数的差异显著性检验不宜用t(或或u)检验,须采用检验,须采用方差分析法方差分析法。方差分析方差分析(analysis of variance)由英国统计学家由英国统计学家R.A.Fisher于于1923年提出的。年提出的。将多个样本将多个样本(处理处理)的观测值作为一个总体,用的观测值作为一个总体,用方差来表示变异,把引起事件总的变异分解为各种因方差来表示变异,把引起事件总的变异分解为各种因素的
4、变异,并对每个因素引起的变异作数量估计,从素的变异,并对每个因素引起的变异作数量估计,从而说明各因素的变异幅度及其在总变异中的重要程度;而说明各因素的变异幅度及其在总变异中的重要程度;并用剩余变异无偏估计随机误差,进而比较处理均值并用剩余变异无偏估计随机误差,进而比较处理均值间的差异。间的差异。第5页,讲稿共119张,创作于星期二有关术语:1、试验指标(experimental index)为衡量试验结果的好坏或处理效应的高低,在试验中具体测定的性状或观测的项目称为试验指标。由于试验目的不同,选择的试验指标也不相同。在畜禽、水产试验中常用的试验指标有:日增重、产仔数、产奶量、产蛋率、瘦肉率、某
5、些生理生化和体型指标(如血糖含量、体高、体重)等。2、试验因素(experimental factor)试验中所研究的影响试验指标的因素叫试验因素。如研究如何提高猪的日增重时,饲料的配方、猪的品种、饲养方式、环境温湿度等都对日增重有影响,均可作为试验因素来考虑。当试验中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上的因素对试验指标的影响时,则称为两因素或多因素试验。试验因素常用大写字母A、B、C、等表示。第6页,讲稿共119张,创作于星期二3、因素水平(level of factor)试验因素所处的某种特定状态或数量等级称为因素水平,简称水平。研究某种饲料中4种不同能量水平对肥
6、育牛瘦肉率的影响,这4种特定的能量水平就是饲料能量这一试验因素的4个水平。因素水平用代表该因素的字母加添足标1,2,来表示。如A1、A2、,B1、B2、,等。4、试验处理(treatment)事先设计好的实施在试验单位上的具体项目叫试验处理,简称处理。在单因素试验中,实施在试验单位上的具体项目就是试验因素的某一水平。例如进行饲料的比较试验时,实施在试验单位(某种畜禽)上的具体项目就是喂饲某一种饲料。所以进行单因素试验时,试验因素的一个水平就是一个处理。在多因素试验中,实施在试验单位上的具体项目是各因素的某一水平组合。例如进行3种饲料和3个品种对猪日增重影响的两因素试验,整个试验共有33=9个水
7、平组合,在多因素试验时,试验因素的一个水平组合就是一个处理。第7页,讲稿共119张,创作于星期二5、试验单位(experimental unit)在试验中能接受不同试验处理的独立的试验载体叫试验单位。在畜禽、水产试验中,一只家禽、一头家畜、一只小白鼠、一尾鱼,即一个动物;或几只家禽、几头家畜、几只小白鼠、几尾鱼,即一组动物都可作为试验单位。试验单位往往也是观测数据的单位。6、重复(repetition)在试验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;一处理实施的试验单位数称为处理的重复数。例如,用某种饲料喂4头猪,就说这个处理(饲料)有4次重复。第8页,讲稿共119张,创
8、作于星期二二、方差分析的基本原理二、方差分析的基本原理1、线性模型与基本假定线性模型与基本假定假设某单因素试验有假设某单因素试验有k个处理,每个处理有个处理,每个处理有n次重次重复,共有复,共有nk个观测值。这类试验资料的数据模式如个观测值。这类试验资料的数据模式如表表7.1所示。所示。第9页,讲稿共119张,创作于星期二表表7.1 k个处理每处理有个处理每处理有n个观测值的数据模式个观测值的数据模式x1.x2.xi.xk.x注:注:xij指第指第i个处理第个处理第j个观察值(个观察值(i=1k;j=1n)第10页,讲稿共119张,创作于星期二xij 可以分解为可以分解为:其中其中:表示全试验
9、观测值总体的平均数;表示全试验观测值总体的平均数;i 是是 第第 i 个个 处理的效应处理的效应(treatment effects)表示处理)表示处理i对试验对试验结果产生的影响。结果产生的影响。显然有显然有ij 是试验误差,相互独立,且服从是试验误差,相互独立,且服从 正态分布正态分布N(0,2)。)。(7-1)式叫做)式叫做 单因素试验的单因素试验的线性模型线性模型,亦称,亦称数学模型数学模型。在这个模型中在这个模型中xij表示为总平均数表示为总平均数、处理效应、处理效应 i、试验误、试验误差差ij之和。之和。(7-1)(7-2)第11页,讲稿共119张,创作于星期二 由由ij 相相 互
10、独立且服从正态分布互独立且服从正态分布 N(0,2),可),可知各处理知各处理i(i=1,2,k)所属总体亦应具正态性,所属总体亦应具正态性,即服从正态分布即服从正态分布N(i,2)。尽管各总体的均数。尽管各总体的均数 i 可可以不等或相等,以不等或相等,2则必须是相等的。所以,单因则必须是相等的。所以,单因素试验的数学模型可归纳为:素试验的数学模型可归纳为:效应的可加性效应的可加性(additivity)、分布的正态性分布的正态性(normality)、方差的同质性方差的同质性(homogeneity)。这也。这也是进行其它类型方差分析的前提或基本假定。是进行其它类型方差分析的前提或基本假定
11、。第12页,讲稿共119张,创作于星期二若将表若将表7.1中的观测值中的观测值 xij(i=1,2,k;j=1,2,n)的数)的数据结构(模型)用样本符号来表示,则据结构(模型)用样本符号来表示,则(7-3)第13页,讲稿共119张,创作于星期二 (7-1)、()、(7-3)两式告诉我们:)两式告诉我们:每每 个个 观观 测测 值值 都包含处理效应都包含处理效应(i 或或 ),与误差与误差(ij 或或 ),故,故kn个观测值的总变异个观测值的总变异可分解为可分解为处理处理间间的变异的变异和和处理处理内内的变异的变异两部分。两部分。第14页,讲稿共119张,创作于星期二药剂药剂 A(xA(x1
12、1)B(xB(x2 2)C(xC(x3 3)D(xD(x4 4)19 19212120202222 23 23242418182525 21 21272719192727 13 13202015152222总和总和T Ti.76 76929272729696平均平均 19 19232318182424观察值观察值【例7.1】-2 2 -3 3 第15页,讲稿共119张,创作于星期二药剂药剂A(xA(x1 1)B(xB(x2 2)C(xC(x3 3)D(xD(x4 4)1919212120202222232324241818252521212727191927271313202015152222
13、总和总和T Ti.7676929272729696平均平均1919232318182424观察值观察值第16页,讲稿共119张,创作于星期二2、自由度与平方和的剖分自由度与平方和的剖分 在方差分析中是用样本方差即在方差分析中是用样本方差即均方均方(MS)来度量资料)来度量资料的变异程度的。的变异程度的。表表7.1中全部观测值的总变异可以用总均方来度量。中全部观测值的总变异可以用总均方来度量。将总变异分解为处理间变异和处理内变异,就是要将总变异分解为处理间变异和处理内变异,就是要将将 总总 均方均方 分解为处理间均方和处理内均方。但这种分分解为处理间均方和处理内均方。但这种分解是通过将总均方的分
14、子解是通过将总均方的分子称为总离均差平方和,简称为总离均差平方和,简称为总平方和,剖分成处理间平方和与处理内平方和两称为总平方和,剖分成处理间平方和与处理内平方和两部分;将总均方的分母部分;将总均方的分母称为总自由度,剖分成处理称为总自由度,剖分成处理间自由度与处理内自由度两部分来实现的。间自由度与处理内自由度两部分来实现的。第17页,讲稿共119张,创作于星期二(1)平方和的剖分平方和的剖分 在表在表7.1中,反映中,反映 全部观测值总变异的总平方和全部观测值总变异的总平方和是各观测值是各观测值xij与总平均数的离均差平方和,记为与总平均数的离均差平方和,记为SST。即即(7-4)第18页,
15、讲稿共119张,创作于星期二因为因为第19页,讲稿共119张,创作于星期二其中其中所以所以(7-5)(7-5)式中,)式中,为各处理平均数与总平均数为各处理平均数与总平均数的离均差平方和与重复数的离均差平方和与重复数n的乘积的乘积,反映了重复,反映了重复 n 次的处理间变异次的处理间变异,称为处理间平方和,记为,称为处理间平方和,记为SSt,即即:(7-6)第20页,讲稿共119张,创作于星期二(7-5)式中,式中,为各处为各处 理内离均差平方和之理内离均差平方和之和,反映了各处理内的变异即误差,称为处理内平和,反映了各处理内的变异即误差,称为处理内平方和或误差平方和,记为方和或误差平方和,记
16、为SSe,即,即:(7-7)第21页,讲稿共119张,创作于星期二于是有于是有 SST=SSt+SSe (7-8)这个关系式中三种平方和的简便计算公式如下:这个关系式中三种平方和的简便计算公式如下:其中,其中,C=T2/(kn)称为矫正数。称为矫正数。(7-9)CTnSSikit-=S=2.11CxSSijnjkiT-=SS=211第22页,讲稿共119张,创作于星期二(2)自由度的剖分自由度的剖分 在计算总平方和时,资料中的各个观测值要受在计算总平方和时,资料中的各个观测值要受 这一条件的约束,故总自由度等于资料中观测值的这一条件的约束,故总自由度等于资料中观测值的总个数减总个数减1,即,即
17、kn-1。总自由度记为总自由度记为dfT,即,即:dfT=kn 1 (7-10)第23页,讲稿共119张,创作于星期二在计算处理间平方和时,各处理均数要受在计算处理间平方和时,各处理均数要受这一条件的约束,故处理间自由度为处这一条件的约束,故处理间自由度为处理数减理数减1,即,即k-1。处理间自由度记为处理间自由度记为dft,即:,即:dft=k-1 (7-11)在计算处理内平方和时,要受在计算处理内平方和时,要受k个条件的约束,即个条件的约束,即,(i=1k)。故处理内自由度为资料中观测。故处理内自由度为资料中观测值的总个数减值的总个数减k,即,即kn-k。处理内自由度记为。处理内自由度记为
18、dfe,即:,即:dfe=kn k=k(n-1)(7-12)第24页,讲稿共119张,创作于星期二因为因为所以所以 综合以上各式得:综合以上各式得:(7-13)(7-14)第25页,讲稿共119张,创作于星期二即:即:总均方一般不等于处理间均方加处理内均方。总均方一般不等于处理间均方加处理内均方。各部分平方和除以各自的自由度便得到总均各部分平方和除以各自的自由度便得到总均方、处理间均方和处理内均方,方、处理间均方和处理内均方,分别记为分别记为 MST(或(或 )、)、MSt(或(或 )和)和MSe(或(或 )。)。(7-15)(3)均方的计算均方的计算 第26页,讲稿共119张,创作于星期二计
19、算均方后,通过比较处理间均方相对误差均方计算均方后,通过比较处理间均方相对误差均方的大小即可判断处理效应所引起的变异所占比重,的大小即可判断处理效应所引起的变异所占比重,从而可以判断试验是否存在明显处理效应。从而可以判断试验是否存在明显处理效应。第27页,讲稿共119张,创作于星期二三、三、方差分析中的方差分析中的F 测验测验方差分析的方差分析的F 检验用于测验某项变异因素的效应检验用于测验某项变异因素的效应是否真实存在是否真实存在将要测验的那一项变异因素的均方作分子,另一项将要测验的那一项变异因素的均方作分子,另一项变异因素(例如变异因素(例如误差项误差项)的均方作分母()的均方作分母(具体
20、情具体情况与所用试验设计和模型有关况与所用试验设计和模型有关)如果如果F0.05,应,应该接受该接受H0第28页,讲稿共119张,创作于星期二F测验需具备的条件:测验需具备的条件:(1)被抽样总体的变数)被抽样总体的变数x服从正态分布,即服从正态分布,即xN(,2 2)(2)和和 彼此相互独立。彼此相互独立。注:当试验资料不符合这些条件时,需要作适注:当试验资料不符合这些条件时,需要作适当转换。当转换。第29页,讲稿共119张,创作于星期二第二节 方差分析的一般步骤一、一、平方和平方和与与自由度自由度的的分解分解二、二、列列出出方差分析表方差分析表,作,作F测验测验三、若三、若F检验显著,则进
21、行检验显著,则进行多重比较多重比较四、四、结果结果的的解释解释/说明说明第30页,讲稿共119张,创作于星期二【例例】以A(CK)、B、C、D共4种药剂处理水稻种子,测得苗高结果如下表:第31页,讲稿共119张,创作于星期二一、一、平方和平方和与与自由度自由度的的分解分解1、平方和的计算方法一:方法一:方法二:方法二:,C=T2/(kn)CTnSSikit-=S=2.11CxSSijnjkiT-=SS=211第32页,讲稿共119张,创作于星期二方法二:C=T2/(kn)=3362/(44)=7056CxSSijnjkiT-=SS=211CTnSSikit-=S=2.11=(182+212+3
22、22)C=602=(722+922+562+1162)/4C=504SSe=SST SSt=602504=98第33页,讲稿共119张,创作于星期二2、自由度的分解tTedfdfdf-=-=tkdf1Tkndf-=1=441=15=41=3=153=12第34页,讲稿共119张,创作于星期二二、二、列列出出方差分析表方差分析表,作,作F测验测验表表7.5 药剂处理后水稻苗高的方差分析表药剂处理后水稻苗高的方差分析表MS168.008.17F20.56显著F值F0.05=3.49F0.01=5.95*第35页,讲稿共119张,创作于星期二三、若三、若F检验显著,则进行检验显著,则进行多重比较多重
23、比较1、最小显著差数最小显著差数法(法(LSD法法)到底哪些处理间存在真实差异?如何判断?到底哪些处理间存在真实差异?如何判断?多重比较多重比较第36页,讲稿共119张,创作于星期二将这一判断标准记作:将这一判断标准记作:第37页,讲稿共119张,创作于星期二LSD0.05=2.1792.02=4.40(cm)LSD0.01=3.0552.02=6.17(cm)第38页,讲稿共119张,创作于星期二2、最小显著极差最小显著极差法(法(LSR法)法)Least Significant Ranges根据根据极差极差抽样分布原理,将一组抽样分布原理,将一组k个平均数个平均数由大到小排列后,依所比较的
24、两个处理平均数的由大到小排列后,依所比较的两个处理平均数的差数是几个平均数间的极差分别确定最小显著极差数是几个平均数间的极差分别确定最小显著极差差LSR值的多重比较方法。值的多重比较方法。用于比较任意两个处理间的平均数的差异显著性,两平用于比较任意两个处理间的平均数的差异显著性,两平均数的差数的绝对值大于或等于均数的差数的绝对值大于或等于LSR则差异显著差异显著与与LSD法相比,不同处理间的差数进行比较时需要根据差法相比,不同处理间的差数进行比较时需要根据差数所包含的平均数个数数所包含的平均数个数(m)不同确定不同的比较标准不同确定不同的比较标准第39页,讲稿共119张,创作于星期二LSR法根
25、据其比较标准此方法包括两种:法根据其比较标准此方法包括两种:复极差法复极差法(q法)法)新复极差法新复极差法(SSR法,法,shortest significant ranges)*这里的q、SSR由、df、m三因素确定。*SE指标准误,随检验的对象不同(平均数或总指标准误,随检验的对象不同(平均数或总和数)而不同。和数)而不同。第40页,讲稿共119张,创作于星期二第41页,讲稿共119张,创作于星期二 计算计算SE(比较四种药剂处理的平均数)(比较四种药剂处理的平均数)据据ve=12查附表查附表6得得SSR,计算,计算LSR,并列表并列表第42页,讲稿共119张,创作于星期二 按从大到小的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 方差分析 基本原理 精选 PPT
限制150内