第三讲方差分析精选PPT.ppt
《第三讲方差分析精选PPT.ppt》由会员分享,可在线阅读,更多相关《第三讲方差分析精选PPT.ppt(56页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三讲方差分析第1页,本讲稿共56页方方方方差差差差分分分分析析析析应应应应用用用用范范范范围围围围很很很很广广广广,在在在在推推推推断断断断统统统统计计计计方方方方法法法法中中中中常常常常用用用用来来来来解解解解决决决决单单单单因因因因素素素素或或或或多多多多因因因因素素素素中中中中每每每每个个个个因因因因素素素素多多多多个个个个水水水水平平平平(处处处处理理理理)均均均均数数数数间间间间的的的的比比比比较较较较(包包包包括括括括均均均均数数数数间间间间的的的的多多多多重重重重比比比比较较较较,即即即即两两两两两两两两比比比比较较较较)和和和和多多多多因因因因素素素素间间间间交交交交互互互互
2、作用的分析。作用的分析。作用的分析。作用的分析。将将将将k k个处理的观测值作为一个整体看待,把观测值总变异的个处理的观测值作为一个整体看待,把观测值总变异的个处理的观测值作为一个整体看待,把观测值总变异的个处理的观测值作为一个整体看待,把观测值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自平方和及自由度分解为相应于不同变异来源的平方和及自平方和及自由度分解为相应于不同变异来源的平方和及自平方和及自由度分解为相应于不同变异来源的平方和及自由度,进而获得不同变异来源总体方差估计值;通过计算由度,进而获得不同变异来源总体方差估计值;通过计算由度,进而获得不同变异来源总体方差估计值;通过
3、计算由度,进而获得不同变异来源总体方差估计值;通过计算这些总体方差的估计值的适当比值,就能检验各样本所属这些总体方差的估计值的适当比值,就能检验各样本所属这些总体方差的估计值的适当比值,就能检验各样本所属这些总体方差的估计值的适当比值,就能检验各样本所属总体平均数是否相等。总体平均数是否相等。总体平均数是否相等。总体平均数是否相等。第2页,本讲稿共56页几个常用术语几个常用术语:1、试验指标试验指标(experimentalindex)为衡量试验结果的好坏或处理效应的高低为衡量试验结果的好坏或处理效应的高低,在试验中具体,在试验中具体测定的性状或观测的项目称为试验指标。由于试验目的不同测定的性
4、状或观测的项目称为试验指标。由于试验目的不同,选择的试验指标也不相同。在畜禽,选择的试验指标也不相同。在畜禽、水产试验中常用的、水产试验中常用的试验指标有试验指标有:日增重:日增重、产仔数、产仔数、产奶量、产奶量、产蛋率、瘦肉率、产蛋率、瘦肉率、某些生理生化和体型指标某些生理生化和体型指标(如血糖含量、体高、体重如血糖含量、体高、体重)等。等。第3页,本讲稿共56页2、试验因素试验因素(experimentalfactor)试验中所研究的影响试验指标的因素叫试验因素。如研究试验中所研究的影响试验指标的因素叫试验因素。如研究如何提高猪的日增重时,饲料的配方、猪的品种、饲养方式、如何提高猪的日增重
5、时,饲料的配方、猪的品种、饲养方式、环境温湿度等都对日增重有影响,均可作为试验因素来考虑。环境温湿度等都对日增重有影响,均可作为试验因素来考虑。当试验中考察的因素只有一个时,称为当试验中考察的因素只有一个时,称为单因素试验单因素试验;若同时研究两个或两个以上的因素对试验指标的影响时,若同时研究两个或两个以上的因素对试验指标的影响时,则称为则称为两因素或多因素试验两因素或多因素试验。试验因素常用大写字母。试验因素常用大写字母A、B、C、等表示。等表示。第4页,本讲稿共56页3、因素水平因素水平(leveloffactor)试验因素所处的某种特定状态或数量等级称为试验因素所处的某种特定状态或数量等
6、级称为因素水平因素水平,简称简称水平水平。如比较如比较3个品种奶牛产奶量的高低,这个品种奶牛产奶量的高低,这3个品种就是奶牛个品种就是奶牛品种这个试验因素的品种这个试验因素的3个水平;个水平;研究某种饲料中研究某种饲料中4种不同能量水平对肥育猪瘦肉率的影响,种不同能量水平对肥育猪瘦肉率的影响,这这4种特定的能量水平就是饲料能量这一试验因素的种特定的能量水平就是饲料能量这一试验因素的4个水平。个水平。第5页,本讲稿共56页因素水平用代表该因素的字母加添角标因素水平用代表该因素的字母加添角标1,2,来表来表示。如示。如A1、A2、,B1、B2、,等。,等。4、试验处理试验处理(treatment)
7、事先设计好的实施在试验单位上的具体项目叫事先设计好的实施在试验单位上的具体项目叫试验处试验处理理,简称,简称处理处理。在单因素试验中,实施在试验单位上的具体项目就是试验在单因素试验中,实施在试验单位上的具体项目就是试验因素的某一水平。例如进行饲料的比较试验时,实施在试验单因素的某一水平。例如进行饲料的比较试验时,实施在试验单位位(某种畜禽某种畜禽)上的具体项目就是喂饲某一种饲料。所以上的具体项目就是喂饲某一种饲料。所以进行单进行单因素试验时,试验因素的一个水平就是一个处理因素试验时,试验因素的一个水平就是一个处理。第6页,本讲稿共56页在多因素试验中,实施在试验单位上的具体项目是各在多因素试验
8、中,实施在试验单位上的具体项目是各因素的某一水平组合。例如进行因素的某一水平组合。例如进行3种饲料和种饲料和3个品种对猪日个品种对猪日增重影响的两因素试验,整个试验共有增重影响的两因素试验,整个试验共有33=9个水平组合,个水平组合,实施在试验单位实施在试验单位(试验猪试验猪)上的具体项目就是某品种与某种上的具体项目就是某品种与某种饲料的结合。所以,饲料的结合。所以,在多因素试验时,试验因素的一个水在多因素试验时,试验因素的一个水平组合就是一个处理平组合就是一个处理。第7页,本讲稿共56页5、试验单位试验单位(experimentalunit)在试验中能接受不同试验处理的独立的试验载体叫试验单
9、在试验中能接受不同试验处理的独立的试验载体叫试验单位。位。在畜禽、水产试验中,在畜禽、水产试验中,一只家禽、一只家禽、一头家畜、一只小一头家畜、一只小白鼠、一尾鱼,即一个动物;或几只家禽、几头家畜、几白鼠、一尾鱼,即一个动物;或几只家禽、几头家畜、几只小白鼠、几尾鱼,即一组动物都可作为试验单位。只小白鼠、几尾鱼,即一组动物都可作为试验单位。试验单位往往也是观测数据的单位。试验单位往往也是观测数据的单位。第8页,本讲稿共56页6、重复重复(repetition)在试验中,将在试验中,将一个处理一个处理实施在两个或两个以实施在两个或两个以上的试验单位上,称为处理有重复;一处理实施上的试验单位上,称
10、为处理有重复;一处理实施的试验单位数称为处理的重复数。的试验单位数称为处理的重复数。例如,用某种饲料喂例如,用某种饲料喂4头猪,就说这个处理头猪,就说这个处理(饲料饲料)有有4次重复。次重复。第9页,本讲稿共56页6.1 6.1 完全随机设计的单因素方差分析完全随机设计的单因素方差分析completely randomized designcompletely randomized design完全随机设计完全随机设计:成组设计的扩大:成组设计的扩大 只能分析一个因素,故称只能分析一个因素,故称“单因素方差分析单因素方差分析”变异和自由度的分解变异和自由度的分解 总变异总变异:各观察值之间的变
11、异,包括处理因素:各观察值之间的变异,包括处理因素的作用和随机误差(个体差异)。的作用和随机误差(个体差异)。第10页,本讲稿共56页 完全随机设计时,可以将总变异分解成组间完全随机设计时,可以将总变异分解成组间变异和组内变异两部分。变异和组内变异两部分。组间变异组间变异:处理组之间的变异,包括处理因素:处理组之间的变异,包括处理因素的作用和随机变异。的作用和随机变异。第11页,本讲稿共56页 组内变异组内变异:各处理组内不同观察值之间的变异,:各处理组内不同观察值之间的变异,反映随机变异。反映随机变异。相应地,自由度也分解成组间自由度和组内自相应地,自由度也分解成组间自由度和组内自由度:由度
12、:第12页,本讲稿共56页 显然,显然,组间变异和组内变异的大小都与自由度有关,组间变异和组内变异的大小都与自由度有关,为了可以比较,我们分别计算为了可以比较,我们分别计算组间和组内均方组间和组内均方第13页,本讲稿共56页方差分析:方差分析:如果处理因素没有作用,如果处理因素没有作用,组间均方组间均方和和组内均方组内均方应应该相等。即使由于抽样误差的存在,两者也不应相该相等。即使由于抽样误差的存在,两者也不应相差太大。建立统计量差太大。建立统计量F F 检验时,检验时,第14页,本讲稿共56页例例6.1三种配合饲料对肉鸡增重效果的对比试验,增重数值为三种配合饲料对肉鸡增重效果的对比试验,增重
13、数值为(60天天体体重重-1000g)如如下下表表,试试检检验验三三种种配配合合饲饲料料的的增增重重效效果果间是否存在差异。间是否存在差异。该试验统计设计是将受试肉鸡该试验统计设计是将受试肉鸡30只随机等分为三组,每组随机分配一只随机等分为三组,每组随机分配一种饲料配方,形成试验方案,故称之为完全随机设计,也称该试验是单因种饲料配方,形成试验方案,故称之为完全随机设计,也称该试验是单因素素饲料配方、三个水平处理饲料配方、三个水平处理A1A2A3、等重复、等重复每个饲料重复每个饲料重复饲喂饲喂10只肉鸡的试验。完全随机设计中,各组也可以采用不等分的只肉鸡的试验。完全随机设计中,各组也可以采用不等
14、分的方式,但从统计设计角度要求,应尽可能采用各组等分的设计为好。方式,但从统计设计角度要求,应尽可能采用各组等分的设计为好。A1(鱼粉为主鱼粉为主)7358713766265349655154.9A2(槐叶、苜蓿粉加鱼粉槐叶、苜蓿粉加鱼粉)1658384220454461344940.7A3(槐叶、苜蓿粉加药剂槐叶、苜蓿粉加药剂)846910678759079941119287.8第15页,本讲稿共56页对该资料做单因素方差分析的前提是:各组数据均服从正态分布,对该资料做单因素方差分析的前提是:各组数据均服从正态分布,且各组数据的方差具有齐性(总体且各组数据的方差具有齐性(总体21=22=2k
15、)。)。首先做正态性检验和方差齐性检验(具体方法从略,本例直接由首先做正态性检验和方差齐性检验(具体方法从略,本例直接由SPSS统计软件给出结果):统计软件给出结果):三三组组经经单单样样本本K-S检检验验,P值值分分别别为为:P=0.979,P=0.993,P=0.987,P值值均均大大于于0.05,即均符合正态分布。,即均符合正态分布。方差齐性检验,采用方差齐性检验,采用LevenesTest法,统计量法,统计量F=0.034,P=0.967P0.05,三组方差具有齐性。,三组方差具有齐性。再做方差分析:再做方差分析:检验假设为检验假设为H0:1=2=k。本例本例H:1=2=3即三种饲料配
16、方增重效果相同。即三种饲料配方增重效果相同。检验原理是,检验原理是,从分析数据的变异原因入手,找出引起数据变异的主从分析数据的变异原因入手,找出引起数据变异的主要原因,进而做出是否拒绝假设要原因,进而做出是否拒绝假设H H0 0的结论的结论。引起数据变异的原因是:。引起数据变异的原因是:1.1.肯定有客观存在的随机误差的影响;肯定有客观存在的随机误差的影响;2.2.可能由饲料配方的不同引可能由饲料配方的不同引起。起。如果主要原因是后者,则拒绝如果主要原因是后者,则拒绝H H0 0;如果主要原因是前者,则不能拒如果主要原因是前者,则不能拒绝绝H H0 0。第16页,本讲稿共56页具体方法:具体方
17、法:分别计算代表不同变异原因分别计算代表不同变异原因的平方和、自由度、的平方和、自由度、方差(亦称样本均方差(亦称样本均方)方)及及F统计量统计量,公式如下表:,公式如下表:变异原因变异原因平方和平方和SS自由度自由度df均方均方MSF统计量统计量总的总的SST=(xij-)2/(N-1)N-1组间组间SS组间组间=ni(xi-)2/(k-1)k-1MS组间组间=SS组间组间/(k-1)F=MS组间组间/MS误差误差组内组内SS误差误差=(xij-)/(N-k)N-kMS误差误差=SS误差误差/(N-k)=SST-SS组间组间(误差)(误差)其中,其中,ni为第为第I个样本的容量,个样本的容量
18、,N为样本数据总个数,为样本数据总个数,k为比较的组数,为比较的组数,为第为第I个样本均数,个样本均数,为为N个数据的均数。个数据的均数。F F 统计量统计量的意义是,代表组间(不同饲料配方间)变异的方差,与代表客观的意义是,代表组间(不同饲料配方间)变异的方差,与代表客观存在的组内(随机误差)变异的方差的比值。比值越大,就越有理由拒绝存在的组内(随机误差)变异的方差的比值。比值越大,就越有理由拒绝H H0 0。_第17页,本讲稿共56页本例计算结果如表:本例计算结果如表:界值界值F0.05,(2,27)=3.35,F0.01,(2,27)=5.49,因,因FF0.01,(2,27),P0.0
19、1(SPSS软件给出软件给出P0.001),即三种饲料配方增重效果间存在差异(不),即三种饲料配方增重效果间存在差异(不都相同)。都相同)。变异原因变异原因SSdfMSF总总的的17243.46729饲料间饲料间11674.86725837.43328.303误误差差5568.60027206.244第18页,本讲稿共56页二、均数间的两两比较二、均数间的两两比较当方差分析当方差分析F检验不能拒绝检验不能拒绝H0时,一般情况下分析结束;当方差分时,一般情况下分析结束;当方差分析析F检验拒绝检验拒绝H0时,通常都进一步做均数间的两两比较(亦称多重比时,通常都进一步做均数间的两两比较(亦称多重比较
20、)。两两比较方法有许多种,下面介绍常用的三种方法。较)。两两比较方法有许多种,下面介绍常用的三种方法。(一)(一)LSD法(最小显著差数法法(最小显著差数法leastsignificantdifference)计算计算及其标准误差及其标准误差Sij=MS误差误差(1/ni+1/nj)其中,其中,ni,nj为为的样本容量,的样本容量,1ijk。可以证明当可以证明当来自同一总体(即来自同一总体(即i=j)时,)时,t=()/Sijt(df误差误差)分布)分布与与t检验相仿,可做出结论。检验相仿,可做出结论。第19页,本讲稿共56页上例上例6.1经经LSD法做均数间的两两比较,由法做均数间的两两比较
21、,由SPSS软件给出检验结软件给出检验结果为:果为:1与与 2有差别,有差别,P=0.036 1与与 3有差别,有差别,P0.001 2与与 3有差别,有差别,P0.001应注意的是,应注意的是,LSD法与法与t检验的差别在于,检验的差别在于,MS误差误差、df误差误差是方差分是方差分析中综合全体数据计算的统计量,而析中综合全体数据计算的统计量,而t检验中检验中t统计量的分母统计量的分母S,仅是第仅是第i、j两个样本计算的统计量。下面介绍的两个样本计算的统计量。下面介绍的SNK法、法、Dunnett法以法以及其它两两比较方法中,误差的估计均采用方差分析中的及其它两两比较方法中,误差的估计均采用
22、方差分析中的MS误差误差。因。因此,两两比较中误差估计要比此,两两比较中误差估计要比t检验准确和精确。检验准确和精确。第20页,本讲稿共56页(二)(二)SNK法(法(q检验法)检验法)计算计算及其标准误差及其标准误差Sij=MS误差误差/n(各均数样本容量相等为(各均数样本容量相等为n)或或Sij=MS误差误差(N-n2i/N)/(k-1)其中,其中,1Ijk。可以证明当可以证明当来自同一总体(即来自同一总体(即i=j)时,)时,q=()/Sijq(df误差误差,a)分布)分布其中,其中,a是是k个均数按大小排队后,个均数按大小排队后,两个及其中间所夹的均数的两个及其中间所夹的均数的总个数。
23、总个数。当当q0.05,不能认为不能认为i与与j间有差异;间有差异;当当qq(df误差,误差,a),0.05时,时,P0.05,认为,认为i、j间有差异。间有差异。上例上例6.1经经SNK法检验,由法检验,由SPSS软件给出结果为:软件给出结果为:每两组间均存在差异,每两组间均存在差异,P0.05;3与与 1有差别,有差别,P=0.0000.05,三组方差具有齐性。,三组方差具有齐性。方差分析,方差分析,F=28.303,P0.001,即三种饲料配方增重效,即三种饲料配方增重效果不都相同。果不都相同。两两比较两两比较SNK法,每两组间均存在差异,法,每两组间均存在差异,P0.05。有关可信区间
24、从略。有关可信区间从略。上述关于完全随机设计单因素方差分析的基本原理及方法,上述关于完全随机设计单因素方差分析的基本原理及方法,可推广至其它方差分析方法,除有特殊区别之处外,不再赘述。可推广至其它方差分析方法,除有特殊区别之处外,不再赘述。第23页,本讲稿共56页该试验统计设计是该试验统计设计是配对试验设计配对试验设计的推的推广,选定三个区组,要求每个区组内,土广,选定三个区组,要求每个区组内,土壤条件尽可能一致,并分成壤条件尽可能一致,并分成8块,随机分块,随机分配种植配种植8个品种的小麦,使得在每个区组个品种的小麦,使得在每个区组上,上,8个品种间均具有良好的可比性。而个品种间均具有良好的
25、可比性。而区组的数目即为每个品种重复试验的次数,区组的数目即为每个品种重复试验的次数,本例重复数为本例重复数为3。6.2随机区组设计方差分析随机区组设计方差分析randomizedblockdesign例例6.28个小麦品种对比试验,在个小麦品种对比试验,在3个地块上进行,记录规定面个地块上进行,记录规定面积产量(积产量(kg)数据如下表,试检验)数据如下表,试检验8个品种产量间有无差异。个品种产量间有无差异。A110.911.312.2A210.812.314.0A311.112.510.5A49.110.711.1A511.813.914.8A610.110.611.8A710.011.5
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三 方差分析 精选 PPT
限制150内