《生物统计第8章 两因素及多因素方差分析.ppt》由会员分享,可在线阅读,更多相关《生物统计第8章 两因素及多因素方差分析.ppt(45页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、8.1 8.1 多因素的试验设计多因素的试验设计8.2 8.2 两因素方差分析中的一些基本概念两因素方差分析中的一些基本概念8.3 8.3 固定模型固定模型8.4 8.4 随机模型随机模型8.5 8.5 混合模型混合模型8.6 8.6 两个以上因素的方差分析两个以上因素的方差分析8.7 8.7 缺失数据的估计缺失数据的估计8.8 8.8 变换变换第八章第八章 两因素及多因素方差分析两因素及多因素方差分析2023/2/14 实际工作中经常会遇到两个或两个以上实际工作中经常会遇到两个或两个以上因素共同影响实验结果的情况。这样的实验因素共同影响实验结果的情况。这样的实验设计称为设计称为交叉分组设计交
2、叉分组设计(cross over cross over designdesign)。)。对于两因素交叉分组设计的实验对于两因素交叉分组设计的实验应采用应采用两因素方差分析两因素方差分析(two factors two factors analysis of varianceanalysis of variance)或者称为或者称为两种方式两种方式分组的方差分析分组的方差分析(two way classification two way classification analysis of varianceanalysis of variance)方法分析实验结果。方法分析实验结果。第八章第八章
3、 两因素及多因素方差分析两因素及多因素方差分析2023/2/14 因素可以分为固定因素和随机因素。两因素实因素可以分为固定因素和随机因素。两因素实验中,两个因素都是固定因素时,称为验中,两个因素都是固定因素时,称为固定模型固定模型(fixed modelfixed model););两个因素均为随机因素时称为两个因素均为随机因素时称为随机模型随机模型(random modelrandom model););两个因素中一个是两个因素中一个是固定因素,另一是随机因素时称为固定因素,另一是随机因素时称为混合模型混合模型(mixed modelmixed model)。)。这三种模型虽然在这三种模型虽
4、然在计算时计算时没有多没有多大不大不同同,但在,但在设计设计实验时,特别是各因素水平的实验时,特别是各因素水平的获得时却有很大获得时却有很大区别区别。它们的均方期望不同,因。它们的均方期望不同,因此检验方法和对结果解释都存在极大不同。此检验方法和对结果解释都存在极大不同。第八章第八章 两因素及多因素方差分析两因素及多因素方差分析2023/2/148.1.1 主效应与交互作用主效应与交互作用由于因素水平的改变而造成因素效应的改变称由于因素水平的改变而造成因素效应的改变称为该因素的为该因素的主效应主效应。由于因素之间的相互作用造成效应的改变是由于因素之间的相互作用造成效应的改变是交交互作用。互作用
5、。举例说明举例说明A A1 1A A2 2B B1 1B B2 218183030282822228.1 两因素方差分析中的一些基本概念两因素方差分析中的一些基本概念2023/2/14A A因素的主效应因素的主效应:A A2 2水平的平均效应减去水平的平均效应减去A A1 1水平的平均效应。水平的平均效应。A=A=(A A2 2B B1 1+A+A2 2B B2 2)/2-/2-(A A1 1B B1 1+A+A1 1B B2 2)/2=25-24=1 /2=25-24=1 B B因素的主效应因素的主效应:B=B=(B B2 2A A1 1+B+B2 2A A2 2)/2-/2-(B B1 1
6、A A1 1+B+B1 1A A2 2)/2=26-24=2 /2=26-24=2 ABAB因素的交互作用因素的交互作用:AB=AB=(A A1 1B B1 1+A+A2 2B B2 2)-(A A1 1B B2 2+A+A2 2B B1 1)=-18 =-18 若若AB=0AB=0,说明说明A A、B B因素间不存在交互作用。因素间不存在交互作用。本例若不考虑两者之间的交互作用将是错误的。本例若不考虑两者之间的交互作用将是错误的。8.1.1 主效应与交互作用主效应与交互作用2023/2/14对于两因素之间是否存在交互作用,有专门的统对于两因素之间是否存在交互作用,有专门的统计判断方法,一般情
7、况下,可以根据计判断方法,一般情况下,可以根据专业知识专业知识判判断。另外可用断。另外可用做图法做图法进行判断。进行判断。因素间交互作用的图示法:因素间交互作用的图示法:2023/2/14 当当A A、B B之间之间不存在不存在交互作用时,从交互作用时,从B B1 1变化变化到到B B2 2是是不依不依A A水平的不同而改变水平的不同而改变,如图,如图9-9-1a1a(B B1 1-B-B1 1平行于平行于B B2 2-B-B2 2););若两者之间若两者之间存在存在交互交互作用,则作用,则A A的效应的效应依依B B的水平而不同的水平而不同,如图,如图9-1a9-1a(B B1 1-B-B1
8、 1不平行于不平行于B B2 2-B-B2 2)。)。直观图可以帮助判断因素之间是否存在交直观图可以帮助判断因素之间是否存在交互作用,但在处理数据时只凭图象是不行的,互作用,但在处理数据时只凭图象是不行的,由于实验误差的干扰,需要经过严格的由于实验误差的干扰,需要经过严格的数据分数据分析析之后,才能最后断定。之后,才能最后断定。因素间交互作用的图示法:因素间交互作用的图示法:2023/2/14 两因素实验的典型设计是:假设两因素实验的典型设计是:假设A A因因素有素有a a个水平,个水平,B B因素有因素有b b个水平,则每个水平,则每一次重复都包括一次重复都包括abab次实验,并设实验重次实
9、验,并设实验重复复n n次,实验总次数为次,实验总次数为abnabn次。次。i iijkijk表示表示A A因素第因素第i i水平,水平,B B因素第因素第j j水平和第水平和第k k次重次重复的观测值。数据如下表所示。复的观测值。数据如下表所示。8.1.2 两因素交叉分组实验设计的一般格式两因素交叉分组实验设计的一般格式2023/2/148.1.2 两因素交叉分组实验设计的一般格式两因素交叉分组实验设计的一般格式2023/2/14上上表中表中各种符号说明:各种符号说明:xi.表示表示A因素第因素第i水平的所有观水平的所有观测值的和;测值的和;x.j.表示表示B因素第因素第j水平所有观测值的和
10、;水平所有观测值的和;xij.表示表示A的第的第i水平和水平和B的第的第j水平的所有观测值的和;水平的所有观测值的和;x表示所有观测值的总如。用公式表示如下(表示所有观测值的总如。用公式表示如下(A、B可以可以是固定因素,也可以是随机因素):是固定因素,也可以是随机因素):8.1.2 两因素交叉分组实验设计的一般格式两因素交叉分组实验设计的一般格式2023/2/14返回8.2 固固定模型定模型8.2.18.2.1线性统计模型线性统计模型观测值可以用以下观测值可以用以下线性统计模型线性统计模型描述描述 ijkijk是相互独立且服从是相互独立且服从N(0,N(0,2 2)的随机变量。两因的随机变量
11、。两因素交叉分组设计中,固定模型方差分析零假设为素交叉分组设计中,固定模型方差分析零假设为2023/2/14返回8.2.2平方和与自由度的分解平方和与自由度的分解方差分析的基本思想,仍然是将总平方和方差分析的基本思想,仍然是将总平方和分解分解2023/2/14返回8.2.2平方和与自由度的分解平方和与自由度的分解总平方和总平方和分解分解为:由于为:由于A A因素所引起的平方和因素所引起的平方和SSSSA A,B B因素引起的平方和因素引起的平方和SSSSB B,A A、B B交互作用所引起的平交互作用所引起的平方和方和SSSSABAB和和误差平方和误差平方和。分别是。分别是2023/2/14
12、每每一一平方和自由度分析如下:总自由度为平方和自由度分析如下:总自由度为abn-1;A因素自由度为因素自由度为a-1;B因素自由度为因素自由度为b-1;交交互作用的自由度,是两因素全部水平的组合数互作用的自由度,是两因素全部水平的组合数减减1,再减,再减A、B主效应自由度,即主效应自由度,即(ab-1)-(a-1)-(b-1)=(a-1)(b-1);自由度及均方的确定:自由度及均方的确定:误差自由度在每一误差自由度在每一因素组合内是因素组合内是n-1,共有共有ab种组合,种组合,为为ab(n-1)。故。故各项各项的均方为:的均方为:2023/2/14由由各项均方期望的公式中如下:各项均方期望的
13、公式中如下:8.2.3 均方期望与统计量均方期望与统计量F由以上公式可以看出,零假设还可以表示为:由以上公式可以看出,零假设还可以表示为:H H0101:2 2=0=0,H H0202:2 2=0=0,H H0303:2 2=0=02023/2/148.2.3 均方期望与统计量均方期望与统计量F两因素固定模型两因素固定模型方差分析表方差分析表如下:如下:2023/2/148.2.4 平方和的简易计算方法平方和的简易计算方法实际计算时,平方和的简易计算方式如下:实际计算时,平方和的简易计算方式如下:其中其中 称为校正项,用称为校正项,用C表示。表示。2023/2/14如果不设重复,残余项就包括由
14、误差及交互作用如果不设重复,残余项就包括由误差及交互作用两部分引起的两部分引起的平方和平方和。8.2.4 平方和的简易计算方法平方和的简易计算方法误差平方和可以通过计算误差平方和可以通过计算重复间平方和重复间平方和得到。得到。由总平方和减去由总平方和减去A因素、因素、B因素及误差平方和,因素及误差平方和,参与相即是参与相即是交互作用平方和交互作用平方和。2023/2/14根据根据经验经验或或专业专业知识,可以判断两因素知识,可以判断两因素间确实间确实无交互作用无交互作用(如种植密度与年份(如种植密度与年份的关系),也可以的关系),也可以不设重复不设重复(n=1(n=1),),将将大大减少工作量
15、,也能达到同样的效果。大大减少工作量,也能达到同样的效果。分析方法类似刚刚阐述的有重复实验时分析方法类似刚刚阐述的有重复实验时的两因素方差分析。的两因素方差分析。8.2.5 无重复实验时的两因素方差分析无重复实验时的两因素方差分析2023/2/148.3 随机模型(对照固定模型)随机模型(对照固定模型)8.3.1 随机线性模型随机线性模型如果因素如果因素A和和B都是随机因素,则构成随机都是随机因素,则构成随机模型,随机模型的每一观测值,可用以下模型,随机模型的每一观测值,可用以下线性统计模型线性统计模型描述:描述:2023/2/14其中模型参数其中模型参数 i i,j j,(,()i ij j
16、和和 ijkijk都是都是随机变量随机变量,i i服从服从N(0,N(0,2 2),j j服从服从N(0,N(0,2 2),()i ij j服从服从N(0,N(0,2 2),ijkijk服从服从N(0,N(0,2 2),因此任何观测值的,因此任何观测值的方差方差8.3.1 随机线性模型随机线性模型其中其中 2 2,2 2,2 2,2 2,称为,称为方差分量方差分量零假设分别为:零假设分别为:H H0101:2=0=0,H H0202:2=0=0,H H0303:2=0=02023/2/14随机效应模型的随机效应模型的方差分析表方差分析表如下如下8.3.2 随机模型统计量随机模型统计量F2023
17、/2/148.4 混合模型(对照前面两种)混合模型(对照前面两种)8.4.1 线性统计模型线性统计模型在两因素交叉分组实验中,若一个因素在两因素交叉分组实验中,若一个因素(如(如A)是固定型,另一个因素(如)是固定型,另一个因素(如B)是)是随机型,则构成随机型,则构成混合模型混合模型,混合模型的每,混合模型的每一观测值,可用以下一观测值,可用以下线性统计模型线性统计模型描述:描述:2023/2/148.4.1 线性统计模型线性统计模型其中其中 i i是固定效应是固定效应,j j是随机效应,交互作用是随机效应,交互作用()i ij j被认定为随机效应。因为被认定为随机效应。因为 i i是固定效
18、应,所是固定效应,所以以 j j是是服从服从N(0,N(0,2 2)的随机变量。的随机变量。交互作用交互作用效应是平均效应是平均数为数为0 0,方差为,方差为 的的正态随机变量正态随机变量。因为。因为固定因素的全部交互作用效应之和为固定因素的全部交互作用效应之和为0 0,即,即所以在固定因素的某个水平上,交互作用的成分所以在固定因素的某个水平上,交互作用的成分不不是独立是独立的,在这个模型内的,在这个模型内()i ij j的方差,定义为的方差,定义为而不是而不是 2 2。这样规定可以使方差期望简单化,虽。这样规定可以使方差期望简单化,虽然然().j j=0,=0,但是在均方期望中,仍有它的效应
19、。但是在均方期望中,仍有它的效应。2023/2/148.4.2 混合模型统计量混合模型统计量混合模型的混合模型的方差分析表方差分析表如下如下2023/2/14 下表为受试者在一天内的四种不同时下表为受试者在一天内的四种不同时间,以四种不同速度工作,即正常速度的间,以四种不同速度工作,即正常速度的60%、80%、100%、120%所得到的能量所得到的能量消耗值。试验共有消耗值。试验共有16个处理,每一处理重个处理,每一处理重复复2次,共做次,共做32次。试分析在选定的四种次。试分析在选定的四种速度下,能量的消耗是否有显著差异?速度下,能量的消耗是否有显著差异?例题例题2023/2/14受试受试时
20、间时间B B一一二二三三四四工作的相工作的相对速度对速度(正常速正常速度的百分度的百分数数)A)A606080801001001201202.702.701.381.382.352.352.262.263.303.301.351.351.951.952.132.131.711.711.741.741.671.673.413.412.142.141.561.561.501.502.562.561.901.903.143.141.631.633.173.172.002.002.292.291.051.053.183.182.722.723.513.511.391.392.222.221.851.8
21、53.153.151.721.722.192.19例题例题受试者在四种不同时期以四种不同速度工作的能量消耗受试者在四种不同时期以四种不同速度工作的能量消耗2023/2/14解:因素解:因素A A是人为选定的,故为是人为选定的,故为固定型固定型;因素;因素B B的的四个水平,是从一天内不同时间随机抽取的,故四个水平,是从一天内不同时间随机抽取的,故为为随机型随机型。本实验属于。本实验属于混合模型混合模型。具体计算略去,。具体计算略去,以下是方差分析表以下是方差分析表变差变差来源来源平方和平方和自由度自由度均均 方方F F相对速度相对速度A A不同时间不同时间B BABAB误误 差差3.99483
22、.99480.45410.45418.41238.41231.79021.79023 33 39 916161.33161.33160.15140.15140.93470.93470.11190.11191.421.421.351.358.358.35总和总和14.651414.6514例题例题能量消耗实验方差分析表能量消耗实验方差分析表根据方差分析表判断,具体计算过程不再重复。根据方差分析表判断,具体计算过程不再重复。2023/2/14 在随机模型和混合模型中,若不设置重复,在随机模型和混合模型中,若不设置重复,同样会有固定模型中的问题,即因素间的交同样会有固定模型中的问题,即因素间的交互作
23、用与实验误差无法区分,全部归于误差互作用与实验误差无法区分,全部归于误差项。特别是在混合模型中,随机因素的各水项。特别是在混合模型中,随机因素的各水平之间实际存在的差异,往往检验不出来,平之间实际存在的差异,往往检验不出来,结果降低了试验的可靠性。因而,在条件允结果降低了试验的可靠性。因而,在条件允许的情况下,不论哪一种模型,许的情况下,不论哪一种模型,最好都设重最好都设重复复。8.4.2 混合模型统计量混合模型统计量2023/2/14可以把两因素的方差分析,扩展到一般情况。可以把两因素的方差分析,扩展到一般情况。例如在一个实验中,例如在一个实验中,A因素有因素有a个水平,个水平,B因因素有素
24、有b个水平,个水平,C因素有因素有c个水平等。假设每个水平等。假设每一处理都有一处理都有n个重复。其线性模型如下:个重复。其线性模型如下:8.5 两个以上因素的方差分析两个以上因素的方差分析8.5.1 平方和与自由度分解的一般规律平方和与自由度分解的一般规律2023/2/14假设假设A、B、C都是固定因素,各因素的平方都是固定因素,各因素的平方和为:和为:8.5.1 平方和与自由度分解的一般规律平方和与自由度分解的一般规律为为了了计计算算交交互互作作用用平平方方和和,需需要要列列出出三三个个两向表,交互作用由下列各式给出。两向表,交互作用由下列各式给出。2023/2/148.5.1 平方和与自
25、由度分解的一般规律平方和与自由度分解的一般规律误差平方和,是由三向表误差平方和,是由三向表xijk中求出的:中求出的:2023/2/148.5.1 平方和与自由度分解的一般规律平方和与自由度分解的一般规律残余项为三因素交互作用。残余项为三因素交互作用。自由度容易确定。每一主效应的自由度是自由度容易确定。每一主效应的自由度是该因素的水平数减该因素的水平数减1;每一交互作用的自由;每一交互作用的自由度是产生交互作用各因素的自由度乘积;误度是产生交互作用各因素的自由度乘积;误差自由度是各因素水平数与重复数减差自由度是各因素水平数与重复数减1的乘的乘积。从以上对二因素三因素的平方和和自由积。从以上对二
26、因素三因素的平方和和自由度分析来看,存在有规律性。度分析来看,存在有规律性。2023/2/148.5.2 统计量统计量F的确定的确定 一一般般规规律律:为为了了得得到到检检验验某某个个因因素素效效应应的的统统计计量量,在在计计算算F时时分分子子均均方方的的组组成成比比分分母母均均方方的的组组成成仅仅多多出出欲欲检检验验的的效效应应(固固定定因因素素)或或方方差差(随随机机因因素素)分分量量,除除此此之之外外的的其其它它成成分分应应完完全全相相同同。设设A、C为为固固定定因因素素,B为为随随机机因因素素,构构成成一一混混合合模模型型,各各均方期望由下表给出。均方期望由下表给出。2023/2/14
27、8.5.2 统计量统计量F的确定的确定2023/2/148.5.2 统计量统计量F的确定的确定交互作用的检验统计量分别为:交互作用的检验统计量分别为:三个主效应的检验统计量三个主效应的检验统计量有了以上工具,可以处理更复杂的实验。有了以上工具,可以处理更复杂的实验。2023/2/14原则:补上缺失数据之后,所得到的误差平方和原则:补上缺失数据之后,所得到的误差平方和SSeSSe最小。要满足这个原则,即要求最小。要满足这个原则,即要求dSSe/dxdSSe/dx=0=0,解一元一次方程即可得到。解一元一次方程即可得到。8.6 缺失数据的估计缺失数据的估计8.6.1 缺失一个数据的估计缺失一个数据
28、的估计8.6.2 缺失两个数据的估计缺失两个数据的估计 原则是一样的。但要满足这个原则是一样的。但要满足这个原则,即要求解该二元一次方原则,即要求解该二元一次方程即可得到缺失的两个数据。程即可得到缺失的两个数据。2023/2/14 需要说明的是缺失数据的估计,只是计算需要说明的是缺失数据的估计,只是计算上的一种上的一种技巧技巧。它可以使计算得以完成,但。它可以使计算得以完成,但并并不能不能提供更多的信息。由于缺失数据是提供更多的信息。由于缺失数据是估估计值计值,因此当缺失一个数据时,总自由度应,因此当缺失一个数据时,总自由度应该减去该减去1 1,但,但A A因素和因素和B B因素的自由度仍是因
29、素的自由度仍是(a-(a-1)1)和和(b-1)(b-1),误差自由度也应该相应减去误差自由度也应该相应减去1 1。同样,缺失两个数据时,总自由度和误差自同样,缺失两个数据时,总自由度和误差自由度均应减去由度均应减去2 2。8.6 缺失数据的估计缺失数据的估计2023/2/14方差分析三个前提条件:方差分析三个前提条件:可加性可加性;正态正态性性;方差齐性方差齐性。变换的变换的目的目的是满足方差齐性的要求,同是满足方差齐性的要求,同时对正态性及可加性的要求都可得到较时对正态性及可加性的要求都可得到较好的满足。好的满足。变换方法有变换方法有三种三种:8.7 变换变换2023/2/14平方根变换平
30、方根变换:属于泊松分布的数据,它们的:属于泊松分布的数据,它们的平均数与方差等值,常常需要采取平方根变平均数与方差等值,常常需要采取平方根变换。如单位面积内的菌落数,一定区域内某换。如单位面积内的菌落数,一定区域内某种昆虫或某种植物数等都属于这种情况。对种昆虫或某种植物数等都属于这种情况。对于这类数据应该将每个观测值取其平方根后于这类数据应该将每个观测值取其平方根后再计算。当数值很小时,如有几个数小于再计算。当数值很小时,如有几个数小于1010时,为了矫正可以使用观测值加时,为了矫正可以使用观测值加1 1后的平方根后的平方根变换。变换。8.7 变换变换2023/2/14 反正弦变换反正弦变换:
31、该方法取每个观测值平方根的反:该方法取每个观测值平方根的反正弦值,使之变成一个角度,而后用这个角度正弦值,使之变成一个角度,而后用这个角度做方差分析。这种变换方法适用于以百分数表做方差分析。这种变换方法适用于以百分数表示的二项分布数据,特点是数据范围很大时,示的二项分布数据,特点是数据范围很大时,尤其要使用这种变换。当百分数的范围是在尤其要使用这种变换。当百分数的范围是在0%-20%0%-20%或或80%-100%80%-100%时,可以用平方根变换。后时,可以用平方根变换。后者在变换之前应先用者在变换之前应先用100100减去各百分数。若百减去各百分数。若百分数的范围是在分数的范围是在30%
32、-70%30%-70%则不一定非要做变换。则不一定非要做变换。当百分数的变化范围很大时,一定要做反正弦当百分数的变化范围很大时,一定要做反正弦变换。变换后的数据可以从附表变换。变换后的数据可以从附表1010中查出。中查出。8.7 变换变换2023/2/14 对数变换对数变换:当方差与平均数的平方成正比:当方差与平均数的平方成正比时,需做对数变换。变换后的方差具备齐时,需做对数变换。变换后的方差具备齐性。对数变换适用于大范围的正整数,对性。对数变换适用于大范围的正整数,对于一些小的数值,例如小于于一些小的数值,例如小于1010时,变换时时,变换时采用每一观测值都加上采用每一观测值都加上1 1再取
33、其对数值。再取其对数值。等等。等等。8.7 变换变换2023/2/14结束结束P173 9.1.P173 9.1.作业:作业:2023/2/14一、名词解释一、名词解释主效应主效应 简单效应简单效应 交互作用交互作用 二、简答题二、简答题1 1、两因素系统分组资料的方差分析与交叉分组资料、两因素系统分组资料的方差分析与交叉分组资料的方差分析有何区别的方差分析有何区别?2 2、为什么要作数据转换、为什么要作数据转换?常用的数据转换方法有哪常用的数据转换方法有哪几种几种?各在什么条件下应用各在什么条件下应用?习题与解答习题与解答2023/2/14三、计算题三、计算题 为为了了比比较较4 4种种饲饲料料(A)(A)和和猪猪的的3 3个个品品种种(B)(B),从从每每个个品品种种随随机机抽抽取取4 4头头猪猪(共共1212头头)分分别别喂喂以以4 4种种不不同同饲饲料料。随随机机配配置置,分分栏栏饲饲养养、位位置置随随机机排排列列。从从6060日日龄龄起起到到9090日日龄龄的的时时期期内内分分别别测测出出每每头头猪猪的的日日增增重重(g),(g),数数据据如如下下,试试检检验验饲饲料料及及品品种种间间的的差差异异显著性。显著性。4 4种饲料种饲料3 3个品种猪个品种猪60609090日龄日增重日龄日增重习题与解答习题与解答2023/2/14
限制150内