最新十章节协方差分析精品课件.ppt
协方差分析有二个意义协方差分析有二个意义 , 一是对试验进行统一是对试验进行统计控制,二是对协方差组分进行估计,现分述如计控制,二是对协方差组分进行估计,现分述如下。下。 一、对试验进行统计控制一、对试验进行统计控制 为了提高试验的精确性和准确性为了提高试验的精确性和准确性 ,对处理以,对处理以外的一切条件都需要采取有效措施严加控制,使外的一切条件都需要采取有效措施严加控制,使它们在各处理间尽量一致,这叫它们在各处理间尽量一致,这叫试验控制试验控制。但在。但在有些情况下,即使作出很大努力也难以使试验控有些情况下,即使作出很大努力也难以使试验控制达到预期目的。例如:研究几种配合饲料对猪制达到预期目的。例如:研究几种配合饲料对猪的增重效果,希望试验仔猪的初始重相同,因为的增重效果,希望试验仔猪的初始重相同,因为仔猪的初始重不同,将影响到猪的增重。经研仔猪的初始重不同,将影响到猪的增重。经研 相应的总体相关系数相应的总体相关系数可用可用x与与y的总体标准的总体标准差差 、 ,总体协方差,总体协方差COV(x,y)或或 表示如下:表示如下: (10-4) xyxyyxxyyxyxCOV),( 均积与均方具有相似的形式均积与均方具有相似的形式 , 也有相似的性也有相似的性质。在方差分析中,一个变量的总平方和与自由质。在方差分析中,一个变量的总平方和与自由度可按变异来源进行剖分,从而求得相应的均方。度可按变异来源进行剖分,从而求得相应的均方。统计学已证明:两个变量的总乘积和与自由度也统计学已证明:两个变量的总乘积和与自由度也可按变异来源进行剖分而获得相应的均积。这种可按变异来源进行剖分而获得相应的均积。这种把两个变量的总乘积和与自由度按变异来源进行把两个变量的总乘积和与自由度按变异来源进行剖分并获得获得相应均积的方法亦称为协方差分剖分并获得获得相应均积的方法亦称为协方差分析。析。 在随机模型的方差分析中,根据均方在随机模型的方差分析中,根据均方MS 和期和期望均方望均方 EMS的关系,的关系, 可以得到不同变异来源的可以得到不同变异来源的方差组分的估计值。同样,在随机模型的协方差方差组分的估计值。同样,在随机模型的协方差分析中,根据均积分析中,根据均积 MP 和期望均积和期望均积 EMP 的关系,的关系,可可 得得 到到 不同变异来源的协方差组分的估计值。不同变异来源的协方差组分的估计值。有了这些估计值,就可进行相应的总体相关分析。有了这些估计值,就可进行相应的总体相关分析。这些分析在遗传、育种和生态、环保的研究上是这些分析在遗传、育种和生态、环保的研究上是很有用处的。很有用处的。 由于篇幅限制由于篇幅限制 , 本章只介绍对试验进行统控本章只介绍对试验进行统控制的协方差分析。制的协方差分析。 表表101 kn对观测值对观测值x、y的单向分组资料的的单向分组资料的 一般形式一般形式 表表101的的x和和y变量的自由度和平方和的剖分参见变量的自由度和平方和的剖分参见单因素试验资料的方差分析方法一节。其乘积和的剖单因素试验资料的方差分析方法一节。其乘积和的剖分则为:分则为: 总变异的乘积和总变异的乘积和SPT是是xji与与 和和yji与与 的离均差乘的离均差乘积之和,即:积之和,即: (10-5) =kn-1 .x.yknyxyxyyxxSPkinjijijkinjijijT.).)(1111Tdfknyyknxxyyxxkiikii.,., ., .11 处理间的乘积和处理间的乘积和SPt是是 与与 和和 与与 的离均的离均差乘积之和乘以差乘积之和乘以n,即:,即: (10-6) 处理内的乘积和处理内的乘积和SPe是是 与与 和和 与与 的离均的离均差乘积之和,即:差乘积之和,即: (10-7) .ix.x.iy.ykiiikiiiiitknyxyxnyyxxnSP11.1.).)(.(1 kdftijx.ixijy.iykinjkitTkiiinjijijiijiijeSPSPyxnyxyyxxSP11111.1.).)( =k(n-1) 以上是各处理重复数以上是各处理重复数n相等时的计算公式,若相等时的计算公式,若各处理重复数各处理重复数n不相等,分别为不相等,分别为n1、n2、nk,其和为其和为 ,则各项乘积和与自由度的计算公式,则各项乘积和与自由度的计算公式为:为: (10-8) edfkiin1kinjkiiiiijijTinyxyxSP111.11kiiTndf =SPT-SPt = -k =dfT-dft (10-9) kiikkktnyxnyxnyxnyxSP1222111.1 kdftkinjijijeiyxSP11kkknyxnyxnyx.222111kiin1edf 有了上述有了上述SP和和df,再加上,再加上x和和y的相应的相应SS,就,就可进行协方差分析。可进行协方差分析。 【例【例10.1】 为了寻找一种较好的哺乳仔猪食为了寻找一种较好的哺乳仔猪食欲增进剂,以增进食欲,提高断奶重,对哺乳仔欲增进剂,以增进食欲,提高断奶重,对哺乳仔猪做了以下试验:猪做了以下试验: 试验设对照、配方试验设对照、配方1、配方、配方2、配方配方3共四个处理,重复共四个处理,重复12 次,选择初始条件尽次,选择初始条件尽量相近的长白种母猪的哺乳仔猪量相近的长白种母猪的哺乳仔猪48头头 ,完全随机,完全随机分为分为4组进行试验,结果见表组进行试验,结果见表102,试作分析。,试作分析。 表表102 不同食欲增进剂仔猪生长情况表不同食欲增进剂仔猪生长情况表 (单位:(单位:kg) 此例,此例, =18.25+15.40+15.65+13.85=63.15 =141.80+130.10+144.80+133.80 =550.50 k=4,n=12,kn=412=48 .4321xxxxx.4321yyyyy 协方差分析的计算步骤如下:协方差分析的计算步骤如下: (一一)求求x变量的各项平方和与自由度变量的各项平方和与自由度 1、总平方和与自由度、总平方和与自由度 dfT(x)=kn-1=412-1=47 75. 14815.638325.844815.63)10. 185. 150. 1 (2222222)( knxxSSijxT83. 04815.63)85.1365.1540.1525.18(121.122222212)(knxxnSSkiixt)(xtdf 3、处理内平方和与自由度、处理内平方和与自由度 (二二)求求y变量各项平方和与自由度变量各项平方和与自由度 1、总平方和与自由度、总平方和与自由度92. 083. 075. 1)()()(xtxTxeSSSSSS44347)()()(xdftxdfTdfxe76.96485 .55031.6410485 .550)00.11.00.1240.12(222222.2)(knyySSijyT4711241)( kndfyT 2、处理间平方和与自由度、处理间平方和与自由度 3、处理内平方和与自由度、处理内平方和与自由度 (三三) 求求x和和y两变量的各项离均差乘积和与自由度两变量的各项离均差乘积和与自由度 1、总乘积和与自由度、总乘积和与自由度 68.114850.550)80.13380.14410.13080.141(121.1222222.2)(knyynSSiyt3141)( kdfyt08.8568.1176.96)()()(ytyTyeSSSSSS44347)()()(ytyTyedfdfdf =kn-1=412-1=47 2、处理间乘积和与自由度、处理间乘积和与自由度 =1.64knyxyxSPkinjijijT.1125. 812450.55015.6350.73212450.55015.6300.1110. 1.00.1285. 140.1250. 1),(yxTdfknyxyxnSPkiiit.1112450.55015.63)80.13385.1380.14465.1510.13040.1580.14125.18(121 =k-1=4-1=3 3、处理内乘积和与自由度、处理内乘积和与自由度 平方和、乘积和与自由度的计算结果列于表平方和、乘积和与自由度的计算结果列于表103。 表表103 x与与y的平方和与乘积和表的平方和与乘积和表),(yxtdf61. 664. 125. 8tTeSPSPSP44347)()(),(vxtvxTyxedfdfdf (四四) 对对x和和y各作方差分析各作方差分析(表表104) 表表104 初生重与初生重与50日龄重的方差分析表日龄重的方差分析表 分析结果表明,分析结果表明,4种处理的供试仔猪平均初生种处理的供试仔猪平均初生重间存在着极显著的差异,其重间存在着极显著的差异,其50 日龄平均重差异日龄平均重差异不显著。须进行协方差分析,以消除初生重不同不显著。须进行协方差分析,以消除初生重不同对试验结果的影响,减小试验误差,揭示出可能对试验结果的影响,减小试验误差,揭示出可能被掩盖的处理间差异的显著性。被掩盖的处理间差异的显著性。 (五五) 协方差分析协方差分析 1、误差项回归关系的分析、误差项回归关系的分析 误差项回归关系分析的意义是要从剔除处理间误差项回归关系分析的意义是要从剔除处理间差异的影响的误差变异中找出差异的影响的误差变异中找出50日龄重日龄重(y)与初生与初生重重(x)之间是否存在线性回归关系。计算出误差项之间是否存在线性回归关系。计算出误差项的回归系数并对线性回归关系进行显著性检验,若的回归系数并对线性回归关系进行显著性检验,若显著则说明两者间存在回归关系。这时就可应用线显著则说明两者间存在回归关系。这时就可应用线性回归关系来校正性回归关系来校正y值值(50日龄重日龄重)以消去仔猪初生以消去仔猪初生重重(x)不同对它的影响。然后根据校正后的不同对它的影响。然后根据校正后的y值值(校校正正50日龄重日龄重)来进行方差分析。如线性回归关系不来进行方差分析。如线性回归关系不显著,则无需继续进行分析。显著,则无需继续进行分析。 回归分析的步骤如下:回归分析的步骤如下: (1) 计算误差项回归系数,回归平方和,离回计算误差项回归系数,回归平方和,离回归平方和与相应的自由度归平方和与相应的自由度 从误差项的平方和与乘积和求误差项回归系从误差项的平方和与乘积和求误差项回归系数:数: (10-10) 误差项回归平方和与自由度误差项回归平方和与自由度 (10-11) dfR(e)=11848. 792. 061. 6)()(xeeeyxSSSPb49.4792. 061. 62)(2)(xeeeRSSSPSS 误差项离回归平方和与自由度误差项离回归平方和与自由度 =85.08-47.49=37.59 (10-12) (2) 检验回归关系的显著性检验回归关系的显著性(表表105) 表表105 哺乳仔猪哺乳仔猪50日龄重与初生重的日龄重与初生重的 回归关系显著性检验表回归关系显著性检验表)()()(eRveerSSSSSS43144)()()(eRveerdfdfdf F检验表明,误差项回归关系极显著,表明哺检验表明,误差项回归关系极显著,表明哺乳仔猪乳仔猪50 日龄重与初生重间存在极显著的线性回日龄重与初生重间存在极显著的线性回归关系。因此,可以利用线性回归关系来校正归关系。因此,可以利用线性回归关系来校正y,并对校正后的并对校正后的y进行方差分析。进行方差分析。 2、对校正后的、对校正后的50日龄重作方差分析日龄重作方差分析 (1)求校正后的求校正后的50日龄重的各项平方和及自由日龄重的各项平方和及自由度度 利用线性回归关系对利用线性回归关系对50日龄重作校正日龄重作校正 ,并由,并由校正后的校正后的50日龄重计算各项平方和是相当日龄重计算各项平方和是相当 麻烦的,麻烦的,统计学已证明,校正后的总平方和、误差平方和统计学已证明,校正后的总平方和、误差平方和及自由度等于其相应变异项的离回归平方和及自及自由度等于其相应变异项的离回归平方和及自由度,因此,其各项平方和及自由度可直接由下由度,因此,其各项平方和及自由度可直接由下述公式计算。述公式计算。 校正校正50日龄重的总平方和与自由度,即总日龄重的总平方和与自由度,即总离回归平方和与自由度离回归平方和与自由度 (10-13) = - =47-1=46 校正校正50日龄重的误差项平方和与自由度,日龄重的误差项平方和与自由度,即误差离回归平方和与自由度即误差离回归平方和与自由度 (10-14) = - =44-1=43 上述回归自由度均为上述回归自由度均为1,因仅有一个自变量,因仅有一个自变量x。 87.5775. 125. 876.962)(2)()()(xTTyTyRyTTSSSPSSSSSSSSTdf)(yTdf)(yRdf59.3792. 061. 608.852)(2)()()(xeeyeeRyeeSSSPSSSSSSSSedf)(yedf)(Redf 校正校正50日龄重的处理间平方和与自由度日龄重的处理间平方和与自由度 =57.87-37.59=20.28 (10-15) =k-1=4-1=3 (2) 列出协方差分析表,对校正后的列出协方差分析表,对校正后的50日龄重日龄重进行方差分析进行方差分析(表表106) 查查F值值: =4.275(由线性内插法计算由线性内插法计算),由于由于F=7.63 ,P0.01,表明对于校正,表明对于校正后的后的50日龄重不同食欲添加剂配方间存在极显著日龄重不同食欲添加剂配方间存在极显著的差异。故须进一步检验不同处理间的差异显著的差异。故须进一步检验不同处理间的差异显著性,即进行多重比较。性,即进行多重比较。 eTtSSSSSSeTtf df df d)43, 3(01. 0F)43, 3(01. 0F 表表106 表表10-2资料的协方差分析表资料的协方差分析表 3、根据线性回归关系计算各处理的校正、根据线性回归关系计算各处理的校正50日日龄平均重龄平均重 误差项的回归系数误差项的回归系数 表示初生重对表示初生重对50日龄重日龄重影响的性质和程度,且不包含处理间差异的影响,影响的性质和程度,且不包含处理间差异的影响,于是可用于是可用 根据平均初生重的不同来校正每一根据平均初生重的不同来校正每一处理的处理的50日龄平均重。校正日龄平均重。校正50日龄平均重计算公日龄平均重计算公式如下:式如下: (10-16) )(eyxb)(eyxb.).(.)(xxbyyieyxii 公式中:公式中: 为第为第i处理校正处理校正50日龄平均重;日龄平均重; 为第为第i处理实际处理实际50日龄平均重日龄平均重(见表见表102); 为第为第i处理实际平均初生重处理实际平均初生重(见表见表102); 为全试验的平均数,为全试验的平均数, 为误差回归系数,为误差回归系数, =7.1848 将所需要的各数值代入将所需要的各数值代入(1016)式中,即可计算出式中,即可计算出各处理的校正各处理的校正50日龄平均重日龄平均重(见表见表 107)。 .iy.iy.ix.x3156. 14815.63.knxx)(eyxb)(eyxb 表表107 各处理的校正各处理的校正50日龄平均重计算表日龄平均重计算表 4、各处理校正、各处理校正50日龄平均重间的多重比较日龄平均重间的多重比较 各处理校正各处理校正50日龄平均重间的多重比较,即日龄平均重间的多重比较,即各种食欲添加剂的效果比较。各种食欲添加剂的效果比较。 (1) t检验检验 检验两个处理校正平均数间的差异检验两个处理校正平均数间的差异显著性,可应用显著性,可应用t检验法:检验法: (10-17) (10-18) .jiyyjiSyyt)(2.).(2xejieyySSxxnSMSji 式中,式中, 为两个处理校正平均数间的差为两个处理校正平均数间的差异;异; 为两个处理校正平均数差数标准误;为两个处理校正平均数差数标准误; 为误差离回归均方;为误差离回归均方; n为各处理的重复数;为各处理的重复数; 为处理为处理i的的x变量的平均数;变量的平均数; 为处理为处理j的的x变量的平均数;变量的平均数; SSe(x)为为x变量的误差平方和变量的误差平方和 例如,检验食欲添加剂配方例如,检验食欲添加剂配方1与对照校正与对照校正50日日龄平均重间的差异显著性:龄平均重间的差异显著性: .jiyy.jiyySeSM .ix.jx =10.3514-12.0758=-1.7244 =37.59/43=0.8742 n=12 =1.52, =1.28, SSe(x)=0.92将上面各数值代入将上面各数值代入(1018)式得:式得: 于是于是 .21yyeSM .1x.2x.21yyS4477. 092. 0)28. 152. 1 (1228742. 0285. 34477. 00758.123514.10t 查查t值表,当自由度为值表,当自由度为43时时 (见表见表106误差自误差自由度由度),t0.01(43)=2.70 (利用线性内插法计算利用线性内插法计算),|t| t0.01(43),P0.01 ,表明对照与食欲添加剂,表明对照与食欲添加剂1号配方号配方校正校正50日龄平均重间存在着极显著的差异,这里表日龄平均重间存在着极显著的差异,这里表现为现为1号配方的校正号配方的校正50日龄平均重极显著高于对照。日龄平均重极显著高于对照。 其余的每两处理间的比较都须另行算出其余的每两处理间的比较都须另行算出 ,再进行再进行t检验。检验。.jiyyS (2)最小显著差数法)最小显著差数法 利用利用t检验法进行多重检验法进行多重比较,每一次比较都要算出各自的比较,每一次比较都要算出各自的 ,比较麻,比较麻烦。当误差项自由度在烦。当误差项自由度在 20以上,以上,x变量的变异不变量的变异不甚大甚大(即即x变量各处理平均数间差异不显著变量各处理平均数间差异不显著),为简,为简便起见,可计算一个平均的便起见,可计算一个平均的 采用最小显著采用最小显著差数法进行多重比较。差数法进行多重比较。 的计算公式如下:的计算公式如下:.jiyyS.jiyyS.jiyyS (10-19) 公式中公式中SSt(x)为为x变量的处理间平方和。变量的处理间平方和。 然后按误差自由度查临界然后按误差自由度查临界t值,计算出最小显著差值,计算出最小显著差数:数: (10-20) .jiyyS) 1(12)()(kSSSSnMSxexte)(dfetLSD.jiyyS 本例本例x变量处理平均数间差异极显著,不满足变量处理平均数间差异极显著,不满足“x变量的变异不甚大变量的变异不甚大”这一条件这一条件 ,不应采用此,不应采用此处所介绍的最小显著差数法进行多重比较。为了处所介绍的最小显著差数法进行多重比较。为了便于读者熟悉该方法,仍以本例的数据说明之。便于读者熟悉该方法,仍以本例的数据说明之。 此时此时 由由 =43,查临界查临界t值得:值得: t0.05(43)=2.017,t0.01(43)=2.70于是于是 LSD0.05=2.0170.4353=0.878 LSD0.01 =2.700.4353 =1.175.jiyyS4354. 0) 14(92. 083. 01128742. 02edf 不同食欲添加剂配方与对照校正不同食欲添加剂配方与对照校正50日龄平均日龄平均重比较结果见表重比较结果见表108。 表表108 不同食欲添加剂配方与对照间的不同食欲添加剂配方与对照间的 效果比较表效果比较表 (3) 最小显著极差法最小显著极差法 当误差自由度在当误差自由度在20以上,以上,x变量的变异不甚大,变量的变异不甚大,还可以计算出平均的平均数校正标准误还可以计算出平均的平均数校正标准误 ,利用,利用LSR 法进行多重比较。法进行多重比较。 的计算公式如下:的计算公式如下: (10-21)yS) 1(1)()(kSSSSnMSxexteySyS 然后由误差自由度然后由误差自由度 和秩次距和秩次距k查查SSR表(或表(或q表),计算最小显著极差:表),计算最小显著极差: (10-22) 对于【例对于【例10.1】资料,】资料, 由于不满足由于不满足“x变量的变量的变异不甚大变异不甚大”这一条件,这一条件, 不应采用此处所介绍的不应采用此处所介绍的LSR法进行多重比较。为了便于读者熟悉该方法,法进行多重比较。为了便于读者熟悉该方法,仍以【例仍以【例10.1】的数据说明之。】的数据说明之。ef d ySSSRLSR =0.8742, n=12,SSt(x)=0.83, SSe(x)=0.92,k=4,代入,代入(1021)式可计算得:式可计算得: SSR值与值与LSR值见表值见表109。 eMS3078. 0) 14(92. 083. 01128742. 0yS 表表109 SSR值与值与LSR值表值表 各处理校正各处理校正50日龄平均重多重比较结果见表日龄平均重多重比较结果见表1010。 表表1010 各处理校正各处理校正50日龄平均重日龄平均重 多重比较表(多重比较表(SSR法法) 多重比较结果表明:多重比较结果表明: 食欲添加剂配方食欲添加剂配方3、2、1号的哺号的哺乳仔猪校正乳仔猪校正 5 0 日龄平均重极显著日龄平均重极显著高于对照高于对照 ,不同食欲添加剂配方间,不同食欲添加剂配方间哺乳仔猪校正哺乳仔猪校正50日龄平均重差异不日龄平均重差异不显著。显著。 55 结束语结束语