欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    第8章单因素方差分析.doc

    • 资源ID:53053287       资源大小:925KB        全文页数:35页
    • 资源格式: DOC        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第8章单因素方差分析.doc

    +第八章 单因素方差分析第一节 方差分析的基本问题一、方差分析要解决的问题t检验法适用于样本平均数与总体平均数及两样本平均数间的差异显著性检验;而多个平均数间的差异显著性检验,必须用方差分析法。1、检验过程繁琐一试验包含5个处理,采用t检验法要进行次两两平均数的差异显著性检验;若有k个处理,则要作k(k-1)/2次类似的检验。表8-1:盐处理对碱蓬整株鲜重的影响株号盐处理浓度(mM NaCl)010020030040014.517.988.568.376.9825.067.658.647.465.8934.367.328.978.796.5444.827.549.018.056.2754.937.638.328.226.7964.467.228.488.656.44平均值4.697.568.668.426.49标准差0.280.270.270.270.392、无统一的试验误差,误差估计的精确性和检验的灵敏性低如表8-1,试验有5个处理,每个处理重复6次,共有30个观测值。进行t检验时,每次只能利用两个处理共12个观测值估计试验误差,误差自由度为2(6-1)=10;若利用整个试验的30个观测值估计试验误差,显然估计的精确性高,且误差自由度为5(6-1)=25。可见在用t检法进行检验时,由于估计误差的精确性低,误差自由度小,使检验的灵敏性降低,容易掩盖差异的显著性。3、推断的可靠性低,检验的I型错误率大用t检验法进行多个处理平均数间的差异显著性检验,由于没有考虑相互比较的两个平均数的秩次问题,因而会增大犯I型错误的概率,降低推断的可靠性。假设每一对检验接受零假设的概率都是1-0.95,而且这些检验都是相互独立的,那么10对检验都接受概率是(0.95)100.60,犯错误的概率=1-0.60=0.40犯I型错误的概率明显增加。由于上述原因,多个平均数的差异显著性检验不宜用t检验,须采用方差分析法。二、方差分析的几个概念方差分析(analysis of variance)是由英国统计学家R.A.Fisher于1923年提出的。这种方法是将a个处理的观测值作为一个整体看待,把观测值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自由度,进而获得不同变异来源总体方差估计值;通过计算这些总体方差的估计值的适当比值,就能检验各样本所属总体平均数是否相等。“方差分析法”是一种在若干能相互比较的资料组中,把产生变异的原因加以区分开来的方法与技术” ,方差分析实质上是关于观测值变异原因的数量分析。要掌握方差分析的方法,必须先了解以下几个基本概念。这几个概念在科学研究中必须用到,非常重要。1、试验指标(experimental index)为衡量试验结果的好坏或处理效应的高低,在试验中具体测定的性状或观测的项目称为试验指标。由于试验目的不同,选择的试验指标也不相同。如研究盐处理对玉米生长状况的影响,常用的生长指标是植株鲜重、株高等指标;如发现盐处理影响鲜重、株高等,还要分析为什么盐处理抑制玉米生长?光合速率是否降低?光合速率为什么降低,是否与色素含量下降有关?盐处理还会对玉米造成那些伤害?如是否影响膜透性?叶片中Na+含量是否升高,从而对叶片具有毒害等。所以研究盐处理对玉米生长的影响,不能只研究一个指标,要研究鲜重、光合速率、色素含量、膜透性、Na+含量等多个指标。再如研究人体心脏功能常用血压、心率、心电图等指标。2、试验因素(experimental factor) 试验中所研究的影响试验指标的因素叫试验因素。如研究盐处理对碱蓬生长的影响,土壤中的盐浓度就是一个因素,此外影响碱蓬生长的因素还有水分、温度、光照等,均可作为试验因素。研究不同品系小麦的株高,品系也是一个影响株高的因素,如表8-2就是研究5个小麦品种株高的差异,因为小麦株高对其产量影响很大。当试验中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上的因素对试验指标的影响时,则称为两因素或多因素试验。表8-2:5个小麦品系株高调查结果株号品 系164.664.567.871.869.2265.365.366.372.168.2364.864.667.170.069.8466.063.766.869.168.3565.863.968.571.067.5平均值65.364.467.370.868.63、因素水平(level of factor) 因素的具体表现或数量等级称为因素水平,简称水平。如盐处理浓度这一因素有0、100、200、300、400 mM NaCl等5个水平。小麦品系这一因素也有、等5个水平。4、试验处理(treatment)在实验对象上实施的事先设计好的具体项目叫试验处理,简称处理。进行单因素试验时,试验因素的一个水平就是一个处理。如表8-1中盐处理共有0、100、200、300、400 mM NaCl等5个处理。表8-2中也是5个处理。对于双因素试验时,处理的个数等于两个因素的水平个数的乘积。表8-3研究的是温度和原料这两个因素对酒精产量的影响,是双因素试验,每个因素都又有3个水平,共有3×39个处理。每一个处理可以看作一个总体,每个处理得到的一组数据可以看作是从这个处理总体中抽取的一个样本的数据。表8-3:不同原料和不同酒曲对发酵酒精产量(kg/100kg)的影响酒曲种类原料种类玉米高梁水稻A414343454749504543454340B313335344338353635383734C3632332828323434303326295、试验单位(experimental unit) 在试验中能接受不同试验处理的独立的试验载体叫试验单位。如植物试验中的一株玉米、一株碱蓬;在畜禽、水产试验中, 一只家禽、一只小白鼠、一位病人,即一个动物、植物或人。有时也用一组实验材料作为一个实验单位,如研究肥料对产量的影响,每种肥料选5块地,每块地是一个试验单位。试验单位是获得观测数据的单位。6、重复(repetition) 在试验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;处理实施的试验单位数目称为处理的重复数。例如,用100 mMNaCl处理了6株碱蓬,那么这个处理有6个重复;用某种饲料喂4头猪,就说这个处理(饲料)有4次重复。但要注意,并非每一个测量结果都是一个重复,重复数是实验单位数,是每一个试验对象从头开始完整的做一遍得到的结果。如测定叶绿素含量,从一瓶叶绿素提取液中取出5小管提取液,分别测定叶绿素含量得到的5个观测数不是5个重复,而是一个,因为实验对象是一个。科学的方法是将5个实验对象(叶片)分别提取,分别测定,不能将5个实验对象的叶片混在一起提取。再如研究饲料的营养,将1头猪称重5次和5头猪各称重1次是完全不一样的:1头猪称重5次得到的5个结果是1个重复,5头猪各称重1次,才是5个重复。以重复测定代替重复实验会减小误差均方,会使本来差异并不显著的因素变得显著,从而得出错误的结论。以上几个基本概念是科学实验中几个最重要的常识之一,希望初学者认真体会。方差分析的原理看似复杂,其实很简单。Excel给我们提供了“数据分析”函数,下面要讲的所有运算过程,用Excel函数都可以快速全自动的得出,我们只需要将我们的原始数据输入Excel工作表就可以了。同样,后面要讲的相关和回归分析也完全可以自动运算。三、方差分析的数学模型(以单因素试验为例)(一)单因素试验的数据描述假设某单因素试验有a个处理,每个处理有n次重复,共有an个观测值。其单因素方差分析试验数据的表示方法见表8-4:表8-4:单因素试验的典型数据表试验次数或重复数实验处理数X1X2X3XiXa1x11x21x31xi1xa12x12x22x32xi2xa23x13x23x33xi3xa3jx1jx2jx3jxijxajnx1nx2nx3nxinxan总计平均值表中数据xij表示第i个处理的第j次观测值,其中的几个符号做如下说明:,表示第i个处理所有数据的和;(i=1,2,a;j1,2,n),表示第i个处理所有数据的平均值。,表示所有处理中全部数据的总和;,全部数据的总平均值;(二)观测值的描述对于上表中的每一个观测值可用线性统计模型描述:其中:xij是在第i水平(处理)下的第j次观测值;为所有观测值的总平均数;i是第i水平的处理效应,即因为此处理而引起的数据的变异;ij是随机误差,即随机抽样误差。方差分析的目的就是要检验处理效应的大小或有无。(三)因素处理效应和实验模型的分类1、固定效应模型如果处理效应是由固定因素所引起的效应,就称为固定效应。固定因素是指因素的水平可以严格地人为控制,水平固定后,它的效应值i也是固定的;实验重复时可以得到相同的结果。如表8-1的试验结果发现,盐处理显著促进了碱蓬生长,最适盐浓度为200 mM NaCl,别人重复这个试验也会得到同样的结果。再如我们调查上海、北京、广州、深圳四个城市市的居民收入,调查结果发现,四个城市的居民收入显著不同,上海>深圳>北京广州,其他人调查也会得到同样的结果。可严格人为控制的因素如:几种不同实验温度、几种不同的化学药物浓度、几个不同的小麦品种、几个城市等都属于固定因素。处理固定因素所用的模型称为固定效应模型,简称为固定模型。固定模型的假设是关于xij的假设,固定模型的方差分析所得到的结论只适合于选定的那几个水平,并不能将其结论推广到其他未考虑的水平上。如表8-1的试验结论“盐处理显著促进碱蓬的生长”只使用于0、100、200、300、400 mM NaCl这5个浓度,不能说“任何盐浓度都可以促进碱蓬生长”。研究北京、上海、广州和深圳的居民收入,发现这四个城市的居民收入有差异,不能说“任意四个城市的居民收入都有差异”。2、随机效应模型如果处理效应是由随机因素所引起的效应,就称为随机效应。若因素的a个水平是从该因素水平总体中随机抽出的样本,那么各个水平的处理效应值i不是固定的数值,不能严格的人为控制,实验重复时很难得到相同的结果,这种因素称为随机因素。处理随机因素所用的模型称为随机效应模型,简称为随机模型。随机效应模型的方差分析所得到的结论可推广到总体水平上,因为这类实验是通过样本对所属总体作出的推断。如探讨不同窝的家兔出生重量是否存在差异,随机选取了4窝家兔,每窝家兔中均随机选了4只幼兔。窝别就是随机因素,任何人都不能再得到完全相同的4窝家兔。调查结果见表8-5:这4窝幼兔中第I窝出生重最大,别人再随机选择4窝家兔,并不一定还是第I窝出生重最大。表8-5的实验结论是:不同窝别的4窝家兔的体重差异显著,别人调查任何4窝家兔也会得到同样的结论。表8-5:4窝家兔的出生重(g)动物号窝别134.733.227.132.9233.326.023.331.4326.228.627.825.7431.632.326.728.0平均值31.45030.02526.22529.500再如调查山东女大学生身高,随机调查了5所大学,每所大学随机调查100名,发现山东各大学女生身高差异不显著。其他人随机调查山东5所大学的女生身高,也会得出同样的结论。从随机因素的a个水平的方差分析所得到的结论,可以推广到这个因素的所有水平上。这里i是一个随机变量,所检验的是关于i的变异性假设。有时随机因素和固定因素很难区分,简单的说固定因素可以严格的人为控制,固定因素的各水平固定以后,其效应值也是固定的,如温度、盐浓度等,其结论只适合固定的这几个水平。随机因素的水平不能严格的人为控制,在各水平固定以后,其效应值并不固定,其统计结论可推广到总体水平上。3、混合模型在多因素试验中,若即包括固定因素,又包括随机因素,那么该实验应该用混合实验模型进行统计分析。如研究生科院男生和女生学习成绩的差异,男女各选50名同学,随机选择了5门课程成绩做比较。那么,课程是随机选取的,属于随机因素;男生、女生是人为确定的,属于固定因素。所以这个实验属于混合模型。由于固定模型、随机模型和混合模型在设计思想上有明显不同,因此在统计推断的方法上也有明显区别。另外,不同实验模型分析的侧重点也不完全相同,固定效应模型侧重于处理效应的估计和检验;随机模型侧重于效应方差(i的变异性)的估计和检验。但对于单因素方差来说,固定模型和随机模型的统计方法完全相同,只是统计推断的假设和推论不同。四、方差分析的原理在一个多处理实验中,得到的一系列观察值数据变异的原因是多方面的。数据的变异可能是处理不同造成的,称为系统误差或处理效应;也可能是随机因素造成的,既抽样的随机性造成的,称为随机误差或试验误差。方差分析的基本思想就是将测量数据的总变异分解为处理效应和试验误差。(一)两类误差1、随机误差在因素的同一水平(同一个总体)下,样本的各观察值之间的差异,称为随机误差。比如,同一盐浓度下的不同碱蓬植株鲜重的差异就是受随机因素的影响,或者说是由于抽样的随机性所造成的。2、系统误差在因素的不同水平(不同总体)下,各观察值之间的存在差异。比如,不同盐浓度处理的碱蓬的植株鲜重不同,这种差异可能是由于抽样的随机性所造成的,也可能是由于盐处理所造成的,盐处理效应所造成的误差是由系统因素造成的,称为系统误差。(二)两类方差1、处理内方差处理内方差指因素的同一水平(同一个总体)下,样本数据的方差。处理内方差只包含随机误差。2、处理间方差处理间方差指因素的不同水平(不同总体)下,各样本之间的方差。处理间方差既包括随机误差和系统误差。(三)方差的比较如果不同盐浓度对植株鲜重没有影响,那么在处理间方差中只包含有随机误差,而没有系统误差。这时,处理间方差与处理内方差就应该很接近,两种方差的比值就会接近1。如果不同的水平对结果有影响,在处理间方差中除了包含随机误差外,还会包含有系统误差,这时处理间方差就会大于处理内方差,处理间方差与处理内方差的比值就会大于1。当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异。m1=m2 =m2 =m4f(X)X图8-1:方差分析原假设图示(四)方差分析的假设(以固定效应模型为例)1、原假设H0:1=2=3=i或者1=2=i=0接受H0表示每个样本都来自均值为µ,方差为2的同一正态总体,各水平间不存在处理效应,每个观测值都是由总平均数加上随机误差造成的。例如研究平均每日食物中肉类比重(0、50、100、250、500克/天)与人的智商的关系?发现吃肉多少对智商影响不大。如图8-1表示,4个总体差异不显著。2、备择假设HA:mi (i=1,2,3,4)不全相等或者i至少有一个不等于0。如果备择假设成立,表示各水平间有系统误差,四个样本分别来自均值不同的正态总体。如图8-2所示,4个总体差异显著。例如调查上海、北京、广州、深圳四个城市市的居民收入,调查结果发现,四个城市的居民收入显著不同。如图8-2表示,4个总体差异显著。µ1¹µ2¹µ3¹µ4f(X)X图8-2:方差分析备择假设图示方差分析比较的是两类误差(随机误差和系统误差),以检验均值是否相等。比较的基础是方差比,即各部分的误差占总误差的比例。如果系统误差(处理效应)显著地不等于随机误差,则几个总体(处理)均值就是不相等的;反之,均值就是相等的。方差分析的显著性检验是F检验。五、方差分析的检验程序(以单因素试验为例)(一)假设H0:1=2=3=i或者1=2=i=0HA:mi (i=1,2,3,4)不全相等或者i至少有一个不等于0。(二)确定显著性水平(三)计算统计量方差是离差平方和除以n-1,即S2=,方差分析就是要把一个试验的总变异依据变异来源分解为处理间变异和处理内变异。分解的方法是通过将总均方的分子称为总离均差平方和,简称为总平方和(SST),分解成处理间平方(SSA)和与处理内平方和(SSe)两部分;将总均方的分母称为总自由度(dft),剖分成处理间自由度(dfA)与处理内自由度(dfe)两部分。1、平方和的计算和分解三种平方和的简便计算公式总平方和,SSTSSA+SSe处理间平方和处理内平方和这里C称为矫正项,2、总自由度的计算和分解总自由度记为dfTan-1。处理间自由度记为dfAa-1。处理内自由度记为dfe=an-a。dfTdfA+dfe3、方差(均方)的计算各部分平方和除以各自的自由度便得到总均方、处理间均方和处理内均方,分别记为MST(或)、MSA(或)和MSe(或)。MSA也称为处理均方,MSe也称为误差均方。总均方:处理间均方:处理内均方:4、显著性检验F检验检验统计量,F值具dfA、dfe自由度。用F分布的上尾检验,拒绝域为F>F。方差分析的方法结合例子很容易理解,本节先对方差分析的程序进行简单介绍。方差分析在科研和社会生活中非常重要。第二节 固定模型的方差分析一、固定模型的方差分析程序(一)提出固定效应模型的假设在固定模型中,i是处理平均数与总平均数的离差,是个常量,因而:。原假设H0:1=2=3=i;或者1=2=i=0备择假设HA:i至少有一个不相等;或至少有一个i不等于0(二)平方和与自由度的分解第一章就介绍过标准差或方差是数据变异程度的度量,这里详细介绍方差的分解方法,这也是本章的核心内容。方差:离差平方和除以n-1,S2=在方差分析中是用样本方差也称均方(mean squares)来度量资料的变异程度。全部观测值的总变异可以用总均方来度量。将总变异分解为处理间变异和处理内变异,就是要将总均方分解为处理间均方和处理内均方。分解方法是通过将总均方的分子称为总离均差平方和,简称为总平方和,分解成处理间平方和与处理内平方和两部分;将总均方的分母称为总自由度,分解成处理间自由度与处理内自由度两部分。1、总平方和的分解 全部观测值xij与总平均数的离均差平方和,称为总平方和,它反映的是全部观测值的离散或变异状况,记为SST。其计算公式为:可以将总平方和SST做如下分解:对于每个固定的,,所以:上式中右边第一项为各处理平均数与总平均数的离均差平方和与重复数n的乘积,反映了重复n次的处理间变异,称为处理间平方和或处理平方和,记为SSA。上式中右边第二项为各处理内离均差平方和之和,反映了各处理内的变异即随机误差的大小,称为处理内平方和或误差平方和,记为SSe。于是有:SSTSSA+SSe 三种平方和的简便计算公式如下:总平方和;处理间平方和;处理内平方和这里C称为矫正项,简便公式的证明略!在方差分析中,为了简化计算,同样可以使用编码法,即将全部数据均减去同一个数。所得的平方和不变。以表8-2试验结果为例计算三种平方和,表8-2中的数据都减去65得到下表。表8-6:5个小麦品系株高调查结果方差分析表(编码后)株号品 系总和1-0.4-0.52.86.84.220.30.31.37.13.23-0.2-0.42.15.04.841.0-1.31.84.13.350.8-1.13.56.02.51.5-3.011.529.018.0572.259132.25841.0324.01308.51.933.429.43174.4668.06277.28先求校正项C,=129.96=277.28-129.96=147.32=147.32-131.74=15.582、总自由度的剖分 在计算总平方和时,资料中的各个观测值要受这一条件的约束,故总自由度等于资料中观测值的总个数减1,即an-1。总自由度记为dfT,即dfTan-1。因素共有a个水平,所以处理间自由度为处理数减1,处理间自由度记为dfA,即dfAa-1。在计算处理内平方和时,因为每个处理均有n-1自由度,共有a个处理,所以处理内自由度为资料中观测值的总个数减a,处理内自由度记为dfe,即dfe=an-aa(n-1)。因为:an-1an-a+a-1a(n-1)+(a-1)所以:dfTdfA+dfe表8-2数据的dfA5-1=4;dfe= 5(5-1)=203、各个均方的计算各部分平方和除以各自的自由度便得到总均方、处理间均方和处理内均方,分别记为MST(或)、MSA(或)和MSe(或)。MSA也称为处理均方,MSe也称为误差均方。总均方:;处理间均方:;处理内均方:表8-2数据的三个均方分别为:;(三)检验统计量,具dfA、dfe自由度。当F<F时,认为MSA和MSe差异不大,产生的误差是由随机误差造成的,接受零假设,处理平均数之间差异不显著。当F>F时,认为MSA显著高于MSe,产生的误差主要是由系统误差造成的,拒绝零假设,处理平均数之间差异显著。表8-2的检验统计量:(四)拒绝域用F分布的上尾检验,拒绝域为F>F,如图8-3所示。F4,20,0.05=2.87;F4,20,0.01=4.43; F=42.23>F0.01,落在拒绝域内不能拒绝H0如果均值相等拒绝H0图8-3:方差分析的F值拒绝域(五)结论:这5个品种小麦的株高至少有两种间差异极显著。注意:方差分析结论是至少有两个处理不同,各处理两两之间是否有差异还要用第四节的内容分析。例8-1:比较5个小麦品系株高差异(表8-2),方差分析过程简要整理如下解:(1)原假设H0:1=2=3=i;备择假设HA:i至少有一个不相等;(2)方差分析将表8-2中的数据编码,都减去65得到表8-6。计算、先求校正项C,=129.96=277.28-129.96=147.32,=147.32-131.74=15.58dfAa-1=5-1=4;dfe= a(n-1)=5(5-1)=20所以,;(3)检验统计量:(4)拒绝域:拒绝域为F>F,F4,20,0.05=2.87;F4,20,0.01=4.43;F=42.23>F0.01,落在拒绝域内。(5)结论:这5个品种小麦的株高差异极显著。二、期望均方与检验统计量F方差分析的一个基本条件是要求各处理观测值总体的方差相等,即,(i=1,2,a)表示第i个处理观测值总体的方差。如果所分析的资料满足这个方差同质性的要求,那么各处理的样本方差都是2的无偏估计量。是由试验资料中第i个处理的n个观测值算得到的方差。显然,各的合并方差(以各处理内的自由度n-1为权的加权平均数)也是2的无偏估计量,且估计的精确度更高。很容易推证处理内均方MSe就是各的合并。其中SSi、dfi(i=1,2,a)分别表示由试验资料中第i个处理的n个观测值算得的平方和与自由度。这就是说,处理内均方MSe是误差方差2的无偏估计量。试验中各处理所属总体的本质差异体现在处理效应的差异上。我们把称为效应方差,它也反映了各处理观测值总体平均数的变异程度,记为。因为各未知,所以无法求得的确切值,只能通过试验结果中各处理均数的差异去估计。然而,并非的无偏估计量。这是因为处理观测值的平均数间的差异实际上包含了两方面的内容:一是各处理本质上的差异即间的差异,二是抽样误差。统计学证明是的无偏估计量。因而,我们前面所计算的处理间均方MSA实际上是的无偏估计量。所以,固定模型中2为MSe的数学期望,是MSA的数学期望。只有当处理效应的方差=0,亦即各处理观测值总体平均数i(i=1,2,a)相等时,处理间均方MSA与处理内均方MSe一样,也是误差方差2的估计值。因此比较MSA和MSe就可以反映出i的大小。方差分析就是通过MSA与MSe的比值来推断是否为零,亦即i是否相等的。可以证明:E(MSe)=,E(MSA)=E()=在固定模型中,i是个常量,因此0。所以,E(MSA)=令:,E(MSA)=,E(MSe)=检验统计量:当F<F时,则说明MSA与MSe相差不大,产生的变异是由随机误差造成的,等于0,接受零假设;就可以认为各i与0相差不大,或者说各处理平均数i间差异不大。反之,i间差异是显著的。因此用F分布的上尾检验。三、不等重复时平方和和均方的计算前面所讲的例子都是不同处理的重复数相同的。若不同处理的观测数不同,以上方差分析方法仍然可用,只是在计算平方和时,计算公式稍做改动,自由度稍有变化。设第i次处理做了ni次观测,总的观测数不再是an,而是个。计算SST和SSA的公式变为:; 自由度的变化:dfAa-1(不变);dfeN-a例8-2:用方差分析的方法比较4种病人的血糖含量是否有显著差异,实验结果见表8-7。表8-7:4种病人的血清中脱水葡萄糖醇含量调查表(µmol/L)病人编号病人类型正常人糖尿病患者肾衰患者肝病患者182.3130.8249.4190.89254.6756.8332.9671.16368.8032.0142.8382.99480.5747.8557.32577.6684.47方差分析方法参照例1进行整理,本节略!第三节 随机效应模型一、观测值的描述在单因素试验中,若用于试验的a个水平是从该因素的水平总体中随机选出的,那么这一因素称为随机因素。其方差分析是通过随机选取的a个水平对该因素的水平总体做推断。单因素随机效应模型中的每一个观测值的描述与固定模型相同。其中:xij是在第i水平(处理)下的第j次观测值;为所有观测值的总平均数;i是第i水平的处理效应;ij是随机误差。其中i和ij都是随机变量,且二者相互独立。如果i的方差为,观测值的总变异为var(xij),那么var()+。因为i是独立的随机变量,所以固定效应模型中的零假设H0:1=2=i=0在随机效应模型中就不再适用。随机模型的零假设为:H0:;备择假设HA:。二、随机模型的方差分析程序若参加实验的a个水平是从该因素的水平总体中随机选出的,那么这一因素称为随机因素,如动物的窝别。其方差分析是通过随机选取的a个水平对该因素的水平总体做推断。所要检验的是i的变异性。所以,随机效应模型方差分析的检验假设与固定效应模型不同。随机效应得零假设H0:=0;备择假设HA:>0。接受零假设表示处理之间无差异,接受备择假设表示处理之间有显著差异。随机效应模型的方差分析检验程序与固定效应模型的程序完全相同。只是假设和检验所得的结论不同。以表8-5中的数据来介绍一下随机效应模型的方差分析方法。例8-3:调查不同窝别家兔出生重量差异,数据见表8-5。解:(1)假设:零假设H0:=0;备择假设HA:>0(2)将数据进行编码(每一个数据都减去30),列成表8-8,并计算三个均方。先求校正项C,=7.84=185.36-7.84=177.52SSe=SST-SSA=177.52-58.575=118.945dfAa-14-13;dfea(n-1)4×312所以:;,F0.05,3,12=3.490,F<F0.05结论:不同窝别家兔出生重差异不显著表8-8:4窝家兔的出生重的方差分析表(编码后)动物号窝别总和14.73.2-2.92.923.3-4.0-6.71.43-3.8-1.4-2.2-4.341.62.3-3.3-2.05.80.1-15.1-2.0-11.233.640.01228.014.00265.6649.9833.4969.0332.86185.36三、期望均方与检验统计量F随机模型中的总平方和与自由度的分解方法与固定效应相同:SSTSSA+SSe;dfTdfA+dfe可以证明:E(MSe)=,E(MSA)=E()=因为0,令,所以E(MSA)=。固定模型中:E(MSA)=,0;检验统计量:当F<F时,则说明MSA与MSe相差不大,均为2的无偏估计量,产生的变异是由随机误差造成的,等于0。因此接受零假设,认为各处理平均数i间差异不大。反之,i间差异是显著的。所以也用F分布的上尾检验。第四节 多重比较方差分析如果否定了零假设H0,表明试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异。但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。因而,有必要对处理平均数间进行两两比较,以具体判断两两处理平均数间的差异显著性。统计上把多个平均数两两间的相互比较称为多重比较(multiple comparisons)。多重比较的方法甚多,常用的有最小显著差数法(LSD法)和最小显著极差法(LSR法)。 一、最小显著差数法(LSD法,least significant difference)最小显著差数法(LSD法)是统计学家Fisher提出的,是最早用于检验多个平均数两两间差异显著性的方法,其实质是两个平均数的t检验。(一)LSD法的基本原理此法的基本作法是:在F检验显著的前提下,先计算出显著水平为的最小显著差数LSD,然后将任意两个处理平均数的差数的绝对值与其比较。若LSD时,则与在水平上差异显著;反之,则在水平上差异不显著。(二)最小显著差数LSD的计算1、先计算平均数差异标准误(1)当各处理重复数n1n2n时,式中:MSe为F检验中的误差均方;n各处理的重复数。(2)当各处理的重复次数不同时,需先计算各ni的平均数n0:n0,a为处理数。此时,平均数差异标准误:2、LSD的计算:式中:为在F检验中误差自由度下,显著水平为的临界t值。从t分布表中查出和,代入得:;将任意两个处理平均数的差数的绝对值与LSD0.05和LSD0.01比较:小于LSD0.05者,两个处理平均数差异不显著,在差数的右上方标记“ns”,或者不标记符号;介于LSD0.05和LSD0.01之间者,两个处理平均数差异显著,在差数的右上方标记“*”;大于LSD0.01者,两个处理平均数差异极显著,在差数的右上方标记“*”。(三)LSD法进行多重比较的检验程序例8-4:仍以表8-2中的数据为例,比较5个小麦品系株高的差异显著性。方差分析结论是不同品种小麦的株高差异极显著(见例8-1),检验品种间的两两差异。表8-2:5个小麦品系株高调查结果株号品 系164.664.567.871.869.2265.365.366.372.168.2364.864.667.170.069.8466.063.766.869.168.3565.863.968.571.067.5平均值65.364.467.370.868.6解:(1)列出方差分析表,进行F检验。检验方法见第二节例8-1,检验结论差异显著。(2)列出平均数的多重比较表,表中各处理按其平均数从大到小的顺序自上而下、自右而左排列;求两两之差的绝对值。表8-9:5个小麦品系株高调查结果多重比较表(LSD法)处理平均数64.465.367.368.670.86.4*5.5*3.5*2.2*68.64.2*3.3*1.3*67.32.9*2.0*65.30.9ns64.4(3)计算最小显著差数LSD0.05和LSD0.01;例8-1中已知MSe0.78,dfe20,n5。所以:(4)将平均数多重比较表中两两平均数的差数与LSD0.05和LSD0.01比较,作出统计推断,并做出标记符号。差异显著的差数右上方标记“*”; 差异极显著的差数右上方标记“*”。LSD法计算简便,也容易比较,但也有难以克服的缺点,如前所述,这种比较方法会加大犯I型错误的概率。(四)关于LSD 法的应用有以下几点说明1、LSD法实质上就是成组数据t检验。(1)成组数据t检验的回顾检验统计量为: 我们把,表示抽样误差。公式的简化形式为:,这里加上绝对值,用上侧检验。当n1=n2=n时 ,上式可以进一步简化为:当t>t0.05时,差异显著;当t>t0.01时,差异极显著。即当差异显著时:>t此时:(2)LSD法与t检验的区别LSD法将t检验中由所求得t值的绝对值与临界t值的比较,转化为将各对平均数差值的绝对值与最小显著差数的比较

    注意事项

    本文(第8章单因素方差分析.doc)为本站会员(飞****2)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开