第章方差分析实验设计和分析.docx
《第章方差分析实验设计和分析.docx》由会员分享,可在线阅读,更多相关《第章方差分析实验设计和分析.docx(24页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -第 4 章 方差分析( ANOV A)试验设计和分析可编辑资料 - - - 欢迎下载精品名师归纳总结4.1 生态学问题Catherine Potvin可编辑资料 - - - 欢迎下载精品名师归纳总结弄懂生态学问题需要将各种环境因子的影响分开,生态工作者用试验来解决这个问题。 不论在野外仍是在掌握环境条件下,可控试验都可以让生态工作者们只变化一个因子来检验其影响。 例如, 生长箱能使生物体生长在完全相同的温度而不同的光周期的条件下,或相同的光强而不同温度条件下的试验成为可能。在掌握试验中, 通常最期望的情形
2、是环境背景 ,即全部的影响因子, 不是自由的变化,而是精确的得到掌握,这样就能够保证在转变目标变量时,观测的反应不会受到其它因素的影响。因而掌握环境条件, 例如使用生长箱和温室,成为植物生态学的一个常用的方法,犹如动物生态学中使用的生长柜和水族槽一样。本章第一部分,我要讲一下作为试验生态学基本工具的方差分析(ANOV A )。本章重点放在试验设计上。虽然人们一般认为生长箱会供应同一环境条件,但不论在一个生长箱内 仍是生长箱间都存在环境异质性(Lee 和 Rawlings 1982 。 Potvin 等 1990a),因而能够充分处理环境异质性的试验设计将在本章中述及。尽管我的论述主要是以生长箱
3、试验为基础,其原理在其它类型的掌握或野外环境的试验争论中同样适用(第 5,15 和 16 章)。我仍要争论错误试验设计的代价。 本章应视为试验设计的起步点,这个起步点就是要考虑各种影响因素。试验者通常进行的试验比这里绽开的要复杂。但是一旦懂得了基本原理,争论各种试验设计就相对简洁一些。更具体的论述请见Cochran & Cox ( 1957 )和 Winter ( 1991)。4.2 统计问题:环境变化与统计分析正如 Underwood1997 建议的一样, 生态试验设计的第一步是建立一个线性模型使争论者能够将感爱好的变量(因素)独立出来。由于试验设计支配误差项,建立线性模型取决于所争论的因子
4、以及具体的试验设计。在任何一个试验开头时,最基本的是要检验空间与时间变化的格局。 试验设计为处理这类无其它方法可掌握的变异性供应了方法。因而, 一个好的试验设计会削减试验误差。检验不同的试验设计有助于挑选合适的设计。并且将与各种变化来源有关的自由度清晰的分开。因而挑选正确的试验设计对防止类似假重复和相互干扰的问题来说至关重要Hurlbert 1984 。本章所争论的内容要求读者对方差分析(ANOV A )有肯定可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 1 页,共 12 页 - - - - - - - - - -可编辑资料 -
5、- - 欢迎下载精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -的基础学问, 从而我可以争论一些方差分析中不太常见的方面。方差分析统计处理的细节可见 Sealer(1971)。方差分析( ANOV A )使用抽样数据来检验关于总体的假设。基于特定线性模型的方差分析将方差安排到各影响因子(通常是处理) 。一个因子可以划分成任意数目的等级( Sealer 1971)。线性模型中描述数据的参数可由一些技术如最小二乘法或最大似然值等方法来估量。传统上用于ANOV A 的最小二乘法估量值将观测数据与期望数据离差的平方和最小化(Sealer 1971)。在最小二乘
6、法分析中,假如数据组是平稳的(即每一分析组cell 观测数相 等),就离差平方总和能很简洁被分解为试验设计中各因子所分别奉献的平方和(SS)。离 差,作为余值就是观测值与均值之差。这种结果是具最小方差的无偏估量值,这是估量值的 上佳性质( Winter 等 1991)。均方( MS )是每自由度的平均变异,由平方和除以自由度 ( SS/df)得出。在此意义上, 均方和统计方差等价。每一个运算出来的均方都有一个相对应的期望值,表 4.1 表示一个均方的期望值是方差成分的线性组合。在 ANOVA中假设检验所依靠的统计量 F,由两个均方的比值得出。因而,探测爱好所在因子的影响概率依靠于正确使用误差项
7、。表 4.1 二因子方差分析(ANOV A) * 的期望均值平方与F-比值影响期望均方F-比值A2nba2可编辑资料 - - - 欢迎下载精品名师归纳总结Aiea1 i 1MS A /MS e可编辑资料 - - - 欢迎下载精品名师归纳总结2nab2可编辑资料 - - - 欢迎下载精品名师归纳总结BjABijbee2na1b1 j 1abi1j112MS B /MA eMS AB /MS e可编辑资料 - - - 欢迎下载精品名师归纳总结2余值(误差)e可编辑资料 - - - 欢迎下载精品名师归纳总结Bnnb222AiMS A /MS AB可编辑资料 - - - 欢迎下载精品名师归纳总结eAB
8、A可编辑资料 - - - 欢迎下载精品名师归纳总结Bj2n2na2MS B /MS AB可编辑资料 - - - 欢迎下载精品名师归纳总结eABB2n2可编辑资料 - - - 欢迎下载精品名师归纳总结ABijeABMS AB /MS e可编辑资料 - - - 欢迎下载精品名师归纳总结2余值(误差)e*A )固定影响分析模型,B )随机影响分析模型可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 2 页,共 12 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结资料word 精心总结归纳 - -
9、- - - - - - - - - -误差项的重要性可由下例说明:ANOV A 的基本理论承认两类影响:随机影响与固定影响有本质上的区分。我们可将一个随机因子的水平视为从一个大的确定的集合随机抽取的,而固定因子的水平就是由试验者特意选取的。从生物学上而言,影响是固定的仍是随机的在进行推论上是重要的。假如影响被认为是固定的,其争论结果就不能推广到争论水平以外。由于所检验因子的水平是特意挑选的。假如要将一个处理因子推广到其它水平,该因子的影响就肯定要被认定为是随机的。增加大气中CO 2 浓度的争论为固定因子影响供应了一个清楚的例子。争论者通常比较当前CO2 水平( 350ml/l )的影响与猜测的
10、21 世纪中期的倍增浓度( 650ml/l )的影响(争论者通常将当前CO 2 水平( 350ml/l )与猜测的21 世纪中期的倍增浓度( 650ml/l )的影响进行比较) 。在这些试验中,人们并不妄想将结果扩展到其它的CO2 浓度。然而,假如试验着重于Arabidopsis (拟南芥属)各种基因型对上升的CO2 浓度的反应,最可能的是这些基因型从代表Arabidopsis 各种基因型的种群随机选出,所以基因型影响应是随机的且试验的结果可以扩展到整个Arabidopsis 的各种基因型。当数据组是平稳的,即该数据组的每一分析组均具有相同的样本大小,不论因子是固定的仍是随机的,其平方和与均方
11、的运算均是一样的(Harr 1986 )。但是均方的期望值是不 同的,这一点特别重要,由于F 比值是由均方期望值打算的。最简洁的例子就是由表4.1 所表示的双因子方差分析模式。在附录 4.1 中,我们给出了方差分析的SAS( SAS 争论所,1989a b)运算机程序。在固定模型中,每一因子的均方期望值是误差方差与该因子的恒常影响之和。因此,用于运算F 值分母的合适均方总是误差均方。在随机模型中,对每一主要影响 均方的期望值是误差方差、相互作用方差以及检验因子影响方差之和。因此, 对主要因子的F-检验要用相互作用均方为分母,而相互作用影响就要用误差方差为分母来检验。在三相(three-way
12、)(或更高)随机, 混合 或固定阶乘 Factorial 模型中,作为F-检验用于分母的经常是一些均方值的组合( Winter等 1991)。由于人们常用的统计软件一般默认用误差方差来衡量全部因子,我在这里要强调均方期望值在确定适当的显著性检验所起的重要作用。不管是否合适, 软件的默认配置仅对固定模型有效。本章剩下各节将展现一些不同的试验设计并给出适当的误差项,我将着重争论挑选错误的误差项所能导致的分析偏差。4.3 统计方法:设计试验数据分析取决于试验设计本身以及如何将各感爱好因子的各水平安排到各试验单元。一般来说, 试验误差越小, 设计就越有效。 设计试验仍涉及到挑选的样本大小以及试验在时可
13、编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 3 页,共 12 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -间、空间上的设置。 大量不同的标准试验设计已经存在,每一种都跟着一个数学模型和分析方法。这里,我只讲两种这类设计, 以及它们各自如何对特定变异格局进行处理。这些设计在生态试验中很典型。处理各种特定问题的其它设计请见Cochran 和 Cox ( 1957), Winter等( 1991)以及 Underwoo
14、d ( 1997 )。在掌握试验中,不同试验单元接受不同水平的处理因子。由此假定试验单元间的差别代表这些因子水平的区分(Hurlbert 1984 )。在不同试验单元上随机安排因子水平和处理重复是一个良好试验设计的基本保证。罗纳德.费舍尔爵士( 1935)就是随机化的坚决鼓吹者。他令人信服的指出随机化是对抗变异来源纷乱的保证。假定我们要比较三种植物的光合作用,且取样支配在早10 点到下午4 点的 3 个两小时时间段内。一个好的设计会随机的将各物种安排到每一取样日的不同时间段内。错误的设计会系统的把种A 放在上午量测,种B放在中午而种C 放在下午量测。这样,各种光合作用率就会与每日取样时间相干扰
15、,而统计检验推论无法告之导致光合速率不同的缘由是由于物种不同了,仍是由于取样时间的不 同。好的试验设计的其次个基本保证是重复。费舍尔(1971 指出,重复有两种目的:“在不同样的重复试验处理在于它是一种提高试验比较精度的方法,其主要的目的是供应误差的估量 ,这是其它方法无法替代的,这种误差估量是用于确定比较显著性所依靠的。” Hurlbert(1984 )引入“假重复” 一词并定义为 “使用推论统计时利用试验数据来检验处理因子影响, 而试验中处理没有重复或重复在统计上不独立。” Hurlbert 文章的核心强调试验布局的假重复。然而, 通常发生的是试验布局很合适而在数据分析上出问题,由于争论者
16、无法判定实际的试验单元或重复,因而使用不合适的误差项。4.3.1 区组将相像试验单元组成区组能调剂环境异质性并提高统计效力。与随机主见一样(Fisher 1971),处理因子的每一水平都要在每一区组内随机安排给不同的试验单元。在随机区组设计中,试验单元安排到各环境相对恒定的区组中。区组内各试验单元的差异供应了对处理影响的量测, 而区组的重复供应处理的重复。这种设计使我们能够将随机离差安排处处理因子项,试验误差项以及不期望的环境(区组)影响项。最终试验误差项会比较小,从而该设计 比完全随机设计更有效。在传统随机区组设计中,处理因子的每一水平随机安排给每一区组中的每个重复项。每一区组内的试验单元数
17、因而与争论的因子水平数相等。这种设计因此可视为ANOV A 的一可编辑资料 - - - 欢迎下载精品名师归纳总结学习资料 名师精选 - - - - - - - - - -第 4 页,共 12 页 - - - - - - - - - -可编辑资料 - - - 欢迎下载精品名师归纳总结资料word 精心总结归纳 - - - - - - - - - - - -种特殊形式区组内无重复。从而其模型不包括相互作用项。随机区组设计可由下面的线性可编辑资料 - - - 欢迎下载精品名师归纳总结模型描述:xijkiiijk( 4.1)可编辑资料 - - - 欢迎下载精品名师归纳总结可编辑资料 - - - 欢迎下
18、载精品名师归纳总结式中 xijk是处理 i 水平下的第j 试验单元的反应,是该反应的总体均值,i 是处理 i 水可编辑资料 - - - 欢迎下载精品名师归纳总结平的影响,j 是 j 区组的影响,ijk是随机方差或误差。对此设计的SAS 程序在附录4.2中给出。 留意均方误差项与区组和处理相互作用项一样( Sokal 和 Rohlf1995 ,pp328,347)。可编辑资料 - - - 欢迎下载精品名师归纳总结随机区组设计的期望误差均方(22SSeAB )与二因子ANOV A 的相互作用均方期望值相对可编辑资料 - - - 欢迎下载精品名师归纳总结应。类似的完全随机设计可描述为:可编辑资料 -
19、 - - 欢迎下载精品名师归纳总结xijkiijk4.2可编辑资料 - - - 欢迎下载精品名师归纳总结对比公式4.1 和 4.2 进一步展现出假如区组设置合理而且各区组有不同的环境条件时,i 项就会由于环境异质性从误差项中移出。其结果是: 误差项将减小, 使得随机区组设计比完全 随机设计更简洁检验出显著的处理影响。传统模型,即公式4.1,无疑假定处理与区组间相互作用不存在。Underwood (1997)和 Newman 等( 1997)都批判在野外试验中有此假定。他们争论说相互作用的存在会使得对处理影响的检验无效。这种争论并不新奇,Kempthorne( 1975)说当相互作用存在时,关于
20、主要因子的总体陈述将没有多大意义。然而,正如Sokal 和 Rohlf ( 1995,p336 )在很多例子中清晰阐明的一样,尽管存在相互作用,对主因子影响的总体显著性的检验可能是重要 的。这就值得我们复习一下Sheff (1959 )来弄清晰。作者认为,一个没有相互作用的案例 是个能够简洁说明的可加性案例:不管因子B 的影响,因子A 将同等的影响全部观测值。然而,假如相互作用的因子存在,因子A 的影响将随因子B 的变化而变。在受控环境下, 区组常由发芽盘、塑料容器等组成,区组与处理间无相互作用的假定大体成立。在其它情形下,如野外操作试验中,处理与区组的相互作用是明显的。但是,正如Sheff
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第章方差分析实验设计和分析 方差分析 实验设计 分析
限制150内