第八九章方差分析优秀PPT.ppt
《第八九章方差分析优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第八九章方差分析优秀PPT.ppt(128页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第八九章方差分析第一页,本课件共有128页第一节第一节 单因素方差分析单因素方差分析(one-factoranalysisofvariance)一、一、一般概念及两种不同的处理效应一般概念及两种不同的处理效应方差分析方差分析是一类特定情况下的统计假设是一类特定情况下的统计假设检验,或者说是平均数差异显著性检验的一检验,或者说是平均数差异显著性检验的一种引伸。种引伸。t 检验可以判断两组数据平均数的检验可以判断两组数据平均数的差异的显著性,差异的显著性,而方差分析则可以同时判断而方差分析则可以同时判断多组数据平均数之间的差异的显著性。当然,多组数据平均数之间的差异的显著性。当然,在多组数据的平均
2、数之间做比较时,可以在平在多组数据的平均数之间做比较时,可以在平均数的所有对之间做均数的所有对之间做 t 检验。但这样做会提高检验。但这样做会提高犯犯型错误的概率,因而是不可取的。型错误的概率,因而是不可取的。第二页,本课件共有128页例例如如,我我们们打打算算用用一一对对一一对对地地比比较较的的方方法法检检验验5个个平平均均数数之之间间的的相相等等性性,共共需需检检验验C2510对对。假假设设每每一一对对检检验验接接受受零零假假设设的的概概率率都都是是10.95,而而且且这这些些检检验验都都是是独独立立的的,那那么么10对对都都接接受受的的概概率率是是(0.95)100.60。10.600.
3、40,犯犯型型错错误误的的概概率率明明显显增增加加。用用方方差差分分析析的的方方法法做做检检验验可可以以防防止止上上述述问问题题的的出出现现。方方差差分分析析的的内内容容很很广广泛泛,上上面面讲讲到到的的那那种种情情况况是是方方差差分分析析中中最最简简单单的的情情况况,称称为为单单因因素素方方差差分分析析或或者者称称为为一一种种方方式式分分组组的的方方差差分分析析(one-way classificationanalysisofvariance)。第三页,本课件共有128页例例2.1调调查查了了5个个不不同同小小麦麦品品系系的的株株高高,结结果列于表果列于表21。在这个例子中,只出现在这个例子
4、中,只出现“品系品系”这样一个这样一个因素因素(factor),故称单因素。共有,故称单因素。共有5个不同的品系,个不同的品系,我们称品系这一因素共有我们称品系这一因素共有5个水平个水平(level)。5个品系个品系可以认为是可以认为是5个总体,表个总体,表24的数据是从的数据是从5个总体个总体中抽出的中抽出的5个样本,通过比较这个样本,通过比较这5个样本,判断这个样本,判断这5个个总体是否存在差异。总体是否存在差异。表表215个小麦品系株高调查结果个小麦品系株高调查结果株号株号株株 高高12345和和64.665.364.866.065.8326.564.565.364.663.763.93
5、22.076.866.367.166.868.5336.571.872.170.069.171.0354.069.268.269.868.367.5343.0平均数平均数65.364.467.370.868.6第四页,本课件共有128页例例2.2为了探讨不同窝的动物的出生重是否存在差异,为了探讨不同窝的动物的出生重是否存在差异,随机选取随机选取4窝动物,每窝中均有窝动物,每窝中均有4只幼仔,结果如下:只幼仔,结果如下:表表224窝动物的出生重(克)窝动物的出生重(克)动物号动物号窝窝别别1234和和34.733.326.231.6125.833.226.028.632.3120.127.123
6、.327.826.7104.932.931.425.728.0118.0平均数平均数31.45030.02526.22529.500通过对以上数据的分析,判断不同窝别动物出生通过对以上数据的分析,判断不同窝别动物出生重是否存在差异。重是否存在差异。第五页,本课件共有128页以上两个例子的共同点是:每个实验都只有一个因素,以上两个例子的共同点是:每个实验都只有一个因素,该因素有该因素有a个水平或称为有个水平或称为有a个处理个处理(treatment),这样的,这样的实验称为单因素实验。实验称为单因素实验。从单因素实验的每一处理所得到从单因素实验的每一处理所得到的结果都是一随机变量的结果都是一随机
7、变量X i。对于。对于a个处理,各重复个处理,各重复n次次(或者说做(或者说做n次观察)的单因素方差分析的一般化表示次观察)的单因素方差分析的一般化表示方法见表方法见表23。表表23单因素方差分析的典型数据单因素方差分析的典型数据X1X2X3 X i X a 123:j nx11 x12x13:x1j:x1nx21 x22x23:x2j:x2nx31 xi1 xa1x32 xi2 xa2x33 xi3 xa3:x3j xij xaj:x3n xin xan平均数平均数x1 x2 x3 xi xa 第六页,本课件共有128页表表中中的的数数据据xij,表表示示第第i 次次处处理理下下的的第第j次
8、次观观察值。其中的察值。其中的n个符号做如下说明:个符号做如下说明:用用“”表示下标的和,使用时很方便,在表示下标的和,使用时很方便,在以后会经常遇到。以后会经常遇到。第七页,本课件共有128页单因素方差分析的基本原理核心思想第八页,本课件共有128页单因素方差分析的基本原理单因素方差分析的基本原理 单因素方差分析是研究一个因素的变化对试验指标的影响单因素方差分析是研究一个因素的变化对试验指标的影响是否显著的统计分析方法。是否显著的统计分析方法。设因素设因素A有有r个水平个水平 在水平在水平 下下进行进行 次独立试验,试验记录如表次独立试验,试验记录如表9-2 表表 9-2 独立试验记录表独立
9、试验记录表 样本水平第九页,本课件共有128页 其中其中 表示第表示第i水平水平 进行第进行第j次试验的可能结果。次试验的可能结果。假设,假设,。待检假设为:。待检假设为:不全相等。不全相等。如果如果 成立,那么成立,那么r个总体间无显著差异,即是说因素个总体间无显著差异,即是说因素A对试对试验结果的影响不显著,所有验结果的影响不显著,所有 可视为来自同一个总体可视为来自同一个总体 ,各各 间的差异只是由随机因素引起的。若间的差异只是由随机因素引起的。若 不成立,则在不成立,则在 所有的所有的总变差中,除随机波动引起的变差外,还应包括由于因素总变差中,除随机波动引起的变差外,还应包括由于因素A
10、的不同的不同水平作用产生的差异。如果不同水平作用产生的差异比随机因素引水平作用产生的差异。如果不同水平作用产生的差异比随机因素引起的差异大得多,就认为因素起的差异大得多,就认为因素A对试验结果有显著影响,否则就认对试验结果有显著影响,否则就认为因素为因素A对试验的影响不显著。为此可在总变差中先将这两种差异对试验的影响不显著。为此可在总变差中先将这两种差异分开,然后进行比较。分开,然后进行比较。第十页,本课件共有128页记记 (9-1)称称 为第为第i组的样本均值,组的样本均值,为样本总均值。再记为样本总均值。再记 (9-2)称为总离差平方和。我们将称为总离差平方和。我们将 分解如下:分解如下:
11、(9-3)其中,其中,(9-4)第十一页,本课件共有128页 是组间平方和,反映了不同水平作用产生的差异大是组间平方和,反映了不同水平作用产生的差异大小;小;是组内平方和,反映的是水平内部,或组内观测是组内平方和,反映的是水平内部,或组内观测值的离散状况,它实质上是随机因素带来的影响。值的离散状况,它实质上是随机因素带来的影响。在在 成立的条件下,由抽样分布定理,我们可以得到:成立的条件下,由抽样分布定理,我们可以得到:(9-5)且且 与与 独立独立 第十二页,本课件共有128页 若组间差异比组内差异大得多,则说明因素的不同水平间有显若组间差异比组内差异大得多,则说明因素的不同水平间有显著差异
12、,应拒绝著差异,应拒绝 。否则,说明因素各水平之间的差异不显著,。否则,说明因素各水平之间的差异不显著,可接受可接受 。为此,选取统计量。为此,选取统计量 (9-6)当当 为真时,由为真时,由F分布的定义知,统计量分布的定义知,统计量 (9-7)如果因素如果因素A的各水平对总体的影响由显著差异,那么的各水平对总体的影响由显著差异,那么 相对较相对较大,因而大,因而F也较大。由此可见,对于给定的显著性水平也较大。由此可见,对于给定的显著性水平 ,拒绝域,拒绝域为为 (9-8)第十三页,本课件共有128页 计算结果列成表,称为方差分析表(见表计算结果列成表,称为方差分析表(见表93)。)。表表 9
13、-3 单因素方差分析表单因素方差分析表 方差来源方差来源平方和平方和自由度自由度F F值值F F的临界值的临界值组组 间间r-1r-1组组 内内n-rn-r总总 和和n-1n-1第十四页,本课件共有128页常用如下的所谓常用如下的所谓线性统计模型线性统计模型(linearstatisticalmodel)描述每一个观察值:描述每一个观察值:其其中中:xij 是是在在第第i水水平平(处处理理)下下的的第第 j次次观观察察值值。是是对对所所有有观观察察值值的的一一个个参参量量,称称为为总总平平均均数数(overallmean)。i是是仅仅限限于于对对第第 i次次处处理理的的一一个个参参量量,称称为
14、为第第i次次处处理理效效应应(treatmenteffect)。方方差差分分析析的的目目的的,就就是是要要检检验验处处理理效效应应的大小或有无。的大小或有无。e eij是随机误差成份。是随机误差成份。第十五页,本课件共有128页上述模型中,包括两类不同的处理效应。第一上述模型中,包括两类不同的处理效应。第一类处理效应称为类处理效应称为固定效应固定效应(fixedeffect),它是由,它是由固定固定因素因素(fixedfactor)所引起的效应。若因素的所引起的效应。若因素的a个水个水平是经过特意选择的,则该因素称为固定因素。平是经过特意选择的,则该因素称为固定因素。例如,几个不同的实验温度,
15、几个不同的化学药例如,几个不同的实验温度,几个不同的化学药物或一种药物的几种不同浓度,几个作物品种以物或一种药物的几种不同浓度,几个作物品种以及几个不同的治疗方案和治疗效果等。及几个不同的治疗方案和治疗效果等。第十六页,本课件共有128页在这些情况中,因素的水平是特意选择的,所检在这些情况中,因素的水平是特意选择的,所检验的是关于验的是关于ai 的假设,得到的结论只适合与方差分析中的假设,得到的结论只适合与方差分析中所考虑的那几个水平,并不能将其结论扩展到未加考虑所考虑的那几个水平,并不能将其结论扩展到未加考虑的其它类似水平上。所以上述的那些因素:温度、药物、的其它类似水平上。所以上述的那些因
16、素:温度、药物、品种等,称为固定因素。处理这样的因素所用的模型称品种等,称为固定因素。处理这样的因素所用的模型称为为固定效应模型固定效应模型(fixedeffectmodel)。例)。例2.1中的中的5个小麦品系是特意选择的,目的是从这个小麦品系是特意选择的,目的是从这5个品系中,选出个品系中,选出最优者,因而最优者,因而“品系品系”这个因素属于固定因素,所用这个因素属于固定因素,所用的模型是固定效应模型。的模型是固定效应模型。第十七页,本课件共有128页第二类处理效应称为第二类处理效应称为随机效应随机效应(ran-domeffect),它是由它是由随机因素随机因素(randomfactor)
17、所引起的效应。若因素)所引起的效应。若因素的的a个水平,是从该因素全部水平的总体中随机抽出的样本,个水平,是从该因素全部水平的总体中随机抽出的样本,则该因素称为随机因素。从随机因素的则该因素称为随机因素。从随机因素的a个水平所得到的结个水平所得到的结论,可以推广到这个因素的所有水平上。处理随机因素所用论,可以推广到这个因素的所有水平上。处理随机因素所用的模型称为的模型称为随机效应模型随机效应模型(randomeffectmo-del)。例)。例2.2的动物窝别,是从动物所有可能的窝别中随机选出来的,的动物窝别,是从动物所有可能的窝别中随机选出来的,实验的目的是考查在窝别之间,出生重是否存在差异
18、,因而实验的目的是考查在窝别之间,出生重是否存在差异,因而“窝别窝别”是随机因素。是随机因素。第十八页,本课件共有128页有时固定因素和随机因素很难区分,除上述有时固定因素和随机因素很难区分,除上述所讲的原则外,还可以从另一角度鉴别。所讲的原则外,还可以从另一角度鉴别。固定固定因素因素是指因素水平,可以严格地人为控制是指因素水平,可以严格地人为控制。在水平固定之后,它的效应值也是固定的。例如,在水平固定之后,它的效应值也是固定的。例如,研究三种温度对胰蛋白酶水解产物的影响。因为温研究三种温度对胰蛋白酶水解产物的影响。因为温度水平是可以严格控制的,即每一温度水平,在各度水平是可以严格控制的,即每
19、一温度水平,在各个重复之间都可以准确地控制在一个固定值上,所个重复之间都可以准确地控制在一个固定值上,所以在重复该实验时,水解产物的产量也是固定的。以在重复该实验时,水解产物的产量也是固定的。简单地说,在水平(不同温度)固定以后,其效应简单地说,在水平(不同温度)固定以后,其效应值(产量)也是固定的。因此,温度是固定因素。值(产量)也是固定的。因此,温度是固定因素。第十九页,本课件共有128页随机因素随机因素的水平的水平是不能严格地人为控制的是不能严格地人为控制的,在水平确,在水平确定之后,它的效应值并不固定。例如,在研究不同农家肥施用定之后,它的效应值并不固定。例如,在研究不同农家肥施用量对
20、作物产量的影响试验中,农家肥是因素,不同施用量是该量对作物产量的影响试验中,农家肥是因素,不同施用量是该因素的不同水平,作物的产量是它的效应值。由于农家肥的有因素的不同水平,作物的产量是它的效应值。由于农家肥的有效成份很复杂,不能像控制温度那样,将农家肥的有效成份严效成份很复杂,不能像控制温度那样,将农家肥的有效成份严格地控制在某一个固定值上。在重复试验时即使施以相同数量格地控制在某一个固定值上。在重复试验时即使施以相同数量的肥料,也得不到一个固定的效应值。即在因素的水平(施肥的肥料,也得不到一个固定的效应值。即在因素的水平(施肥量)固定之后,它的效应值(产量)并不固定,因而农家肥是量)固定之
21、后,它的效应值(产量)并不固定,因而农家肥是一随机因素。一随机因素。第二十页,本课件共有128页二、二、固定效应模型固定效应模型在固定效应模型中,在固定效应模型中,a ai 是处理平均数与总是处理平均数与总平均数的离差,且是个常量,因而平均数的离差,且是个常量,因而 要检验要检验a个处理效应的相等性,就要个处理效应的相等性,就要a ai 判断各判断各是否等于是否等于0。若各。若各a ai 都等于都等于0,则各处理效应之间,则各处理效应之间无差异。因此,零假设为:无差异。因此,零假设为:备备择择假假设设为为:HA:a ai0(至至少少有有1个个i)。若若接接受受H0,则则不不存存在在处处理理效效
22、应应,每每个个观观察察值值都都是是由由平平均均数数加加上上随随机机误误差差所所构构成成。若若拒拒绝绝H0,则则存存在在处处理理效效应应,每每个个观观察察值值是是由由总总平平均均数数、处处理理效效应应和和误误差三部分构成。差三部分构成。第二十一页,本课件共有128页方差分析的基本思想方差分析的基本思想,就是将总的变差分,就是将总的变差分解为构成总变差的各个部分。对单因素实验,解为构成总变差的各个部分。对单因素实验,可以将总平方和(可以将总平方和(totalsumofsqua-res)做如)做如下分解:下分解:对于每个固定的对于每个固定的xi,第二十二页,本课件共有128页因此,因此,(23)式式
23、表表示示度度量量全全部部数数据据变变差差的的总总平平方方和和,可可以以分分解解为为处处理理平平均均数数与与总总平平均均数数之之间间离离差差的的平平方方和和,处处理理内内部部观观察察值值与与处处理理平平均均数数之之间间离离差差的的平平方方和和两两部部分分。处处理理平平均均数数与与总总平平均均数数之之间间的的离离差差,度度量量了了处处理理之之间间的的差差异异;而而处处理理内内部部观观察察值值与与处处理理平平均均数数之之间间的的离离差差,度度量量了了随随机误差的大小。机误差的大小。第二十三页,本课件共有128页用用SST表示表示总平方和总平方和,用用SSA表表示示(23)等等号号右右边边第第一一项项
24、,称称为为处处理理平平方方和和(treatmentssumofsquares)或或称称为为处处理理间间平方和平方和(sumofsquaresbetweentreatments)。)。第二十四页,本课件共有128页用用SSe表示(表示(23)等号右边第二项,称为)等号右边第二项,称为误差平误差平方和方和(errorsumofsquares)或称为)或称为处理内平处理内平方和方和(sumofsquareswithintreatments)。因此:)。因此:自自由由度度可可以以做做同同样样的的分分割割:SST具具an1自自由由度度dfTan1;A因因素素工工有有a水水平平,因因而而SSA有有a1自自
25、由由度度dfAa1;SSe有有ana自自由由度度,这这是是因因为为每每一一处处理理均均有有n1自自由由度度,共共有有a个个处处理理,因因而而SS e的的自自由由度度为为ana,dfeana。为为了了估估计计s s2,用用SS e除以相应的自由度除以相应的自由度第二十五页,本课件共有128页 MS e称为称为误差均方误差均方(errormeansquare)。)。用类似的方法,可以求出处理均方用类似的方法,可以求出处理均方MSA(treatmentsmeansquare)用用MSA与与MS e比较,就可以反映出比较,就可以反映出a i的大小。的大小。若若MSA与与MS e相差不大,就可以认为各相
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 方差分析 优秀 PPT
限制150内