《第10章_方差分析与试验设计优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第10章_方差分析与试验设计优秀PPT.ppt(101页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第1010章章_ _方差分析与方差分析与试验设计试验设计现在学习的是第1页,共101页10.1 方差分析的引论方差分析的引论 10.2 单因素方差分析单因素方差分析10.3 方差分析中的多重比较方差分析中的多重比较10.4 双因素方差分析双因素方差分析10.5 试验设计初步试验设计初步第第 10 章章 方差分析与试验设计方差分析与试验设计现在学习的是第2页,共101页学习目标学习目标1.解释方差分析的概念解释方差分析的概念2.解释方差分析的基本思想和原理解释方差分析的基本思想和原理3.掌握单因素方差分析的方法及应用掌握单因素方差分析的方法及应用4.理解多重比较的意义理解多重比较的意义5.掌握
2、双因素方差分析的方法及应用掌握双因素方差分析的方法及应用6.掌握试验设计的基本原理和方法掌握试验设计的基本原理和方法现在学习的是第3页,共101页10.1 方差分析引论方差分析引论一一.方差分析及其有关术语方差分析及其有关术语二二.方差分析的基本思想和原理方差分析的基本思想和原理三三.方差分析的基本假定方差分析的基本假定四四.问题的一般提法问题的一般提法现在学习的是第4页,共101页方差分析及其有关术语方差分析及其有关术语现在学习的是第5页,共101页什么是方差分析什么是方差分析(ANOVA)?(analysis of variance)1.检验多个总体均值是否相等通过分析察数据的误差判断各总
3、体均值是否相等通过分析察数据的误差判断各总体均值是否相等2.研究分类型自变量对数值型因变量的影响 n n一个或多个分类尺度的自变量一个或多个分类尺度的自变量l l2 2个或多个个或多个 (k k 个个)处理水平或分类处理水平或分类n n一个间隔或比率尺度的因变量一个间隔或比率尺度的因变量3.有单因素方差分析和双因素方差分析n n单因素方差分析:涉及一个分类的自变量单因素方差分析:涉及一个分类的自变量n n双因素方差分析:涉及两个分类的自变量双因素方差分析:涉及两个分类的自变量现在学习的是第6页,共101页什么是方差分析什么是方差分析?(例题分析例题分析)消费者对四个行业的投诉次数消费者对四个行
4、业的投诉次数 行业观测值零售业旅游业航空公司家电制造业12345675766494034534468392945565131492134404451657758【例例例例】为了对几个行业的服务质量进行评价,消费者协会在四个为了对几个行业的服务质量进行评价,消费者协会在四个行业分别抽取了不同的企业作为样本。最近一年中消费者对总共行业分别抽取了不同的企业作为样本。最近一年中消费者对总共2323家企业投诉的次数如下表家企业投诉的次数如下表现在学习的是第7页,共101页什么是方差分析什么是方差分析?(例题分析例题分析)1.分析四个行业之间的服务质量是否有显著差异,也就是要判断“行业”对“投诉次数”是否
5、有显著影响2.作出这种判断最终被归结为检验这四个行业被投诉次数的均值是否相等3.如果它们的均值相等,就意味着“行业”对投诉次数是没有影响的,即它们之间的服务质量没有显著差异;如果均值不全相等,则意味着“行业”对投诉次数是有影响的,它们之间的服务质量有显著差异现在学习的是第8页,共101页方差分析中的有关术语方差分析中的有关术语1.因素或因子(factor)所要检验的对象所要检验的对象要要分分析析行行业业对对投投诉诉次次数数是是否否有有影影响响,行行行行业业业业是是要要检检验验的的因素或因子因素或因子2.水平或处理(treatment)因子的不同表现因子的不同表现零零售售业业、旅旅游游业业、航航
6、空空公公司司、家家电电制制造造业业就就是是因因子子的的水平水平3.观察值在每个因素水平下得到的样本值在每个因素水平下得到的样本值每个行业被投诉的次数就是观察值每个行业被投诉的次数就是观察值现在学习的是第9页,共101页方差分析中的有关术语方差分析中的有关术语1.试验这里只涉及一个因素,因此称为单因素四水平的试验这里只涉及一个因素,因此称为单因素四水平的试验2.总体因素的每一个水平可以看作是一个总体因素的每一个水平可以看作是一个总体比比如如零零售售业业、旅旅游游业业、航航空空公公司司、家家电电制制造造业业可可以以看看作作是四个总体是四个总体3.样本数据被投诉次数可以看作是从这四个总体中抽取的样本
7、数据被投诉次数可以看作是从这四个总体中抽取的样本数据现在学习的是第10页,共101页方差分析的基本思想和原理方差分析的基本思想和原理现在学习的是第11页,共101页方差分析的基本思想和原理方差分析的基本思想和原理(图形分析图形分析)零售业 旅游业 航空公司 家电制造现在学习的是第12页,共101页1.1.从从散点图上可以看出n n不同行业被投诉的次数是有明显差异的不同行业被投诉的次数是有明显差异的n n即即使是在同一个行业,不同企业被投诉的次数也明显不同使是在同一个行业,不同企业被投诉的次数也明显不同l l家电制造也被投诉的次数较高,航空公司被投诉的次数较低家电制造也被投诉的次数较高,航空公司
8、被投诉的次数较低2.2.行行业与被投诉次数之间有一定的关系n n如如果果行行业业与与被被投投诉诉次次数数之之间间没没有有关关系系,那那么么它它们们被被投投诉诉的的次次数数应应该该差差不不多多相相同同,在在散散点点图图上上所所呈呈现现的的模模式式也就应该很接近也就应该很接近方差分析的基本思想和原理方差分析的基本思想和原理(图形分析图形分析)现在学习的是第13页,共101页1.1.仅仅从从散散点点图图上上观观察察还还不不能能提提供供充充分分的的证证据据证证明明不不同同行行业业被投诉的次数之间有显著差异被投诉的次数之间有显著差异n n这种差异也可能是由于抽样的随机性所造成的这种差异也可能是由于抽样的
9、随机性所造成的2.2.需需要要有有更更准准确确的的方方法法来来检检验验这这种种差差异异是是否否显显著著,也也就就是进行方差分析是进行方差分析n n所所以以叫叫方方差差分分析析,因因为为虽虽然然我我们们感感兴兴趣趣的的是是均均值值,但但在判断均值之间是否有差异时则需要借助于方差在判断均值之间是否有差异时则需要借助于方差n n这这个个名名字字也也表表示示:它它是是通通过过对对数数据据误误差差来来源源的的分分析析判判断断不不同同总总体体的的均均值值是是否否相相等等。因因此此,进进行行方方差差分分析析时时,需需要考察数据误差的来源。要考察数据误差的来源。方差分析的基本思想和原理方差分析的基本思想和原理
10、现在学习的是第14页,共101页1.比较两类误差,以检验均值是否相等2.比较的基础是方差比3.如果系统(处理)误差显著地不同于随机误差,则均值就是不相等的;反之,均值就是相等的4.误差是由各部分的误差占总误差的比例来测度的方差分析的基本思想和原理方差分析的基本思想和原理现在学习的是第15页,共101页方差分析的基本思想和原理方差分析的基本思想和原理(两类误差两类误差)1.随机误差随机误差因素的同一水平因素的同一水平(总体总体)下,样本各观察值之间的差异下,样本各观察值之间的差异比如,同一行业下不同企业被投诉次数是不同的比如,同一行业下不同企业被投诉次数是不同的这种差异可以看成是随机因素的影响,
11、称为这种差异可以看成是随机因素的影响,称为随机误差随机误差随机误差随机误差 2.系统误差系统误差因素的不同水平因素的不同水平(不同总体不同总体)下,各观察值之间的差异下,各观察值之间的差异比如,不同行业之间的被投诉次数之间的差异比如,不同行业之间的被投诉次数之间的差异这这种种差差异异可可能能是是由由于于抽抽样样的的随随机机性性所所造造成成的的,也也可可能能是是由由于于行行业业本本身身所所造造成成的的,后后者者所所形形成成的的误误差差是是由由系系统性因素造成的,称为统性因素造成的,称为系统误差系统误差系统误差系统误差现在学习的是第16页,共101页方差分析的基本思想和原理方差分析的基本思想和原理
12、(两类方差两类方差)1.数据的误差用平方和(sum of squares)表示,称为方差2.组内方差(within groups)因素的同一水平因素的同一水平(同一个总体同一个总体)下样本数据的方差下样本数据的方差比如,零售业被投诉次数的方差比如,零售业被投诉次数的方差组内方差只包含组内方差只包含随机误差随机误差随机误差随机误差3.组间方差(between groups)因素的不同水平因素的不同水平(不同总体不同总体)下各样本之间的方差下各样本之间的方差比如,四个行业被投诉次数之间的方差比如,四个行业被投诉次数之间的方差组间方差既包括组间方差既包括随机误差随机误差随机误差随机误差,也包括,也包
13、括系统误差系统误差系统误差系统误差现在学习的是第17页,共101页方差分析的基本思想和原理方差分析的基本思想和原理(方差的比较方差的比较)1.若若不不同同不不同同行行业业对对投投诉诉次次数数没没有有影影响响,则则组组间间误误差差中中只只包包含含随随机机误误差差,没没有有系系统统误误差差。这这时时,组组间间误误差差与与组组内内误误差差经经过过平平均均后后的的数值就应该很接近,它们的比值就会接近数值就应该很接近,它们的比值就会接近1 12.2.若若不不同同行行业业对对投投诉诉次次数数有有影影响响,在在组组间间误误差差中中除除了了包包含含随随机机误误差差外外,还还会会包包含含有有系系统统误误差差,这
14、这时时组组间间误误差差平平均均后后的的数数值值就就会会大大于于组组内内误误差平均后的数值,它们之间的比值就会大于差平均后的数值,它们之间的比值就会大于1 13.当当这这个个比比值值大大到到某某种种程程度度时时,就就可可以以说说不不同同水水平平之之间间存存在在着着显显著著差异,也就是自变量对因变量有影响差异,也就是自变量对因变量有影响 判判断断行行业业对对投投诉诉次次数数是是否否有有显显著著影影响响,实实际际上上也也就就是是检检验验被被投投诉诉次次数数的的差差异异主主要要是是由由于于什什么么原原因因所所引引起起的的。如如果果这这种种差差异异主主要要是是系系统统误差,说明不同行业对投诉次数有显著影
15、响误差,说明不同行业对投诉次数有显著影响现在学习的是第18页,共101页方差分析的基本假定方差分析的基本假定现在学习的是第19页,共101页方差分析的基本假定方差分析的基本假定1.每个总体都应服从正态分布对对于于因因素素的的每每一一个个水水平平,其其观观察察值值是是来来自自服服从从正正态态分分布总体的简单随机样本布总体的简单随机样本比如,每个行业被投诉的次数必需服从正态分布比如,每个行业被投诉的次数必需服从正态分布2.各个总体的方差必须相同各组观察数据是从具有相同方差的总体中抽取的各组观察数据是从具有相同方差的总体中抽取的比如,四个行业被投诉次数的方差都相等比如,四个行业被投诉次数的方差都相等
16、3.观察值是独立的比比如如,每每个个行行业业被被投投诉诉的的次次数数与与其其他他行行业业被被投投诉诉的的次次数独立数独立现在学习的是第20页,共101页方差分析中的基本假定方差分析中的基本假定1.在上述假定条件下,判断行业对投诉次数是否有显著影响,实际上也就是检验具有同方差的四个正态总体的均值是否相等2.如果四个总体的均值相等,可以期望四个样本的均值也会很接近四四个个样样本本的的均均值值越越接接近近,推推断断四四个个总总体体均均值值相相等等的的证证据据也就越充分也就越充分样样本本均均值值越越不不同同,推推断断总总体体均均值值不不同同的的证证据据就就越越充充分分 现在学习的是第21页,共101页
17、方差分析中基本假定方差分析中基本假定 如果原假设成立,即H0:1=2=3=4n n四个行业被投诉次数的均值都相等四个行业被投诉次数的均值都相等n n意味着意味着每个样本都来自均值为每个样本都来自均值为、差为、差为 2 2的同一正的同一正态总体态总体 X XXf(X)f(X)f(X)1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 现在学习的是第22页,共101页方差分析中基本假定方差分析中基本假定若备择假设成立,即H1:i(i=1,2,3,4)不全相等n n至少有一个总体的均值是不同的至少有一个总体的均值是不同的n n四个样本分别来自均值不同的四个正态总体四个样本分别来自均值不同
18、的四个正态总体 X X Xf(X)f(X)f(X)3 3 3 3 1 1 1 1 2 2 2 2 4 4 4 4 现在学习的是第23页,共101页问题的一般提法问题的一般提法现在学习的是第24页,共101页问题的一般提法问题的一般提法1.1.设设因因素素有有k k个个水水平平,每每个个水水平平的的均均值值分分别别用用 1 1、2 2、k k 表示表示2.2.要要检检验验k k个个水水平平(总总体体)的的均均值值是是否否相相等等,需需要要提提出出如如下下假假设:设:H H0 0:1 1 2 2 k k H H1 1:1 1,2 2,,k k 不全相等不全相等不全相等不全相等3.3.设设 1 1为
19、为零零售售业业被被投投诉诉次次数数的的均均值值,2 2为为旅旅游游业业被被投投诉诉次次数数的的均均值值,3 3为为航航空空公公司司被被投投诉诉次次数数的的均均值值,4 4为为家家电电制制造业造业被投诉次数的均值被投诉次数的均值,提出的假设为提出的假设为 H H0 0:1 1 2 2 3 3 4 4 H H1 1:1 1,2 2,3 3,4 4 不全相等不全相等不全相等不全相等现在学习的是第25页,共101页10.2 单因素方差分析单因素方差分析一一.数据结构数据结构二二.分析步骤分析步骤三三.关系强度的测量关系强度的测量四四.用用Excel进行方差分析进行方差分析现在学习的是第26页,共101
20、页单因素方差分析的数据结构单因素方差分析的数据结构(one-way analysis of variance)观察值观察值 (j j)因素因素(A A)i i 水平水平A A1 1 水平水平A A2 2 水平水平A Ak k12:n x11 x21 xk1 x12 x22 xk2 :x1nx2n xkn现在学习的是第27页,共101页分析步骤分析步骤提出假设提出假设构造检验统计量构造检验统计量统计决策统计决策现在学习的是第28页,共101页提出假设提出假设1.一般提法H H0:1=2=k k 自变量对因变量没有显著影响自变量对因变量没有显著影响 H1 1:1,2,k k不全相等自变量对因变量有
21、显著影响自变量对因变量有显著影响 2.注意:拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等 现在学习的是第29页,共101页构造检验的统计量构造检验的统计量构造统计量需要计算水平的均值全部观察值的总均值误差平方和均方(MS)现在学习的是第30页,共101页构造检验的统计量构造检验的统计量(计算水平的均值计算水平的均值)1.假定从第i个总体中抽取一个容量为ni的简单随机样本,第i个总体的样本均值为该样本的全部观察值总和除以观察值的个数2.计算公式为 式中:式中:n ni i为第为第 i i 个总体的样本观察值个数个总体的样本观察值个数 x xij ij 为第为第 i
22、i 个总体的第个总体的第 j j 个观察值个观察值 现在学习的是第31页,共101页构造检验的统计量构造检验的统计量(计算全部观察值的总均值计算全部观察值的总均值)1.全部观察值的总和除以观察值的总个数2.计算公式为 现在学习的是第32页,共101页构造检验的统计量构造检验的统计量(例题分析例题分析)现在学习的是第33页,共101页构造检验的统计量构造检验的统计量(计算总误差平方和计算总误差平方和 SST)1.全部观察值 与总平均值 的离差平方和2.反映全部观察值的离散状况3.其计算公式为 前例的计算结果:前例的计算结果:SST SST=(57-47.869565)=(57-47.869565
23、)2 2+(58-47.869565)(58-47.869565)2 2 =115.9295 =115.9295现在学习的是第34页,共101页构造检验的统计量构造检验的统计量(计算水平项平方和计算水平项平方和 SSA)1.各组平均值 与总平均值 的离差平方和2.反映各总体的样本均值之间的差异程度,又称组间平方和3.该平方和既包括随机误差,也包括系统误差4.计算公式为 前例的计算结果:前例的计算结果:SSA SSA=1456.608696现在学习的是第35页,共101页构造检验的统计量构造检验的统计量(计算误差项平方和计算误差项平方和 SSE)1.每个水平或组的各样本数据与其组平均值的离差平方
24、和2.反映每个样本各观察值的离散状况,又称组内平方和3.该平方和反映的是随机误差的大小4.计算公式为 前例的计算结果:前例的计算结果:SSE SSE=2708现在学习的是第36页,共101页构造检验的统计量构造检验的统计量(三个平方和的关系三个平方和的关系)总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和(SSA)之间的关系SST=SSA+SSE 前例的计算结果:前例的计算结果:4164.608696=1456.608696+2708 4164.608696=1456.608696+2708 现在学习的是第37页,共101页构造检验的统计量构造检验的统计量(三个平方和的作用
25、三个平方和的作用)1.SST反映全部数据总的误差程度;SSE反映随机误差的大小;SSA反映随机误差和系统误差的大小2.如果原假设成立,则表明没有系统误差,组间平方和SSA除以自由度后的均均方方与组内平方和SSE和除以自由度后的均均方方差异就不会太大;如果组组间间均均方方显著地大于组组内内均均方方,说明各水平(总体)之间的差异不仅有随机误差,还有系统误差3.判断因素的水平是否对其观察值有影响,实际上就是比较组间方差组间方差与组内方差组内方差之间差异的大小现在学习的是第38页,共101页构造检验的统计量构造检验的统计量(计算均方计算均方MS)1.各误差平方和的大小与观察值的多少有关,为消除观察值多
26、少对误差平方和大小的影响,需要将其平均,这就是均方均方,也称为方差2.计算方法是用误差平方和除以相应的自由度3.三个平方和对应的自由度分别是SST SST 的的自由度为自由度为n n-1-1,其中,其中n n为全部观察值的个数为全部观察值的个数SSASSA的的自由度为自由度为k k-1-1,其中,其中k k为因素为因素水平水平(总体总体)的的个数个数SSE SSE 的的自由度为自由度为n n-k k现在学习的是第39页,共101页构造检验的统计量构造检验的统计量(计算均方计算均方 MS)1.组间方差组间方差:SSA的均方,记为MSA,计算公式为2.组内方差组内方差:SSE的均方,记为MSE,计
27、算公式为现在学习的是第40页,共101页构造检验的统计量构造检验的统计量(计算检验统计量计算检验统计量 F)1.将MSA和MSE进行对比,即得到所需要的检验统计量F2.当H0为真时,二者的比值服从分子自由度为k-1、分母自由度为 n-k 的 F 分布,即 现在学习的是第41页,共101页构造检验的统计量构造检验的统计量(F分布与拒绝域分布与拒绝域)如果均值相等,如果均值相等,如果均值相等,F F F=MSAMSAMSA/MSEMSEMSE1 11 F 分布分布F(k-1,n-k)0 0拒绝拒绝拒绝拒绝HH0 0不拒绝不拒绝不拒绝不拒绝H H H H0 0 0 0F F现在学习的是第42页,共1
28、01页统计决策统计决策 将统计量的值F与给定的显著性水平的临界值F进行比较,作出对原假设H0的决策根根据据给给定定的的显显著著性性水水平平,在在F F分分布布表表中中查查找找与与第第一一自自由由度度dfdf1 1k k-1-1、第第二二自自由由度度dfdf2 2=n n-k k 相相应应的的临临界界值值 F F 若若F F F F ,则则拒拒绝绝原原假假设设H H0 0 ,表表明明均均值值之之间间的的差差异是显著的,所检验的因素对观察值有显著影响异是显著的,所检验的因素对观察值有显著影响若若FFF F F ,则则拒拒拒拒绝绝绝绝原原假假设设H H0 0 ,表表明明均均值值之之间间的的差差异异是
29、是显显著著的的,即即所所检检验验的的行行因因素素对对观观察察值值有有显显著著影响影响若若F FC C F F ,则则拒拒拒拒绝绝绝绝原原假假设设H H0 0 ,表表明明均均值值之之间间有有显显著著差异,即所检验的列因素对观察值有显著影响差异,即所检验的列因素对观察值有显著影响 现在学习的是第72页,共101页双因素方差分析表双因素方差分析表(基本结构基本结构)现在学习的是第73页,共101页双因素方差分析双因素方差分析(例题分析例题分析)提出假设n n对品牌因素提出的假设为对品牌因素提出的假设为lH H0 0:1 1=2 2=3 3=4 4 (品牌对销售量没有影响品牌对销售量没有影响)lH H
30、1 1:i i (i i=1,2,4)=1,2,4)不全相等不全相等 (品牌对销售量有影响品牌对销售量有影响)n n对地区因素提出的假设为对地区因素提出的假设为H H0 0:1 1=2 2=3 3=4 4=5 5 (地区地区对销售量没有影响对销售量没有影响)H H1 1:j j (j j=1,2,5)=1,2,5)不全相等不全相等 (地区对销售量有影响地区对销售量有影响)用用Excel进行无重复双因素分析进行无重复双因素分析现在学习的是第74页,共101页双因素方差分析双因素方差分析(例题分析例题分析)结论:结论:结论:结论:F FR R18.1077718.10777F F 3.49033.
31、4903,拒绝原假设,拒绝原假设H H0 0,说明彩电的品牌,说明彩电的品牌对销售量有显著影响对销售量有显著影响 F FC C2.100846 2.100846 F F 3.25923.2592,不拒绝原假设,不拒绝原假设H H0 0,不能认为销,不能认为销售地区对彩电的销售量有显著影响售地区对彩电的销售量有显著影响现在学习的是第75页,共101页双因素方差分析双因素方差分析(关系强度的测量关系强度的测量)1.1.行行平平方方和和(行行SSSS)度度量量了了品品牌牌这这个个自自变变量量对对因因变变量量(销销售售量量)的的影影响响效应效应2.2.列列平平方方和和(列列SSSS)度度量量了了地地区
32、区这这个个自自变变量量对对因因变变量量(销销售售量量)的的影影响效应响效应3.3.这这两两个个平平方方和和加加在在一一起起则则度度量量了了两两个个自自变变量量对对因因变变量量的的联联合合效应效应4.4.联合效应与总平方和的比值定义为联合效应与总平方和的比值定义为R R2 25.5.其平方根其平方根R R反映了这两个自变量合起来与因变量之间的关系强度反映了这两个自变量合起来与因变量之间的关系强度 现在学习的是第76页,共101页双因素方差分析双因素方差分析(关系强度的测量关系强度的测量)例题分析n n品牌因素和地区因素合起来总共解释了销售量差异的83.94%83.94%n n其其 他他 因因 素
33、素(残差变量)只只 解解 释释 了了 销销 售售 量量 差差 异异 的的16.06%16.06%n nR=0.9162=0.9162,表明品牌和地区两个因素合起来与销售量之间有较强的关系 现在学习的是第77页,共101页有交互作用的双因素方差分析有交互作用的双因素方差分析(可重复双因素分析可重复双因素分析)现在学习的是第78页,共101页可重复双因素分析可重复双因素分析(例题例题)【例例例例】城城市市道道路路交交通通管管理理部部门门为为研研究究不不同同的的路路段段和和不不同同的的时时间间段段对对行行车车时时间间的的影影响响,让让一一名名交交通通警警察察分分别别在在两两个个路路段段和和高高峰峰期
34、期与与非非高高峰峰期期亲亲自自驾驾车车进进行行试试验验,通通过过试试验验取取得得共共获获得得2020个个行行车车时时间间(分分钟钟)的的数数据据,如如下下表表。试试分分析析路路段段、时时段段以以及及路路段段和和时时段段的的交交互互作作用用对行车时间的影响对行车时间的影响 现在学习的是第79页,共101页交互作用的图示交互作用的图示路段与时段对行车时间的影响交互作用交互作用交互作用交互作用无交互作用无交互作用无交互作用无交互作用行车时间行车时间路段路段1 1路段路段2 2高峰期高峰期非高峰期非高峰期行车时间行车时间路段路段1 1路段路段2 2高峰期高峰期非高峰期非高峰期现在学习的是第80页,共1
35、01页可重复双因素分析可重复双因素分析(方差分析表的结构方差分析表的结构)现在学习的是第81页,共101页可重复双因素分析可重复双因素分析(平方和的计算平方和的计算)设:为对应于行因素的第i个水平和列因素的第j个 水平的第l行的观察值 为行因素的第i个水平的样本均值 为列因素的第j个水平的样本均值 对应于行因素的第i个水平和列因素的第j个水 平组合的样本均值 为全部n个观察值的总均值 现在学习的是第82页,共101页可重复双因素分析可重复双因素分析(平方和的计算平方和的计算)1.1.总平方和:总平方和:2.2.行变量平方和:行变量平方和:3.3.列变量平方和:列变量平方和:4.4.交互作用平方
36、和:交互作用平方和:5.5.误差项平方和:误差项平方和:现在学习的是第83页,共101页可重复双因素分析可重复双因素分析(Excel计算计算)第第第第1 1步:步:步:步:选择选择“工具工具”下拉菜单,并选择下拉菜单,并选择“数据分析数据分析”选项选项第第第第2 2步:步:步:步:在分析工具中选择在分析工具中选择“素方差分析:可重复双因素分素方差分析:可重复双因素分 析析”,然后选择,然后选择“确定确定”第第第第3 3步:步:步:步:当对话框出现时当对话框出现时 在在“输入区域输入区域”方框内键入方框内键入A1A1:C11C11 在方框内键入在方框内键入0.050.05(可根据需要确定可根据需
37、要确定)在在“每一样本的行数每一样本的行数”方框内键入方框内键入5 5 在在“输出选项输出选项”中选择输出区域中选择输出区域用用Excel进行可重复双因素分析进行可重复双因素分析现在学习的是第84页,共101页10.5 试验设计初步试验设计初步一一.完全随机化设计完全随机化设计二二.随机化区组设计随机化区组设计三三.因子设计因子设计现在学习的是第85页,共101页试验设计与方差分析试验设计与方差分析完全随机化完全随机化设计设计因子因子设计设计试验设计试验设计随机化随机化区组设计区组设计可重复双因素可重复双因素方差分析方差分析单因素单因素方差分析方差分析无重复双因素无重复双因素方差分析方差分析现
38、在学习的是第86页,共101页完全随机化设计完全随机化设计现在学习的是第87页,共101页完全随机化设计完全随机化设计(completely randomized design)1.“处理”被随机地指派给试验单元的一种设计n n“处理处理”是指可控制的因素的各个水平是指可控制的因素的各个水平n n“试试验验单单元元(experiment experiment unitunit)”是是接接受受“处处理理”的的对对象象或或实体实体2.在试验性研究中,感兴趣的变量是明确规定的,因此,研究中的一个或多个因素可以被控制,使得数据可以按照因素如何影响变量来获取3.对完全随机化设计的数据采用单因素方差分析单
39、因素方差分析现在学习的是第88页,共101页完全随机化设计完全随机化设计(例例题题分析分析)【例例】一家种业开发股份公司研究出三个新的小麦品种:品种1、品种2、品种3。为研究不同品种对产量的影响,需要选择一些地块,在每个地块种上不同的品种,然后获得产量数据进行分析。这一过程就是试验设计的过程 n n这这里里的的“小小麦麦品品种种”就就是是试试验验因因子子或或因因素素,品品种种1 1、品种品种2 2、品种、品种3 3就是因子的三个不同水平,称为就是因子的三个不同水平,称为处理处理处理处理n n假假定定选选取取3 3个个面面积积相相同同的的地地块块,这这里里的的“地地块块”就就是是接受处理的对象或
40、实体,称为接受处理的对象或实体,称为试验单元试验单元试验单元试验单元n n将将每每个个品品种种随随机机地地指指派派给给其其中中的的一一个个地地块块,这这一一过过程程就是随机化设计过程就是随机化设计过程现在学习的是第89页,共101页完全随机化设计完全随机化设计(例例题题分析分析)试验数据:试验数据:现在学习的是第90页,共101页完全随机化设计完全随机化设计(例例题题分析分析)方差分析:方差分析:现在学习的是第91页,共101页随机化区组设计随机化区组设计现在学习的是第92页,共101页随机化区组设计随机化区组设计(randomized block design)1.先按一定规则将试验单元划分
41、为若干同质组,称为“区组(Block)”2.再将各种处理随机地指派给各个区组n n比比如如在在上上面面的的例例子子中中,首首先先根根据据土土壤壤的的好好坏坏分分成成几几个个区区组组,假假定定分分成成四四个个区区组组:区区组组1 1、区区组组2 2、区区组组3 3、区组区组4 4,每个区组中有三个地块,每个区组中有三个地块n n在在每每个个区区组组内内的的三三个个地地块块以以抽抽签签方方式式决决定定所所种种的的小小麦麦品种品种3.分组后再将每个品种(处理)随机地指派给每一个区组的设计就是随机化区组设计4.试验数据采用无重复双因素方差分析无重复双因素方差分析现在学习的是第93页,共101页随机化区
42、组设计随机化区组设计(例例题题分析分析)试验数据:试验数据:现在学习的是第94页,共101页随机化区组设计随机化区组设计(例例题题分析分析)方差分析:方差分析:现在学习的是第95页,共101页因子设计因子设计现在学习的是第96页,共101页因子设计因子设计(factorial design)1.1.感兴趣的因素有两个感兴趣的因素有两个n n如:小麦品种和施肥方式如:小麦品种和施肥方式l l假假定定有有甲甲、乙乙两两种种施施肥肥方方式式,这这样样三三个个小小麦麦品品种种和和两两种种施施肥肥方方式式的的搭搭配配共共有有3 3 2=62=6种种。如如果果我我们们选选择择3030个个地地块块进进行行实
43、实验验,每每一一种种搭搭配配可可以以做做5 5次次试试验验,也也就就是是每每个个品品种种(处处理理)的的样样本本容容量为量为5 5,即相当于每个品种,即相当于每个品种(处理处理)重复做了重复做了5 5次试验次试验2.2.考考虑虑两两个个因因素素(可可推推广广到到多多个个因因素素)的的搭搭配配试试验验设设计计称称为为因因子设计子设计3.3.该该设设计计主主要要用用于于分分析析两两个个因因素素及及其其交交互互作作用用对对试试验验结结果果的的影影响响4.4.试验数据采用试验数据采用可重复双因素方差分析可重复双因素方差分析可重复双因素方差分析可重复双因素方差分析现在学习的是第97页,共101页因子设计因子设计(例例题题分析分析)试验数据:试验数据:现在学习的是第98页,共101页因子设计因子设计(例例题题分析分析)方差分析:方差分析:现在学习的是第99页,共101页本章小结本章小结1.方差分析方差分析(ANOVA)的概念的概念2.方差分析的思想和原理方差分析的思想和原理3.素方差分析中的基本假设素方差分析中的基本假设4.单因素方差分析单因素方差分析5.双因素方差分析双因素方差分析6.试验设计试验设计现在学习的是第100页,共101页结结 束束现在学习的是第101页,共101页
限制150内