《数理统计课件-方差分析.ppt》由会员分享,可在线阅读,更多相关《数理统计课件-方差分析.ppt(82页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章 方差分析第一节第一节 方差分析的基本问题方差分析的基本问题 第二节第二节 单因素方差分析单因素方差分析第三节第三节 双因素方差分析双因素方差分析如某种农作物的收获量受作物品种、如某种农作物的收获量受作物品种、肥料种类及数量等的影响;选择不同肥料种类及数量等的影响;选择不同的品种、的品种、肥料种类及数量进行试验,肥料种类及数量进行试验,日常生活中经常发现,影日常生活中经常发现,影响一个事物的因素很多,响一个事物的因素很多,希望找到影响最显著的因希望找到影响最显著的因素素看哪一个影响大?并需要知道看哪一个影响大?并需要知道起显著作用的因素在什么时候起显著作用的因素在什么时候起最好的影响作用
2、。起最好的影响作用。方差分析就是解决这方差分析就是解决这些问题的些问题的一种有效方法。一种有效方法。ANOVA ANOVA 由英国统计由英国统计学家学家R.A.FisherR.A.Fisher首创,首创,为纪念为纪念FisherFisher,以,以F F命命名,故方差分析又称名,故方差分析又称 F F 检验检验 (F F test test)。用)。用于推断于推断多个总体均数多个总体均数有有无差异无差异 因素(因子)可以控制的试验条件因素的水平 因素所处的状态或等级单(双)因素方差分析讨论一个(两个)因素对试验结果有没有显著影响。例如:某厂对某种晴棉漂白工艺中酸液浓度(例如:某厂对某种晴棉漂白
3、工艺中酸液浓度(g/kg/k)进进行试验,以观察酸液浓度对汗布冲击强力有无显著影行试验,以观察酸液浓度对汗布冲击强力有无显著影响。响。序号序号冲击强力冲击强力浓度浓度1 2 3 4 5 6A1 16.2 15.1 15.8 14.8 17.1 15.0 A2 16.8 17.5 17.1 15.9 18.4 17.7A3 19.0 20.1 18.9 18.2 20.5 19.7方差分析就是把总的方差分析就是把总的试验数据的波动分成试验数据的波动分成1、反映、反映因素水平因素水平改变引起的波动。改变引起的波动。2、反映、反映随机因素随机因素所引起的波动。所引起的波动。然后加以比较进行统然后加以
4、比较进行统计判断,得出结论。计判断,得出结论。第一节 方差分析的基本问题一、方差分析的内容一、方差分析的内容二、方差分析的基本思想二、方差分析的基本思想三、方差分析的原理三、方差分析的原理一、方差分析的内容 该饮料在五家超市的销售情况该饮料在五家超市的销售情况该饮料在五家超市的销售情况该饮料在五家超市的销售情况超市超市超市超市无色无色无色无色粉色粉色粉色粉色橘黄色橘黄色橘黄色橘黄色绿色绿色绿色绿色1 12 23 34 45 526.526.528.728.725.125.129.129.127.227.231.231.228.328.330.830.827.927.929.629.627.92
5、7.925.125.128.528.524.224.226.526.530.830.829.629.632.432.431.731.732.832.8(一)例题一)例题一)例题一)例题 某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为橘黄橘黄色色、粉色粉色、绿色绿色和无色透明。这四种饮料的营养含量、味道、价格、包装等可和无色透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超级能影响销售量的因素全部相同。现从地理位置相似、经营规模相仿的五家超级市场上收集了前一时
6、期该饮料的销售情况,见表。试分析饮料的颜色是否对销市场上收集了前一时期该饮料的销售情况,见表。试分析饮料的颜色是否对销售量产生影响。售量产生影响。一、方差分析的内容(二)几个基本概念(二)几个基本概念1.1.因素或因子因素或因子 所要检验的对象称为因子所要检验的对象称为因子 要要分分析析饮饮料料的的颜颜色色对对销销售售量量是是否否有有影影响响,颜颜颜颜色色色色是是要要检检验验的的因因素素或或因子因子2.水平水平 因素的具体表现称为水平因素的具体表现称为水平 A A1 1、A A2 2、A A3 3、A A4 4四种颜色就是因素的水平四种颜色就是因素的水平3.观察值观察值 在每个因素水平下得到的
7、样本值在每个因素水平下得到的样本值 每种颜色饮料的销售量就是观察值每种颜色饮料的销售量就是观察值一、方差分析的内容4.4.试验这这里里只只涉涉及及一一个个因因素素,因因此此称称为为单单因因素素四四水水平平的的试验试验5.5.总体因素的每一个水平可以看作是一个总体因素的每一个水平可以看作是一个总体比比如如A A1 1、A A2 2、A A3 3、A A4 4四四种种颜颜色色可可以以看看作作是是四四个个总总体体6.样本数据上上面面的的数数据据可可以以看看作作是是从从这这四四个个总总体体中中抽抽取取的的样样本数据本数据(一)比较两类误差,以检验均值是否相等(二)比较的基础是方差比(三)如果系统(处理
8、)误差显著地不同于随机误差,则均值就是不相等的;反之,均值就是相等的(四)误差是由各部分的误差占总误差的比例来测度的二、方差分析的基本思想三、方差分析的原理(一)两类误差1.随机误差随机误差随机误差随机误差在在因因素素的的同同一一水水平平(同同一一个个总总体体)下下,样样本本的的各各观观察察值值之之间间的差异的差异比如,同一种颜色的饮料在不同超市上的销售量是不同的比如,同一种颜色的饮料在不同超市上的销售量是不同的不不同同超超市市销销售售量量的的差差异异可可以以看看成成是是随随机机因因素素的的影影响响,或或者者说是由于抽样的随机性所造成的,称为说是由于抽样的随机性所造成的,称为随机误差随机误差随
9、机误差随机误差 2.2.系统误差系统误差系统误差系统误差 在因素的不同水平在因素的不同水平(不同总体不同总体)下,各观察值之间的差异下,各观察值之间的差异 比如,同一家超市,不同颜色饮料的销售量也是不同的比如,同一家超市,不同颜色饮料的销售量也是不同的 这这种种差差异异可可能能是是由由于于抽抽样样的的随随机机性性所所造造成成的的,也也可可能能是是由由于于颜颜色色本本身身所所造造成成的的,后后者者所所形形成成的的误误差差是是由由系系统统性性因因素素造成的,称为造成的,称为系统误差系统误差系统误差系统误差三、方差分析的原理(二)(二)两类方差1.1.组内方差组内方差因素的同一水平因素的同一水平(同
10、一个总体同一个总体)下样本数据的方差下样本数据的方差比如,无色饮料比如,无色饮料A A1 1在在5 5家超市销售数量的方差家超市销售数量的方差组内方差只包含组内方差只包含随机误差随机误差随机误差随机误差2.2.组间方差组间方差因素的不同水平因素的不同水平(不同总体不同总体)下各样本之间的方差下各样本之间的方差比比如如,A A1 1、A A2 2、A A3 3、A A4 4四四种种颜颜色色饮饮料料销销售售量量之之间间的的方差方差组间方差既包括组间方差既包括随机误差随机误差随机误差随机误差,也包括,也包括系统误差系统误差系统误差系统误差三、方差分析的原理(三)(三)方差的比较方差的比较如如果果不不
11、同同颜颜色色(水水平平)对对销销售售量量(结结果果)没没有有影影响响,那那么么在在组组间间方方差差中中只只包包含含有有随随机机误误差差,而而没没有有系系统统误误差差。这这时时,组组间间方方差差与与组组内内方方差差就就应应该该很很接接近近,两两个个方方差差的的比比值值就就会会接接近近1 1。如如果果不不同同的的水水平平对对结结果果有有影影响响,在在组组间间方方差差中中除除了了包包含含随随机机误误差差外外,还还会会包包含含有有系系统统误误差差,这这时时组组间间方方差差就就会会大大于于组内方差,组间方差与组内方差的比值就会大于组内方差,组间方差与组内方差的比值就会大于1 1。当当这这个个比比值值大大
12、到到某某种种程程度度时时,就就可可以以说说不不同同水水平平之之间间存存在在着显著差异。着显著差异。三、方差分析的原理(四)(四)基本假定基本假定1.1.每个总体都应每个总体都应服从正态分布服从正态分布 对对于于因因素素的的每每一一个个水水平平,其其观观察察值值是是来来自自服服从从正正态态分分布布总总体体的的简单随机样本简单随机样本 比如,每种颜色饮料的销售量必需服从正态分布比如,每种颜色饮料的销售量必需服从正态分布2.2.各个总体的各个总体的方差必须相同方差必须相同 对于各组观察数据,是从具有相同方差的总体中抽取的对于各组观察数据,是从具有相同方差的总体中抽取的 比如,四种颜色饮料的销售量的方
13、差都相同比如,四种颜色饮料的销售量的方差都相同3.3.观察值是观察值是独立独立的的 比如,每个超市的销售量都与其他超市的销售量独立比如,每个超市的销售量都与其他超市的销售量独立三、方差分析的原理 在上述假定条件下,判断颜色对销售量是否有显著影响,实际上也就是检验具有同方差的四个正态总体的均值是否相等的问题 如果四个总体的均值相等,可以期望四个样本的均值也会很接近1 1、四四个个样样本本的的均均值值越越接接近近,我我们们推推断断四四个个总总体体均均值值相等的证据也就越充分相等的证据也就越充分2 2、样样本本均均值值越越不不同同,我我们们推推断断总总体体均均值值不不同同的的证证据据就越充分就越充分
14、 三、方差分析的原理3 3、如果原假设成立,即、如果原假设成立,即H H0 0:1 1=2 2=3 3=4 4 四种颜色饮料销售的均值都相等四种颜色饮料销售的均值都相等 没有系统误差没有系统误差 这意味着这意味着每个样本都来自均值为每个样本都来自均值为、差为、差为 2 2的的同一正态总体同一正态总体 X X Xf(X)f(X)f(X)1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 三、方差分析的原理4 4、如果备择假设成立,即、如果备择假设成立,即H H1 1:i i(i i=1=1,2 2,3 3,4)4)不全相等不全相等 至少有一个总体的均值是不同的至少有一个总体的均值是不
15、同的 有系统误差有系统误差 这意味着四个样本分别来自均值不同的四个正态总体这意味着四个样本分别来自均值不同的四个正态总体 X X Xf(X)f(X)f(X)3 3 3 3 1 1 1 1 2 2 2 2 4 4 4 4 第二节 单因素方差分析一、数据结构二、单因素方差分析的步骤 三、单因素方差分析中的其它问题X X Xf(X)f(X)f(X)1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 一、数据结构 观察值观察值观察值观察值 (j j)因素因素因素因素(A A)i i 水平水平水平水平A A1 1 水平水平水平水平A A2 2 水平水平水平水平A Ak k12:n x11 x
16、12 x1k x21 x22 x2k :xn1 xn2 xnk二、单因素方差分析的步骤(一)提出假设(一)提出假设(一)提出假设(一)提出假设(二)构造检验统计量(二)构造检验统计量(二)构造检验统计量(二)构造检验统计量(三)统计决策(三)统计决策(三)统计决策(三)统计决策二、单因素方差分析的步骤(一)提出假设1、一般提法H H0 0:1 1=2 2=k k (因素有因素有k k个水平)个水平)H H1 1:1 1 ,2 2 ,k k不全相等不全相等2、对前面的例子H H0 0:1 1=2 2=3 3=4 4颜色对销售量没有影响颜色对销售量没有影响H H0 0:1 1 ,2 2 ,3 3,
17、4 4不全相等不全相等颜色对销售量有影响颜色对销售量有影响二、单因素方差分析的步骤(二)构造检验统计量1、为检验H0是否成立,需确定检验的统计量 2、构造统计量需要计算水平的均值水平的均值全部观察值的总均值全部观察值的总均值离差平方和离差平方和均方均方(MSMS)二、单因素方差分析的步骤假假定定从从第第i i个个总总体体中中抽抽取取一一个个容容量量为为n ni i的的简简单单随随机机样样本本,第第i i个个总总体体的的样样本本均均值值为为该该样样本本的的全全部部观观察察值值总总和和除除以观察值的个数以观察值的个数计算公式为计算公式为 式中:式中:n ni i为第为第 i i 个总体的样本观察值
18、个数个总体的样本观察值个数 x xij ij 为第为第 i i 个总体的第个总体的第 j j 个观察值个观察值 二、单因素方差分析的步骤全部观察值的总和除以观察值的总个数计算公式为 二、单因素方差分析的步骤实例实例实例实例 四种颜色饮料的销售量及均值四种颜色饮料的销售量及均值四种颜色饮料的销售量及均值四种颜色饮料的销售量及均值超市超市超市超市(j j)水平水平水平水平A A(i i)无色无色无色无色(A A1 1)粉色粉色粉色粉色(A A2 2)橘黄色橘黄色橘黄色橘黄色(A A3 3)绿色绿色绿色绿色(A A4 4)1 12 23 34 45 526.526.528.728.725.125.1
19、29.129.127.227.231.231.228.328.330.830.827.927.929.629.627.927.925.125.128.528.524.224.226.526.530.830.829.629.632.432.431.731.732.832.8合计合计合计合计136.6136.6147.8147.8132.2132.2157.3157.3573.9573.9水平均值水平均值水平均值水平均值观察值个数观察值个数观察值个数观察值个数 x x1 1=27.3227.32n n1 1=5=5 x x2 2=29.5629.56n n2 2=5=5 x x3 3=26.442
20、6.44n n3 3=5=5 x x4 4=31.4631.46n n4 4=5=5总均值总均值总均值总均值x x=28.695=28.695二、单因素方差分析的步骤全部观察值 与总平均值 的离差平方和反映全部观察值的离散状况其计算公式为 前例的计算结果:前例的计算结果:SST SST=(26.5-28.695)=(26.5-28.695)2 2+(28.7-28.695)+(28.7-28.695)2 2+(32.8-28.695)(32.8-28.695)2 2 =115.9295 =115.9295二、单因素方差分析的步骤计算SSE每个水平或组的各样本数据与其组平均值的离差平方和每个水平
21、或组的各样本数据与其组平均值的离差平方和反映每个样本各观察值的离散状况,又称反映每个样本各观察值的离散状况,又称组内离差平方和组内离差平方和该平方和反映的是随机误差的大小该平方和反映的是随机误差的大小计算公式为计算公式为 前例的计算结果:前例的计算结果:SSE SSE=39.084=39.084二、单因素方差分析的步骤计算SSA各组平均值各组平均值 与总平均值与总平均值 的离差平方和的离差平方和反映各总体的样本均值之间的差异程度,又称反映各总体的样本均值之间的差异程度,又称组间平方和组间平方和该平方和既包括随机误差,也包括系统误差该平方和既包括随机误差,也包括系统误差计算公式为计算公式为 前例
22、的计算结果:前例的计算结果:SSA SSA=76.8455=76.8455二、单因素方差分析的步骤三个平方和的关系总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和(SSA)之间的关系SST=SSE+SSA离差平方和的分解与显著检验离差平方和的分解与显著检验 记:记:将将Q进行分解:进行分解:由于由于故:故:在假设在假设H0成立的条件下,可以证明:成立的条件下,可以证明:相互独立相互独立理论证明二、单因素方差分析的步骤三个平方和的作用SSTSST反反映映了了全全部部数数据据总总的的误误差差程程度度;SSESSE反反映映了了随随机机误误差的大小;差的大小;SSASSA反映了随机
23、误差和系统误差的大小反映了随机误差和系统误差的大小如如果果原原假假设设成成立立,即即H H1 1 H H2 2 H Hk k为为真真,则则表表明明没没有有系系统统误误差差,组组间间平平方方和和SSASSA除除以以自自由由度度后后的的均均均均方方方方与与组组内内平平方方和和SSESSE和和除除以以自自由由度度后后的的均均均均方方方方差差异异就就不不会会太太大大;如如果果组组组组间间间间均均均均方方方方显显著著地地大大于于组组组组内内内内均均均均方方方方,说说明明各各水水平平(总体总体)之间的差异不仅有随机误差,还有系统误差之间的差异不仅有随机误差,还有系统误差判判断断因因素素的的水水平平是是否否
24、对对其其观观察察值值有有影影响响,实实际际上上就就是是比较比较组间方差组间方差组间方差组间方差与与组内方差组内方差组内方差组内方差之间差异的大小之间差异的大小为检验这种差异,需要构造一个用于检验的统计量为检验这种差异,需要构造一个用于检验的统计量二、单因素方差分析的步骤计算均方MS各各离离差差平平方方和和的的大大小小与与观观察察值值的的多多少少有有关关,为为了了消消除除观观察察值值多多少少对对离离差差平平方方和和大大小小的的影影响响,需需要要将将其其平平均均,这就是均方,也称为方差这就是均方,也称为方差计算方法是用离差平方和除以相应的自由度计算方法是用离差平方和除以相应的自由度三个平方和的自由
25、度分别是三个平方和的自由度分别是 SST SST 的自由度为的自由度为n n-1-1,其中,其中n n为全部观察值的个数为全部观察值的个数 SSASSA的自由度为的自由度为k k-1-1,其中,其中k k为因素水平为因素水平(总体总体)的个数的个数 SSE SSE 的自由度为的自由度为n n-k kn-1=(k-1)+(n-k)n-1=(k-1)+(n-k)二、单因素方差分析的步骤 SSA的均方也称组组间间方方差差,记为MSA,计算公式为SSE的均方也称组组内内方方差差,记为MSE,计算公式为二、单因素方差分析的步骤计算检验的统计量F将将MSAMSA和和MSEMSE进进行行对对比比,即即得得到
26、到所所需需要要的的检检验验统统计计量量F F当当H H0 0为为真真时时,二二者者的的比比值值服服从从分分子子自自由由度度为为k k-1-1、分分母自由度为母自由度为 n n-k k 的的 F F 分布,即分布,即 二、单因素方差分析的步骤如果均值相等,如果均值相等,如果均值相等,如果均值相等,如果均值相等,如果均值相等,F F F=MSAMSAMSA/MSEMSEMSE1 1 1 F 分布分布F(k-1,n-k)0 0拒绝拒绝拒绝拒绝HH0 0不能拒绝不能拒绝不能拒绝不能拒绝H H H H0 0 0 0F F宇传华 制作http:/三、计算的简化三、计算的简化1、对对SST、SSE、SSA计
27、算简化。(给出一个简化计算简化。(给出一个简化的计算公式和数据简化的方法)的计算公式和数据简化的方法)令:令:同样可推出:同样可推出:2、数据的简化:数据的简化:试验数据经过变换试验数据经过变换 数据简化后对数据简化后对F值的计算没有影响,不会影响检验的值的计算没有影响,不会影响检验的结果结果方差分析表方差分析表方差来源方差来源 离差平方和离差平方和 自由度自由度 F值值 F0.05 F0.01 显著性显著性因素因素A SSA k-1 试验误差试验误差 SSE n-k总误差总误差 SST n-1二、单因素方差分析的步骤(三)(三)统计决策统计决策 将将统统计计量量的的值值F F与与给给定定的的
28、显显著著性性水水平平 的的临临界界值值F F 进进行行比较,作出接受或拒绝原假设比较,作出接受或拒绝原假设H H0 0的决策的决策1 1、根根据据给给定定的的显显著著性性水水平平,在在F F分分布布表表中中查查找找与与第第一一自自由由度度dfdf1 1k k-1-1、第第二二自自由由度度dfdf2 2=n n-k k 相相应应的的临临界界值值 F F 若若F F F F ,则则拒拒绝绝原原假假设设H H0 0 ,表表明明均均值值之之间间的的差差异异是是显显著的,所检验的因素著的,所检验的因素(A A)对观察值有显著影响对观察值有显著影响 若若F F F F ,则则不不能能拒拒绝绝原原假假设设H
29、 H0 0 ,表表明明所所检检验验的的因因素素(A A)对观察值没有显著影响对观察值没有显著影响 二、单因素方差分析的步骤方差来源方差来源平方和平方和SS自由度自由度df均方均方MSF 值值组间组间(因素影响因素影响)组内组内(误差误差)总和总和SSASSESSTk-1n-kn-1MSAMSEMSAMSE2、单因素方差分析表、单因素方差分析表二、单因素方差分析的步骤二、单因素方差分析的步骤3、例题例题 为了对几个行业的服务质量进行评价,消费者协会在零售业、旅游业、航空公司、家电制造业分别抽取了不同的样本,其中零售业抽取7家,旅游业抽取了6家,航空公司抽取5家、家电制造业抽取了5家,然后记录了一
30、年中消费者对总共23家服务企业投诉的次数,结果如表9.7。试分析这四个行业的服务质量是否有显著差异?(0.05)二、单因素方差分析的步骤消费者对四个行业的投诉次数消费者对四个行业的投诉次数消费者对四个行业的投诉次数消费者对四个行业的投诉次数 观察值观察值观察值观察值(j j)行业行业行业行业(A A)零售业零售业零售业零售业旅游业旅游业旅游业旅游业航空公司航空公司航空公司航空公司家电制造业家电制造业家电制造业家电制造业1 12 23 34 45 56 67 757575555464645455454535347 47 6262494960605454565655 55 515149494848
31、555547 47 707068686363696960 60 二、单因素方差分析的步骤(计算结果)解解:设设四四个个行行业业被被投投诉诉次次数数的的均均值值分分别别为为,1 1、2 2 、3 3、4 4 ,则需要检验如下假设,则需要检验如下假设 H H0 0:1 1 =2 2 =3 3 =4 4 (四四个个行行业业的的服服务务质质量量无无显显著著差异差异)H H1 1:1 1 ,2 2 ,3 3,4 4不全相等不全相等 (有显著差异有显著差异)ExcelExcel输出的结果如下输出的结果如下 结论:拒绝结论:拒绝H H0 0。四个行业的服务质量有显著差异四个行业的服务质量有显著差异例:前例题
32、例:前例题 1、对数据的简化、对数据的简化 得下得下表:表:序号序号冲击强力冲击强力浓度浓度1 2 3 4 5 6 A1 -8 -19 -12 -22 1 -20 -80 1454 A2 -2 5 1 -11 14 7 14 396A3 20 31 19 12 35 27 144 3820由表中由表中数据可算出数据可算出计算计算计算出计算出F值:值:方差来源方差来源 离差平方和离差平方和 自由度自由度 F值值 F0.05 F0.01 显著性显著性因素因素A 4217.3 2 28.38 3.68 6.38 *(十分显著)十分显著)试验误差试验误差 1114.7 15总误差总误差 5332 17
33、列表:列表:说明:说明:说明酸液浓度对汗布冲击强力有十分显说明酸液浓度对汗布冲击强力有十分显著的影响。著的影响。S Si iS S1 1S S2 2S S3 3S S4 4合计合计值值5.99 5.99 4.15 4.15 3.78 3.78 4.71 4.71 6.65 6.65 H0:即即4个试验组总体均数相等个试验组总体均数相等 H1:4个试验组总体均数个试验组总体均数不全相等不全相等 检验水准检验水准 一、一、建立检验假设建立检验假设二、二、计算离均差平方、自由度、均方计算离均差平方、自由度、均方三、计算三、计算F值值四、下结论四、下结论 n n例题例题 某公司计划引进一条生产线某公司
34、计划引进一条生产线.为了选择为了选择一条质量优良的生产线以减少日后的维一条质量优良的生产线以减少日后的维修问题修问题,他们对他们对6种型号的生产线作了初种型号的生产线作了初步调查步调查,每种型号调查每种型号调查4条条,结果列于表结果列于表8-1。这些结果表示每个型号的生产线上。这些结果表示每个型号的生产线上个月维修的小时数。试问由此结果能否个月维修的小时数。试问由此结果能否判定由于生产线型号不同而造成它们在判定由于生产线型号不同而造成它们在维修时间方面有显著差异维修时间方面有显著差异?表表表表 4 41 1 对对对对6 6种型号生产线维修时数的调查结果种型号生产线维修时数的调查结果种型号生产线
35、维修时数的调查结果种型号生产线维修时数的调查结果 序序序序号号号号型号型号型号型号1 12 23 34 4AA型型型型9.59.58.88.811.411.47.87.8BB型型型型4.34.37.87.83.23.26.56.5C C型型型型6.56.58.38.38.68.68.28.2DD型型型型6.16.17.37.34.24.24.14.1E E型型型型10.010.04.84.85.45.49.69.6F F型型型型9.39.38.78.77.27.210.110.1表表表表 4 45 5 计算列表计算列表计算列表计算列表 台台台台号号号号型号型号型号型号1 12 23 34 4T
36、 Ti iT Ti i2 2AA型型型型9.59.58.88.811.411.4 7.87.837.37.5 51406.1406.2525358.358.4949BB型型型型4.34.37.87.83.23.26.56.521.21.8 8475.2475.24 4131.131.8282C C型型型型6.56.58.38.38.68.68.28.231.31.6 6998.5998.56 6252.252.3434DD型型型型6.16.17.37.34.24.24.14.121.21.7 7470.8470.89 9124.124.9595E E型型型型10.010.0 4.84.85.4
37、5.49.69.629.29.8 8888.0888.04 4244.244.3636F F型型型型9.39.38.78.77.27.210.110.1 35.35.3 31246.1246.0909316.316.03034.2.4 显著性检验显著性检验再将计算结果分别代入再将计算结果分别代入SA与与SE两式中,得两式中,得到到第一自由度第一自由度 第二自由度第二自由度 查查F分布表得分布表得由于由于 ,故拒绝,故拒绝H0。该结论说明,至少有一种生产线型号的效该结论说明,至少有一种生产线型号的效应不为零,这等价于至少有两种型号的生产应不为零,这等价于至少有两种型号的生产线的平均维修时数是有显
38、著差异的。线的平均维修时数是有显著差异的。方差来源方差来源方差来源方差来源平方和平方和平方和平方和 自由度自由度自由度自由度均方均方均方均方F F比比比比组间组间组间组间S SAA55.5555.555 511.1111.11组内组内组内组内S SE E56.7256.7218183.153.15总和总和总和总和S ST T112.2112.27 72323-方差分析表方差分析表二、双因素方差分析的假定条件(一)每个总体都服从正态分布 对于因素的每一个水平,其观察值是来自正态分布总体的简单随机样本(二)各个总体的方差必须相同 对于各组观察数据,是从具有相同方差的总体中抽取的(三)观察值是独立的
39、第三节 双因素方差分析一、双因素方差分析的类型 二、双因素方差分析的假定条件三、双因素方差分析的数据结构四、双因素方差分析的例题三、双因素方差分析的数据结构 因素因素因素因素A A(i i)因素因素因素因素(B B)j j 平均值平均值平均值平均值 B1 B2 BrA1A2:Ak x11 x12 x1k x21 x22 x2k :xr1 xr2 xrk :平均值平均值平均值平均值 三、双因素方差分析的数据结构 是因素是因素A A的第的第i i个水平下各观察值的平均值个水平下各观察值的平均值 是因素是因素B B的第的第j j个水平下的各观察值的均值个水平下的各观察值的均值 是全部是全部 krkr
40、 个样本数据的总平均值个样本数据的总平均值三、双因素方差分析的数据结构(一)提出假设1、对因素A提出的假设为H H0 0:1 1 =2 2 =i i =k k (i i为为第第i i个水平的均值个水平的均值)H H1 1:i i (i i=1,2,=1,2,k k)不全相等不全相等2、对因素B提出的假设为H H0 0:1 1 =2 2 =j j =r r (j j为为第第j j个水平的均值个水平的均值)H H1 1:j j (j j=1,2,=1,2,r r)不全相等不全相等三、双因素方差分析的数据结构(二)构造检验的统计量1、为检验H0是否成立,需确定检验的统计量 2、构造统计量需要计算总离
41、差平方和总离差平方和水平项平方和水平项平方和误差项平方和误差项平方和均方均方 三、双因素方差分析的数据结构(三)计算总离差平方和SST全全部部观观察察值值 与与总总平平均均值值 的离差平方和的离差平方和反映全部观察值的离散状况反映全部观察值的离散状况计算公式为计算公式为三、双因素方差分析的数据结构(四)计算SSA、SSB和SSE1、因素A的离差平方和SSA2、因素B的离差平方和SSB3、误差项平方和SSE三、双因素方差分析的数据结构(五)各平方和的关系 总离差平方和(SST)、水平项离差平方和(SSA和SSB)、误差项离差平方和(SSE)之间的关系SST=SSA+SSB+SSE 三、双因素方差
42、分析的数据结构(六)计算均方MS1 1、各各离离差差平平方方和和的的大大小小与与观观察察值值的的多多少少有有关关,为为消消除除观观察察值值多多少少对对离离差差平平方方和和大大小小的的影影响响,需需要要将将其其平平均均,这这就就是均方,也称为方差是均方,也称为方差2 2、计算方法是用离差平方和除以相应的自由度、计算方法是用离差平方和除以相应的自由度3 3、三个平方和的自由度分别是、三个平方和的自由度分别是 总离差平方和总离差平方和SSTSST的自由度为的自由度为 krkr-1-1 因素因素A A的离差平方和的离差平方和SSASSA的自由度为的自由度为 k k-1-1 因素因素B B的离差平方和的
43、离差平方和SSBSSB的自由度为的自由度为 r r-1-1 随机误差平方和随机误差平方和SSESSE的自由度为的自由度为 (k k-1)(-1)(r r-1)-1)三、双因素方差分析的数据结构4 4、因素、因素A A的均方,记为的均方,记为MSAMSA,计算公式为,计算公式为5 5、因素、因素B B的均方,记为的均方,记为MSBMSB ,计算公式为,计算公式为6 6、随机误差项的均方,记为、随机误差项的均方,记为MSEMSE ,计算公式为,计算公式为三、双因素方差分析的数据结构(七)计算检验的统计量F1、为检验因素A的影响是否显著,采用下面的统计量 2、为检验因素B的影响是否显著,采用下面的统
44、计量 三、双因素方差分析的数据结构(八)统计决策 将将统统计计量量的的值值F F与与给给定定的的显显著著性性水水平平 的的临临界界值值F F 进进行比较,作出接受或拒绝原假设行比较,作出接受或拒绝原假设H H0 0的决策的决策1 1、根根据据给给定定的的显显著著性性水水平平 在在F F分分布布表表中中查查找找相相应应的的临临界界值值 F F 2 2、若若F FA A F F ,则则拒拒绝绝原原假假设设H H0 0 ,表表明明均均值值之之间间的的差差异异是是显显著的,即所检验的因素著的,即所检验的因素(A A)对观察值有显著影响对观察值有显著影响3 3、若若F FB B F F ,则则拒拒绝绝原
45、原假假设设H H0 0 ,表表明明均均值值之之间间有有显显著著差差异异,即所检验的因素即所检验的因素(B B)对观察值有显著影响对观察值有显著影响 双因素方差分析表(基本结构)方差来源方差来源平方和平方和SS自由度自由度df均方均方MSF值值 因素因素A 因素因素B误差误差总和总和SSASSBSSESSTk-1r-1(k-1)(r-1)kr-1MSAMSBMSEFAFB四、双因素方差分析例题 不同品牌的彩电在各地区的销售量数据不同品牌的彩电在各地区的销售量数据不同品牌的彩电在各地区的销售量数据不同品牌的彩电在各地区的销售量数据 品牌品牌品牌品牌(因素因素因素因素A A)销售地区销售地区销售地区
46、销售地区(因素因素因素因素B B)B B1 1B B2 2B B3 3B B4 4B B5 5A A1 1A A2 2A A3 3A A4 4365365345345358358288 288 350350368368323323280 280 343343363363353353298 298 340340330330343343260 260 323323333333308308298 298【例例例例】有有四四个个品品牌牌的的彩彩电电在在五五个个地地区区销销售售,为为分分析析彩彩电电的的品品牌牌(因因素素A A)和和销销售售地地区区(因因素素B B)对对销销售售量量是是否否有有影影响响,
47、对对每每个个品品牌牌在在各各地地区区的的销销售售量量取取得得以以下下数数据据,见见下下表表。试试分分析析品品牌牌和销售地区对彩电的销售量是否有显著影响?和销售地区对彩电的销售量是否有显著影响?四、双因素方差分析例题1、对因素A提出的假设为H H0 0:1 1=2 2=3 3=4 4 (品牌对销售量没有影响品牌对销售量没有影响)H H1 1:i i (i i=1,2,4)=1,2,4)不全相等不全相等 (品牌对销售量有影响品牌对销售量有影响)2、对因素B提出的假设为H H0 0:1 1=2 2=3 3=4 4=5 5 (地区对销售量没有影响地区对销售量没有影响)H H1 1:j j (j j=1,2,5)=1,2,5)不全相等不全相等 (地区对销售量有影响地区对销售量有影响)四、双因素方差分析例题 结论:结论:结论:结论:F FA A18.1077718.10777F F 3.49033.4903,拒绝原假设,拒绝原假设H H0 0,说明彩电,说明彩电的品牌对销售量有显著影响的品牌对销售量有显著影响 F FB B2.100846 2.100846 F F 3.25923.2592,接受原假设,接受原假设H H0 0,说明销售,说明销售地区对彩电的销售量没有显著影响地区对彩电的销售量没有显著影响学以致用课间休息
限制150内