第七章方差分析精选文档.ppt
第七章方差分析本讲稿第一页,共四十页【实例描述实例描述】某公司要采购一批原材料,现从A供应商抽25个样本,方差30,从B供应商抽30个样本,方差10.那么如何比较两个供应商之间是否存在明显差异,怎样直观的判断哪个供应商更好,进而对供应商的选取与管理上有所参考呢?本讲稿第二页,共四十页7.1方差分析基础7.1.1单因素方差分析7.1.2双因素方差分析7.1.3可重复试验的双因素方差分析本讲稿第三页,共四十页7.1.1单因素方差分析例如:某克山病区测得11例克山病患者和13名健康人的血磷值(mmol/L)如下,患者:0.841.051.201.201.391.531.671.801.872.072.11健康人:0.540.640.640.750.760.811.161.201.341.351.481.561.87问该地克山病患者与健康人的血磷值是否不同?本讲稿第四页,共四十页7.1.1单因素方差分析当方差分析只涉及一个分类型变量时称为单单因素方差分析因素方差分析。基本步骤如下:第一步:建立检验假设。H0:多个样本总体均数相等;H1:多个样本总体均数不相等或不全等。第二步:计算检验统计量F值。第三步:确定P值或F临界值并作出推断结果,当P值小于显著性水平时拒绝原假设。本讲稿第五页,共四十页7.1.1单因素方差分析例例7-1:某克山病区测得11例克山病患者和13名健康人的血磷值(mmol/L)如下,患者:0.841.051.201.201.391.531.671.801.872.072.11健康人:0.540.640.640.750.760.811.161.201.341.351.481.561.87问该地克山病患者与健康人的血磷值是否不同?显著性水平0.05。本讲稿第六页,共四十页7.1.1单因素方差分析结论如下:由F值=6.369183F临界值=4.300949或P值=0.019337042显著性水平0.05可知,应拒绝原假设,患者和健康人的血磷值不同,有显著性差异。F(k-1,n-k)0 0小概率区域,拒绝H0不能拒绝H0F图6-1 方差分析的拒绝域与接受域本讲稿第七页,共四十页7.1.2双因素方差分析双因素方差分析如果对试验结果(相应变量)的影响因素不止一个,我们就要进行多因素方差分析。特别地,当影响因素有两个的时候,就进行双双因素方差分析因素方差分析。如果A和B对试验结果的影响是相互独立的,分别判断因素A和因素B对试验指标的影响,这时的双因素方差分析称为无重复试验的双因素方差分析无重复试验的双因素方差分析,否则称为可重复双因素方差分析可重复双因素方差分析。本讲稿第八页,共四十页7.1.2双因素方差分析双因素方差分析例如,为了了解不同品种小麦的产量进行农业试验,选择三块土质相同的试验田,每块又分成面积相等的四小块,把四个不同品种的小麦分别种植在每块试验田里,收获量(kg)如下,检验小麦品种及试验田对收获量是否有显著影响。本讲稿第九页,共四十页7.1.3可重复试验的双因素方差分析可重复的双因素方差分析是用来分析影响某一试验结果的两个不同因素之间关系的一种方法。它与无重复双因素分析相比具有以下几点区别:(1)调查者对两个因素都感兴趣;(2)每个因素的每组值都不止一个观察值;(3)除了每个因素的影响外,分析者也应注意到这些因素之间的相互作用,这些因素的不同组合可能带来不同的影响。本讲稿第十页,共四十页7.1.3可重复试验的双因素方差分析例如,为了了解3种改革方案在3个不同地区促使经济效益提高的状况,现抽样调查,得到数据如下表所示,检验哪些因素对经济效益的提高有显著影响。方案地区A1地区A2地区A3B1355340335334357359B2395380378396387380B3367356388372384358本讲稿第十一页,共四十页7.2用EXCEL作方差分析7.2.1单因素方差分析7.2.2无重复双因素方差分析7.2.3可重复双因素方差分析本讲稿第十二页,共四十页7.2.1单因素方差分析1检验模型例例7-2:某军区总医院欲研究A、B、C三种解毒药物的解毒效果,将24只小白鼠随机分为四组,其中三个试验组,分别注射不同的解毒药物,对照组不给药。一定时间后测定小白鼠血中胆硷脂酶含量(/ml),如表6-1,问不同解毒药对小白鼠血中胆硷脂酶含量有无显著影响?显著性水平取0.05。本讲稿第十三页,共四十页7.2.1单因素方差分析表6-1小白鼠血中胆硷脂酶含量本讲稿第十四页,共四十页7.2.1单因素方差分析(1)建立“方差分析”工作表,如图6-2所示。图6-2“方差分析”工作表(2)在单元格A8中输入“样本均值”,在单元格A9中输入“总体均值”。(3)选择单元格B8,输入公式“=AVERAGE(B2:B7)”,计算样本均值,并将其复制到C8、D8和E8单元格中,得到的值分别是18.50、28.00、18.67和14.83。图6-2“方差分析”工作表本讲稿第十五页,共四十页7.2.1单因素方差分析(4)在单元格E9中输入公式“=AVERAGE(B2:E7)”,回车后显示20。(5)建立一个新工作表“计算表”。(6)分别将单元格A2A7、A8A13、A14A19、A20A25合并,并分别输入“第一组”、“第二组”、“第三组”和“第四组”,表示样本的组数。(7)将“方差分析”工作表中B2B7、C2C7、D2D7、E2E7区域内的数据复制到“计算表”的B2B25区域中。(8)在“方差分析”工作表中选择单元格B8,单击“复制”按钮,切换到“计算表”工作表,选定单元格C2C7,右击选择“选择性粘贴”选项,打开“选择性粘贴”对话框,单击“粘贴链接”按钮。同样方法将“方差分析”表C8、D8和E8中的数据复制到“计算表”的C8C13、C14C19、C20C25区域。(9)按照步骤(8)的方法将“方差分析”表E9中的数据复制到“计算表”D2D25区域。“计算表”中的数据如图6-3所示。本讲稿第十六页,共四十页7.2.1单因素方差分析图6-3“计算表”工作表本讲稿第十七页,共四十页7.2.1单因素方差分析接例7-2,构造F统计量进行检验,需要利用“计算表”中的数据。(1)打开“计算表”工作表,在单元格E1、F1、G1中分别输入“(x-xbar)2”、“(xbar-Xbar)2”和“(x-Xbar)2”,分别表示组内方差、组间方差和总方差。在单元格A26中输入“合计”。(2)在单元格E2中输入“=(B2-C2)2”,回车后显示20.25。(3)在单元格F2中输入“=(C2-D2)2”,回车后显示2.25。(4)在单元格G2中输入“=(B2-D2)2”,回车后显示9。(5)选择单元格E2:G2,并复制到E3:G25区域中。(6)在单元格E26中输入“=SUM(E2:E25)”,并将其复制到F26和G26。计算结果如图6-4所示。本讲稿第十八页,共四十页7.2.1单因素方差分析图6-4 各离差平方和的计算本讲稿第十九页,共四十页7.2.1单因素方差分析2方差分析表下面用Excel建立方差分析表。(1)打开“方差分析”工作表和“计算表”工作表。(2)在“方差分析”工作表的单元格B11F11中分别输入“平方和”、“自由度”、“均方差”、“F值”、“P值”;分别在单元格A12A14中输入“组间方差”、“组内方差”和“总方差”。(3)将“计算表”工作表单元格E26、F26、G26中的数据分别“粘贴链接”到“方差分析”工作表的B13、B12和B14单元格中。(4)确定各方差的自由度。总方差的自由度是样本容量数之和减1,因此应为666+6-123,在单元格C14中输入23。(5)在单元格D12中输入“=B12/C12”,并将其复制到D13和D14。(6)在单元格E12中输入“=D12/D13”,计算F值。(7)在单元格F12中输入公式“=FDIST(E12,C12,C13)”,回车后显示0.00079,即为P值。计算结果如图6-5所示。本讲稿第二十页,共四十页7.2.1单因素方差分析因为P值低于显著性水平0.05,应拒绝原假设,所以不同解毒药对小白鼠血中胆硷脂酶含量有显著差异的。图6-5 方差分析表本讲稿第二十一页,共四十页7.2.1单因素方差分析3单因素方差分析工具Excel分析工具中具有方差分析模块,利用它分析例6-2可以产生与上述操作相同的结论。具体方法如下:(1)打开“方差分析”工作表。(2)选择“工具”菜单中的“数据分析”选项,弹出“数据分析”对话框,选择“方差分析:单因素方差分析”选项,单击“确定”按钮,进入“方差分析:单因素方差分析”对话框。(3)在“输入区域”中输入“$B$1:$E$7”,选中“标志位于第一行”复选框,在“”区域中输入0.05,表明显著性水平。选中“输出区域”,输入“$A$16”,表明以A16为起点放置方差分析结果,如图6-6所示。本讲稿第二十二页,共四十页7.2.1单因素方差分析图6-6“方差分析:单因数方差分析”对话框本讲稿第二十三页,共四十页7.2.1单因素方差分析(4)单击“确定”按钮,输出结果如图6-7所示。图6-7单因数方差分析输出结果图6-7 单因数方差分析输出结果本讲稿第二十四页,共四十页7.2.1单因素方差分析例例7-3:为实验三种镇咳药(1.可待因,2.复方2号,3.复方1号),分别用这三种药给三组小白鼠灌胃,测得小白鼠延迟咳嗽时间(秒)如下,比较三种药物的镇咳作用。(=0.05)本讲稿第二十五页,共四十页7.2.1单因素方差分析(1)输入原始数据。建立“药物试验分析”工作表。在A1、B1、C1、D1单元格中分别输入例号、可待因、复方1、复方2。在A2:A16单元格区域中分别输入115,在B2:B16、C2:C16、D2:D16单元格区域中分别输入可待因、复方1、复方2三种药物的数据。如图6-8所示。图6-8“药物试验分析”工作表本讲稿第二十六页,共四十页7.2.1单因素方差分析(2)利用分析工具实现自动计算,得出方差分析结果。单击“工具”菜单中的“数据分析”命令,弹出数据分析对话框。在分析工具列表中,选择“方差分析:单因素方差分析”工具,单击“确定”按钮,在出现的“方差分析:单因素分析”对话框的“输入区域”中输入$B$1:$D$16;在分组方式中选定“列”单选按钮;选中“标志位于第一行”复选框;在“”框中输入需要用来计算F值的置信度(0.05);在“输出选项”中,选定要粘贴计算结果的位置,在本例中选定为$A$18单元格,如图6-9所示。单击“确定”按钮,就得到增重分析结果报告表,如图6-10所示。本讲稿第二十七页,共四十页7.2.1单因素方差分析图6-9“方差分析:单因素方差分析”对话框图6-10 单因素方差分析输出结果本讲稿第二十八页,共四十页7.2.1单因素方差分析(3)根据结果进行判断,得出结论。因为P值=0.021712F=3.219942,所以拒绝原假设,表明三种镇咳药对延迟咳嗽时间的效果有显著差异。本讲稿第二十九页,共四十页7.2.2无重复双因素方差分析例例7-4:为了了解不同品种小麦的产量进行农业试验,选择三块土质相同的试验田,每块又分成面积相等的四小块,把四个不同品种的小麦分别种植在每块试验田里,收获量(kg)如下,试以显著性水平=0.05检验小麦品种及试验田对收获量是否有显著影响。本讲稿第三十页,共四十页7.2.3可重复双因素方差分析例例7-5:为了了解3种改革方案在3个不同地区促使经济效益提高的状况,现抽样调查,得到数据如下表所示,以显著性水平=0.01检验不同改革方案、不同地区以及它们之间的交互作用对经济效益的提高是否有显著影响。本讲稿第三十一页,共四十页7.3上机实验六用Excel进行方差分析一、实验目的及要求1理解方差分析的基本思想,掌握单因素方差分析与双因素方差分析的基本方法。2能用Excel进行单因素方差分析和双因素方差分析,会利用Excel方差分析工具对数据进行分析,并做出正确的判断。本讲稿第三十二页,共四十页7.3上机实验六用Excel进行方差分析二、实验内容(一)某公司为了了解A、B、C三种不同的营销策略对该公司生产的某产品销售额的影响,随即对4个市场进行试验。其中3个市场分别用不同的营销策略进行销售,第4个市场不采取营销策略。现将该产品4个季度的销售额统计如下:(单位:万元)(1)不同的营销策略对该产品的销售额有无显著影响?显著性水平0.05。参照6.2节建立检验模型。(2)在显著性水平0.05下检验不同营销策略及不同销售季度对销售额有无显著影响?策略季度ABCD第一季度102411081200988第二季度1138122511581024第三季度1250118012101150第四季度1120106810881025本讲稿第三十三页,共四十页7.3上机实验六用Excel进行方差分析(二)从本市高考考生中简单随机抽取50人,登记个人的考试成绩、性别、父母文化程度(按父母中较高者,文化程度记作:A大专以上,B高中,C初中,D小学以下)。(1)试检验学生的考试成绩与性别是否显著地统计相依(显著水平标准0.05);(2)试检验学生的考试成绩与家长的文化程度是否显著地统计相依(显著水平0.05)。本讲稿第三十四页,共四十页7.3上机实验六用Excel进行方差分析(350,女,C)(420,男,C)(450,男,C)(480,女,C)(530,女,C)(540,男,C)(390,男,C)(410,女,C)(310,女,C)(300,男,C)(540,女,D)(560,女,D)(290,女,D)(310,男,D)(300,男,D)(340,男,D)(490,男,D)(280,男,D)(310,女,D)(320,女,D)(405,女,D)(410,男,D)(1)试检验学生的考试成绩与性别是否显著地统计相依(显著水平标准0.05);(2)试检验学生的考试成绩与家长的文化程度是否显著地统计相依(显著水平0.05)。本讲稿第三十五页,共四十页【小结】方差分析是用来推断两组或多组资料的总体均数是否相同,检验两个或多个样本均数的差异是否有统计学意义,即判断分类变量对数值变量是否有显著影响。本章介绍了方差分析的基本思想和操作步骤;单因素方差分析;无重复试验的双因素方差分析;可重复试验的双因素方差分析。本讲稿第三十六页,共四十页【思考与练习题】1某银行支行为了对其下属分理处的服务质量进行评价,在网上银行服务、电话银行服务、ATM服务、柜台储蓄业务分别进行了调研,其中网上银行调研了7家,电话银行调研6家,信用卡调研5家、柜台储蓄调研5家,然后记录了一年中客户对不同银行服务的投诉次数,结果如表所示。试分析这四个业务的服务质量是否有显著差异?(0.05)本讲稿第三十七页,共四十页【思考与练习题】本讲稿第三十八页,共四十页【思考与练习题】2一位研究者感兴趣影响儿童阅读能力的因素。研究者认为儿童的年龄和每次阅读时间可能是重要的影响因素,设计了以下实验:选取三个年龄组的儿童:3岁、8岁、和14岁,将每个年龄组的儿童随机分配到三个阅读条件。组1阅读时间为5分钟;组2为15分钟;对于组3为30分钟。两个星期之后测试了这些儿童的阅读能力如下表所示,试分析年龄和每次阅读时间对儿童阅读能力的影响。本讲稿第三十九页,共四十页【思考与练习题】本讲稿第四十页,共四十页