欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    统计学 方差分析.pptx

    • 资源ID:87513381       资源大小:403.28KB        全文页数:54页
    • 资源格式: PPTX        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    统计学 方差分析.pptx

    第一节第一节 方差分析的一般问题方差分析的一般问题一、方差分析的含义一、方差分析的含义二、方差分析的类型二、方差分析的类型三、方差分析的基本思想三、方差分析的基本思想第1页/共54页方差分析(方差分析(analysis of variance,通常简记为,通常简记为ANOVA)是著名统计学家)是著名统计学家R.Fisher在二十世纪二十年代前后提出并系统阐述的,早期在农业、生物领域获在二十世纪二十年代前后提出并系统阐述的,早期在农业、生物领域获得应用,后来逐渐推广到医学、教学、心理、社会等众多学科领域,目前它已经成得应用,后来逐渐推广到医学、教学、心理、社会等众多学科领域,目前它已经成为数理统计中应用最广泛的几个研究方向之一,也是人文社科与自然科学研究及实为数理统计中应用最广泛的几个研究方向之一,也是人文社科与自然科学研究及实践中分析调查或实验数据的重要工具之一。践中分析调查或实验数据的重要工具之一。第2页/共54页 方差分析该统计分析方法能一次性方差分析该统计分析方法能一次性地检验多个总体均值是否存在显著差地检验多个总体均值是否存在显著差异。假设检验主要是检验两总体的均异。假设检验主要是检验两总体的均值是否差异显著。对于多个总体均值值是否差异显著。对于多个总体均值是否差异显著的问题,如果按照每一是否差异显著的问题,如果按照每一对总体进行一次检验,显然要花费较对总体进行一次检验,显然要花费较多的时间。因此,方差分析所提供的多的时间。因此,方差分析所提供的处理方法比两两比较的处理方法要方处理方法比两两比较的处理方法要方便得多。便得多。第3页/共54页某饮料生产企业研制出一种新型饮料。饮某饮料生产企业研制出一种新型饮料。饮料的颜色共有四种,分别为料的颜色共有四种,分别为橘黄色橘黄色、粉色粉色、绿色绿色和和无色无色透明。这四种饮料的营养含量、透明。这四种饮料的营养含量、味道、价格、包装等可能影响销售量的因味道、价格、包装等可能影响销售量的因素全部相同。现从地理位置相似、经营规素全部相同。现从地理位置相似、经营规模相仿的五家超级市场上收集了前一时期模相仿的五家超级市场上收集了前一时期该饮料的销售情况,见下表,试分析饮料该饮料的销售情况,见下表,试分析饮料的颜色是否对销售量产生影响。的颜色是否对销售量产生影响。例例第4页/共54页 该饮料在五家超市的销售情况该饮料在五家超市的销售情况超市超市无色无色粉色粉色橘黄色橘黄色绿色绿色1234526.528.725.129.127.231.228.330.827.929.627.927.925.125.128.528.524.224.226.526.530.829.632.431.732.8第5页/共54页方差分析的基本概念方差分析的基本概念因素因素因素又称因子,指所要检因素又称因子,指所要检验的对象。是在实验中或验的对象。是在实验中或在抽样时发生的在抽样时发生的“量量”,通常用通常用A、B、C表表示。示。要分析饮料的颜色对销要分析饮料的颜色对销售量是否有影响,颜色售量是否有影响,颜色是要检验的因素或因子是要检验的因素或因子第6页/共54页水平水平因子在实验中的不同状因子在实验中的不同状态或因素的具体表现称态或因素的具体表现称为水平。上例中为水平。上例中A1、A2、A3、A4四种颜色就是因四种颜色就是因素的水平。素的水平。交互影响交互影响如果因子间存在相互作用,如果因子间存在相互作用,称之为称之为“交互影响交互影响”;如;如果因子间是相互独立的,果因子间是相互独立的,则称为无交互影响。则称为无交互影响。第7页/共54页观察值观察值在每个因素水平下得到的样在每个因素水平下得到的样本值。本值。上例中每种颜色饮料的销售上例中每种颜色饮料的销售量就是观察值。量就是观察值。总体总体因素的每一个水平可以看作因素的每一个水平可以看作是一个总体。是一个总体。上例中上例中A1、A2、A3、A4四四种颜色可以看作是四个总体。种颜色可以看作是四个总体。第8页/共54页按影响分析指标的因素个数多少的不同按影响分析指标的因素个数多少的不同 单因素方差分析单因素方差分析 双因素方差分析双因素方差分析 多因素方差分析多因素方差分析按分析指标(观察结果)中变量个数多少的不同按分析指标(观察结果)中变量个数多少的不同 一元方差分析一元方差分析 多元方差分析多元方差分析 第9页/共54页X11aX21aXn1aX12aX22aXn2a.X1kaX2kaXnkaX11bX21bXn1bX12bX22bXn2b.X1lbX2lbXnlbX11cX21cXn1cX11cX22cXn1c.X11cX2kcXnmc因子因子A因子因子B因子因子C水水平平1水水平平2.水水平平k水水平平1水水平平2.水水平平l水水平平1水水平平2.水水平平m第10页/共54页方差分析的基本思想方差分析的基本思想n n比较两类误差以检验均值是否相等比较两类误差以检验均值是否相等比较两类误差以检验均值是否相等比较两类误差以检验均值是否相等n n 比较的基础是方差比比较的基础是方差比比较的基础是方差比比较的基础是方差比n n 如果系统如果系统如果系统如果系统(处理处理处理处理)误差显著地不同于随机误差,则均值就是不相等的;反之,均值就是相等误差显著地不同于随机误差,则均值就是不相等的;反之,均值就是相等误差显著地不同于随机误差,则均值就是不相等的;反之,均值就是相等误差显著地不同于随机误差,则均值就是不相等的;反之,均值就是相等的的的的n n 误差是由各部分的误差占总误差的比例来测度的误差是由各部分的误差占总误差的比例来测度的误差是由各部分的误差占总误差的比例来测度的误差是由各部分的误差占总误差的比例来测度的第11页/共54页两类误差两类误差随机随机误差误差在因素的同一水平在因素的同一水平(同一个总体同一个总体)下,样本的各观察值之间的差异。下,样本的各观察值之间的差异。比如,同一种颜色的饮料在不同比如,同一种颜色的饮料在不同超市上的销售量是不同的。不同超市上的销售量是不同的。不同超市销售量的差异可以看成是随超市销售量的差异可以看成是随机因素的影响,或者说是由于抽机因素的影响,或者说是由于抽样的随机性所造成的,称为随机样的随机性所造成的,称为随机误差误差。第12页/共54页系统系统误差误差在因素的不同水平在因素的不同水平(不同总体不同总体)下,下,各观察值之间的差异。比如,各观察值之间的差异。比如,同一家超市,不同颜色饮料的同一家超市,不同颜色饮料的销售量也是不同的。这种差异销售量也是不同的。这种差异可能是由于抽样的随机性所造可能是由于抽样的随机性所造成的,也可能是由于颜色本身成的,也可能是由于颜色本身所造成的,后者所形成的误差所造成的,后者所形成的误差是由系统性因素造成的,称为是由系统性因素造成的,称为系统误差。系统误差。第13页/共54页两类方差两类方差组内方差组内方差因素的同一水平因素的同一水平(同一个总同一个总体体)下样本数据的方差。下样本数据的方差。比如,无色饮料比如,无色饮料A1在在5家家超市销售数量的方差。超市销售数量的方差。组内方差只包含随机误差组内方差只包含随机误差第14页/共54页组间方组间方差差因素的不同水平因素的不同水平(不同总不同总体体)下各样本之间的方差下各样本之间的方差比如,比如,A1、A2、A3、A4四种颜色饮料销售量之间四种颜色饮料销售量之间的方差。组间方差既包括的方差。组间方差既包括随机误差,也包括系统误随机误差,也包括系统误差。差。两类方差两类方差第15页/共54页方差的比较方差的比较如如果果不不同同颜颜色色(水水平平)对对销销售售量量(结结果果)没没有有影影响响,那那么么在在组组间间方方差差中中只只包包含含有有随随机机误误差差,而而没没有有系系统统误误差差。这这时时,组组间间方方差差与与组组内内方方差差就就应应该该很很接接近近,两个方差的比值就会接近两个方差的比值就会接近1第16页/共54页如果不同的水平对结果有影响,在组间如果不同的水平对结果有影响,在组间方差中除了包含随机误差外,还会包含方差中除了包含随机误差外,还会包含有系统误差,这时组间方差就会大于组有系统误差,这时组间方差就会大于组内方差,组间方差与组内方差的比值就内方差,组间方差与组内方差的比值就会大于会大于1。当当这这个个比比值值大大到到某某种种程程度度时时,就就可可以以说说不同水平之间存在着显著差异。不同水平之间存在着显著差异。方差的比较方差的比较第17页/共54页基本假定基本假定 每个总体都应服从每个总体都应服从正态分布正态分布对对于于因因素素的的每每一一个个水水平平,其其观观察察值值是是来来自自服服从从正正态态分分布布总总体体的的简简单随机样本单随机样本比比如如,每每种种颜颜色色饮饮料料的的销销售售量量必必须服从正态分布须服从正态分布第18页/共54页基本假定基本假定 各个总体的各个总体的方差必须相同方差必须相同对对于于各各组组观观察察数数据据,是是从从具具有有相相同同方方差差的总体中抽取的。的总体中抽取的。比比如如,四四种种颜颜色色饮饮料料的的销销售售量量的的方方差差都都相同。相同。观察值是观察值是独立独立的。的。比比如如,每每个个超超市市的的销销售售量量都都与与其其他他超超市市的销售量独立。的销售量独立。第19页/共54页方差分析的原理方差分析的原理 在上述假定条件下,判断颜色对销售量在上述假定条件下,判断颜色对销售量u是否有显著影响,实际上也就是检验具是否有显著影响,实际上也就是检验具u有同方差的四个正态总体的均值是否相有同方差的四个正态总体的均值是否相u等的问题。等的问题。u如果四个总体的均值相等,可以期望四如果四个总体的均值相等,可以期望四u个样本的均值也会很接近。个样本的均值也会很接近。第20页/共54页方差分析的原理方差分析的原理 四四个个样样本本的的均均值值越越接接近近,我我们们推推断断四四个个总总体体均均值值相相等等的的证证据据也就越充分。也就越充分。u样本均值越不同,我们推断样本均值越不同,我们推断总体均值不同的证据就越充分。总体均值不同的证据就越充分。第21页/共54页如果原假设成立,即如果原假设成立,即H0:=四种颜色饮料销售的均值都相四种颜色饮料销售的均值都相等等没有系统误差没有系统误差 这意味着每个样本都来自均值为这意味着每个样本都来自均值为 、方差为、方差为 2的同一正态总体的同一正态总体 第22页/共54页X X Xf(X)f(X)f(X)第23页/共54页如果备择假设成立,即如果备择假设成立,即H1:(i=1,2,3,4)不全相等不全相等至少有一个总体的均值是不同的至少有一个总体的均值是不同的有系统误差有系统误差 这意味着四个样本分别来自均值不同的这意味着四个样本分别来自均值不同的四个正态总体四个正态总体。第24页/共54页X X Xf(X)f(X)f(X)第25页/共54页方差的分解方差的分解样本数据的波动又两个来源:样本数据的波动又两个来源:一个是随机波动;一个是因子一个是随机波动;一个是因子影响。样本数据的波动,可通影响。样本数据的波动,可通过离差平方和来反映。这个离过离差平方和来反映。这个离差平方和可分解为组间方差与差平方和可分解为组间方差与组内方差两部份。即组内方差两部份。即第26页/共54页方差的分解方差的分解总离差平方和总离差平方和=组间离差平方和组间离差平方和+组内离差平方和组内离差平方和 组间方差反映出不同的因子对样本波动的组间方差反映出不同的因子对样本波动的影响;组内方差则是不考虑组间方差的纯随机影响;组内方差则是不考虑组间方差的纯随机影响。影响。如果组间方差明显高于组内方差,说明样如果组间方差明显高于组内方差,说明样本数据波动的主要来源是组间方差,因子是引本数据波动的主要来源是组间方差,因子是引起波动的主要原因,可认为因子对实验的结果起波动的主要原因,可认为因子对实验的结果存在显著的影响;存在显著的影响;第27页/共54页反之,如果波动的主要部分来自组内方差,则因子反之,如果波动的主要部分来自组内方差,则因子的影响就不明显,没有充足理由认为因子对实验或的影响就不明显,没有充足理由认为因子对实验或抽样的结果有显著作用。抽样的结果有显著作用。检验统计量检验统计量1、自由度:产生方差的独立变量的个数,称做自、自由度:产生方差的独立变量的个数,称做自由度。由度。2、均方差:方差除以独立变量个数即自由度。、均方差:方差除以独立变量个数即自由度。3、检验因子影响是否显著的统计量、检验因子影响是否显著的统计量.第28页/共54页F F统计量越大,越说明组间方差统计量越大,越说明组间方差是主要的方差来源,因子影响是是主要的方差来源,因子影响是显著的;显著的;F F越小,越说明随机方越小,越说明随机方差是主要的方差来源,因子的影差是主要的方差来源,因子的影响不显著。响不显著。第29页/共54页第二节第二节 单因素方差分析单因素方差分析一、单因素方差分析的步骤一、单因素方差分析的步骤二、单因素方差分析中的其它问题二、单因素方差分析中的其它问题三、显著性统计检验三、显著性统计检验第30页/共54页单因素方差分析的步骤单因素方差分析的步骤(一)提出假设(一)提出假设(二)构造检验统计量(二)构造检验统计量(三)统计决策(三)统计决策第31页/共54页单因素方差分析的步骤单因素方差分析的步骤提出假设提出假设一般提法一般提法H H0 0:=:=(因素有因素有r r个水平)个水平)H H1 1:,不不全相等全相等对前面的例子提出假设对前面的例子提出假设H H0 0:=:=颜色对销售量没有影响颜色对销售量没有影响H H1 1:,不全相等不全相等颜色对销售量有影响颜色对销售量有影响第32页/共54页构造检验统计量构造检验统计量为检验为检验H H0 0是否成立,需确定检验是否成立,需确定检验的统计量的统计量 FF统计量统计量第33页/共54页构造检验统计量需要计算构造检验统计量需要计算1 1、水平的均值、水平的均值2 2、全部观察值的总均值、全部观察值的总均值3 3、离差平方和、离差平方和4 4、均方差、均方差第34页/共54页平方和分解公式平方和分解公式 (总离差平方和)(总离差平方和)(组间离差平方和)(组间离差平方和)(组内离差平方和)(组内离差平方和)SSTSSASSE第35页/共54页 单因素方差分析数据结构表单因素方差分析数据结构表 水平号水平号观察指标值观察指标值算术均值算术均值方差方差A1A2Arx11 x12 .x1n x21 x22 x2n.xr 1 xr2 xrn.S12 S22.Sr2第36页/共54页SSSST T是全部观察值是全部观察值 与总平均值的离与总平均值的离差平方和,反映全部观察值的离散差平方和,反映全部观察值的离散状况。状况。其计算公式为:其计算公式为:SSSST T反映了全部数据总的误差程度。反映了全部数据总的误差程度。第37页/共54页计算计算SSSSE E组内离差平方和组内离差平方和SSSSE E反映了随机误差的大小。反映了随机误差的大小。第38页/共54页计算计算SSSSA A(组间离差平方和)组间离差平方和)SSSSA A既包括随机误差,也包括系统既包括随机误差,也包括系统误差,反映的是随机误差和系统误差,反映的是随机误差和系统误差的大小。误差的大小。第39页/共54页方差来方差来源源df(自由自由度度)S2(离差平离差平方和方和)S2(均方差均方差)F值值p值值因素因素Ar-1P随机误随机误差差n-r总总 和和n-1 单因素方差分析表单因素方差分析表 第40页/共54页如果原假设成立,即如果原假设成立,即H H1 1 H H2 2 H Hr r为真,则表明没有系统误差,组间平方为真,则表明没有系统误差,组间平方和和SSSSA A除以自由度后的均方差与组内平方和除以自由度后的均方差与组内平方和SSSSE E除以自由度后的均方差的差异就不会太大;除以自由度后的均方差的差异就不会太大;如果组间均方差显著地大于组内均方差,说明各水平如果组间均方差显著地大于组内均方差,说明各水平(总体总体)之间的差异不仅有随机误差,之间的差异不仅有随机误差,还有系统误差。还有系统误差。第41页/共54页判断因素的水平是否对其观察值有判断因素的水平是否对其观察值有影响,实际上就是比较组间均方差与影响,实际上就是比较组间均方差与组内均方差之间差异的大小。组内均方差之间差异的大小。检验这种差异,需要构造一个用于检检验这种差异,需要构造一个用于检验的统计量。验的统计量。检验统计量检验统计量=组间均方差组间均方差/组内均方差组内均方差即:即:第42页/共54页计算均方差计算均方差各离差平方和的大小与观察值的多少有关,各离差平方和的大小与观察值的多少有关,为了消除观察值多少对离差平方和大小的影为了消除观察值多少对离差平方和大小的影响,需要用离差平方和除以相应的自由度,响,需要用离差平方和除以相应的自由度,这就是均方差。这就是均方差。计算方法:计算方法:第43页/共54页统计决策统计决策将检验统计量的值将检验统计量的值F F与给定的显著性与给定的显著性水平水平 的临界值的临界值F F 进行比较,作出进行比较,作出接受或拒绝原假设接受或拒绝原假设H H0 0的决策。的决策。第44页/共54页接受域接受域 拒绝域拒绝域检检验验规规则则第45页/共54页若若FFFF ,则拒绝原假设,则拒绝原假设H H0 0 ,表明均值,表明均值之间的差异是显著的,所检验的因素之间的差异是显著的,所检验的因素(A)(A)对观察值有显著影响。对观察值有显著影响。若若F F F F ,则不能拒绝原假设,则不能拒绝原假设H H0 0 ,表明所检验的因素,表明所检验的因素(A)(A)对观察值没有显著影响对观察值没有显著影响。第46页/共54页方差来方差来源源df(自由自由度度)S2(离差平离差平方和方和)S2(均方差均方差)F值值p值值因素因素Ar-1P随机误随机误差差n-r总总 和和n-1 单因素方差分析表单因素方差分析表 第47页/共54页单因素方差分析表单因素方差分析表方差来源方差来源平方和平方和SS自由度自由度df均方差均方差F 值值组间组间(因素影响因素影响)组内组内(误差误差)总和总和SA2SE2ST2r-1n-r rn-1 1SA2SE2第48页/共54页例例 为了对几个行业的服务质量进行评价,消费者协会在零售业、旅游业、航空公司、家电制造为了对几个行业的服务质量进行评价,消费者协会在零售业、旅游业、航空公司、家电制造业分别抽取了不同的样本,其中零售业抽取业分别抽取了不同的样本,其中零售业抽取7家,旅游业抽取了家,旅游业抽取了6家,航空公司抽取家,航空公司抽取5家、家、家电制造业抽取了家电制造业抽取了5家,然后记录了一年中消费者对总共家,然后记录了一年中消费者对总共23家服务企业投诉的次数,结果家服务企业投诉的次数,结果如下表所示。试分析这四个行业的服务质量是否有显著差异?如下表所示。试分析这四个行业的服务质量是否有显著差异?(0.05)第49页/共54页消费者对四个行业的投诉次数消费者对四个行业的投诉次数 观察值观察值(j)行业行业(A)零售业零售业旅游业旅游业航空公司航空公司家电制造业家电制造业123456757554645545347 624960545655 5149485547 7068636960 第50页/共54页解解:设设四四个个行行业业被被投投诉诉次次数数的的均均值值分分别别为为,、,则则需需要要检检验验如如下下假设假设 H0:=(四四个个行行业业的服务质量无显著差异的服务质量无显著差异)H1:,不不全全相相等等 (有有显著差异显著差异)Excel输出的结果如下输出的结果如下第51页/共54页第52页/共54页结论结论:拒绝拒绝H0,即四个行即四个行业的服务质量有业的服务质量有显著差异。显著差异。第53页/共54页感谢您的观看!第54页/共54页

    注意事项

    本文(统计学 方差分析.pptx)为本站会员(莉***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开