第七章方差案例优秀PPT.ppt
《第七章方差案例优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第七章方差案例优秀PPT.ppt(133页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2022/11/51现有有5 5种治种治疗荨麻疹的新麻疹的新药,为了比了比较其其疗效,将效,将3030个病人随机分成个病人随机分成5 5组,每,每组6 6人。人。让同一同一组运用同一种新运用同一种新药,各病人治愈天数如,各病人治愈天数如7-17-1表表所示所示:表表7.1 57.1 5种治种治疗荨麻疹新麻疹新药治愈病人天数治愈病人天数问:5 5种种药物的物的疗效是否存在效是否存在显著差异?若存在著差异?若存在显著差异,差异体著差异,差异体现 在那些在那些药物之物之间?2022/11/52药物药物治愈天数治愈天数A16877108A2466356A3644523A4746635A59457762
2、022/11/5版权全部版权全部 BY 统计学课程组统计学课程组31.方差分析:方差分析:2.是一种是一种检验多个多个总体均体均值是否相等的是否相等的统计方法。方差分析主方法。方差分析主要用来探要用来探讨一个定量因一个定量因变量与一个或多个定性自量与一个或多个定性自变量的关系。量的关系。3.试验因素:因素:4.试验的的设计者希望考察的者希望考察的试验条件,或者条件,或者说就是方差分析探就是方差分析探讨的的对象,象,简称因素,也可称称因素,也可称为自自变量,如案例中的量,如案例中的药物。物。5.因素水平:因素水平:6.试验因素的某种特定状因素的某种特定状态或数量等或数量等级称称为因素水平,因素水
3、平,简称水称水平,事平,事实上就是因素的不同表上就是因素的不同表现。如案例中的。如案例中的5种种药物。物。若方差若方差分析只分析只针对一个因素一个因素进行,行,则称称为单因素方差分析。若方差分因素方差分析。若方差分析同析同时针对两个因素两个因素进行,行,则称称为双因素方差分析。双因素方差分析。2022/11/544.试验指指标:5.衡量衡量试验结果好坏程度的指果好坏程度的指标,也可称,也可称为因因变量,其量,其不同不同6.的取的取值常称常称为视察察值或或试验数据。在本章案例中,治愈数据。在本章案例中,治愈天天7.数就是数就是试验指指标。8.处理:理:9.依据因素的依据因素的给定水平定水平对试验
4、对象所做的操作。象所做的操作。这种操种操作就作就10.是是对因素划因素划类或确定数量等或确定数量等级,形成因素的不同水平。,形成因素的不同水平。因因11.素的一个水平就是一个素的一个水平就是一个处理。每个理。每个处理可看作一个理可看作一个试验条条12.件或一个件或一个总体。体。13.试验单元元14.接受接受处理的理的试验对象称象称为试验单元,元,简称称单元。如案元。如案例中例中15.接受治接受治疗的患者,一个患者就是一个的患者,一个患者就是一个试验单元。元。16.2022/11/552022/11/5版权全部版权全部 BY 统计学课程组统计学课程组62022/11/5版权全部版权全部 BY 统
5、计学课程组统计学课程组72022/11/5版权全部版权全部 BY 统计学课程组统计学课程组8治治愈愈天天数数A1A2A3A4A51.从散点图上可以看出 不同药物的治愈天数是有明显差异的 同一个药物不同患者的治愈天数也明显不同2.药物与治愈天数之间有确定的关系 假如药物与治愈天数之间没有关系,那么患者被治 愈的天数应当差不多相同,在散点图上所呈现的模 式也就应当很接近,不同药物的平均治愈天数就几 乎应当在一条水平线上。2022/11/5版权全部版权全部 BY 统计学课程组统计学课程组93.仅从散点图上视察还不能供应充分的证据证明不同药物的治愈天数之间有显著差异。4.须要有更精确的方法来检验这种差
6、异是否显著,也就是进行方差分析。所以叫方差分析,因为虽然我们感爱好的是均值,但在推断均值之间是否有差异时则须要借助于方差。5.不同药物的治愈天数之间的差异可能是由于抽样的随机性所造成的,也有可能是系统性影响因素造成的。6.通过对数据误差来源的分析,推断不同总体的均值是否相等。2022/11/510数据误差的来源分为随机误差和系统误差。1.随机误差 因素的同一水平(总体)下,样本各视察值之间的差异。比 如,同一药物下不同患者的治愈天数是不同的。这种差异 可以看成是随机因素影响的结果,称为随机误差。2.系统误差 因素的不同水平(不同总体)下,各视察值之间存在差异。比如,不同药物的治愈时间之间的差异
7、。这种差异可能是由于抽样的随机性所造成的,也可能是由于药物本身所造成的,后者所形成的误差是由系统性因素造成的,称为系统误差。2022/11/5112022/11/5版权全部版权全部 BY 统计学课程组统计学课程组12处理处理观测值观测值合计合计平均平均A1A2AiAk合计合计方差分析的数据结构(以单因素方差分析为例)方差分析的数据结构(以单因素方差分析为例):因素A的第i个处理的第j次观测值 :第i个处理的n个观测值之和 :全部观测值的总和 :第i个处理平均数 :全部观测值的总平均数2022/11/5版权全部版权全部 BY 统计学课程组统计学课程组13l方差分析中的统计模型,用来描述因素A的第
8、i个处理的第j次观测值 的形成机理。l结合本章案例,假设在第i个处理下的第j次观测是患者张三,则张三的治愈天数应当为:l 张三治愈天数=张三所在处理组的平均天数+l 随机因素对张三治愈天数的影响(可正可负)l =总平均天数+张三所在组平均天数与总l 平均天数之差+随机因素对治愈天数的l 影响2022/11/5版权全部版权全部 BY 统计学课程组统计学课程组14这个差值说这个差值说明白什么?明白什么?设张三所在组的平均治愈天数为 ,总平均治愈天数为 ,随机因素的影响为 ,张三所在组的平均治愈天数与总平均治愈天数之差为 ,则张三的治愈天数可表达为:2022/11/515(1)每个总体都应听从正态分
9、布对于因素的每一个水平,其视察值是来自听从正态分布总体的简洁随机样本。(2)各个总体的方差必需相同各组视察数据是从具有相同方差的总体中抽取的(3)视察值是独立的各观测值彼此之间相互不影响在上述假定条件下,推断药物对治愈天数是否有显著影响,实际上也就是检验具有同方差的五个正态总体的均值是否相等。2022/11/5版权全部版权全部 BY 统计学课程组统计学课程组16结合本章案例,方差分析要回答的问题就是5种不同的药物对治愈天数是否有显著影响,事实上就是检验五种药物的平均治愈天数是否相等。所建立的假设为:2022/11/5版权全部版权全部 BY 统计学课程组统计学课程组17l方差分析方差分析检验多个
10、多个总体的均体的均值是否相等,或是否存在是否相等,或是否存在显著著差异,是从差异,是从对数据差异来源的分析入手的。数据差异来源的分析入手的。l从本章案例中可以看出,从本章案例中可以看出,试验数据的差异存在于如下三个数据的差异存在于如下三个方面:方面:l全部全部观测值存在差异存在差异l各水平(各水平(处理)内部理)内部观测值存在差异存在差异l各水平(各水平(处理)之理)之间观测值存在差异存在差异l上述各种差异上述各种差异产生的生的缘由只有两个方面,即系由只有两个方面,即系统性因素与性因素与随机性因素。数据差异源分析,就是通随机性因素。数据差异源分析,就是通过构造反映数据差构造反映数据差异的异的统
11、计量即离差平方和,并量即离差平方和,并对其其进行分解,确定数据差行分解,确定数据差异的异的缘由。由。2022/11/518总离差平方和反映全部观测值总变异的程度。总变异可能是随机因素与系统因素(试验因素)共同影响形成的。2022/11/519处理内(组内)离差平方和反映各处理内观测值的变异程度。组内离差平方和是某一特定处理下试验数据的差异程度,与试验因素(系统因素)的变更无关,所以该离差平方和反映了随机因素所导致的数据差异,也称误差平方和。2022/11/520处理间(组间)离差平方和反映重复n次的处理间观测值的变异程度。组间离差平方和既与试验因素(系统因素)的变更有关,也与随机因素有关,所以
12、该离差平方和反映了试验因素(系统因素)与随机因素共同所导致的数据差异。2022/11/5212022/11/522SSTSSASSE 总离差平方和因素A及随机因素导致的变差随机因素导致的变差组间离差平方和组内离差平方和前述的各离差平方和的确定值的大小受到处理的重复数的影响,为了消退重复数对离差平方和的影响,并实现各离差平方和之间的可比,须要将离差平方和改造为误差均方(也可称方差)。误差均方是将各离差平方和与其对应的自由度相除所得的结果。各离差平方和的自由度如下:2022/11/523离差平方和离差平方和自由度自由度SSTSSESSA(1)组内均方(组内方差)(2)组间均方(组间方差)假如原假设
13、成立,则表明没有系统误差,组间均方与组内均方差异就不会太大;假如组间均方显著地大于组内均方,说明各水平(总体)之间的差异不仅有随机误差,还有系统误差,推断因素的水平是否对其视察值有影响,事实上就是比较组间方差与组内方差之间差异的大小。2022/11/5242022/11/525组间离差平方和组内离差平方和组间方差组内方差受因素A和随机因素的影响只受随机因素的影响通过比较组间均方与组内均方之间的大小,来检验多个总体均值是否相等,是方差分析的基本思想。假如组间均方显著地大于组内均方,说明各水平(总体)之间的差异不仅受随机因素,还有系统因素的影响,试验因素对试验指标有显著的影响;反之,若两者很接近,
14、说明各水平(总体)之间的差异仅有随机因素的影响,试验因素对试验指标无显著的影响。依据这一思想,可以构造检验的统计量。2022/11/5261.1.假如因素假如因素A A的不同水平的不同水平对试验结果没有影响,那么果没有影响,那么在在组间方差中只包含有随机方差中只包含有随机误差,两个方差的比差,两个方差的比值会接近会接近1 1。2.2.假如不同水平假如不同水平对试验结果有影响,果有影响,组间方差就会方差就会大于大于组内方差,内方差,组间方差与方差与组内方差的比内方差的比值就会就会大于大于1 1。3.3.当当这个比个比值大到某种程度大到某种程度时,就可以,就可以说不同水平不同水平之之间存在存在显著
15、差异,或者著差异,或者说因素因素A A对试验结果有果有显著影响。著影响。2022/11/527假如 ,则拒绝原假设,认为各水平均值之间存在显著差异,反之,不能拒绝原假设,认为各水平均值之间没有显著差异。2022/11/528 F F (k k-1,-1,nk-k)nk-k)0 0拒绝拒绝拒绝拒绝HH0 0不能拒绝不能拒绝不能拒绝不能拒绝H H H H0 0 0 0F F变差来源变差来源离差平方和离差平方和SSSS自由度自由度dfdf均方均方MSMSF F值值组组 间间SSASSAk-1k-1MSAMSAMSA/MSEMSA/MSE组组 内内SSESSEnk-knk-kMSEMSE总和总和SST
16、SSTnk-1nk-12022/11/529方差分析表(单因素)一般形式方差分析表(单因素)一般形式1.1.为为为为什么要什么要什么要什么要进进进进行多重比行多重比行多重比行多重比较较较较在方差分析中,不拒在方差分析中,不拒在方差分析中,不拒在方差分析中,不拒绝绝绝绝原假原假原假原假设设设设,表示拒,表示拒,表示拒,表示拒绝总绝总绝总绝总体均数相等的体均数相等的体均数相等的体均数相等的证证证证据据据据不足,分析不足,分析不足,分析不足,分析终终终终止;当原假止;当原假止;当原假止;当原假设设设设被拒被拒被拒被拒绝时绝时绝时绝时,我,我,我,我们们们们可以确定至少有两可以确定至少有两可以确定至少
17、有两可以确定至少有两个个个个总总总总体的均体的均体的均体的均值值值值有有有有显显显显著差异。但要著差异。但要著差异。但要著差异。但要进进进进一步一步一步一步检验检验检验检验哪些均哪些均哪些均哪些均值值值值之之之之间间间间有有有有显显显显著差异著差异著差异著差异还须还须还须还须要接受多重比要接受多重比要接受多重比要接受多重比较较较较的方法的方法的方法的方法进进进进行分析。行分析。行分析。行分析。2.2.什么是多重比什么是多重比什么是多重比什么是多重比较较较较多重比多重比多重比多重比较较较较是同是同是同是同时对时对时对时对各个各个各个各个总总总总体均体均体均体均值进值进值进值进行的两两比行的两两比
18、行的两两比行的两两比较较较较。方法很多,。方法很多,。方法很多,。方法很多,如如如如FisherFisher最小最小最小最小显显显显著差异(著差异(著差异(著差异(Least Significant DifferenceLeast Significant Difference,LSDLSD)方法、方法、方法、方法、TukeyTukey的的的的诚恳显诚恳显诚恳显诚恳显著差异(著差异(著差异(著差异(HSDHSD)方法或)方法或)方法或)方法或BonferroniBonferroni的方的方的方的方法法法法等。等。等。等。这这这这里我里我里我里我们们们们只介只介只介只介绍绍绍绍最小最小最小最小显显
19、显显著差异方法。著差异方法。著差异方法。著差异方法。2022/11/5302022/11/531(1)(1)(1)(1)提出假设提出假设提出假设提出假设 (2)(2)(2)(2)计算检验的统计量计算检验的统计量计算检验的统计量计算检验的统计量 (3)(3)(3)(3)决策决策决策决策 假如假如假如假如 或或或或 则拒绝则拒绝则拒绝则拒绝H0H0H0H0。2022/11/532l实际应用中,也可以按下列规则决策:实际应用中,也可以按下列规则决策:l首先计算检验统计量:首先计算检验统计量:l其次计算检验临界值:其次计算检验临界值:l最终进行统计决策:若最终进行统计决策:若 ,则拒绝原假设;反之不拒
20、,则拒绝原假设;反之不拒绝。绝。1.提出假提出假设2.计算各离差平方和及其自由度算各离差平方和及其自由度3.计算均方和算均方和F统计量量4.列方差分析表,列方差分析表,进行行F检验5.对原假原假设进行决策。若拒行决策。若拒绝原假原假设,则进行多行多 重比重比较2022/11/533l依据支配的依据支配的试验因素的多少,方差分析分因素的多少,方差分析分为单因素因素方差分析、两因素方差分析和多因素方差分析。方差分析、两因素方差分析和多因素方差分析。l单因素方差分析依据各因素方差分析依据各处理内重复数是否相等,分理内重复数是否相等,分为重复数相等与重复数不等的方差分析两种状况。重复数相等与重复数不等
21、的方差分析两种状况。l上上节探探讨的是重复数相等的状况,而重复数不等的的是重复数相等的状况,而重复数不等的方差分析的基本原理与重复数相等方差分析的基本原理与重复数相等时的的过程是一程是一样的,只是各离差平方和、自由度的的,只是各离差平方和、自由度的计算,以及多重算,以及多重比比较中中标准准误差的差的计算略有不同。算略有不同。2022/11/5342022/11/535依据本章案例介绍过程。依据本章案例介绍过程。1.建立假设:建立假设:2.计算各均值、各离差平方和、各均方、计算各均值、各离差平方和、各均方、F统计量,列方差分统计量,列方差分析表。这类计算比较麻烦,可借助相关软件完成。析表。这类计
22、算比较麻烦,可借助相关软件完成。2022/11/536差异源差异源SSdfMSFP-valueF crit组间组间47.47411.875.550.002452.76组内组内53.5252.14总计总计100.9829-方差分析表方差分析表2022/11/5373.统计决策:统计决策:从临界值来看,由于从临界值来看,由于 ,所以拒绝原假设;,所以拒绝原假设;从从P值来看,由于值来看,由于 ,所以拒绝原假设;所以拒绝原假设;4.进行多重比较进行多重比较 在显著性水平在显著性水平 时,时,由于由于 所以,水平所以,水平1和水平和水平2的均值之间存在显著差异。余此类推的均值之间存在显著差异。余此类推
23、【例】为了对几个行业的服务质量进行评价,某市消费者协会对该地的旅游业、居民服务业、马路客运业和保险业分别抽取了不同数量的企业。每个行业中的这些企业在服务内容、服务对象、企业规模等方面基本相同。经统计,最近一年消费者对这23家企业投诉的次数资料如表7-7所示,消费者协会想知道:这几个行业之间的服务质量是否有显著差异?如果有,原委是在哪些行业之间?假如能找出哪些行业的服务质量最差,就可以建议对消费者权益爱护法中该行业的某些条款作出修正。2022/11/5382022/11/539 某地消费者对四个行业的投诉次数观测序列序列旅游旅游业A1居民服居民服务业A2公路客运公路客运业A3保保险业A41576
24、25170255495968346604863445545569554564760653557473.多重比较中检验统计量:4.其余操作与单因素方差分析过程一样。2022/11/5版权全部版权全部 BY 统计学课程组统计学课程组402022/11/541解:(1)建立假设 H0:1=2=m;H1:1,2,m不 全相等 (2)计算有关均值及平方和 ST=1175.913,SE=422,SA=753.913 方差来源方差来源离差平方和离差平方和S自由度自由度均方离差均方离差F值组间SA=753.9133251.3043F=11.315组内内SE=42219 22.21053总差异差异ST=1175
25、.91322方差分析表方差分析表(3)统计决策对于显著性水平=0.05,F0.05(3.19)=3.1274由于检验统计量 F=11.315 F0.05(3.19),所以拒绝原假设 H0 ,即有95%的把握认为不同的行业之间投诉的差异显著。2022/11/5版权全部版权全部 BY 统计学课程组统计学课程组42(1)点击“工具”栏中的数据分析项;(2)在分析工具框中连击“单因素方差分析”;(3)在对话框的“数据区域”框中键入A3:C6;在框中保持0.05不变(也可依据须要变为0.01);在“输出选项”中键入D3;选择“确定”,输出结果如表7-9所示:2022/11/5版版权全部全部 BY 统计学
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七 方差 案例 优秀 PPT
限制150内