多重均值比较与方差分析前提假设的检验.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《多重均值比较与方差分析前提假设的检验.ppt》由会员分享,可在线阅读,更多相关《多重均值比较与方差分析前提假设的检验.ppt(44页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于多重均值比较与关于多重均值比较与方差分析前提假设的方差分析前提假设的检验检验9/4/20221现在学习的是第1页,共44页9/4/20222失业保险案例:为什么要进行方差分析? 为了减小失业保险支出、促进就业,政府试图为失业者提供再就业奖励:如果失业者可以在限定的时间内重新就业,他将可以获得一定数额的奖金。政策会有效吗? 现在学习的是第2页,共44页9/4/20223试验数据试验数据不同奖金水平失业者的再就业时间(天) 无奖金低奖金中奖金高奖金92869678100108927585939076888877878989797390757183947882828072756878798172
2、现在学习的是第3页,共44页9/4/20224要研究的问题要研究的问题总体1,1(奖金=1)总体2,2 (奖金=2)总体3,3(奖金=3)样本1样本2样本3样本4总体4,4(奖金=4)211, sx222, sx233, sx244, sx01234:?H现在学习的是第4页,共44页9/4/20225各个总体的均值相等吗?各个总体的均值相等吗?Xf(X)1 2 3 4Xf(X)3 1 2 4 现在学习的是第5页,共44页9/4/20226失业保险案例:实验结果失业保险案例:实验结果1=无奖金 2=低奖金 3=中奖金 4=高奖金。根据实验结果,可以认为各总体的平均失业时间相同吗?现在学习的是第6
3、页,共44页9/4/20227研究方法:两样本的研究方法:两样本的t检验?检验?n如果采用如果采用t检验法对多个总体均值进行差异显检验法对多个总体均值进行差异显著性检验著性检验 ,会出现如下问题:,会出现如下问题:n全部检验过程烦琐,做法不经济全部检验过程烦琐,做法不经济 n无统一的总体方差估计无统一的总体方差估计 ,检验的精度降低,检验的精度降低n犯第一类错误的概率增大,检验的可靠性降犯第一类错误的概率增大,检验的可靠性降低低 现在学习的是第7页,共44页9/4/20228思考思考n7岁儿童的平均身高为102,现测得某班12名7岁儿童身高分别为:n97、99、103、100、104、97、1
4、05、110、99、98、103、99n请问该班儿童身高与平均水平是否存在差异?现在学习的是第8页,共44页9/4/20229方差分析可以用来比较多个均值方差分析可以用来比较多个均值n方差分析(方差分析(Analysis of variance,ANOVA)的主要目的是)的主要目的是通过对通过对方差方差的比较来的比较来同时同时检验多个检验多个均值均值之间差异的显著性。之间差异的显著性。n可以看作可以看作t检验的扩展,只比较两个均值时与检验的扩展,只比较两个均值时与t检验等价。检验等价。n20世纪世纪20年代由英国统计学家费喧(年代由英国统计学家费喧(R. A. Fisher)最早提出)最早提出
5、的,开始应用于生物和农业田间试验,以后在许多学科中得到的,开始应用于生物和农业田间试验,以后在许多学科中得到了广泛应用。了广泛应用。现在学习的是第9页,共44页9/4/202210ANOVA (analysis of variance)n由于方差分析法是通过比较有关方差的大小而由于方差分析法是通过比较有关方差的大小而得到结论的,所以在统计中,常常把运用方差得到结论的,所以在统计中,常常把运用方差分析法的活动称为方差分析。分析法的活动称为方差分析。n方差分析的内容很广泛,既涉及到实验设计的方差分析的内容很广泛,既涉及到实验设计的模式,又关乎数据分析模型中因素效应的性质。模式,又关乎数据分析模型中
6、因素效应的性质。本章在完全随机试验设计下,讨论固定效应模本章在完全随机试验设计下,讨论固定效应模型方差分析的基本原理与方法,重点介绍单因型方差分析的基本原理与方法,重点介绍单因素方差分析。素方差分析。 现在学习的是第10页,共44页9/4/202211方差分析中的基本假设方差分析中的基本假设n(1)在各个总体中因变量都服从正态分布;)在各个总体中因变量都服从正态分布;n(2)在各个总体中因变量的方差都相等;)在各个总体中因变量的方差都相等;n(3)各个观测值之间是相互独立的。)各个观测值之间是相互独立的。现在学习的是第11页,共44页9/4/202212n同一试验条件下的数据变异同一试验条件下
7、的数据变异-随机因素影响随机因素影响n不同试验条件下,试验数据变异不同试验条件下,试验数据变异-随机因素随机因素和可能存在的系统性因素即试验因素共同影响和可能存在的系统性因素即试验因素共同影响试验数据变异原因(误差来源)分析试验数据变异原因(误差来源)分析现在学习的是第12页,共44页9/4/202213实验数据误差类型实验数据误差类型n因素的同一水平因素的同一水平( (总体总体) )下,样本各观察值之间的差异下,样本各观察值之间的差异n比如,同一奖金水平下不同不同人的失业时间是不同的比如,同一奖金水平下不同不同人的失业时间是不同的n这种差异可以看成是随机因素影响的结果,称为这种差异可以看成是
8、随机因素影响的结果,称为n系统误差系统误差n因素的不同水平因素的不同水平( (不同总体不同总体) )下,各观察值之间的差异下,各观察值之间的差异n比如,不同奖金水平之间的失业时间之间的差异比如,不同奖金水平之间的失业时间之间的差异n这种差异这种差异可能可能是由于是由于抽样的随机性抽样的随机性所造成的,所造成的,也可能也可能是由于是由于奖金奖金本身本身所造成的,后者所形成的误差是由系统性因素造成的,所造成的,后者所形成的误差是由系统性因素造成的,称为称为现在学习的是第13页,共44页9/4/202214方差分析的实质与分析目的方差分析的实质与分析目的n方差分析的实质:观测值变异原因的数量分析。方
9、差分析的实质:观测值变异原因的数量分析。n方差分析的目的:系统中是否存在显著性影响方差分析的目的:系统中是否存在显著性影响因素因素现在学习的是第14页,共44页9/4/202215 单因素方差分析模型(单因素方差分析模型(1)n单因素方差分析: 模型中有一个自变量(因素)和一个因变量。n在失业保险实验中,假设张三在高奖金组,则张三的失业时间=高奖金组的平均失业时间 + 随机因素带来的影响=总平均失业时间 +高奖金组平均值与总平均值之差 + 随机因素带来的影响ijiijiijX现在学习的是第15页,共44页9/4/202216 单因素方差分析模型(单因素方差分析模型(2)()()()()11,2
10、, , ;1,2, ,0ijiijkiiijxik jnmaeaes=+=2可 加 性 假 定约 束 条 件相 互 独 立 , 且 均 服 从 N 0,独 立 性 、 正 态 性 、 方 差 齐 性 假 定现在学习的是第16页,共44页9/4/202217总变差(离差平方和)的分解总变差(离差平方和)的分解n数据的误差用离差平方和数据的误差用离差平方和(sum of squares)描述。描述。n组内离差平方和组内离差平方和(within groups)n因素的同一水平因素的同一水平(同一个总体同一个总体)下样本数据的变异下样本数据的变异n比如,同一奖金水平下失业时间的差异比如,同一奖金水平下
11、失业时间的差异n组内离差平方和只包含组内离差平方和只包含随机误差随机误差n组间离差平方和组间离差平方和(between groups)n因素的不同水平因素的不同水平(不同总体不同总体)下各样本之间的变异下各样本之间的变异n比如,四个奖金水平之间失业时间的差异比如,四个奖金水平之间失业时间的差异n组间离差平方和既包括组间离差平方和既包括随机误差随机误差,也包括,也包括系统误差系统误差现在学习的是第17页,共44页9/4/202218总变差(离差平方和)分解的图示总变差(离差平方和)分解的图示组间变异总变异组内变异现在学习的是第18页,共44页9/4/202219SSTSSASSE 总变差211(
12、)knijijSSTxx因素A及随机因素导致的变差随机因素导致的变差组间离差平方和组内离差平方和21()kiiSSAnxx211()knijiijSSExx现在学习的是第19页,共44页9/4/202220离差平方和的自由度与均方离差平方和的自由度与均方n三个平方和的自由度分别是三个平方和的自由度分别是nSST 的自由度为的自由度为nk-1,nk为全部观察值的个数为全部观察值的个数nSSA的自由度为的自由度为k-1,其中,其中k为因素水平的个数为因素水平的个数nSSE 的自由度为的自由度为nk-kn各离差平方和的大小与观察值的多少有关,为了消除观察值多少对各离差平方和的大小与观察值的多少有关,
13、为了消除观察值多少对离差平方和大小的影响,需要将其平均,这就是均方,也称为方差。离差平方和大小的影响,需要将其平均,这就是均方,也称为方差。n均方的计算方法是用离差平方和除以相应的自由度。均方的计算方法是用离差平方和除以相应的自由度。现在学习的是第20页,共44页9/4/202221组间离差平方和组内离差平方和21()kiiSSAnxx211()knijiijSSExx组间方差1SSAMSAk组内方差SSEMSEnkk受因素A和随机因素的影响只受随机因素的影响现在学习的是第21页,共44页9/4/202222F比值比值n如果因素A的不同水平对结果没有影响,那么在组间方差中只包含有随机误差,两个
14、方差的比值会接近1n如果不同水平对结果有影响,组间方差就会大于组内方差,组间方差与组内方差的比值就会大于1n当这个比值大到某种程度时,就可以说不同水平之间存在显著差异,或者说因素A对结果有显著影响。组间方差1S S AM S Ak组内方差S S EM S En kkF =现在学习的是第22页,共44页9/4/202223F比的分布比的分布10,10215, 1215, 52122121122/22/12121121)(222)(FFFfF 分布曲线现在学习的是第23页,共44页9/4/202224F分布与拒绝域分布与拒绝域现在学习的是第24页,共44页9/4/202225方差分析的基本思想方差
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多重 均值 比较 方差分析 前提 假设 检验
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内