《五章节假设检验与方差分析.ppt》由会员分享,可在线阅读,更多相关《五章节假设检验与方差分析.ppt(54页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、5-5-1 1统计学统计学五章节假设检验与方差分析 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望5-5-2 2统计学统计学实际中的假设检验问题1.产品自动生产线工作是否正常;产品自动生产线工作是否正常;2.某种新生产方法是否会降低产品成本;某种新生产方法是否会降低产品成本;3.治疗某疾病的新药是否比旧药疗效更高;治疗某疾病的新药是否比旧药疗效更高;4.厂商声称产品质量符合标准,是否可信;厂商声称产品质量符合标准,是否可信;5.学生考试成绩是否服从正态分布学生考试
2、成绩是否服从正态分布 假设检验假设检验假设检验假设检验事先作出关于总体参数、分布事先作出关于总体参数、分布形式、相互关系等的命题形式、相互关系等的命题(假设)(假设),然后通过,然后通过样本信息来判断该命题是否成立样本信息来判断该命题是否成立(检验)(检验)。5-5-3 3统计学统计学 一、假设检验的基本思想一、假设检验的基本思想例例1.从从1000件产品中抽出件产品中抽出10件,有件,有4件次品,件次品,问这批产品能否出厂?问这批产品能否出厂?提出假设:提出假设:P5np5,n n(1-p1-p)55,可用正,可用正态分布来近似)态分布来近似)2.成数检验的 Z 统计量5-5-2929统计学
3、统计学(例)(例)一一研究者估计某市居民家庭的汽车拥有率为30%。现随机抽查了200的家庭,其中68个家庭拥有汽车。试问研究者的估计是否可信?(=0.05)5-5-3030统计学统计学 检验结果检验结果H H0 0:p p=0.3=0.3,H H1 1:p p 0.3 0.3 =0.05=0.05,n n =20=20 临界值:临界值:临界值:临界值:-1.96-1.96,+1.96+1.96检验统计量检验统计量检验统计量检验统计量:结论结论结论结论:在在 =0.05=0.05的显著性水平上接受的显著性水平上接受H H0 0,表明,表明研究者的估计可接受的。研究者的估计可接受的。5-5-313
4、1统计学统计学1。检验的。检验的P-值值2。怎样提出假设。怎样提出假设3。利用置信区间进行检验。利用置信区间进行检验 (区间估计与假设检验的关系)(区间估计与假设检验的关系)几点补充几点补充5-5-3232统计学统计学1.假设检验的假设检验的P-值值(P-Value)P值(值(P-value)是一种概率。)是一种概率。在在原原假假设设为为真真的的假假定定前前提提下下,出出现现观观察到的样本以及更极端样本的概率。察到的样本以及更极端样本的概率。拒绝原假设的最小显著性水平;拒绝原假设的最小显著性水平;观观察察到到的的显显著著性性水水平平(实实测测的的显显著著性性水平)。水平)。5-5-3333统计
5、学统计学(续续)P值值表表示示所所观观察察到到的的样样本本对对原原假假设设的支持程度。的支持程度。n nP P值值值值越越越越大大大大,在在在在原原原原假假假假设设设设为为为为真真真真的的的的情情情情况况况况下下下下,样样样样本本本本出出出出现现现现的的的的概概概概率率率率越越越越大大大大,出出出出现现现现这这这这样样样样的的的的样样样样本本本本不不不不是是是是小小小小概概概概率率率率事事事事件件件件,说说说说明明明明原原原原假假假假设设设设不不不不能能能能拒拒拒拒绝绝绝绝。反反反反之之之之,应应应应拒绝原假设。拒绝原假设。拒绝原假设。拒绝原假设。5-5-3434统计学统计学利用利用 P 值进
6、行决策值进行决策1.单侧检验n n若若P P值值 ,不能拒绝不能拒绝 H H0 0n n若若P P值值 ,拒绝拒绝 H H0 02.双侧检验n n若若P P值值 /2/2,不能拒绝不能拒绝 H H0 0n n若若P P值值 /2/2,拒绝拒绝 H H0 05-5-3535统计学统计学P值的计算值的计算设检验的统计量为,c是计算得统计量的值。n n左侧检验时,P值=p c n n右侧检验时,P值=P=p c n n双侧检验中,P值=单侧P值的2倍。5-5-3636统计学统计学例例在例三(1)中,用Z检验法对总体均值进行双侧检验,给定显著性水平=0.05,由样本数据计算出检验统计量的值=2.5,因
7、此可计算出该假设检验的:P值=Prob|2.5=2 Prob2.5 =21Prob2.5=2(0.9938)=0.0124由于P值给定的,所以拒绝原假设。5-5-3737统计学统计学2.怎样原假设和备择假设?(1)根据研究问题确定假设的形式)根据研究问题确定假设的形式n n 双侧:关心总体参数与某值有无差异。双侧:关心总体参数与某值有无差异。双侧:关心总体参数与某值有无差异。双侧:关心总体参数与某值有无差异。n n 单单单单侧侧侧侧:关关关关心心心心总总总总体体体体参参参参数数数数是是是是否否否否比比比比某某某某值值值值偏偏偏偏大大大大或或或或偏偏偏偏小。小。小。小。(2 2)建建立立原原假假
8、设设应应该该本本着着“保保守守”或或“不不轻易拒绝原假设轻易拒绝原假设”的原则。的原则。(3)有时还要顾及数学上的处理方便。)有时还要顾及数学上的处理方便。5-5-3838统计学统计学3.利用置信区间进行假设检验利用置信区间进行假设检验(双侧检验)(双侧检验)1.求出双侧检验均值的置信区间 已知时:已知时:已知时:未知时:未知时:未知时:2.若总体的假设值在置信区间内,则接受H0,反之则拒绝H0 。5-5-3939统计学统计学区间估计与假设检验的联系区间估计与假设检验的联系与区别与区别二者既有联系,二者既有联系,n n都属于统计推断方法,根据样本信息进行推断;都属于统计推断方法,根据样本信息进
9、行推断;n n推断结果都有一定置信度或有一定风险;推断结果都有一定置信度或有一定风险;n n对相同条件的推断问题,其推断的理论依据对相同条件的推断问题,其推断的理论依据抽样分布理论也相同;抽样分布理论也相同;n n利用置信区间可以进行假设检验。利用置信区间可以进行假设检验。又有区别:又有区别:n n区间估计立足于大概率,假设检验更注重小概率区间估计立足于大概率,假设检验更注重小概率是否发生;是否发生;n n二者的主要决策参考点不同。二者的主要决策参考点不同。5-5-4040统计学统计学第四节第四节 单因素试验的方差分单因素试验的方差分析析假假假假设设设设检检检检验验验验可可可可以以以以用用用用
10、于于于于检检验验一一个个总总体体的的均均值值或或检检验验两两个个总总体的均值是否相等;体的均值是否相等;方差分析方差分析方差分析方差分析检验多个总体的均值是否相等检验多个总体的均值是否相等根据所涉及的因素多少,方差分析分为:根据所涉及的因素多少,方差分析分为:单因素方差分析单因素方差分析单因素方差分析单因素方差分析双因素方差分析双因素方差分析无交互影响的无交互影响的有交互影响的有交互影响的多因素方差分析多因素方差分析5-5-4141统计学统计学方差分析的基本思想和方差分析的基本思想和原理原理(几个基本概念)(几个基本概念)1.1.因素或因子因素或因子因素或因子因素或因子 所要检验的对象称为因子
11、所要检验的对象称为因子2.水平水平水平水平 因素的具体表现称为水平(也称为类别或处理方案)因素的具体表现称为水平(也称为类别或处理方案).3.观察值观察值观察值观察值 在第在第 i i 个水平下的个水平下的 j j 个观察值,记为个观察值,记为yij ij。4.4.试验试验试验试验每一次随机抽样可看成一次随机试验每一次随机抽样可看成一次随机试验 这里只涉及一个因素,因此称为单因素试验。这里只涉及一个因素,因此称为单因素试验。5.5.总体总体总体总体 因素的每一个水平可以看作是一个总体因素的每一个水平可以看作是一个总体5-5-4242统计学统计学观察值的两种误差观察值的两种误差设各水平下的观察值
12、表示为:=该水平的总体均值该水平的总体均值该水平的总体均值该水平的总体均值+随机项随机项随机项随机项所有观察值所有观察值yij ij 之间的差异,可能来源于两个方面:之间的差异,可能来源于两个方面:1.1.系统误差(条件误差)系统误差(条件误差)系统误差(条件误差)系统误差(条件误差)各水平的总体均值不同,从各水平的总体均值不同,从而导致了各水平下的样本观察值也有差异。而导致了各水平下的样本观察值也有差异。由由于于所所研研究究因因素素改改变变而而产产生生的的试试验验结结果果的的差差异异,即即在因素的不同水平(总体)下,各观察值间的差异。在因素的不同水平(总体)下,各观察值间的差异。5-5-43
13、43统计学统计学(观察值的两种误差观察值的两种误差)2.随随机机误误差差由由于于偶偶然然因因素素而而产产生生的的差差异异,或者说是由于抽样的随机性所造成的。或者说是由于抽样的随机性所造成的。即即在在因因素素的的同同一一水水平平(同同一一个个总总体体)下下,样样本本的各观察值之间的差异;的各观察值之间的差异;方差分析就是要判断有无系统误差存在。为此,要对观察值的差异进行分析。5-5-4444统计学统计学方差的分解方差的分解1.总总离离差差平平方方和和全全部部观观察察值值与与总总平平均均数数的的离离差平方和。差平方和。2.组内平方和组内平方和各水平内部的观察值与该水平均值各水平内部的观察值与该水平
14、均值各水平内部的观察值与该水平均值各水平内部的观察值与该水平均值的离差平方和。的离差平方和。的离差平方和。的离差平方和。反映同一水平下样本观察值的差异程度,所以不包含反映同一水平下样本观察值的差异程度,所以不包含反映同一水平下样本观察值的差异程度,所以不包含反映同一水平下样本观察值的差异程度,所以不包含系统误差,系统误差,系统误差,系统误差,只包含只包含只包含只包含随机误差。随机误差。随机误差。随机误差。5-5-4545统计学统计学3.组间平方和组间平方和各组平均数与总平均数的离差平方和。各组平均数与总平均数的离差平方和。各组平均数与总平均数的离差平方和。各组平均数与总平均数的离差平方和。反反
15、映映因因素素的的不不同同水水平平(不不同同总总体体)下下各各样样本本均均值值之之间的差异;间的差异;既包括既包括随机误差随机误差随机误差随机误差,也包括,也包括系统误差;系统误差;系统误差;系统误差;总离差平方和总离差平方和总离差平方和总离差平方和=组内平方和组内平方和组内平方和组内平方和+组间平方和组间平方和组间平方和组间平方和 SST=SSE+SSA SST=SSE+SSA5-5-4646统计学统计学各离差平方和的大小与观察值的多少有关,为了消除观察值多少对离差平方和大小的影 响,需 要 将 其 平 均,这 就 是 均 方(MS),也称为方差(分分分分母母母母为为为为相应的自由度)。总总总
16、总 方方方方 差差差差=总总总总离离离离差差差差平平平平方方方方和和和和/(n-1n-1)=SST/=SST/(n-n-1 1)组内方差组内方差组内方差组内方差=组内平方和组内平方和组内平方和组内平方和/(n-kn-k)=SSE/=SSE/(n-kn-k)组间方差组间方差组间方差组间方差=组间平方和组间平方和组间平方和组间平方和/(k-1k-1)=SSA/=SSA/(k-1k-1)5-5-4747统计学统计学方差分析中的基本假定方差分析中的基本假定1.每个总体都应服从正态分布每个总体都应服从正态分布也也就就是是说说,对对于于因因素素的的每每一一个个水水平平,其其观观察察值值是是来来自自服从正态
17、分布总体的简单随机样本;服从正态分布总体的简单随机样本;2.各个总体的方差必须相同各个总体的方差必须相同也也就就是是说说,对对于于各各组组观观察察数数据据,是是从从具具有有相相同同方方差差的的总体中抽取的;总体中抽取的;3.观察值是独立的观察值是独立的5-5-4848统计学统计学提出假设提出假设构造检验的统计量构造检验的统计量给定检验的显著性水平给定检验的显著性水平计算检验统计量的值计算检验统计量的值统计决策(结论)统计决策(结论)单因素方差分析的步骤单因素方差分析的步骤5-5-4949统计学统计学1.提出假设提出假设一般提法H H0 0:m m1 1=m m2 2=m mk k (因素有因素
18、有k k个水平)个水平)H H1 1:m m1 1 ,m m2 2 ,m mk k不全相等不全相等对例七:H H0 0:m m1 1=m m2 2=m m3 3不不同同班班次次的的劳劳动动效效率率无无显显著著性性差差异异(班班次次对对劳劳动动效率没有影响)效率没有影响)H H0 0:m m1 1 ,m m2 2 ,m m3 3不全相等不全相等不同班次的劳动效率有显著性差异不同班次的劳动效率有显著性差异5-5-5050统计学统计学2.构造检验的统计量构造检验的统计量1.将MSA和MSE进行对比,即得到所需要的检验统计量F;2.当H0为真时,二者的比值服从分子自由度为k-1、分母自由度为 n-k
19、的 F 分布,即 5-5-5151统计学统计学给定显著性水平确定拒绝域给定显著性水平确定拒绝域 F(k-1,n-k)0 0拒绝拒绝拒绝拒绝HH0 0不能拒绝不能拒绝不能拒绝不能拒绝H H H H0 0 0 0F F如果均值相等,如果均值相等,如果均值相等,如果均值相等,如果均值相等,如果均值相等,F F F=MSAMSAMSA/MSEMSEMSE1 1 1统计量统计量 F分布与拒绝域分布与拒绝域 若检验统计量若检验统计量若检验统计量若检验统计量F F的值的值的值的值 临界点临界点临界点临界点F F (k-1,n-k)(k-1,n-k),则拒绝原假设。则拒绝原假设。则拒绝原假设。则拒绝原假设。5
20、-5-5252统计学统计学(例七例七)=825.143=825.143=38.857=38.857=786.286=786.2865-5-5353统计学统计学检验结果检验结果结论结论结论结论:F=182.118:F=182.118F F 0.010.01(2,18)(2,18)F F 0.050.05(2,18),(2,18),所以所以所以所以,在在在在0.010.01的显著性水平上应拒绝原的显著性水平上应拒绝原的显著性水平上应拒绝原的显著性水平上应拒绝原假设假设假设假设,自然在自然在自然在自然在0.050.05的显著性水平上也应拒绝原假设的显著性水平上也应拒绝原假设的显著性水平上也应拒绝原假
21、设的显著性水平上也应拒绝原假设.计算结果常常列为表格计算结果常常列为表格计算结果常常列为表格计算结果常常列为表格方差分析表(基方差分析表(基方差分析表(基方差分析表(基本结构见表本结构见表本结构见表本结构见表5-25-2)5-5-5454统计学统计学本章小结本章小结1.1.假设检验的概念和基本思想假设检验的概念和基本思想假设检验的概念和基本思想假设检验的概念和基本思想 2.2.假设检验的过程(一般步骤)假设检验的过程(一般步骤)假设检验的过程(一般步骤)假设检验的过程(一般步骤)3.一个正态总体参数的假设检验问题一个正态总体参数的假设检验问题一个正态总体参数的假设检验问题一个正态总体参数的假设检验问题4.4.一个总体成数的假设检验问题一个总体成数的假设检验问题一个总体成数的假设检验问题一个总体成数的假设检验问题5.利用利用p p 值进行假设检验值进行假设检验6.单因素方差分析单因素方差分析单因素方差分析单因素方差分析7.用用EXCELEXCEL进行区间估计和假设检验进行区间估计和假设检验
限制150内