概率论和数理统计 假设检验.ppt
第四章第四章 假设检验假设检验 在前面两章在前面两章,我们研究了数理统计的基本概念我们研究了数理统计的基本概念,着重介绍了几个着重介绍了几个常用统计量及抽样分布常用统计量及抽样分布,例如,例如 分分布,布,t分布,分布,F分布;然后研究了参数估计方法,分分布;然后研究了参数估计方法,分别讨论了别讨论了点估计点估计包括矩估计法和最大似然估计法,包括矩估计法和最大似然估计法,区间估计区间估计主要是正态总体参数的区间估计。主要是正态总体参数的区间估计。1 本章将主要介绍本章将主要介绍假设检验假设检验,它是统计推断中的,它是统计推断中的一类重要问题,具有较强的实用性。一类重要问题,具有较强的实用性。2本章主要学习内容本章主要学习内容1 1 假设检验概述假设检验概述2 2 正态总体参数的假设检验正态总体参数的假设检验3 3 非参数检验非参数检验4 4假设检验问题的假设检验问题的p p值法值法3所谓假设检验就是对总体所谓假设检验就是对总体X X作某种假设作某种假设,然后,然后依据样依据样本数据本数据,利用,利用概率论的知识,判定假设概率论的知识,判定假设“H H0 0”是否成是否成立立的推断方法。的推断方法。1.1.总体分布类型已知但含有未知参数,对未知参数作某种总体分布类型已知但含有未知参数,对未知参数作某种 假设,然后判定假设的正确性。假设,然后判定假设的正确性。2.2.总体分布类型未知,对总体的分布类型等作某种假设,总体分布类型未知,对总体的分布类型等作某种假设,然后判定假设的正确性。然后判定假设的正确性。参数检验参数检验非参数检验非参数检验两类典型问题两类典型问题:1 1 假设检验假设检验4 本节主要学习假设检验的概念;本节主要学习假设检验的概念;要点是:理解假设检验的基本思想,熟悉要点是:理解假设检验的基本思想,熟悉假设检验可能产生的两类错误。假设检验可能产生的两类错误。5引例引例引例引例1 1 1 1 某车间用一台包装机包装葡萄糖,额定标准为每袋某车间用一台包装机包装葡萄糖,额定标准为每袋净重净重0.50.5公斤。设实际袋重服从正态分布,且公斤。设实际袋重服从正态分布,且=0.015=0.015。某。某天开工后,随机抽取天开工后,随机抽取9 9袋,称得净重为袋,称得净重为 0.497,0.560,0.518 0.524,0.489,0.511,0.510,0.515,0.512.问包装机的工作是否问包装机的工作是否正常正常?一、问题的引出一、问题的引出 思考:思考:思考:思考:怎样算是怎样算是 “包装机的工作正常包装机的工作正常”?总体的均值是否等于额定值总体的均值是否等于额定值 0.5?各袋重量允许有误差,但平均袋重应当稳定在额定标准!各袋重量允许有误差,但平均袋重应当稳定在额定标准!解决思路:解决思路:假设假设 的值等于的值等于0.50.5,我们以,我们以样本数据样本数据为事实依为事实依据,来据,来检验检验该假设的正确性。该假设的正确性。6如何给出一个明确的数量界限,以便确认此如何给出一个明确的数量界限,以便确认此偏差是否过大呢?偏差是否过大呢?由于样本均值是总体由于样本均值是总体 的无偏估计,故的无偏估计,故当当H0 0为真时,为真时,当当H0 0为真时为真时如果如果过分大过分大,则有理由,则有理由 怀疑怀疑H0 0的正确性从而拒绝的正确性从而拒绝H0分析分析:记包装机所包装的糖的重量为记包装机所包装的糖的重量为X,则则假设假设 H0 0:=0 0=0.5=0.5(相当于假设包装机工作正常)相当于假设包装机工作正常),7小概率原理小概率原理小概率原理小概率原理:一个小概率事件一个小概率事件,在一次试验中是不会发生的。在一次试验中是不会发生的。代入样本值,计算得代入样本值,计算得小概率事件在一次试验中竟然发生了,与小概率事件在一次试验中竟然发生了,与“小概率原理小概率原理”相相背背 -矛盾!矛盾!因此,我们有理由认为,假设因此,我们有理由认为,假设H0 0不真,而拒绝之。不真,而拒绝之。有理由认为包装机工作不正常。有理由认为包装机工作不正常。|U|1.96|1.96是一个概率很小的事件!是一个概率很小的事件!比如取比如取=0.05,就有,就有概率反证法:概率反证法:如果小概率事件在一次试验中竟然发生了,如果小概率事件在一次试验中竟然发生了,我们就我们就 以很大的把握否定原假设。以很大的把握否定原假设。8二、常用的术语二、常用的术语 故假设故假设H0 0是不合理的,从而拒绝是不合理的,从而拒绝H0 0,接受接受H1 1,即认为包装机的工作不正常。即认为包装机的工作不正常。临界值点临界值点解解:今假设今假设H0 0:=0 0=0.5=0.5,且记且记H1 1:0 0=0.5=0.5,由于由于XN(0 0,2 2),),故故进而进而:检验统计量检验统计量对于给定的对于给定的 =0.05=0.05,检检验验水水平平 有有 P|U|k=0.05=0.05拒绝域拒绝域 其中其中 k=z/2/2=1.96=1.96。实际计算得实际计算得原假设原假设备择假设备择假设当当H0 0为真时,为真时,统计量的实测值落统计量的实测值落入了拒绝域入了拒绝域1 1、两种易犯的错误、两种易犯的错误9 “弃真弃真”错误:错误:三、方法的分析三、方法的分析 即即为为检验水平检验水平.“弃真弃真”错误发生的概错误发生的概率率为为?当假设当假设H0 0为真时,因样本的统计量的为真时,因样本的统计量的观察值落入拒绝域,按此方法,观察值落入拒绝域,按此方法,H0 0被拒绝被拒绝。因代入样本值,因代入样本值,概率(概率()很小的事件)很小的事件|U|1.96|1.96发生了发生了,发现发现:P 拒绝拒绝H0 0|H0 0为真为真 =拒绝拒绝H H0 010 “纳伪纳伪”错误:错误:“纳伪纳伪”错误发生的概率错误发生的概率为为?PP接受接受H0 0|H0 0为假为假=.注注注注:1-1-.在实际应用中在实际应用中,这两种错误这两种错误,都会带来损失!都会带来损失!通常记为通常记为 ,即,即 当当H0 0为假时,因样本的统计量的观察值落入接为假时,因样本的统计量的观察值落入接受域,按此方法,受域,按此方法,H0 0 被接受被接受.11愿望愿望愿望愿望:和和 都尽可能地小都尽可能地小.事实事实事实事实:n一定时一定时,减少减少 ,必导致必导致 的增加的增加;原则原则:通常只控制犯第一类错误的概率通常只控制犯第一类错误的概率,即只控制使即只控制使 适量地小适量地小,(如:取如:取 为为0.1,0.05,0.01,0.0050.1,0.05,0.01,0.005等等,)而不考虑第二类错误的概而不考虑第二类错误的概率率.这样的检验称为这样的检验称为显著性检验显著性检验,数数 称为称为显著性显著性检验水平检验水平(简称水平或信度简称水平或信度).).经实践论证:当经实践论证:当n充分大时充分大时,和和 可同时减少可同时减少,或或(或或)减少而不至于使减少而不至于使(或或)增加增加.2 2、检验结果的含义、检验结果的含义 拒绝假设拒绝假设H0 0是有说服力的;是有说服力的;12因因 P|U|k=在引例中,在引例中,拒绝拒绝H0 0小概率事件发生了小概率事件发生了而接受而接受H0 0相对来说,是欠说服力的。相对来说,是欠说服力的。找出了矛盾找出了矛盾可见,可见,H0 0与与H1 1不是不是“对称对称”的,不能随意交换!的,不能随意交换!因此,为了得到较有说服力的结果,应将我们要说明因此,为了得到较有说服力的结果,应将我们要说明的结论作为的结论作为H1 1,而把其反面作为而把其反面作为H0 0。例如例如:有两个总体有两个总体 XN(N(1 1,1 12 2),),YN(2 2,2 22 2)要问:两总体的均值是否有显著的差别?要问:两总体的均值是否有显著的差别?应设应设 H0 0:1 1=2 2,H1 1:1 1 2 2要问:总体要问:总体X X的均值是否显著比总体的均值是否显著比总体Y Y的均值大的均值大?应设应设 H0 0:1 1 2 2,H1 1:1 1 2 2双边检验双边检验单边检验单边检验 1 1、根据问题的要求,提出假设、根据问题的要求,提出假设H0和备择假设和备择假设H1。13 2 2、在、在H0成立的前提下,构造一个适当的检验统计量成立的前提下,构造一个适当的检验统计量V,(它的分布应不含任何未知参数,而且可以查出或算出它的分位点。)它的分布应不含任何未知参数,而且可以查出或算出它的分位点。)3 3、按给定的显著性水平、按给定的显著性水平,在原假设为真的条件下,在原假设为真的条件下,求出临界值点求出临界值点,从而求出拒绝域。从而求出拒绝域。4 4、根据样本的观察值算出、根据样本的观察值算出V的值,确定是否拒绝的值,确定是否拒绝H0。注注注注:前两步乃解决问题的关键点!前两步乃解决问题的关键点!四、方法的步骤四、方法的步骤 结合备择假设结合备择假设回顾引例的解题过程回顾引例的解题过程-k0k临界值点临界值点拒绝域拒绝域1 1、按检验对象分类:、按检验对象分类:参数检验,非参数检验。参数检验,非参数检验。142 2、按拒绝域形成分类:、按拒绝域形成分类:双边检验双边检验:在水平在水平 下检验假设下检验假设 H0 0:=0 0;H1 1:0 0 哪一个成立。哪一个成立。单边检验单边检验:在水平在水平 下检验假设下检验假设 H0 0:=0 0;H1 1:0 0 (或或 0 0=40=40一个有用的一个有用的结论结论:具有相同的拒绝域具有相同的拒绝域.(1)(1)此问题为此问题为:在水平在水平 =0.05=0.05下检验假设:下检验假设:H0 0:0 0=40=40;H1 1:0 0=40=40 哪一个成立哪一个成立?(2)取统计量取统计量:17解:解:则则UN(0,1)。u =(40.75-40)/(2/5)=1.8651.65所以应予拒绝所以应予拒绝H0 0,而接受而接受H1 1;也就是说;也就是说,技术革新后技术革新后,产品的寿命在水平产品的寿命在水平=0.05=0.05下下有了显著提高。有了显著提高。Z1-接受域拒绝域1.假设的提法假设的提法;2.选择检验统计量选择检验统计量;3.确定拒绝域的形式。确定拒绝域的形式。注意注意用单侧分位点用单侧分位点双侧检验双侧检验的拒绝域取在两侧的拒绝域取在两侧;单边检验单边检验的拒绝域中不等式的取向与的拒绝域中不等式的取向与备择假设备择假设H1中不中不等式的取向完全等式的取向完全一致。一致。(3)(3)由由P UZ0.05 =0.05 查表查表Z0.050.05=1.65,=1.65,(4)(4)而而U 的数值的数值:18单个正态总体均值单个正态总体均值 的检验的检验总体方差总体方差 2 2已知时,已知时,总体方差总体方差 2 2未知时,未知时,检验统计量检验统计量检验统计量检验统计量U检验法检验法t检验法检验法拒绝域拒绝域拒绝域拒绝域双侧检验双侧检验的拒绝域取在两侧的拒绝域取在两侧;单边检验单边检验的拒绝域中不等式的取向与的拒绝域中不等式的取向与备择假设备择假设H1中不中不等式的取向完全等式的取向完全一致。一致。HH0:=0 0 H1 1:0 0 H0:=0 0 H1 1:0 0 H0:=0 0 H1 1:0 H0:=0 H1:t0.025(9)=0.05,查查t分布表得分布表得 t0.0250.025(9)=2.262,(9)=2.262,即在显著性水平即在显著性水平0.050.05下,可认为下,可认为灯泡的平均寿命为灯泡的平均寿命为 =1600=1600。统计量的观测值未落入拒绝域中,从而统计量的观测值未落入拒绝域中,从而接受接受H0 0.H0 0:=0 0=1600=1600,H1 1:0 0 解:解:解:解:(2)(2)由于方差未知由于方差未知,所以选统计量所以选统计量:例例2 2 在正常情况下在正常情况下,某工厂生产的灯泡的寿命某工厂生产的灯泡的寿命X X服从正态分布服从正态分布,今今测得测得1010个灯泡寿命个灯泡寿命为为:14901490,1440,1680,1610,1500,1750,1550,1420,1800,1580,1440,1680,1610,1500,1750,1550,1420,1800,1580 问能否认为该工厂生产的灯泡寿命问能否认为该工厂生产的灯泡寿命 0 0=1600=1600 (=0.05)?=0.05)?(1)(1)提出假设提出假设:(4)(4)而而T 的数值的数值:20问题问题:区间估计与假设检验有何关系区间估计与假设检验有何关系?以以 2未知,未知,关于关于 的区间估计与假设检验为例说明的区间估计与假设检验为例说明.设置信度为设置信度为1,即即检验水平为检验水平为 ,则则对对,查查t分布表使分布表使得得 的置信区间为的置信区间为选用统计量选用统计量共同点:共同点:区间估计区间估计假设检验假设检验假设假设 H0:=0,H1:0H H0 0的拒绝域为的拒绝域为:求得统计量的观求得统计量的观测值测值区间估计与假设检验的统计处理是区间估计与假设检验的统计处理是相通相通的的.但区间估计是但区间估计是估计未知参数所在的区间;估计未知参数所在的区间;假设检验是给了有关未知参数的假设假设检验是给了有关未知参数的假设,去去判定假设的对错。判定假设的对错。结论:结论:区别:区别:两总体两总体X与与Y的方差的方差 1 12 2、2 22 2已知时,用已知时,用21作为检验统计量作为检验统计量U检验法。检验法。两总体两总体X与与Y的方差的方差 1 12 2、2 22 2未知,但未知,但 1 12 2=2 22 2=2 2,用,用作为检验统计量作为检验统计量t检验法。检验法。二、两个正态总体均值二、两个正态总体均值差差的检验的检验22例例1 1 在平炉上进行一项试验以确定改变操作方法的革新是否会增加钢的得率在平炉上进行一项试验以确定改变操作方法的革新是否会增加钢的得率.现在同一平炉上分别用标准方法和革新方法交替各炼现在同一平炉上分别用标准方法和革新方法交替各炼10 10 炉炉,其得率分别为其得率分别为:标准方法:标准方法:78.178.1,72.4,76.2,74.3,77.4,78.4,76.0,75.5,76.7,72.4,76.2,74.3,77.4,78.4,76.0,75.5,76.7,77.377.3新新 方法:方法:79.179.1,81.0,77.3,79.1,80.0,79.1,79.1,77.3,80.2,82.1,81.0,77.3,79.1,80.0,79.1,79.1,77.3,80.2,82.1设这两个样本相互独立,都来自正态总体,且二总体的方差相同。问革新的方设这两个样本相互独立,都来自正态总体,且二总体的方差相同。问革新的方法能否提高得率?取法能否提高得率?取=0.005.=0.005.设用标准方法炼一炉钢的得率为设用标准方法炼一炉钢的得率为X,用新方法炼一炉用新方法炼一炉钢的得率为钢的得率为Y,则则XN(,2 2 2 2),Y N(2 2,2 2 2 2).(1)(1)首先考虑需检验的原假设、备择假设是什么首先考虑需检验的原假设、备择假设是什么?(2)(2)检验统计量应用哪一个检验统计量应用哪一个?H0 0:-2 2 0,H1 1:-2 2 0分析分析分析分析:23 先求出各方法的样本均值和样本方差先求出各方法的样本均值和样本方差:标准方法标准方法:n:n1 1=10 x=10 x1 1=76.23 s=76.23 s1 12 2=3.325=3.325 新新 方方 法法:n:n2 2=10 x=10 x2 2=79.43 s=79.43 s2 22 2=2.225=2.225当假设当假设H H0 0为真时为真时,取统计量取统计量则则Tt(18)(18)由由P T-t0.0050.005=0.005,=0.005,查表得查表得-t0.0050.005=-2.8784=-2.8784。从而拒绝域为(从而拒绝域为(-,-2.8784-2.8784)。)。代入样本值得代入样本值得T的值为的值为t=-4.295-2.8784,=-4.295-2.8784,所以拒绝所以拒绝H0 0.故我们认为建议的操作方法较原来的标准方法为优故我们认为建议的操作方法较原来的标准方法为优.解解:在水平在水平=0.005=0.005下检验假设下检验假设:H0 0:-2 2 0,H1 1:-2 2 t0.025=0.05,查查t 分布表得分布表得:t0.025(8)=2.306,即拒绝域为即拒绝域为 (,2.306)(2.306,+),=0.23 0 02 2 =0.02=0.022 2取统计量:取统计量:29则则Y 2(8)由由 PY 20.05=0.05,查查 2分布表得分布表得:20.05(8)=15.507,从而拒绝域为从而拒绝域为(15.507,+)而而Y的数值的数值 y=(8 0.022)0.0262=9.69 15.507,故接受故接受H H0 0。综合(综合(1 1)和()和(2 2)可以认为车床工作正常。)可以认为车床工作正常。30五、两个正态总体方差比的检验五、两个正态总体方差比的检验现在需要检验假设现在需要检验假设:当当H0为真时为真时,知知即得检验问题的拒绝域为即得检验问题的拒绝域为:例例3 3 某建筑构件厂使用两种不同的沙石生产混凝土预制块某建筑构件厂使用两种不同的沙石生产混凝土预制块,各各在所产产品中取样分析在所产产品中取样分析.取使用甲种沙石的预制块取使用甲种沙石的预制块20块块,测得平测得平均强度为均强度为310kg/cm2,标准差为标准差为4.2kg/cm2,取使用乙种沙石取使用乙种沙石的预制块的预制块16块块,测得平均强度为测得平均强度为308kg/cm2,标准差为标准差为3.6kg/cm2,设两个总体都服从正态分布设两个总体都服从正态分布,在在=0.01=0.01下下,问问 (1)(1)能否认为两个总体方差相等能否认为两个总体方差相等?(2)(2)能否认为使用甲种沙石的预制块的平均强度显著的高于能否认为使用甲种沙石的预制块的平均强度显著的高于用乙种沙石的预制块的平均强度用乙种沙石的预制块的平均强度?3132取统计量取统计量则则F F(1919,1515),查分布表得),查分布表得 F F0.01/20.01/2(19,15)=F19,15)=F0.0050.005(19,15)=3.59 (19,15)=3.59 F F1-0.0051-0.005(19,15)=1/F(19,15)=1/F0.0050.005(15,19)=0.26(15,19)=0.26从而拒绝域为从而拒绝域为(0,0.26)(3.59,+)(0,0.26)(3.59,+)将样本值将样本值S S1 1=4.2,S=4.2,S2 2=3.6=3.6代入代入,得得F F的数值为的数值为4.24.22 2/3.6/3.62 2=1.36=1.360.261.363.590.261.36 2 2取统计量取统计量33则则T Tt(nt(n1 1+n+n2 2-2)=t(34)-2)=t(34)由由PTtPTt0.010.01(34)=0.01,(34)=0.01,查分布表得查分布表得t t0.010.01=2.4411=2.4411从而拒绝域为(从而拒绝域为(2.44112.4411,+)从而接受假设从而接受假设H H0 0.即即:使用甲种沙石的预制块的平均强度显著的低于使用乙种沙石的使用甲种沙石的预制块的平均强度显著的低于使用乙种沙石的预制块的平均强度预制块的平均强度.代入样本值代入样本值n n1 1=20,n=20,n2 2=16,S=16,S1 1=4.2,S=4.2,S2 2=3.6=3.6得得T T的统计值为的统计值为 t=1.51 t=1.512.44112.4411三、检验统计量小结三、检验统计量小结共有四类问题六种模型,分别为:共有四类问题六种模型,分别为:341 1、单一总体均值、单一总体均值 的检验(的检验(H H0 0:=0 0 )总体方差总体方差 2 2已知时,用已知时,用 总体方差总体方差 2 2未知时,用未知时,用作为检验统计量作为检验统计量作为检验统计量作为检验统计量 U U检验法。检验法。t t检验法。检验法。2 2、单一总体方差、单一总体方差 2 2的检验(的检验(H H0 0:2 2=0 02 2 )用用作为检验统计量作为检验统计量 2 2检验法检验法3 3、两总体、两总体X X与与Y Y的均值差的均值差 1 1-2 2的检验(的检验(H H0 0:1 1=2 2 )两总体两总体X X与与Y Y的方差的方差 1 12 2、2 22 2已知时,用已知时,用35作为检验统计量作为检验统计量U U检验法。检验法。两总体两总体X X与与Y Y的方差的方差 1 12 2、2 22 2未知,但未知,但 1 12 2=2 22 2=2 2,用,用作为检验统计量作为检验统计量T T检验法。检验法。4 4、两总体、两总体X X与与Y Y方差比方差比 1 12 2 2 22 2的检验的检验 无论两总体无论两总体X X与与Y Y的均值的均值 1 1、2 2是否已知,均用是否已知,均用 36作为检验统计量作为检验统计量 F F检验法。检验法。以上这些统计量以上这些统计量,你是否已经记熟你是否已经记熟?