第八章-假设检验-第1讲ppt课件.ppt
概率论与数理统计福建师范大学福清分校数计系福建师范大学福清分校数计系1第八章第八章 假设检验假设检验第第1 1讲讲2假设检验的基本概念假设检验的基本概念若对若对参数参数有所有所了解了解但有怀但有怀疑猜测疑猜测需要证需要证实之时实之时用假设用假设检验的检验的方法来方法来 处理处理若对参数若对参数一无所知一无所知用参数估计用参数估计的方法处理的方法处理3 假设检验是指施加于一个或多个假设检验是指施加于一个或多个总体的概率分布或参数的假设总体的概率分布或参数的假设.所作所作假设可以是正确的假设可以是正确的,也可以是错误的也可以是错误的.为判断所作的假设是否正确为判断所作的假设是否正确,从从总体中抽取样本总体中抽取样本,根据样本的取值根据样本的取值,按按一定原则进行检验一定原则进行检验,然后作出接受或然后作出接受或拒绝所作假设的决定拒绝所作假设的决定.何为假设检验何为假设检验?4假设检验所以可行假设检验所以可行,其理论背景为实际其理论背景为实际推断原理推断原理,即即“小概率原理小概率原理”假设检验的内容假设检验的内容参数检验参数检验非参数检验非参数检验总体均值总体均值,均值差的检验均值差的检验总体方差总体方差,方差比的检验方差比的检验分布拟合检验分布拟合检验符号检验符号检验秩和检验秩和检验假设检验的理论依据假设检验的理论依据5 引例引例 某产品出厂检验规定某产品出厂检验规定:次品率次品率p不不超过超过4%才能出厂才能出厂.现从一万件产品中任意现从一万件产品中任意抽查抽查12件发现件发现3件次品件次品,问该批产品能否出问该批产品能否出厂?若抽查结果发现厂?若抽查结果发现1件次品件次品,问能否出厂?问能否出厂?解解 假设假设 这是这是 小概率事件小概率事件,一般在一次试验中一般在一次试验中是不会发生的是不会发生的,现一次试验竟然发生现一次试验竟然发生,故认故认为原假设不成立为原假设不成立,即该批产品次品率即该批产品次品率 ,则该批产品不能出厂则该批产品不能出厂.6 这不是这不是小概率事件小概率事件,没理由拒绝原假设没理由拒绝原假设,从而接受原假设从而接受原假设,即该批产品可以出厂即该批产品可以出厂.若不用假设检验若不用假设检验,按理不能出厂按理不能出厂.注注1直接算直接算注注2本检验方法是本检验方法是 概率意义下的反证法,概率意义下的反证法,故拒绝原假设是有说服力的故拒绝原假设是有说服力的,而接受而接受原假设是没有说服力的原假设是没有说服力的.因此应把希因此应把希望否定的假设作为原假设望否定的假设作为原假设.7对对总体总体 提出假设提出假设要求利用样本观察值要求利用样本观察值对对提供的信息作出接受提供的信息作出接受 (可出厂可出厂),还还是接受是接受 (不准出厂不准出厂)的判断的判断.出厂检验问题的数学模型出厂检验问题的数学模型81 假设检验假设检验9统计推断的另一类重要问题是假设检验问题统计推断的另一类重要问题是假设检验问题.在总体的分布函数完全未知或只知其形式在总体的分布函数完全未知或只知其形式,但不知道参数的情况但不知道参数的情况,为了推断总体的某些为了推断总体的某些未知特性未知特性,提出某些关于总体的假设提出某些关于总体的假设.例如例如,提出总体服从泊松分布的假设提出总体服从泊松分布的假设,又如又如,对正态对正态总体提出数学期望等于总体提出数学期望等于 0的假设等的假设等.我们是我们是要根据样本对所提出的假设作出是接受要根据样本对所提出的假设作出是接受,还还是拒绝的决策是拒绝的决策.假设检验是作出这一决策的假设检验是作出这一决策的过程过程.10例例1 某车间用一台包装机包装葡萄糖某车间用一台包装机包装葡萄糖.包得的包得的袋装糖重是一个随机变量袋装糖重是一个随机变量,它服从正态分布它服从正态分布.当机器正常时当机器正常时,其均值为其均值为0.5公斤公斤,标准差为标准差为0.015公斤公斤.某日开工后为检验包装机是否正某日开工后为检验包装机是否正常常,随机地抽取它所包装的糖随机地抽取它所包装的糖9袋袋,称得净重称得净重为为(公斤公斤):0.497,0.506,0.518,0.524,0.498,0.511,0.520,0.515,0.512问机器是否正常问机器是否正常?11以以,分别表示这一天袋装糖重总体分别表示这一天袋装糖重总体X的均值的均值和标准差和标准差.由于长期实践表明标准差比较稳由于长期实践表明标准差比较稳定定,就设就设=0.015.于是于是XN(,0.0152),这里这里 未知未知.问题是根据样本值来判断问题是根据样本值来判断=0.5还是还是 0.5.为此为此,我们提出两个相互对立的假设我们提出两个相互对立的假设H0:=0=0.5和和H1:0.5.然后给一个合理的法则然后给一个合理的法则,利用已知样本作出利用已知样本作出是接受假设是接受假设H0,还是接受假设还是接受假设H1.如果接受如果接受H0,则认为机器工作正常则认为机器工作正常,否则不正常否则不正常.12由于要检验的假设涉及总体均值由于要检验的假设涉及总体均值,故首先想故首先想到是否可借助样本均值到是否可借助样本均值 X这一统计量来进行这一统计量来进行判断判断.X是是 的无偏估计的无偏估计,其观察值的大小在其观察值的大小在一定程度上反映一定程度上反映 的大小的大小.如果假设如果假设H0为真为真,则观察值则观察值 x与与 0的偏差的偏差|x-0|一般不应太大一般不应太大.若若|x-|过分大过分大,就怀疑假设就怀疑假设H0的正确性而拒的正确性而拒13因此因此,可适当选定一正数可适当选定一正数k,使当观察值使当观察值 x满足满足然而然而,因为决策的依据是样本因为决策的依据是样本,当实际上当实际上H0为为真时仍可能做出拒绝真时仍可能做出拒绝H0的决策的决策(这种可能性是这种可能性是无法消除的无法消除的),这是一种错误这是一种错误,犯这种错误的犯这种错误的概率记为概率记为14因无法排除犯这类错误的可能性因无法排除犯这类错误的可能性,因此自然因此自然希望将犯这类错误的概率控制在一定的限度希望将犯这类错误的概率控制在一定的限度之类之类.即给出一个较小的数即给出一个较小的数(0 1),使犯这使犯这类错误的概率不超过类错误的概率不超过,即使得即使得P当当H0为真拒绝为真拒绝H0 .(1.1)犯这类错误的概率最大为犯这类错误的概率最大为,令令(1.1)式取等号式取等号,15态分布分位点的定义得态分布分位点的定义得:k=z/2.0 0/2z/2/2/2-z/2/216因而因而,若若Z的观察值满足的观察值满足则拒绝则拒绝H0,而若而若则接受则接受H017例如例如,在本例中取在本例中取=0.05,则有则有k=z0.05/2=z0.025=1.96,又已知又已知n=9,=0.015,再由再由样本算得样本算得 x=0.511,即有即有于是拒绝于是拒绝H0,认为这天包装机工作不正常认为这天包装机工作不正常.18上例中所采用的检验法则是符合实际推断原上例中所采用的检验法则是符合实际推断原理的理的.因通常因通常 总是取得较小总是取得较小,一般取一般取=0.01,0.05.因而若因而若H0为真为真,即当即当=0时时,断原理断原理,就可以认为就可以认为,如果如果H0为真为真,则由一次则由一次试验得到的观察值试验得到的观察值 x,满足不等式满足不等式了了,则我们有理由怀疑则我们有理由怀疑H0为假为假,拒绝拒绝H0.19上例中上例中,当样本容量固定时当样本容量固定时,选定选定 后后,可确可确定定绝对值绝对值|z|大于等于大于等于k还是小于还是小于k来作出决策来作出决策.数数k是检验上述假设的一个门槛值是检验上述假设的一个门槛值.如果如果|z|k,则称则称 x与与 0的差异是显著的的差异是显著的,这时拒绝这时拒绝H0;反之反之,如果如果|z|0.(1.3)形如形如(1.3)的假设检验的假设检验,称为右边检验称为右边检验.类似类似地地,有时需要检验假设有时需要检验假设H0:0,H1:0(1.3)的拒绝域的拒绝域.因因H0中的全部中的全部 都比都比H1中的中的 要小要小,当当H1为真为真时时,观察值观察值 x往往偏大往往偏大,因此因此,拒绝域的形式拒绝域的形式为为 x k(k是某一正常数是某一正常数).25下面来确定常数下面来确定常数k令令26270aza28类似地类似地,可得左边检验问题可得左边检验问题H0:0,H1:0(假设新方法提高了燃烧率假设新方法提高了燃烧率).这是右边检验问题这是右边检验问题,其拒绝域如其拒绝域如(1.6)式式所所示示,z的值落在拒绝域中的值落在拒绝域中,所以在显著性水平所以在显著性水平=0.05下拒下拒绝绝H0,认为新法的燃烧率有显著提高认为新法的燃烧率有显著提高.33综上所述综上所述,处理参数的假设检验问题步骤为处理参数的假设检验问题步骤为:1.根据实际问题的要求根据实际问题的要求,提出原假设提出原假设H0及备及备择假设择假设H1;2.给定显著性水平给定显著性水平 以及样本容量以及样本容量n;3.确定检验统计量以及拒绝域的形式确定检验统计量以及拒绝域的形式;4.按按P当当H0为真拒绝为真拒绝H0 求出拒绝域求出拒绝域;5.取样取样,根据样本观察值作出决策根据样本观察值作出决策,是接受是接受H0还是拒绝还是拒绝H0.342 正态总体均值的假设检验35(一一)单个总体单个总体N(,2)均值均值 的检验的检验1,2已知已知,关于关于 的检验的检验(Z检验检验)在在1中已讨论过正态总体中已讨论过正态总体N(,2)当当 2已知时已知时关于关于 的检验问题的检验问题(1.2),(1.3),(1.4).在这在这些检验问题中些检验问题中,我们都是利用统计量我们都是利用统计量这种检验法常称为这种检验法常称为Z检验法检验法.36 0 0 0 0 0Z检验法检验法(2 2 已知已知)原假设原假设 H0备择假设备择假设 H1检验统计量及其检验统计量及其H0为真时的分布为真时的分布拒绝域拒绝域372,2未知未知,关于关于 的检验的检验(t检验检验)设总体设总体XN(,2),其中其中,2未知未知,我们来求我们来求检验问题检验问题H0:=0,H1:0的拒绝域的拒绝域(显著性水平为显著性水平为).设设X1,X2,.,Xn是来自总体是来自总体X的样本的样本,由于由于 2未未到到S2是是 2的无偏估计的无偏估计,我们用我们用S来代替来代替,采用采用38域的形式为域的形式为而当而当H0为真时为真时,39故由故由得得k=t/2(n-1),即得拒绝域为即得拒绝域为对于正态总体对于正态总体N(,2),当当 2未知关于未知关于 的单的单边检验的拒绝域在书上表边检验的拒绝域在书上表8.1中给出中给出.上述利用上述利用 t 统计量的检验法称为统计量的检验法称为t 检验法检验法40 0 0 0 0 0T T 检验法检验法(2 2 未知未知)原假设原假设 H0备择假设备择假设 H1检验统计量及其检验统计量及其H0为真时的分布为真时的分布拒绝域拒绝域41例例 某厂生产小型马达某厂生产小型马达,说明书上写着说明书上写着:在在正常负载下平均消耗电流不超过正常负载下平均消耗电流不超过0.8 安培安培.解解 根据题意待检假设可设为根据题意待检假设可设为随机测试随机测试16台马达台马达,平均消耗电流为平均消耗电流为0.92安培,标准差为安培,标准差为0.32安培安培.设马达所消耗的电流设马达所消耗的电流 服从正态分布服从正态分布,取显著性水平为取显著性水平为 =0.05,问根据此样本问根据此样本,能否否定厂方的断言能否否定厂方的断言?42 H0:0.8;H1:0.8 未知未知,选检验统计量选检验统计量:代入得代入得故接受原假设故接受原假设 H0,即不能否定厂方断言即不能否定厂方断言.:拒绝域为拒绝域为落在拒绝域落在拒绝域 外外将将43解二解二 H0:0.8;H1:225.取取=0.05.由表由表8.1知此检验问题的拒绝域为知此检验问题的拒绝域为现在现在n=16,t0.05(15)=1.7531.又算得又算得 x=241.5,s=98.7259,即有即有t没有落在拒绝域中没有落在拒绝域中,故接受故接受H0,认为元件寿命不大认为元件寿命不大于于225小时小时.49(二二)两个正态总体均值差的检验两个正态总体均值差的检验(t检验检验)设两样本独立设两样本独立.又分别记它们的样本均值为又分别记它们的样本均值为 X,Y,记样本方差为记样本方差为S12,S22.设设 1,2,2均均为未知为未知,要特别注意二总体方差相等要特别注意二总体方差相等.求检验求检验问题问题:H0:1-2=,H1:1-2 (为已知常数为已知常数)的拒绝域的拒绝域.取显著性水平为取显著性水平为.50引用下述引用下述t统计量作为检验统计量统计量作为检验统计量:当当H0为真时为真时,由第六章定理四知由第六章定理四知tt(n1+n2-2)51与单个总体的与单个总体的t检验法相仿检验法相仿,其拒绝域的形式为其拒绝域的形式为由由 P当当H0为真拒绝为真拒绝H0=可得可得k=t/2(n1+n2-2).52于是得拒绝域为于是得拒绝域为而两个单边检验的问题的拒绝域在表而两个单边检验的问题的拒绝域在表8.1中给中给出出,常用的是常用的是=0的情况的情况.当两个正态总体的方差均为已知当两个正态总体的方差均为已知(不一定相等不一定相等)时时,我们可用我们可用Z检验法来检验两正态总体均检验法来检验两正态总体均值差的假设问题值差的假设问题,也见表也见表8.1.53 1 2=(12,22 已知已知)(1)(1)关于均值差关于均值差 1 1 2 2 的检验的检验 1 2 1 2 1 2 1 2 原假设原假设 H0备择假设备择假设 H1检验统计量及其在检验统计量及其在H0为真时的分布为真时的分布拒绝域拒绝域54 1 2=1 2 1 2 1 2 1 2 其中其中 12,22未知未知 12=22原假设原假设 H0备择假设备择假设 H1检验统计量及其在检验统计量及其在H0为真时的分布为真时的分布拒绝域拒绝域55例例2 在平炉上进行一项试验以确定新方法是在平炉上进行一项试验以确定新方法是否比标准方法增加钢的得率否比标准方法增加钢的得率.用标准方法和用标准方法和新方法各炼新方法各炼10炉钢炉钢,其得率为其得率为(1)标准方法标准方法 78.1,72.4,76.2,74.3,77.4,78.4,76.0,75.5,76.7,77.3(2)新方法新方法 79.1,81.0,77.3,79.1,80.0,79.1,79.1,77.3,80.2,82.1设这两个样本相互独立设这两个样本相互独立,且分别来自正态总且分别来自正态总体体N(1,2),N(2,2),1,2,2均未知均未知.问问建议的新操作方法能否提高得到率建议的新操作方法能否提高得到率?(取取=0.05.)56解解 需要检验假设需要检验假设H0:1-2 0,H1:1-20.分别求出标准方法和新方法下的样本均值和分别求出标准方法和新方法下的样本均值和样本方差如下样本方差如下:n1=10,x=76.23,s12=3.325.n2=10,y=79.43,s22=2.225.sw2=2.775,t0.05(18)=1.7341,故拒绝域为故拒绝域为而现而现t-4.2950;(3)H0:D 0,H1:D0.61分别记分别记D1,D2,.,Dn的样本均值和样本方差的观察的样本均值和样本方差的观察值为值为 d,sD2,按表按表8.1中单个正态总体均值的中单个正态总体均值的 t 检验检验.知检验问题知检验问题(1),(2),(3),的拒绝域分别为的拒绝域分别为(检验水检验水平为平为):62现考虑本例问题现考虑本例问题,将每一对数据之差算出将每一对数据之差算出.按按题意需检验假设题意需检验假设H0:D=0,H1:D 0.现在现在n=9,t/2(8)=t0.005(8)=3.3554即知拒绝域即知拒绝域为为由观察值得由观察值得 d=0.06,sD=0.1227,|t|=1.467 02 (3.2)拒绝域的形式为拒绝域的形式为 s2 k.下面确定常数下面确定常数k.68要控制要控制P当当H0为真拒绝为真拒绝H0 ,只需令只需令69类似地类似地,可得左边检验问题可得左边检验问题H0:2 02,H1:2 02 2 02 2 22 12 22 12 22(2)(2)关于方差比关于方差比 1 12 2 /2 22 2 的检验的检验 1,2 均未知均未知原假设原假设 H0备择假设备择假设 H1检验统计量及其在检验统计量及其在H0为真时的分布为真时的分布拒绝域拒绝域79例2 试对2例2中的数据检验假设(取a=0.01)H0:s12=s22,H1:s12s22.解 此处n1=n2=10,a=0.01F0.005(9,9)=6.54,F1-0.005(9,9)=0.153.拒绝域为现算得s12=3.325,s22=2.225,s12/s22=1.49,即0.153s12/s226.54(没有落入拒绝域)故接受H0,认为两总体方差相等.两总体方差相等也称两总体具有方差齐性.80置信区间与假设检验之间的关系81接受域接受域置信区间置信区间假假设设检检验验区区间间估估计计统计量统计量 枢轴量枢轴量对偶关系对偶关系同一函数同一函数假设检验与区间估计的联系假设检验与区间估计的联系82置信区间与假设检验之间有明显的联系,先考察置信区间与双边检验之间的对应关系.设X1,.,Xn是一个来自总体的样本,x1,.,xn是相应的样本值.Q是参数q的可能取值范围.设(q(X1,.,Xn),q(X1,.,Xn)是参数q的一个置信水平为1-a的置信区间,则对于任意qQ,有 Pqq(X1,.,Xn)q q(X1,.,Xn)1-a,(4.1)考虑显著性水平为a的双边检验H0:q=q0,H1:qq0.(4.2)83 Pqq(X1,.,Xn)q q(X1,.,Xn)1-a,(4.1)H0:q=q0,H1:qq0.(4.2)由(4.1),当H0为真时按显著性水平为a的假设检验的拒绝域的定义,检验(4.2)的拒绝域为 q0 q(x1,.,xn)或 q0 q(x1,.,xn);接受域为q(x1,.,xn)q0 q(x1,.,xn).84这就是说,当我们要检验假设(4.2)时,先求出q的置信水平为1-a的置信区间(q,q),然后考察q0是否落在区间(q,q),若q0(q,q),则接受H0,若q0(q,q),则拒绝H0.85反之反之,对于任意对于任意q q0 Q Q,考虑显著性水平为考虑显著性水平为 的假设的假设检验问题检验问题:H0:q q=q q0,H1:q q q q0,假设它的接受域为假设它的接受域为 q q(x1,.,xn)q q0 qq(x1,.,xn),即有即有由由q q0的任意性的任意性,由上式知对于任意由上式知对于任意q q Q Q,有有因此因此(q q(X1,.,Xn),qq(X1,.,Xn)是参数是参数q q的一个的一个置信水平为置信水平为1-的置信区间的置信区间.86这就是说,为要求出参数q的置信水平为1-a的置信区间,我们先求出显著性水平为a的假设检验问题:H0:q=q0,H1:qq0的接受域:q(x1,.,xn)q0 q(x1,.,xn),那么(q(X1,.,Xn),q(X1,.,Xn)就是q的置信水平为1-a的置信区间.87还可验证,置信水平为1-a的单侧置信区间(-,q(X1,.,Xn)与显著性水平为a的左边检验问题H0:qq0,H1:qq0有类似的对应关系.即若已求得单侧置信区间(-,q(X1,.,Xn),则 当q0(-,q(X1,.,Xn)时接受H0,当q0(-,q(X1,.,Xn)时拒绝H0.反之,若已求得检验问题H0:qq0,H1:qq0的接收域为:-q0也有类似的对应关系.即若已求得单侧置信区间(q(X1,.,Xn),).则 当q0(q(X1,.,Xn),)时接受H0,当q0(q(X1,.,Xn),)时拒绝H0.反之,若已求得检验问题H0:qq0,H1:qq0的接受域为:q(X1,.,Xn)q0m0的接受域,并求m的单侧置信下限(a=0.05).解 检验问题的拒绝域为或即m04.79.于是检验问题的接受域为m04.79.这样就得到m的单侧置信区间(4.79,),单侧置信下限m=4.79.94作业 第八章习题第232页第1,2,14题951 1假设检验的依据是什么?假设检验的依据是什么?答:假设检验的依据是“实际推断原理”,即“小概率事件在一次试验中几乎不可能发生”。962 2假设检验可能产生的两类错误是什么?假设检验可能产生的两类错误是什么?第一类错误:为真但拒绝了,称此类错误为“弃真”;(称为显著性检验问题)第二类错误:为假但接受了,称此类错误为“取伪”。973 3假设检验的一般步骤是什么?假设检验的一般步骤是什么?假设检验的一般步骤是 根据给定问题提出原假设和备择假设;选取适当的统计量,并在原假设成立的条件下确定其分布;给定显著性水平,确定检验的拒绝域和接受域;根据样本观察值计算统计量的观察值;做出判断。98请提问99