概率统计假设检验的基本概念.ppt
概率统计假设检验的基本概念1现在学习的是第1页,共25页8.1 8.1 假设检验的基本概念假设检验的基本概念若对若对参数参数有所有所了解了解但有怀但有怀疑猜测疑猜测需要证需要证实之时实之时用假设用假设检验的检验的方法来方法来 处理处理若对参数若对参数一无所知一无所知用参数估计用参数估计的方法处理的方法处理2现在学习的是第2页,共25页 假设检验是指施加于一个或多个总体假设检验是指施加于一个或多个总体的概率分布或参数的假设的概率分布或参数的假设.所作假设可以所作假设可以是正确的是正确的,也可以是错误的也可以是错误的.为判断所作的假设是否正确为判断所作的假设是否正确,从总从总体中抽取样本体中抽取样本,根据样本的取值根据样本的取值,按一定按一定原则进行检验原则进行检验,然后作出接受或拒绝所然后作出接受或拒绝所作假设的决定作假设的决定.何为何为假设检验假设检验?3现在学习的是第3页,共25页假设检验所以可行假设检验所以可行,其理论背景为实际其理论背景为实际推断原理推断原理,即即“小概率原理小概率原理”假设检验的内容假设检验的内容参数检验参数检验(8.28.2)非参数检验非参数检验总体均值总体均值,均值差的检验均值差的检验总体方差总体方差,方差比的检验方差比的检验分布拟合检验(分布拟合检验(8.38.3)符号检验符号检验秩和检验秩和检验假设检验的理论依据假设检验的理论依据4现在学习的是第4页,共25页 引例引例1 1 某产品出厂检验规定某产品出厂检验规定:次品率次品率p不不超过超过4%才能出厂才能出厂.现从一万件产品中任意现从一万件产品中任意抽查抽查12件发现件发现3件次品件次品,问该批产品能否出问该批产品能否出厂?若抽查结果发现厂?若抽查结果发现1件次品件次品,问能否出厂?问能否出厂?01.00097.0)1()3(9331212ppCP代入04.0p解解 假设假设0.04,p04.0p 这是这是 小概率事件小概率事件,一般在一次试验中一般在一次试验中是不会发生的是不会发生的,现一次试验竟然发生现一次试验竟然发生,故认故认为原假设不成立为原假设不成立,即该批产品次品率即该批产品次品率 ,则该批产品不能出厂则该批产品不能出厂.5现在学习的是第5页,共25页 这不是这不是小概率事件小概率事件,没理由拒绝原假设没理由拒绝原假设,从而接受原假设从而接受原假设,即该批产品可以出厂即该批产品可以出厂.3.0306.0)1()1(11111212ppCP若不用假设检验若不用假设检验,按理不能出厂按理不能出厂.注注104.0083.012/1直接算直接算注注2本检验方法是本检验方法是 概率意义下的反证法,概率意义下的反证法,故拒绝原假设是有说服力的故拒绝原假设是有说服力的,而接受而接受原假设是没有说服力的原假设是没有说服力的.因此应把希因此应把希望否定的假设作为原假设望否定的假设作为原假设.6现在学习的是第6页,共25页对总体对总体 提出假设提出假设1(;)(1),0,1xxX f x pppx04.0:;04.0:10pHpH要求利用样本观察值要求利用样本观察值)13(121orxii对提供的信息作出接受对提供的信息作出接受 (可出厂可出厂),还还是接受是接受 (不准出厂不准出厂)的判断的判断.0H1H),(1221xxx出厂检验问题的数学模型出厂检验问题的数学模型7现在学习的是第7页,共25页 某厂生产的螺钉某厂生产的螺钉,按标准强度为按标准强度为68/mm68/mm2 2,而实际生产的强度而实际生产的强度X X 服服N N(,3.6,3.62 2).).若若E E(X X)=)=68,=68,则认为这批螺钉符合要求则认为这批螺钉符合要求,否否则认为不符合要求则认为不符合要求.为此提出如下假设为此提出如下假设:H0:=68 称为称为原假设原假设或或零假设零假设 原假设的对立面原假设的对立面:H1:68 称为称为备择假设备择假设引例引例2 2假设检验假设检验的任务的任务必须在原假设与必须在原假设与备择假设备择假设 之间作一选择之间作一选择8现在学习的是第8页,共25页若原假设正确若原假设正确,则则)36/6.3,68(2NX因而因而 68)(XE,即即X偏离偏离6868不应该太远不应该太远,故故取较大值是小概率事件取较大值是小概率事件.6/6.368X可以确定一个常数可以确定一个常数c c 使得使得cXP6/6.368因此因此,取取 ,则则05.0 现从整批螺钉中取容量为现从整批螺钉中取容量为3636的样本的样本,其其均值为均值为 ,问原假设是否正确问原假设是否正确?5.68x96.1025.02zzc9现在学习的是第9页,共25页681.963.6/6X 由由为检验的为检验的接受域接受域(实际上没理由拒绝实际上没理由拒绝),现现5.68x落入接受域落入接受域,则接受原假设则接受原假设824.6618.69XX或即区间即区间(,66.824)与与(69.18,+)为检验的为检验的拒绝域拒绝域称称 的取值区间的取值区间X(66.824,69.18)H H0 0:=6810现在学习的是第10页,共25页 由引例由引例2 2可见可见,在给定在给定 的前提下的前提下,接受还是拒绝原假设完全取决于样本接受还是拒绝原假设完全取决于样本值值,因此所作检验可能导致以下两类因此所作检验可能导致以下两类错误的产生:错误的产生:第一类错误弃真错误第二类错误取伪错误11现在学习的是第11页,共25页正确正确正确正确假设检验的两类错误假设检验的两类错误 犯第一类错误的概率通常记为犯第一类错误的概率通常记为 犯第二类错误的概率通常记为犯第二类错误的概率通常记为 H0 为真为真H0 为假为假真实情况真实情况所作判断所作判断接受接受 H0拒绝拒绝 H0第一类错误第一类错误(弃真弃真)第二类错误第二类错误(取伪取伪)12现在学习的是第12页,共25页 任何检验方法都不能完全排除犯错任何检验方法都不能完全排除犯错 假设检验的指导思想是控制犯第一类假设检验的指导思想是控制犯第一类误的可能性误的可能性.理想的检验方法应使犯两类理想的检验方法应使犯两类错误的概率都很小错误的概率都很小,但在样本容量给定的但在样本容量给定的情形下情形下,不可能使两者都很小不可能使两者都很小,降低一个降低一个,往往使另一个增大往往使另一个增大.错误的概率不超过错误的概率不超过,然后然后,若有必要若有必要,通通过增大样本容量的方法来减少过增大样本容量的方法来减少 .13现在学习的是第13页,共25页P P(拒绝拒绝H H0 0|H H0 0为真为真)若若H H0 0为真为真,则则 2(68,3.6/36)XN所以所以,拒绝拒绝 H H0 0 的概率为的概率为,又称为又称为显著性显著性水平水平,越大越大,犯第一类错误的概率越大犯第一类错误的概率越大,即越显著即越显著.引例引例2 2 中,中,犯第一类错误的概率犯第一类错误的概率05.0)18.69824.66(XXP14现在学习的是第14页,共25页H H0 0不真不真,即即 68,68,可能小于可能小于68,68,也可能大于也可能大于68,68,的大小取决于的大小取决于 的真值的大小的真值的大小.0853.09147.01)37.1()3.5(下面计算犯第二类错误的概率 设设 =P P(接受接受H H0 0|H H0 0不真不真)6.06682.666.06618.69)6618.6982.66(66XP266,36,(66,3.6/36)nXN15现在学习的是第15页,共25页若若6177.00002.06179.0)63.3()3.0(6.06982.666.06918.69)6918.6982.66(69XP取伪的概率较大取伪的概率较大.269,36,(69,3.6/36)nXN16现在学习的是第16页,共25页67.5 70 72.5 75 77.5 80 82.50.020.040.060.080.10.12/2/2H0 真真H0 不真不真17现在学习的是第17页,共25页仍取仍取=0.05,=0.05,则则96.1025.02zzc681.963.6/8X 由由可以确定拒绝域为可以确定拒绝域为 (,67.118)与与(68.882,+)因此,接受域为因此,接受域为(67.118,68.882)(67.118,68.882)现增大样本容量现增大样本容量,取取n=n=64,64,=66,=66,则则2(66,3.6/64)XN18现在学习的是第18页,共25页0853.00064.09936.01)49.2()4.6(6177.03936.0)6988.6812.67(69XP)1,(045.06612.6745.06688.68)66882.68118.67(66XP19现在学习的是第19页,共25页 当样本容量确定后当样本容量确定后,犯两类错误的犯两类错误的命题命题概率不可能同时减少概率不可能同时减少.01100:;:HH此时犯此时犯第二类错误的概率为第二类错误的概率为 )(00伪接受HHP)(10kXP)(01kXPH)(0111kXPH)(001011nnHkXP)(001nk证证 设设 在水平在水平 给定下给定下,检验假设检验假设),(20NX20现在学习的是第20页,共25页zkn0)(001nz)(2122zdxexz又又)(010010nzzzzn即由此可见由此可见,当当 n 固定时固定时1)若若zz2)若若zz(见注见注)证毕证毕.21现在学习的是第21页,共25页注注)()()(11zzzXP)(1)1(11zXP 从而从而当当 时时1)/,(201nNX)1,0(/01NXnX22现在学习的是第22页,共25页 一般一般,作假设检验时作假设检验时,先控制犯第一类先控制犯第一类错误的概率错误的概率,在此基础上使在此基础上使 尽量地小尽量地小.要降低要降低 一般要增大样本容量一般要增大样本容量.当当H H0 0不真时不真时,参数值越接近真值参数值越接近真值,越大越大.备择假设可以是单侧备择假设可以是单侧,也可以双侧也可以双侧.H0:=68;H1:68注注 1 1注注 2 2引例引例2 2中的备择假设是双侧的中的备择假设是双侧的.若根据以若根据以往生产情况往生产情况,0 0=68.=68.现采用了新工艺现采用了新工艺,关关心的是新工艺能否提高螺钉强度心的是新工艺能否提高螺钉强度,越大越大越好越好.此时可作如下的右边假设检验此时可作如下的右边假设检验:23现在学习的是第23页,共25页关于原假设与备择假设的选取关于原假设与备择假设的选取H H0 0与与H H1 1地位应平等地位应平等,但在控制犯第一类错但在控制犯第一类错误的概率误的概率 的原则下的原则下,使得采取拒绝使得采取拒绝H H0 0 的决策变得较慎重的决策变得较慎重,即即H H0 0 得到特别的保护得到特别的保护.因而因而,通常把有把握的、有经验的结论作通常把有把握的、有经验的结论作为原假设为原假设,或者尽可能使后果严重的错误或者尽可能使后果严重的错误成为第一类错误成为第一类错误.注注 3 324现在学习的是第24页,共25页假设检验步骤(三部曲三部曲)其中其中)(VVPq 根据实际问题所关心的内容根据实际问题所关心的内容,建立建立H H0 0与与H H1 1q 在在H H0 0为真时为真时,选择合适的统计量选择合适的统计量V V,由由H H1 1确确给定显著性水平给定显著性水平,其对应的拒绝域其对应的拒绝域)()(221VVVV双侧检验双侧检验)(1VV左边检验左边检验定拒绝域形式定拒绝域形式q 根据样本值计算根据样本值计算,并作出相应的判断并作出相应的判断.右边检验右边检验)(VV 25现在学习的是第25页,共25页