概率论与数理统计之2.ppt
第八章第八章18.1 8.1 假设检验的基本概念假设检验的基本概念 假设检验是指施加于一个或多个总体假设检验是指施加于一个或多个总体的概率分布或参数的假设的概率分布或参数的假设.所作的假设可所作的假设可以是正确的以是正确的,也可以是错误的也可以是错误的.为判断所作的假设是否正确为判断所作的假设是否正确,从总体从总体中抽取样本中抽取样本,根据样本的取值根据样本的取值,按一定的按一定的原则进行检验原则进行检验,然后然后,作出接受或拒绝所作出接受或拒绝所作假设的决定作假设的决定.何为何为假设检验假设检验?8.18.12假设检验所以可行假设检验所以可行,其理论背景为实际其理论背景为实际推断原理推断原理,即即“小概率原理小概率原理”假设检验的内容假设检验的内容参数检验参数检验非参数检验非参数检验总体均值总体均值,均值差的检验均值差的检验总体方差总体方差,方差比的检验方差比的检验分布拟合检验分布拟合检验符号检验符号检验秩和检验秩和检验假设检验的理论依据假设检验的理论依据3 引例引例1 1 某产品出厂检验规定某产品出厂检验规定:次品率次品率p不不超过超过4%才能出厂才能出厂.现从一万件产品中任意现从一万件产品中任意抽查抽查12件发现件发现3件次品件次品,问该批产品能否出问该批产品能否出厂?若抽查结果发现厂?若抽查结果发现1件次品件次品,问能否出厂?问能否出厂?解解 假设假设 这是这是 小概率事件小概率事件,一般在一次试验中一般在一次试验中是不会发生的是不会发生的,现一次试验竟然发生现一次试验竟然发生,故认故认为原假设不成立为原假设不成立,即该批产品次品率即该批产品次品率 ,则该批产品不能出厂则该批产品不能出厂.4 这不是这不是小概率事件小概率事件,没理由拒绝原假设没理由拒绝原假设,从而接受原假设从而接受原假设,即该批产品可以出厂即该批产品可以出厂.若不采用假设检验若不采用假设检验,按理也不能够出厂按理也不能够出厂.注注直接算直接算5对对总体总体 提出假设提出假设要求利用样本观察值要求利用样本观察值对对提供的信息作出接受提供的信息作出接受 (可出厂可出厂),还还是接受是接受 (不准出厂不准出厂)的判断的判断.出厂检验问题的数学模型出厂检验问题的数学模型6 某厂生产的螺钉某厂生产的螺钉,按标准强度为按标准强度为68/68/mmmm2 2,而实际生产的强度而实际生产的强度X X 服服N N(,3.6,3.62 2).).若若E E(X X)=)=68,=68,则认为这批螺钉符合要求则认为这批螺钉符合要求,否否则认为不符合要求则认为不符合要求.为此提出如下假设为此提出如下假设:H0:=68 称为称为原假设原假设或或零假设零假设 原假设的对立面原假设的对立面:H1:68 称为称为备择假设备择假设 现从生产的螺钉中抽取容量为现从生产的螺钉中抽取容量为3636的样的样本本,其均值为其均值为 ,问原假设是否正确问原假设是否正确?引例引例2 2 引例引例2 27若原假设正确若原假设正确,则则故故 取较大值是小概率事件取较大值是小概率事件.因而因而,即即偏离偏离6868不应该太远不应该太远,偏离较远是小概率事件偏离较远是小概率事件,由于由于 8规定规定 为小概率事件的概率大小为小概率事件的概率大小,通常取通常取 =0.05,0.01,=0.05,0.01,例如例如,取取 =0.05,=0.05,则则因此因此,可以确定一个常数可以确定一个常数c c,使得使得9由由为检验的为检验的接受域接受域(实际上没理由拒绝实际上没理由拒绝),现现落入接受域落入接受域,则接受原假设则接受原假设而区间而区间(,66.824)与与(69.18,+)为检验的为检验的拒绝域拒绝域称称 的取值区间的取值区间(66.824,69.18)(66.824,69.18)H H0 0:=68=6810 由引例由引例2 2可见可见,在给定在给定 的前提下的前提下,接受还是拒绝原假设完全取决于样本接受还是拒绝原假设完全取决于样本值值,因此所作检验可能导致以下两类因此所作检验可能导致以下两类错误的产生:错误的产生:第一类错误弃真错误第二类错误取伪错误11正确正确正确正确第一类错误第一类错误 (弃真弃真)第二类错误第二类错误 (取伪取伪)假设检验的两类错误假设检验的两类错误 犯第一类错误的概率通常记为犯第一类错误的概率通常记为 犯第二类错误的概率通常记为犯第二类错误的概率通常记为 表H0 为真为真H0 为假为假真实情况真实情况所作判断所作判断接受接受 H0拒绝拒绝 H012 任何检验方法都不能完全排除犯错任何检验方法都不能完全排除犯错 假设检验的指导思想是控制犯第一类假设检验的指导思想是控制犯第一类误的可能性误的可能性.理想的检验方法应使犯两类理想的检验方法应使犯两类错误的概率都很小错误的概率都很小,但在样本容量给定的但在样本容量给定的情形下情形下,不可能使两者都很小不可能使两者都很小,降低一个降低一个,往往使另一个增大往往使另一个增大.错误的概率不超过错误的概率不超过,然后然后,若有必要若有必要,通通过增大样本容量的方法来减少过增大样本容量的方法来减少 .13P P(拒绝拒绝H H0 0|H H0 0为真为真)若若H H0 0为真为真,则则 所以所以,拒绝拒绝 H H0 0 的概率为的概率为,又称为又称为显显著性水平著性水平,越大越大,犯第一类错误的概犯第一类错误的概率越大率越大,即越显著即越显著.引例引例2 2 中,中,犯第一类错误的概率犯第一类错误的概率14H H0 0不真不真,即即 68,68,可能小于可能小于68,68,也可能大也可能大于于68,68,的大小取决于的大小取决于 的真值的大小的真值的大小.下面计算犯第二类错误的概率 设设 =P P(接受接受H H0 0|H H0 0不真不真)15若若取伪的概率较大取伪的概率较大.16/2/2H0 真真H0 不真不真图17仍取仍取=0.05,=0.05,则则由由可以确定拒绝域为可以确定拒绝域为 (,67.118)与与(68.882,+)因此,接受域为因此,接受域为(67.118,68.882)(67.118,68.882)现增大样本容量现增大样本容量,取取n=n=64,64,=66,=66,则则1819 当样本容量确定后当样本容量确定后,犯两类错误的犯两类错误的命题命题概率不可能同时减少概率不可能同时减少.证明20假设检验步骤(三部曲三部曲)其中其中q 根据实际问题所关心的内容根据实际问题所关心的内容,建立建立H H0 0与与H H1 1q 在在H H0 0为真时为真时,选择合适的统计量选择合适的统计量V V,由由H H1 1确确给定显著性水平给定显著性水平,其对应的拒绝域其对应的拒绝域双侧检验双侧检验左边检验左边检验定拒绝域形式定拒绝域形式q 根据样本值计算根据样本值计算,并作出相应的判断并作出相应的判断.右边检验右边检验三部曲21