概率论第八章 假设检验精选文档.ppt
《概率论第八章 假设检验精选文档.ppt》由会员分享,可在线阅读,更多相关《概率论第八章 假设检验精选文档.ppt(88页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、概率论第八章概率论第八章假设假设检验检验本讲稿第一页,共八十八页上一章介绍了对总体中未知参数的估计方法。上一章介绍了对总体中未知参数的估计方法。本章将讨论统计推断的另一个重要方面本章将讨论统计推断的另一个重要方面统计假设检验统计假设检验。出于某种需要,对未知的或不完。出于某种需要,对未知的或不完全明确的总体给出某些假设,用以说明总体可能全明确的总体给出某些假设,用以说明总体可能具备的某种性质,这种假设称为具备的某种性质,这种假设称为统计假设统计假设。如。如正正态分布态分布的假设,的假设,总体均值总体均值的假设等。这个假设是的假设等。这个假设是否成立,还需要考察,这一过程称为否成立,还需要考察,
2、这一过程称为假设检验假设检验,并最终作出判断,是接受假设还是拒绝假设。并最终作出判断,是接受假设还是拒绝假设。本章主要介绍假设检验的基本思想和常用的检本章主要介绍假设检验的基本思想和常用的检验方法,重点解决正态总体参数的假设检验验方法,重点解决正态总体参数的假设检验。本讲稿第二页,共八十八页 1假设检验的基本思想假设检验的基本思想一、一、假设检验问题的提出假设检验问题的提出二、假设检验的基本思想二、假设检验的基本思想三、假设检验中两类错误三、假设检验中两类错误本讲稿第三页,共八十八页统计推断的另一个重要问题是假设检验问题。统计推断的另一个重要问题是假设检验问题。在总体的分布函数未知或只知其形式
3、,但不知其参在总体的分布函数未知或只知其形式,但不知其参数的情况下,为了推断总体的某些性质,提出某些数的情况下,为了推断总体的某些性质,提出某些关于总体的假设。例如,提出总体服从泊松分布的关于总体的假设。例如,提出总体服从泊松分布的假设,又如,对于正态总体提出数学期望假设,又如,对于正态总体提出数学期望 0的假的假设等。设等。这里,先结合例子来说明假设检验的基本思这里,先结合例子来说明假设检验的基本思想和做法。想和做法。假设检验就是根据样本对所提出的假设作出假设检验就是根据样本对所提出的假设作出判断:是判断:是接受接受,还是,还是拒绝拒绝。本讲稿第四页,共八十八页例例1已知某炼铁厂的铁水含碳量
4、已知某炼铁厂的铁水含碳量X在某种工艺条件下在某种工艺条件下服从正态分布服从正态分布N(4.55,0.1082)。现改变了工艺条件,测了五。现改变了工艺条件,测了五炉铁水,其含碳量分别为:炉铁水,其含碳量分别为:4.28,4.40,4.42,4.35,4.37根据以往的经验,总体的方差根据以往的经验,总体的方差 2=0.1082一般不会改变。试一般不会改变。试问工艺条件改变后,铁水含碳量的均值有无改变?问工艺条件改变后,铁水含碳量的均值有无改变?本讲稿第五页,共八十八页 显然,这里需要解决的问题是,如何根据样显然,这里需要解决的问题是,如何根据样本判断现在冶炼的铁水的含碳量是服从本判断现在冶炼的
5、铁水的含碳量是服从 4.55的的正态分布呢?还是与过去一样仍然服从正态分布呢?还是与过去一样仍然服从=4.55的的正态分布呢?若是前者,可以认为新工艺对铁水正态分布呢?若是前者,可以认为新工艺对铁水的含碳量有显著的影响;若是后者,则认为新工的含碳量有显著的影响;若是后者,则认为新工艺对铁水的含碳量没有显著影响。通常,选择其艺对铁水的含碳量没有显著影响。通常,选择其中之一作为假设后,再利用样本检验假设的真伪。中之一作为假设后,再利用样本检验假设的真伪。本讲稿第六页,共八十八页例例2某自动车床生产了一批铁钉,现从该批铁钉中随某自动车床生产了一批铁钉,现从该批铁钉中随机抽取了机抽取了11根,测得长度
6、根,测得长度(单位:单位:mm)数据为:数据为:10.41,10.32,10.62,40.18,10.77,10.64,10.82,10.49,10.38,10.59,10.54。试问铁钉的长度试问铁钉的长度X是否服从正态分布?是否服从正态分布?而在本例中,我们关心的问题是总体而在本例中,我们关心的问题是总体X是否服从正是否服从正态分布。态分布。如同例如同例1那样,选择那样,选择“是是”或或“否否”作为假设,然后利用作为假设,然后利用样本对假设的真伪作出判断。样本对假设的真伪作出判断。本讲稿第七页,共八十八页 以上两例都是实际问题中常见的假设检验问题。以上两例都是实际问题中常见的假设检验问题。
7、我们把问题中涉及到的假设称为我们把问题中涉及到的假设称为原假设原假设或称或称待检假设待检假设,一,一般用般用H0表示。而把与原假设对立的断言称为表示。而把与原假设对立的断言称为备择假设备择假设,记,记为为H1。如例如例1,若原假设为,若原假设为H0:=0=4.55,则备择假设为,则备择假设为H1:4.55。若例若例2的原假设为的原假设为H0:X服从正态分布,则备择假设为服从正态分布,则备择假设为H1:X不服从正态分布。不服从正态分布。本讲稿第八页,共八十八页 当然,在两个假设中用哪一个作为原假设,哪一当然,在两个假设中用哪一个作为原假设,哪一个作为备择假设,视具体问题的题设和要求而定。个作为备
8、择假设,视具体问题的题设和要求而定。在许多问题中,当总体分布的类型已知时,只对其在许多问题中,当总体分布的类型已知时,只对其中一个或几个未知参数作出假设,这类问题通常称之为中一个或几个未知参数作出假设,这类问题通常称之为参数假设检验参数假设检验,如例,如例1。而在有些问题中,当总体的分布完全不知或不确切而在有些问题中,当总体的分布完全不知或不确切知道,就需要对总体分布作出某种假设,这种问题称为知道,就需要对总体分布作出某种假设,这种问题称为分布假设检验分布假设检验,如例,如例2。本讲稿第九页,共八十八页接下来我们要做的事是:给出一个合理的法则,根据接下来我们要做的事是:给出一个合理的法则,根据
9、这一法则,利用巳知样本做出判断是接受假设这一法则,利用巳知样本做出判断是接受假设H0,还是拒,还是拒绝假设绝假设H0。本讲稿第十页,共八十八页二、假设检验的基本思想二、假设检验的基本思想假设检验的一般提法是:在给定备择假设假设检验的一般提法是:在给定备择假设H1下,利下,利用样本对原假设用样本对原假设H0作出判断,若拒绝原假设作出判断,若拒绝原假设H0,那就意,那就意味着接受备择假设味着接受备择假设H1,否则,就接受原假设,否则,就接受原假设H0。换句话说,假设检验就是要在原假设换句话说,假设检验就是要在原假设H0和备择假设和备择假设H1中中作出拒绝哪一个和接受哪一个的判断。究竟如何作出判断作
10、出拒绝哪一个和接受哪一个的判断。究竟如何作出判断呢?对一个统计假设进行检验的依据是所谓呢?对一个统计假设进行检验的依据是所谓小概率原理小概率原理,即即概率很小的事件在一次试验中是几乎不可能发生概率很小的事件在一次试验中是几乎不可能发生概率很小的事件在一次试验中是几乎不可能发生概率很小的事件在一次试验中是几乎不可能发生!本讲稿第十一页,共八十八页例如,在例如,在100件产品中,有一件次品,随机地从中取件产品中,有一件次品,随机地从中取出一个产品是次品的事件就是小概率事件。出一个产品是次品的事件就是小概率事件。因为此事件发生的概率因为此事件发生的概率=0.01很小,因此,从中任很小,因此,从中任意
11、抽一件产品恰好是次品的事件可认为几乎不可能发生意抽一件产品恰好是次品的事件可认为几乎不可能发生的,如果确实出现了次品,我们就有理由怀疑这的,如果确实出现了次品,我们就有理由怀疑这“100件产品中只有一件次品件产品中只有一件次品”的真实性。的真实性。那么那么 取值多少才算是小概率呢?这就要视实际问取值多少才算是小概率呢?这就要视实际问题的需要而定,一般题的需要而定,一般 取取0.1,0.05,0.01等。等。本讲稿第十二页,共八十八页以例以例1为例:首先建立假设为例:首先建立假设:H0:=0=4.55,H1:4.55。其次,从总体中作一随机抽样得到一样本观察值其次,从总体中作一随机抽样得到一样本
12、观察值(x1,x2,xn)。本讲稿第十三页,共八十八页注意到注意到是的无偏估计量。因此,若是的无偏估计量。因此,若H0正确,则正确,则与与 0的偏差一般不应太大,即的偏差一般不应太大,即不应太大,若过分大,我们有理由怀疑不应太大,若过分大,我们有理由怀疑H0的正确性而拒的正确性而拒绝绝H0。由于。由于因此,考察因此,考察的大小等价于考察的大小等价于考察的大小,哪么如何判断的大小,哪么如何判断是否偏大呢?是否偏大呢?本讲稿第十四页,共八十八页具体设想是,对给定的小正数具体设想是,对给定的小正数,由于事件,由于事件是概率为是概率为 的小概率事件,即的小概率事件,即因此,当用样本值代入统计量因此,当
13、用样本值代入统计量具体计算得到其观察值具体计算得到其观察值本讲稿第十五页,共八十八页统计量统计量称为检验统计量。称为检验统计量。当检验统计量取某个区域当检验统计量取某个区域C中的值时,就拒绝中的值时,就拒绝H0,则称则称C为为H0的拒绝域,拒绝域的边界点称为临界值。如的拒绝域,拒绝域的边界点称为临界值。如例例1中拒绝域为中拒绝域为,临界值为,临界值为和和若若即说明在一次抽样中,小概率事件居然发生了。即说明在一次抽样中,小概率事件居然发生了。因此依据小概率原理,有理由拒绝因此依据小概率原理,有理由拒绝H0,接受,接受H1;,则没有理由拒绝,则没有理由拒绝H0,只能接受,只能接受H0。若若本讲稿第
14、十六页,共八十八页将上述检验思想归纳起来,可得参数的假设检验的一将上述检验思想归纳起来,可得参数的假设检验的一般步骤:般步骤:(1)根据所讨论的实际问题建立原假设根据所讨论的实际问题建立原假设H0及备择假设及备择假设H1;(2)选择合适的检验统计量选择合适的检验统计量Z,并明确其分布;,并明确其分布;(3)对预先给定的小概率对预先给定的小概率 0,由,由P|Z|z/2=确定确定临界值临界值z/2;(4)由样本值具体计算统计量由样本值具体计算统计量Z的观察值的观察值z,并作出判断,并作出判断,若若|z|z/2,则拒绝,则拒绝H0,接受,接受H1;若;若|z|z/2,则接受,则接受H0。本讲稿第十
15、七页,共八十八页现在,我们来解决例现在,我们来解决例1提出的问题:提出的问题:(1)假设假设H0:=0=4.55,H1:4.55;(2)选择检验用统计量选择检验用统计量(3)对于给定小正数,如对于给定小正数,如=0.05,查标准正态分表得到临,查标准正态分表得到临界值界值z/2=z0.025=1.96;因为因为|z|=3.91.96,所以拒绝,所以拒绝H0,接受,接受H1,即认为,即认为新工艺改变了铁水的平均含碳量。新工艺改变了铁水的平均含碳量。(4)具体计算:这里具体计算:这里n=5,故故Z的观察值的观察值本讲稿第十八页,共八十八页三、假设检验中两类错误三、假设检验中两类错误第第类错误类错误
16、,当原假设,当原假设H0为真时,却作出拒绝为真时,却作出拒绝H0的判断,通常称之为的判断,通常称之为弃真错误弃真错误,由于样本的随机,由于样本的随机性,犯这类错误的可能性是不可避免的。若将犯这性,犯这类错误的可能性是不可避免的。若将犯这一类错误的概率记为一类错误的概率记为,则有,则有P拒绝拒绝H0|H0为真为真=。第第类错误类错误,当原假设,当原假设H0不成立时,却作出接不成立时,却作出接受受H0的决定,这类错误称之为的决定,这类错误称之为取伪错误取伪错误,这类错误,这类错误同样是不可避免的。若将犯这类错误的概率记为同样是不可避免的。若将犯这类错误的概率记为,则有则有P接受接受H0|H0为假为
17、假=。本讲稿第十九页,共八十八页自然,我们希望一个假设检验所作的判断犯这两自然,我们希望一个假设检验所作的判断犯这两类错误的概率都很小。事实上,在样本容量类错误的概率都很小。事实上,在样本容量n固定的固定的情况下,这一点是办不到的。因为当情况下,这一点是办不到的。因为当 减小时,减小时,就就增大;反之,当增大;反之,当 减小时,就减小时,就 增大。增大。那么,如何处理这一问题呢?那么,如何处理这一问题呢?事实上,在处理实际问题中,一般地,对原假事实上,在处理实际问题中,一般地,对原假设设H0,我们都是经过充分考虑的情况下建立的,或,我们都是经过充分考虑的情况下建立的,或者认为犯弃真错误会造成严
18、重的后果。者认为犯弃真错误会造成严重的后果。本讲稿第二十页,共八十八页例如,原假设是前人工作的结晶,具有稳定性,从经例如,原假设是前人工作的结晶,具有稳定性,从经验看,没有条件发生变化,是不会轻易被否定的,如果验看,没有条件发生变化,是不会轻易被否定的,如果因犯第因犯第类错误而被否定,往往会造成很大的损失。类错误而被否定,往往会造成很大的损失。因此,在因此,在H0与与H1之间,我们主观上往往倾向于保护之间,我们主观上往往倾向于保护H0,即,即H0确实成立时,作出拒绝确实成立时,作出拒绝H0的概率应是一个很小的正的概率应是一个很小的正数,也就是将犯弃真错误的概率限制在事先给定的范围内,数,也就是
19、将犯弃真错误的概率限制在事先给定的范围内,这类假设检验通常称为这类假设检验通常称为显著性假设检验显著性假设检验,小正数,小正数 称为称为检验检验水平水平或称或称显著性水平显著性水平。本讲稿第二十一页,共八十八页8.2 正态总体下未知参数的假设检验正态总体下未知参数的假设检验 一、单个正态总体情形一、单个正态总体情形本讲稿第二十二页,共八十八页1均值均值 的检验的检验原假设原假设H0:=0,备择假设,备择假设H1:0。(a)2已知已知由上节的讨论可知,在由上节的讨论可知,在H0成立的条件下,选用检验统计成立的条件下,选用检验统计量量对给定的检验水平对给定的检验水平,查正态分布表得临界值,查正态分
20、布表得临界值z/2,再,再由由样本值具体计算统计量样本值具体计算统计量Z的观察值的观察值z并与并与z/2比较比较,若,若|z|z/2,则拒绝,则拒绝H0,接受,接受H1;若;若|z|z/2,则接受,则接受H0。这种检验法常称为这种检验法常称为Z检验法。检验法。一、单个正态总体情形一、单个正态总体情形本讲稿第二十三页,共八十八页例例1设某车床生产的钮扣的直径设某车床生产的钮扣的直径X服从正态分布,根据以往的服从正态分布,根据以往的经验,当车床工作正常时,生产的钮扣的平均直径经验,当车床工作正常时,生产的钮扣的平均直径 0=26mm,方差,方差 2=2.62。某天开机一段时间后,为检验车床工作是否
21、正。某天开机一段时间后,为检验车床工作是否正常,随机地从刚生产的钮扣中抽检了常,随机地从刚生产的钮扣中抽检了100粒,测得均值为粒,测得均值为26.56。假定方差没有什么变化。试分别在假定方差没有什么变化。试分别在 1=0.05,2=0.01下,检验该下,检验该车床工作是否正常?车床工作是否正常?由由 1=0.05及及 2=0.01,查正态分布表,得临界值,查正态分布表,得临界值z 1/2=z0.025=1.96,z 2/2=z0.005=2.58。而。而解:原假设解:原假设H0:=0,备择假设,备择假设H1:0。本讲稿第二十四页,共八十八页因此,因此,|z|=2.151.96,但,但|z|=
22、2.152.58,故在检,故在检验水平验水平 1=0.05下,应当拒绝下,应当拒绝H0,接受,接受H1,即认为该天车,即认为该天车床工作不正常;而在检验水平床工作不正常;而在检验水平 2=0.01下,应当接受下,应当接受H0,即,即认为该天车床工作是正常的。认为该天车床工作是正常的。本讲稿第二十五页,共八十八页上例说明:上例说明:1)对于同一个问题,同一个样本,由于检验水平不一样,)对于同一个问题,同一个样本,由于检验水平不一样,可能得出完全相反的结论。因此,在实际应用中,如何合可能得出完全相反的结论。因此,在实际应用中,如何合理地选择检验水平是非常重要的。理地选择检验水平是非常重要的。本讲稿
23、第二十六页,共八十八页(b)2未知未知由于由于 2未知,因此,不能用未知,因此,不能用Z作为检验统计量,但注意到样作为检验统计量,但注意到样本方差本方差是是 2的无偏估计量,因此,我们自然会想到用的无偏估计量,因此,我们自然会想到用s2代替代替 2,而在第六章的定理,而在第六章的定理3也已经证明,在也已经证明,在H0成立的条件下,成立的条件下,统计量统计量本讲稿第二十七页,共八十八页于是,对给定的显著性水平于是,对给定的显著性水平 0,查,查t分布表可得临分布表可得临界值界值t/2,使,使P|t|t/2=成立。再由样本值具体计算统成立。再由样本值具体计算统计量计量T的观察值的观察值t,并与,并
24、与t/2比较,若比较,若|t|t/2,则拒绝,则拒绝H0,接受接受H1;若;若|t|t/2,则接受,则接受H0。这种检验法也称为。这种检验法也称为t 检检验法验法。例例2某厂利用某种钢生产钢筋,根据长期资料的分析,知某厂利用某种钢生产钢筋,根据长期资料的分析,知道这种钢筋强度道这种钢筋强度X服从正态分布,今随机抽取六根钢筋进行服从正态分布,今随机抽取六根钢筋进行强度试验,测得强度强度试验,测得强度X(单位:单位:kg/mm2)为为48.5,49.0,53.5,56.0,52.5,49.5。试问:能否据此认为这种钢筋的平均强度为试问:能否据此认为这种钢筋的平均强度为52.0kg/mm2(=0.0
25、5)?本讲稿第二十八页,共八十八页解解设设XN(,2),依题意建立假设依题意建立假设H0:=0,H1:0。这里这里 2未知,故在未知,故在H0成立的条件下应选取检验统计量成立的条件下应选取检验统计量由已知由已知=0.05,查,查t分布表得临界值分布表得临界值t/2=t0.025(61)=2.571。本讲稿第二十九页,共八十八页又由样本值算得又由样本值算得因为,因为,|t|0.412.571,故接受,故接受H0,即可以认为这种钢,即可以认为这种钢筋的平均强度为筋的平均强度为52.0kg/mm2。本讲稿第三十页,共八十八页本讲稿第三十一页,共八十八页2方差的检验方差的检验设总体设总体XN(,2),
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率论第八章 假设检验精选文档 概率论 第八 假设检验 精选 文档
限制150内