《概率论与数理统计》第七章假设检验..pdf
《《概率论与数理统计》第七章假设检验..pdf》由会员分享,可在线阅读,更多相关《《概率论与数理统计》第七章假设检验..pdf(33页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章第七章假设检验假设检验学习目标知识目标:理解假设检验的基本概念小概率原理;理解假设检验的基本概念小概率原理;掌握假设检验的方法和步掌握假设检验的方法和步骤。骤。能力目标:能够作正态总体均值、比例的假设检验和两个正态总体的均值、能够作正态总体均值、比例的假设检验和两个正态总体的均值、比例之差的假设检验。比例之差的假设检验。参数估计和假设检验是统计推断的两种形式,它们都是利用样本对总体进行某种推断,然而推断的角度不同。参数估计是通过样本统计量来推断总体未知参数的取值范围,以及作出结论的可靠程度,总体参数在估计前是未知的。而在假设检验中,则是预先对总体参数的取值提出一个假设,然后利用样本数据检
2、验这个假设是否成立,如果成立,我们就接受这个假设,如果不成立就拒绝原假设。当然由于样本的随机性,这种推断只能具有一定的可靠性。本章介绍假设检验的基本概念,以及假设检验的一般步骤,然后重点介绍常用的参数检验方法。由于篇幅的限制,非参数假设检验在这里就不作介绍了。第一节假设检验的一般问题关键词:参数假设;检验统计量;接受域与拒绝域;假设检验的两类错误一、假设检验的基本概念(一)原假设和备择假设为了对假设检验的基本概念有一个直观的认识,不妨先看下面的例子。例某厂生产一种日光灯管,其寿命X服从正态分布N(,2002),从过去的生产经验看,灯管的平均寿命为1550小时,。现在采用新工艺后,在所生产的新灯
3、管中抽取 25 只,测其平均寿命为 1650 小时。问采用新工艺后,灯管的寿命是否有显著提高这是一个均值的检验问题。灯管的寿命有没有显著变化呢这有两种可能:一种是没有什么变化。即新工艺对均值没有影响,采用新工艺后,X仍然服从N(1550,2002)。另一种情况可能是,新工艺的确使均值发生了显著性变化。这样,X 1650和01550之间的差异就只能认为是采用新工艺的关系。究竟是哪种情况与实际情况相符合,这需要作检验。假如给定显著性水平 0.05。在上面的例子中,我们可以把涉及到的两种情况用统计假设的形式表示出来。第一个统计假设1550表示采用新工艺后灯管的平均寿命没有显著性提高。第二个统计假设1
4、550表示采用新工艺后灯管的平均寿命有显著性提高。这第一个假设称为原假设(或零假设),记为H0:1550;第二个假设1550称为备择假设,记为H1:1550。至于在两个假设中,采用哪一个作为原假设,哪一个作为备择假设,要看具体的研究目的和要求而定。假如我们的目的是希望从子样观察值对某一陈述取得强有力的支持,则把该陈述的否定作为原假设,该陈述本身作为备择假设。譬如在上例中,我们的目的当然是希望新工艺对产品寿命确有提高,但又没有更多的数据可以掌握。为此,我们取“寿命没有显著性提高(1550)”作原假设,而以“寿命有显著性提高(1550)”作为备择假设。(二)检验统计量假设检验问题的一般提法是:在给
5、定备择假设H1下对原假设H0作出判断,若拒绝原假设H0,那就意味着接受备择假设H1,否则就接受原假设H0。在拒绝原假设H0或接受备择假设H1之间作出某种判断,必须要从子样(X1,X2,Xn)出发,制定一个法则,一旦子样(x1,x2,xn)的观察值确定之后,利用我们制定的法则作出判断:拒绝原假设H0还是接受原假设H0。那么检验法则是什么呢它应该是定义在子样空间上的一个函数为依据所构造的一个准则,这个函数一般称为检验统计量。如上面列举的原假设H0:0(01550),那么子样均值X就可以作为检验统计量,有时还可以根据检验统计量的分布进一步加工,如子样均值服从正态分布时将其标准化,Z X 0/n作为检
6、验统计量,简称Z检验量。或者在总体方差 2未知的条件下,t X 0Sn/n作为检验量,称为t检验量。(三)接受域和拒绝域假设检验中接受或者拒绝原假设H0的依据是假设检验的小概率原理。所谓小概率原理,是指发生概率很小的随机事件在一次实验中几乎是不可能发生的,根据这一原理就可以作出接受或是拒绝原假设的决定。如,一家厂商声称其某种产品的合格率很高,可以达到 99,那么从一批产品(如100 件)中随机抽取一件,这一件恰好是次品的概率就非常之小,只有1。如果把厂商的宣称,即产品的次品率仅为 1作为一种假设,并且是真的。那么由小概率原理,随机抽取一件是次品的情形就几乎是不可能发生的。如果这种情形居然发生了
7、,这就不能不使人们怀疑原来的假设,即产品的次品率仅为1的假设的正确性,这时就可以作出原假设为伪的判断,于是否定原假设。接受域和拒绝域是在给定的显著性水平下,由检验法则所划分的样本空间的两个互不相交的区域。原假设H0为真时的可以接受的可能范围称为接受域,另一区域是当原假设H0为真时只有很小的概率发生,如果小概率事件确实发生,就要拒绝原假设,这一区域称为拒绝域(或否定域)。落入拒绝域是个小概率事件,一旦落入拒绝域,就要拒绝原假设而接受备择假设。那么应该确定多大的概率算作小概率呢这要根据不同的目的和要求而定,一般选择0.05或者0.01,通常用表示。它说明用多大的小概率来检验原假设。显然愈小愈不容易
8、推翻原假设,而一旦拒绝原假设,原假设为真的可能性就越小。所以在作假设检验时通常要事先给定显著性水平.(1称为置信水平)。图 7-1 所示Z检验时的拒绝域和接受域。(四)假设检验中的两类错误由前面已知,假设检验是在子样观察值确定之后,根据小概率原理进行推断的,由于样本的随机性,这种推断不可能有绝对的把握,不免要犯错误。所犯错误的类型有两类:一类错误是原假设H0为真时却被拒绝了。这类错误称为弃真错误,犯这种错误的概率用表示,所以也叫错误或第一类错误。另一类错误是指原假设H0为伪时,却被人们接受而犯了错误。这是一种取伪的错误,这种错误发生的概率用表示,故也称错误或第二类错误。在厂家出售产品给消费者时
9、,通常要经过产品质量检验,生产厂家总是假定产品是合格的,但检验时厂家总要承担把合格产品误检为不合格产品的某些风险,生产者承担这些风险的概率就是,所以也称为生产者风险。而在消费者一方却耽心把不合格产品误检为合格品而被接受,这是消费者承担的某些风险,其概率就是,因此第二类错误也称为消费者风险。正确的决策和犯错误的概率可以归纳为表。自然,人们希望犯这两类错误的概率愈小愈好。但对于一定的子样容量n,不可能同时做到犯这两类错误的概率都很小。通常的假设检验只规定第一类错误,即显著性水平,而不考虑第二类错误,并称这样的检验为显著性检验。表假设检验中各种可能结果的概率接受H0拒绝H0,接受H1H0为真1(正确
10、决策)(弃真错误)1(正确决策)H0为伪(取伪错误)(五)双边检验和单边检验根据假设的形式,可以把检验分为双边检验和单边检验,单边检验又进一步分为右检验和左检验。1、双边检验例如,检验的形式为:H0:0H1:0由于我们在这里提出的原假设是等于某一数值0,所以只要0或0二者之中有一个成立,就可以否定原假设,这种假设检验称为双边检验,它的拒绝域分为两个部分,有两个临界值,在给定显著性水平下,每个拒绝域的面积为/2。双边检验如图所示。2、单边检验在有些情况下,我们关心的假设问题带有方向性。例如产品的次品率则要求愈低愈好,它不能高于某一指标,当高于某一指标,就要拒绝原假设,这就是单边检验。这时拒绝域的
11、图形在右侧,就称作单边右检验。检验的形式可以写为:H0:0,H1:0。又例如,灯管的使用寿命,药物的有效成分这类产品质量指标是愈高愈好,它不能低于某一标准,当低于某一标准时就要拒绝原假设,这时拒绝域的图形在左侧,就称为单边左检验。检验的形式为:H0:0,H1:0。二、假设检验的一般步骤一个完整的假设检验过程,一般包括五个主要步骤:(一)提出原假设和备择假设确定是双边检验还是单边检验,例如双边检验为:H0:0,H1:0。单边左检验为:H0:0,H1:0。单边右检验为:H0:0,H1:0。(二)(二)建立检验统计量建立检验统计量是假设检验的重要步骤。譬如上例中,在总体X服从正态分布N(,2002)
12、的假定下,当原假设H0:1550成立时,建立检验统计量Z X 1550200/n,那么Z就服从标准正态分布N(0,1)。在具体问题里,选择什么统计量作为检验统计量,需要考虑的因素与参数估计相同。例如,用于进行检验的样本是大样本还是小样本,总体方差是已知还是未知等等,在不同条件下应选择不同的检验统计量。(三)(三)规定显著性水平,确定H0的拒绝域例如,当原假设H0:0成立时,检验统计量U服从标准正态分布N(0,1),那么给定显著性水平(0 1),按双边检验,在标准正态分布表中查得临界值z,使得2PZ z2,或者Pz Z z122。若由子样(X1,X2,Xn)的一组观察值(x1,x2,xn)算得统
13、计量Z的值z落在(,z)或(z,)时,则拒绝或否定H0,(,z)及(z,)2222组成H0的拒绝域,称z为临界值。2(四)(四)计算实际检验量在例中,X 016501550200/25z/n 2.5。(五)(五)判断将实际检验量的数值与临界值比较,以确定接受或拒绝H0。在本例中,z u0.051.645。实际检验量u之值大于临界值1.645,即落入拒绝域,故拒绝H0:1550,接受假设H1:1550,即可认为采用新工艺后日光灯管的平均寿命有显著性提高。第二节正态总体的参数检验关键词:总体均值的检验;总体比例的检验;单边右检验;单边左检验;两个总体均值之差;两个总体比例之差一、一个正态总体的参数
14、检验(一)总体均值的检验、正态总体且方差 2已知例某厂生产一种耐高温的零件,根据质量管理资料,在以往一段时间里,零件抗热的平均温度是 12500C,零件抗热温度的标准差是 1500C。在最近生产的一批零件中,随机测试了 100 个零件,其平均抗热温度为 12000C。该厂能否认为最近生产的这批零件仍然符合产品质量要求,而承担的生产者风险为。解:从题意分析知道,该厂检验的目的是希望这批零件的抗热温度高于 12500C,而低于 12500C 的应予拒绝,因此这是一个左边检验问题。(1)提出假设:H0:1250,H1:1250。(2)建立检验统计量为:X 0Z/n。(3)根 据 给 定 的 显 著
15、性 水 平 0.05,查 表 得 临 界 值 z0.05 1.645,因此拒绝域为(,1.645)。(4)计算检验量的数值X 012001250150/100z/n 3.33。(5)因为3.33(,1.645),落入拒绝域,故拒绝原假设或接受备择假设,认为最近生产的这批零件的抗高温性能低于12500C,不能认为产品符合质量要求。、大样本,总体分布和总体方差2未知在大样本的条件下,不论总体是否服从正态分布,由中心极限定理可知,样本均值X近似服从正态分布N(,2n),(为总体均值,2为总体方差,n为样本容量)。总体方差未知时,可用大样本方差S2n11n(Xi X)2代替总体方差2来估计。所以总体均
16、值的检验量n 1i1为:Z X 0Sn1/n。例例某阀门厂的零件需要钻孔,要求孔径10cm,孔径过大过小的零件都不合格。为了测试钻孔机是否正常,随机抽取了 100 件钻孔的零件进行检验,测得X 9.6cm,s 1cm。给定 0.05,检验钻孔机的操作是否正常。解:从题意可知,这是一个总体均值的双边检验问题。(1)提出假设:H0:10,H1:10。(2)建立检验统计量:X 0Sn1/n。Z(3)由给定的显著性水平 0.05,查表得临界值 z/2 1.96,因此拒绝域为(,1.96)及(1.96,)。(4)计算实际检验量的数值:z X 0Sn1/n9.6101/100 4。(5)因为 4(,1.9
17、6),落入拒绝域,故应拒绝原假设H0,接受H1,认为零件的孔径偏离了10cm的合格要求,且偏小。这说明钻孔机的操作已不正常,应进行调试。、小样本,正态总体且方差 2未知当总体服从正态分布N(,2),和 2为未知参数,小样本时,要检验H0时的统计量是自由度为n1的t 分布:t X 0Sn1/n。例 某日用化工厂用一种设备生产香皂,其厚度要求为5cm,今欲了解设备的工作性能是否良好,随机抽取 10 块香皂,测得平均厚度为5.3cm,标准差为0.3cm,试分别以0.01,0.05的显著性水平检验设备的工作性能是否合乎要求。解:根据题意,香皂的厚度指标可以认为是服从正态分布的,但总体方差未知,且为小样
18、本。这是一个总体均值的双边检验问题。(1)提出假设:H0:5(合乎质量要求),H1:5(不合乎质量要求)。(2)建立检验统计量。由题目的条件,检验统计量为:X 0Sn1/n。t(3)当 0.01和自由度n19,查表得t/2(9)3.2498,拒绝域为(,3.2498)及(3.2498,),接受域为(3.2498,3.2498)。当 0.05和自由度n19,查表得t/2(9)2.2622,拒绝域为(,2.2622)及(2.2622,)。(4)计算实际检验量的值:X 0s/n5.350.3/10t 3.16。(5)当 0.01时,3.16(3.2498,3.2498),落入接受域,故接受原假设H0
19、,认为在 0.01的显著性水平下,设备的工作性能尚属良好。当 0.05时,3.16(2.2622,),落入了拒绝域,因此要拒绝原假设H0,认为在 0.05的显著性水平下,设备的性能与良好的要求有显著性差异。同样的检验数据,检验的结论不同,这似乎是矛盾的。其实不然,当在显著性水平 0.01时接受原假设,只能是认为在规定的显著性水平下,尚不能否定原假设。接受H0,并不意味着有绝对的把握保证H0为真。我们从此例看到,在 95的置信水平上否定原假设,但是却不能在 99的置信水平上否定原假设。(二)总体比例的检验在实际问题中,检验总体中具有某种特征的个体所占的比例是否为某个假设值p0,是经常遇到的。譬如
20、,一批产品中的次品率,适龄儿童的入学率,电视节目的收视率,等等。由中心极限定理可知,在渐进服从正态分布,因而可用Z统计量大样本的情况下,样本比例p进行检验。p0pp0(1 p0)nZ 例例一项社会调查结果指出某市老年人口的比重为,该市老年人口研究会为了检验调查结果的可靠程度,随机抽选了该市 400 名居民,其中有 57 名年龄在 65 岁以上的老年人。在给定显著性水平 0.05下,调查结果是否支持该市老年人口的比重为的看法解:这是一个有关总体比例的双边检验问题。(1)提出假设:H0:p 14.7,H1:p 14.7。(2)计算子样比例p5714.25及实际检验量:400z p0pp0(1 p0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率论与数理统计 概率论 数理统计 第七 假设检验
限制150内