(本科)第7章假设检验ppt课件.pptx
第第七七章章假设检验假设检验假设检验的基本原理假设检验的基本原理总体参数假设检验总体参数假设检验非参数检验非参数检验(本科)第7章假设检验ppt课件第一节第一节假设检验的基本原理假设检验的基本原理假设检验的基本原理假设检验的基本原理假设检验的规则与两类错误假设检验的规则与两类错误检验功效检验功效(本科)第7章假设检验ppt课件一、假设检验的基本原理一、假设检验的基本原理v假设检验是统计推断的另一项重要组成部分,是参数估假设检验是统计推断的另一项重要组成部分,是参数估计的延续,是对参数估计在统计上的验证与补充。它首计的延续,是对参数估计在统计上的验证与补充。它首先对考察总体的分布形式或总体的某些未知参数事先做先对考察总体的分布形式或总体的某些未知参数事先做出某些假设,然后根据检验对象构造合适的检验统计量出某些假设,然后根据检验对象构造合适的检验统计量并经过数理统计分析,确定在假设下,该检验统计量的并经过数理统计分析,确定在假设下,该检验统计量的抽样分布;在给定的显著性水平下,从抽样分布中得出抽样分布;在给定的显著性水平下,从抽样分布中得出鉴别对原先假设的拒绝域和接受域的临界值;之后由所鉴别对原先假设的拒绝域和接受域的临界值;之后由所抽取的样本资料计算样本统计量,并将样本统计量与临抽取的样本资料计算样本统计量,并将样本统计量与临界统计量进行比较,从而对所提出的原假设做出统计判界统计量进行比较,从而对所提出的原假设做出统计判断:是接受还是拒绝原假设。也就是从样本中所蕴含的断:是接受还是拒绝原假设。也就是从样本中所蕴含的信息来对总体情况进行判断。信息来对总体情况进行判断。(本科)第7章假设检验ppt课件v假设检验所遵循的推断依据是统计中的假设检验所遵循的推断依据是统计中的“小概小概率原理率原理”:小概率事件在一次试验中几乎是不:小概率事件在一次试验中几乎是不会发生的。举个例子来说,在会发生的。举个例子来说,在10000件的产品中,件的产品中,如果只有如果只有1件是次品,那么可以得知,在一次试件是次品,那么可以得知,在一次试验中随机抽取验中随机抽取1件产品,它为次品的概率就为件产品,它为次品的概率就为0.01,此概率是非常小的。或者是说,在一次,此概率是非常小的。或者是说,在一次随机抽样试验中,次品几乎是不会被抽到的。随机抽样试验中,次品几乎是不会被抽到的。反过来,如果从这批产品中随机抽取反过来,如果从这批产品中随机抽取1件,恰好件,恰好是次品,那么,我们就有理由怀疑该批产品的是次品,那么,我们就有理由怀疑该批产品的次品率不是很小,否则就不会那么容易地抽到次品率不是很小,否则就不会那么容易地抽到次品。因此,有足够的理由否认该批产品的次次品。因此,有足够的理由否认该批产品的次品率很低的假设。品率很低的假设。(本科)第7章假设检验ppt课件v通常概率要多大才能算得上是小概率呢?假设检验中把通常概率要多大才能算得上是小概率呢?假设检验中把这个小概率称为显著性水平这个小概率称为显著性水平,其取值的大小与我们能,其取值的大小与我们能否做出正确判断有着相当大的关系。然而,否做出正确判断有着相当大的关系。然而,的取值并的取值并没有固定的标准,只能根据实际需要来确定。一般地,没有固定的标准,只能根据实际需要来确定。一般地,取取0.05(5),对于一些比较严格的情况,例如在一),对于一些比较严格的情况,例如在一些高精密质量检验的假设检验中,它可以取些高精密质量检验的假设检验中,它可以取0.01或者更或者更小。小。越小,所做出的拒绝原假设的判断的说服力就越越小,所做出的拒绝原假设的判断的说服力就越强。当然,不管强。当然,不管有多么地小,也不能代表小概率事件有多么地小,也不能代表小概率事件没有发生的可能,这也正是假设检验与数学上没有发生的可能,这也正是假设检验与数学上“反证法反证法”的不同之处。所以,对于拒绝或者接受,都只是统计的不同之处。所以,对于拒绝或者接受,都只是统计意义上的,并不是完全意义上的。这一点在学习假设检意义上的,并不是完全意义上的。这一点在学习假设检验过程中是容易被疏忽的。验过程中是容易被疏忽的。(本科)第7章假设检验ppt课件v事先建立假设,是假设检验中关键的一项工作。它包括事先建立假设,是假设检验中关键的一项工作。它包括原假设和备选假设两部分。原假设是建立在假定原来总原假设和备选假设两部分。原假设是建立在假定原来总体没有发生变化的基础之上的,也就是总体参数没有显体没有发生变化的基础之上的,也就是总体参数没有显著变化。备选假设是原假设的对立,是在否认原假设之著变化。备选假设是原假设的对立,是在否认原假设之后所要接受的内容,通常这是我们真正感兴趣的一个判后所要接受的内容,通常这是我们真正感兴趣的一个判断。例如在上面的例子中,如果想确认次品率是否为断。例如在上面的例子中,如果想确认次品率是否为0.01,我们可以分别建立原假设和备选假设为:,我们可以分别建立原假设和备选假设为:H0:0=0.01%,H1:00.01%;如果我们想确认次品率是;如果我们想确认次品率是否大于(小于)否大于(小于)0.01,那么对应的备选假设为:,那么对应的备选假设为:H1:00.01%(或或00.01%),原假设与前面相同。由此可,原假设与前面相同。由此可见,备选假设与原假设的建立不是随意的,而是要根据见,备选假设与原假设的建立不是随意的,而是要根据研究的需要来确定的。研究的需要来确定的。(本科)第7章假设检验ppt课件v应当指出,在假设检验中,相对而言,当原假应当指出,在假设检验中,相对而言,当原假设被拒绝时,我们能够以较大的把握肯定备选设被拒绝时,我们能够以较大的把握肯定备选假设的成立;而当原假设不能被拒绝时,我们假设的成立;而当原假设不能被拒绝时,我们并不能断定原假设确实成立。例如,当给定的并不能断定原假设确实成立。例如,当给定的为为0.01时,如果检验统计量的取值落入其发生概时,如果检验统计量的取值落入其发生概率不超过率不超过0.04但又大于但又大于0.01的区域时,我们不能的区域时,我们不能拒绝原假设。但事实上,在原假设成立的前提拒绝原假设。但事实上,在原假设成立的前提下,其发生的概率最多只有下,其发生的概率最多只有0.04,因此难以断定,因此难以断定原假设成立。如果将显著水平定为原假设成立。如果将显著水平定为0.05,则原假则原假设就会被拒绝。设就会被拒绝。(本科)第7章假设检验ppt课件v假设检验按照所检验内容的不同,可以分为参假设检验按照所检验内容的不同,可以分为参数检验和非参数检验。对已知总体分布的某个数检验和非参数检验。对已知总体分布的某个未知参数进行的检验,称为参数检验;对总体未知参数进行的检验,称为参数检验;对总体的分布形式进行的检验,则称为非参数检验。的分布形式进行的检验,则称为非参数检验。本章将分别对这两类检验进行介绍。本章将分别对这两类检验进行介绍。(本科)第7章假设检验ppt课件二、假设检验的规则与两类错误二、假设检验的规则与两类错误(一)假设检验的规则(一)假设检验的规则v综合上面假设检验的原理分析,给出假设检验的步骤:综合上面假设检验的原理分析,给出假设检验的步骤:1根据实际应用问题确定合适的原假设根据实际应用问题确定合适的原假设H0和备选假设和备选假设H1;2确定检验统计量,通过数理统计分析确定该统计量的确定检验统计量,通过数理统计分析确定该统计量的抽样分布;抽样分布;3给定检验的显著性水平给定检验的显著性水平,在原假设成立的条件下,结,在原假设成立的条件下,结合备选假设的定义,由检验统计量的抽样分布情况求出合备选假设的定义,由检验统计量的抽样分布情况求出相应的临界值,该临界值为原假设的接受域与拒绝域的相应的临界值,该临界值为原假设的接受域与拒绝域的分界值;分界值;4从样本资料计算检验的样本统计量,并将其与临界值从样本资料计算检验的样本统计量,并将其与临界值进行比较,判断是否接受或拒绝原假设。进行比较,判断是否接受或拒绝原假设。(本科)第7章假设检验ppt课件v上面步骤中,对检验统计量抽样分布的确认属于高深的上面步骤中,对检验统计量抽样分布的确认属于高深的概率数理统计的研究内容,本处我们不作探讨。概率数理统计的研究内容,本处我们不作探讨。v从检验程序我们可以看出,统计量的取值范围可以分为从检验程序我们可以看出,统计量的取值范围可以分为接受域和拒绝域两个区域。拒绝域正就是统计量取值的接受域和拒绝域两个区域。拒绝域正就是统计量取值的小概率区域。按照我们将这个拒绝域安排在所检验统计小概率区域。按照我们将这个拒绝域安排在所检验统计量的抽样分布的某一侧还是两端,可以将检验分为单侧量的抽样分布的某一侧还是两端,可以将检验分为单侧检验和双侧检验。单侧检验中,又可以根据拒绝域,是检验和双侧检验。单侧检验中,又可以根据拒绝域,是在左侧还是在右侧而分为左侧检验和右侧检验。对于上在左侧还是在右侧而分为左侧检验和右侧检验。对于上述的情况,我们可以通过服从检验统计量的分布图来形述的情况,我们可以通过服从检验统计量的分布图来形象表示:象表示:(本科)第7章假设检验ppt课件图图7-1双侧检验与单侧检验双侧检验与单侧检验v图中的阴影部分为拒绝域,对应的分别是双侧、图中的阴影部分为拒绝域,对应的分别是双侧、左单侧、右单侧检验。左单侧、右单侧检验。(本科)第7章假设检验ppt课件v实际应用中,是采用双侧检验还是单侧检验?单侧检验实际应用中,是采用双侧检验还是单侧检验?单侧检验中,是采用左单侧还是右单侧呢?例如,某公司采取了中,是采用左单侧还是右单侧呢?例如,某公司采取了新的销售方案,我们想检验新方案下销售收入是否与实新的销售方案,我们想检验新方案下销售收入是否与实施前的有差异,即是否等同于原来的销售收入水平,对施前的有差异,即是否等同于原来的销售收入水平,对该情况的检验就是双侧检验。如果我们想检验新方案下该情况的检验就是双侧检验。如果我们想检验新方案下的销售收入水平是否有所提高,此时检验就转化为单侧的销售收入水平是否有所提高,此时检验就转化为单侧检验了,而且是右侧检验。同理,如果想检验收入水平检验了,而且是右侧检验。同理,如果想检验收入水平是否低于实施前的收入水平,就要采用单侧检验中的左是否低于实施前的收入水平,就要采用单侧检验中的左侧检验。也就是说,选用双侧、左侧或右侧检验时,要侧检验。也就是说,选用双侧、左侧或右侧检验时,要结合备选假设来考虑。又如,前面提到的次品率的例子结合备选假设来考虑。又如,前面提到的次品率的例子中,如果备选假设为中,如果备选假设为H1:00.01%,就是双侧检验;,就是双侧检验;如果备选假设为如果备选假设为H1:0)0.01%,就是属于左(右),就是属于左(右)单侧检验。单侧检验。(本科)第7章假设检验ppt课件v在检验规则中,我们经常碰到两种重要的检验方法:在检验规则中,我们经常碰到两种重要的检验方法:z检验与检验与t检验。检验。1z检验。又称为正态分布检验,该检验认为所检验的统检验。又称为正态分布检验,该检验认为所检验的统计量服从正态分布。例如,从正态分布总体中抽取一个计量服从正态分布。例如,从正态分布总体中抽取一个样本,则样本均值样本,则样本均值服从正态分布服从正态分布;从一般;从一般非正态分布总体中抽样,当样本容量非正态分布总体中抽样,当样本容量n很大时,样本均很大时,样本均值值 近似地服从正态分布近似地服从正态分布,其中,其中,,为总体标准差。因为统计量为总体标准差。因为统计量 N(0,1),所以,我们可以利用标准正态分布来进行检验。根据给所以,我们可以利用标准正态分布来进行检验。根据给定的显著性水平,从标准正态分布的临界表中查得临界定的显著性水平,从标准正态分布的临界表中查得临界值值,将,将z统计量的取值与临界值比较来判断统计量的取值与临界值比较来判断能否拒绝原假设。能否拒绝原假设。(本科)第7章假设检验ppt课件v2t检验。在检验中,当总体的标准差检验。在检验中,当总体的标准差未知未知时,需要用样本标准差时,需要用样本标准差来代替,从而来代替,从而构成统计量构成统计量。同样,从。同样,从t分布的分布的临界表中查得临界值临界表中查得临界值,并将样本统计量,并将样本统计量的的值与其比较做出判断。值与其比较做出判断。(本科)第7章假设检验ppt课件(二)(二)p值检验值检验v在上面的检验步骤中,判断最后是接受原假设在上面的检验步骤中,判断最后是接受原假设还是拒绝原假设依据是,计算的样本统计量的还是拒绝原假设依据是,计算的样本统计量的数值与检验统计量的临界值的大小比较。此外,数值与检验统计量的临界值的大小比较。此外,我们也可以根据计算的概率值我们也可以根据计算的概率值p来判断能否拒绝来判断能否拒绝原假设,这就是原假设,这就是p值检验。现在在众多流行的统值检验。现在在众多流行的统计计量软件中(如计计量软件中(如SAS,SPSS,EXCEL等),等),最后的结果表中都给出了最后的结果表中都给出了p值。值。(本科)第7章假设检验ppt课件vp值检验的原理:建立原假设后,在假定原假设成值检验的原理:建立原假设后,在假定原假设成立的情况下,参照备选假设,可以计算出检验统立的情况下,参照备选假设,可以计算出检验统计量超过或者小于(还要依照分布的不同、单侧计量超过或者小于(还要依照分布的不同、单侧检验、双侧检验的差异而定)由样本所计算出的检验、双侧检验的差异而定)由样本所计算出的检验统计量的数值的概率,这便是检验统计量的数值的概率,这便是p值;而后将此值;而后将此p值与事先给出的显著性水平值与事先给出的显著性水平进行比较,如果进行比较,如果p值小于值小于,也就是说,原假设对应的为小概率事件,也就是说,原假设对应的为小概率事件,根据上述的根据上述的“小概率原理小概率原理”,我们就可以否定原,我们就可以否定原假设,而接受对应的备选假设。如果假设,而接受对应的备选假设。如果p值大于值大于,我们不就能否定原假设。,我们不就能否定原假设。(本科)第7章假设检验ppt课件v例如,对应上面的例如,对应上面的检验中,如果是双侧检验,检验中,如果是双侧检验,根据上面的说明,可以计算根据上面的说明,可以计算,若若p,那么我们就可以否认原假设,反之不,那么我们就可以否认原假设,反之不能否定原假设。能否定原假设。p值检验与前面介绍的方法得值检验与前面介绍的方法得出的结论是一致的。出的结论是一致的。(本科)第7章假设检验ppt课件(三)两类错误(三)两类错误v在假设检验中,对假设的检验判断是依据样本实际资料在假设检验中,对假设的检验判断是依据样本实际资料所计算的统计量的值与临界值的比较来做出的。由于样所计算的统计量的值与临界值的比较来做出的。由于样本的随机性、样本信息的分散性等原因,这种合理的本的随机性、样本信息的分散性等原因,这种合理的“以偏概全以偏概全”式的假设检验,总是无法让我们百分百的肯式的假设检验,总是无法让我们百分百的肯定所做出结论的正确性。也就是说,我们有可能会做出定所做出结论的正确性。也就是说,我们有可能会做出错误的判断,这种风险是客观存在的。错误的判断,这种风险是客观存在的。v例如,实际上依据真实总体情况,我们应该接受原假设例如,实际上依据真实总体情况,我们应该接受原假设H0,但根据样本信息,却做出拒绝,但根据样本信息,却做出拒绝H0的错误结论,称的错误结论,称这种错误为这种错误为“弃真弃真”错误;此外,我们也可能犯这样的错误;此外,我们也可能犯这样的错误:实际的总体情况是应该拒绝原假设,而我们却接错误:实际的总体情况是应该拒绝原假设,而我们却接受了它,称此为受了它,称此为“纳伪纳伪”错误。错误。(本科)第7章假设检验ppt课件v对于上述的两类错误,我们都希望能尽量减少其发生的对于上述的两类错误,我们都希望能尽量减少其发生的概率。因此需要对它们的概率进行简要分析。在假设中,概率。因此需要对它们的概率进行简要分析。在假设中,我们给出了显著性水平我们给出了显著性水平(概率值),在(概率值),在“小概率事件小概率事件是几乎不会发生的是几乎不会发生的”原理上,如果样本资料的信息与总原理上,如果样本资料的信息与总体信息之间的差异出现的概率小于等于体信息之间的差异出现的概率小于等于,那么可以认,那么可以认为在一次试验中该事件不会发生(发生的可能性为在一次试验中该事件不会发生(发生的可能性很小)很小),从而我们就拒绝了原假设。这就是说,有,从而我们就拒绝了原假设。这就是说,有的可能性的可能性发生原假设是真实的却被拒绝的情况。所以显著性水平发生原假设是真实的却被拒绝的情况。所以显著性水平就是我们犯就是我们犯“弃真弃真”错误的可能性大小。错误的可能性大小。越小,则越小,则犯犯“弃真弃真”错误的可能性就越小。因而,可以根据实际错误的可能性就越小。因而,可以根据实际需要对显著性水平需要对显著性水平加以控制,一般取加以控制,一般取=0.05(或者(或者=0.1),这就保证犯),这就保证犯“弃真弃真”错误的可能性不超过错误的可能性不超过5(或者(或者1)。如果要求更加严格,)。如果要求更加严格,可取更小的数值。可取更小的数值。(本科)第7章假设检验ppt课件v通常记通常记为犯为犯“纳伪纳伪”错误的可能性大小。由于错误的可能性大小。由于两类错误是一对矛盾,在其他条件不变的情况两类错误是一对矛盾,在其他条件不变的情况下,减少犯下,减少犯“弃真弃真”错误的可能性(错误的可能性(),势),势必增大犯必增大犯“纳伪纳伪”错误的可能性(错误的可能性(),也就),也就是说,是说,的大小和显著性水平的大小和显著性水平的大小成相反方的大小成相反方向变化。向变化。(本科)第7章假设检验ppt课件v两类错误发生的概率两类错误发生的概率的相对关系可由下面的图形来表示:的相对关系可由下面的图形来表示:图图7-2两类错误两类错误v从图从图7-2中,我们也可以看出,当真实分布与待判别分中,我们也可以看出,当真实分布与待判别分布越远离时,在布越远离时,在一定下,一定下,将越小;也就是说,当差别将越小;也就是说,当差别比较明显时,我们犯错误的可能性会更小,反之亦然。比较明显时,我们犯错误的可能性会更小,反之亦然。真实假设(本科)第7章假设检验ppt课件表表7-1 7-1 假设检验两类错误假设检验两类错误接 受拒 绝原假设为真正确的结论(1)“弃真”错误()原假设为假“纳伪”错误()正确的结论(1)(本科)第7章假设检验ppt课件三、检验功效三、检验功效v由于由于为犯为犯“纳伪纳伪”错误的可能性大小,或者说错误的可能性大小,或者说表示表示出现接受不真实的原假设的结论的概率,那么出现接受不真实的原假设的结论的概率,那么1-就是就是指出现拒绝不真实的原假设的概率。若指出现拒绝不真实的原假设的概率。若1-的数值越接的数值越接近于近于1,表明不真实的原假设几乎都能够被拒绝。诚然,表明不真实的原假设几乎都能够被拒绝。诚然,如果如果1-的数值接近于的数值接近于0,表明犯,表明犯“纳伪纳伪”错误的可能性错误的可能性很大。因此,很大。因此,1-可以用来表明所做假设检验工作好坏可以用来表明所做假设检验工作好坏的一个指标,我们称之为检验功效。它的数值表明我们的一个指标,我们称之为检验功效。它的数值表明我们做出正确决策的概率为做出正确决策的概率为1-。v一个好的检验法则总是希望犯两类错误的可能性一个好的检验法则总是希望犯两类错误的可能性与与都都很小,但是这在一般场合下是很难实现的。要使得很小,但是这在一般场合下是很难实现的。要使得小,小,必然导致必然导致大,若要使大,若要使小,必导致小,必导致增大。增大。(本科)第7章假设检验ppt课件v在实际检验中,一般首先控制犯在实际检验中,一般首先控制犯“弃真弃真”错误错误的概率,也就是事先给出的显著性水平的概率,也就是事先给出的显著性水平的数值的数值尽量地小,在其它条件不变的情况下,增加犯尽量地小,在其它条件不变的情况下,增加犯“纳伪纳伪”错误的可能性,即错误的可能性,即增大,从而使得检增大,从而使得检验功效(验功效(1-)减弱。在此情况下,如何增强检)减弱。在此情况下,如何增强检验功效?解决的唯一办法只有增大样本容量,验功效?解决的唯一办法只有增大样本容量,这样既能保证满足取得较小的这样既能保证满足取得较小的,又能取得较,又能取得较小的小的值,一举两得。然而实际上样本容量的取值,一举两得。然而实际上样本容量的取得是有限制的,只能根据实际来确定。得是有限制的,只能根据实际来确定。(本科)第7章假设检验ppt课件第二节第二节总体参数假设检验总体参数假设检验总体均值的假设检验总体均值的假设检验两个总体均值之差的检验两个总体均值之差的检验总体成数的假设检验总体成数的假设检验总体均值的假设检验总体均值的假设检验两个正态总体方差比的检验两个正态总体方差比的检验(本科)第7章假设检验ppt课件v总体参数假设检验就是检验已知分布形式(本总体参数假设检验就是检验已知分布形式(本节主要考虑正态分布)的总体的某些参数(例节主要考虑正态分布)的总体的某些参数(例如均值或者方差)是否与事先所做的假设存在如均值或者方差)是否与事先所做的假设存在显著性差异,又称为显著性检验。主要包括对显著性差异,又称为显著性检验。主要包括对总体均值和总体方差的假设检验。本节分各种总体均值和总体方差的假设检验。本节分各种情况对这两方面的检验进行介绍。情况对这两方面的检验进行介绍。(本科)第7章假设检验ppt课件一、总体均值的假设检验一、总体均值的假设检验v总体均值的假设检验就是检验由样本信息所推总体均值的假设检验就是检验由样本信息所推断的当前总体均值是否与事先假设的总体均值断的当前总体均值是否与事先假设的总体均值存在显著性差异。存在显著性差异。v设样本设样本X1,X2,Xn来自于正态总体来自于正态总体N(,2),样,样本均值为本均值为,样本的标准差为,样本的标准差为s2,对于均值,对于均值的的检验问题。检验问题。(本科)第7章假设检验ppt课件(一)总体方差(一)总体方差2已知已知v对于双侧检验,建立的假设为:对于双侧检验,建立的假设为:H0:=0,H1:0v其中其中为一个给定已知的常数。为一个给定已知的常数。v对于左(右)单侧检验来说,建立的假设为:对于左(右)单侧检验来说,建立的假设为:H0:=0,H1:)0v可以利用上面介绍过的可以利用上面介绍过的z检验法,构造检验统计检验法,构造检验统计量量(7.1)v在原假设成立的条件下,该统计量的分布为:在原假设成立的条件下,该统计量的分布为:zN(0,1)。(本科)第7章假设检验ppt课件v从而在给定的显著性水平从而在给定的显著性水平下,我们可从标准正下,我们可从标准正态分布表中查得临界值态分布表中查得临界值(对应于左、右单(对应于左、右单侧检验的临界值分别为侧检验的临界值分别为-z1-和和z1-)。)。v根据样本资料及假设,计算出样本统计量的值根据样本资料及假设,计算出样本统计量的值z。这样,我们便可以得出原假设的拒绝域为:这样,我们便可以得出原假设的拒绝域为:(对双侧检验而言)(对双侧检验而言)zz1-(对于右单侧检验而言)(对于右单侧检验而言)v当当z值处于拒绝域中时,我们就可拒绝原假设,值处于拒绝域中时,我们就可拒绝原假设,否则不能拒绝原假设。否则不能拒绝原假设。(本科)第7章假设检验ppt课件(二)总体方差(二)总体方差2未知未知v总体方差总体方差2未知时对于均值未知时对于均值的假设检验,类似的假设检验,类似上面方差上面方差2已知时的做法。已知时的做法。v对于双侧检验,建立的假设为:对于双侧检验,建立的假设为:H0:=0,H1:0v对于左(右)单侧检验来说,建立的假设为:对于左(右)单侧检验来说,建立的假设为:H0:=0,H1:)0v只是在构造检验统计量时,不是利用只是在构造检验统计量时,不是利用z检验法。检验法。而是在原假设成立的条件下,利用而是在原假设成立的条件下,利用t检验法,构检验法,构造检验统计量造检验统计量t(n-1)(7.2)(本科)第7章假设检验ppt课件v其中其中为样本标准差。为样本标准差。t统计量就是用统计量就是用样本标准差样本标准差s来代替来代替z统计量中未知的总体标准统计量中未知的总体标准差差。v对于临界值,在对于临界值,在t分布表中查得临界值分布表中查得临界值(双(双侧检验)、侧检验)、-t1-(n-1)(左单侧检验)、(左单侧检验)、t1-(n-1)(右单侧检验)。(右单侧检验)。(本科)第7章假设检验ppt课件v根据样本资料及假设,计算出样本统计量的值根据样本资料及假设,计算出样本统计量的值t。这样,可以得出对原假设的拒绝域为:样本统这样,可以得出对原假设的拒绝域为:样本统计量的值计量的值t满足满足(双侧检验)(双侧检验)tt1-(n-1)(右单侧检验)(右单侧检验)v当当t值落入拒绝域,就拒绝原假设,否则不能拒值落入拒绝域,就拒绝原假设,否则不能拒绝原假设。绝原假设。(本科)第7章假设检验ppt课件v这里应该注意的是,在实际中不能够确定总体这里应该注意的是,在实际中不能够确定总体是否满足正态分布,但是样本容量是否满足正态分布,但是样本容量n很大。根据很大。根据中心极限定理,该总体分布近似服从正态分布,中心极限定理,该总体分布近似服从正态分布,对该总体均值的检验可以依据上面的总体方差对该总体均值的检验可以依据上面的总体方差未知的程序来进行。对于小样本情况,我们也未知的程序来进行。对于小样本情况,我们也是根据上面的是根据上面的t检验来进行。检验来进行。(本科)第7章假设检验ppt课件v【例例7-1】为了考察某种类型的电子元件的使用为了考察某种类型的电子元件的使用寿命情况,假定该电子元件使用寿命的分布为寿命情况,假定该电子元件使用寿命的分布为正态分布。而且根据历史记录得知该分布的参正态分布。而且根据历史记录得知该分布的参数为:平均使用寿命数为:平均使用寿命为为100(小时),标准差(小时),标准差=10(小时)。现在随机抽取(小时)。现在随机抽取100个该类型的元个该类型的元件,测得平均寿命为件,测得平均寿命为102(小时),给定显著性(小时),给定显著性水平水平=0.05,问该类型的电子元件的使用寿命,问该类型的电子元件的使用寿命是否有明显的提高。是否有明显的提高。(本科)第7章假设检验ppt课件解:此题为单侧检验,且是右单侧检验。解:此题为单侧检验,且是右单侧检验。v以以表示元件的平均使用寿命(小时),则表示元件的平均使用寿命(小时),则(1)建立假设)建立假设H0:=100,即平均使用寿命无明显变化;,即平均使用寿命无明显变化;H1:100,即使用寿命有明显提高。,即使用寿命有明显提高。(2)确定检验统计量及其分布)确定检验统计量及其分布N(0,1)(本科)第7章假设检验ppt课件(3)确定临界值)确定临界值v右单侧检验的临界值为右单侧检验的临界值为z。由于给定的显著性。由于给定的显著性水平水平=0.05,那么双侧概率水平为,那么双侧概率水平为20.050.1,则,则F(z)=1-0.1=0.9,查正态分布表得到,查正态分布表得到z=1.645,即为临界值。即为临界值。(本科)第7章假设检验ppt课件(4)计算样本统计量并判断)计算样本统计量并判断v根据样本资料,计算样本统计量:根据样本资料,计算样本统计量:v由于计算的样本统计量由于计算的样本统计量z1.645,所以拒绝原假,所以拒绝原假设设H0,可以认为该类型的电子元件的使用寿命,可以认为该类型的电子元件的使用寿命确实有所提高。确实有所提高。(本科)第7章假设检验ppt课件v【例例7-2】在上例中,如果抽出的在上例中,如果抽出的100个样本元个样本元件,测得其平均使用寿命为件,测得其平均使用寿命为98(小时),其余(小时),其余条件相同,试问该类型元件的使用寿命是否有条件相同,试问该类型元件的使用寿命是否有显著性下降。显著性下降。(本科)第7章假设检验ppt课件解:此例为左单侧检验问题。解:此例为左单侧检验问题。(1)建立的假设检验为)建立的假设检验为H0:=100,无明显变化,无明显变化;H1:100,有显著,有显著性下降。性下降。(2)确定检验统计量及其分布)确定检验统计量及其分布v在原假设成立下,检验统计量为:在原假设成立下,检验统计量为:N(0,1)(本科)第7章假设检验ppt课件(3)确定临界值)确定临界值v此时左侧临界值为此时左侧临界值为-z,根据上面的结果,得到,根据上面的结果,得到临界值为临界值为-z=-1.645(4)计算样本统计量并做出判断:)计算样本统计量并做出判断:v样本统计量为:样本统计量为:v由于由于-z500(2)确定临界值)确定临界值v由于是属于单侧检验,所以只有一个临界值;由于是属于单侧检验,所以只有一个临界值;N=10,=0.01,查表得到该临界值为,查表得到该临界值为t()=t0.01(9)=2.821(本科)第7章假设检验ppt课件(3)计算样本统计量)计算样本统计量v跟上例的计算一样,此处略,得到样本统计量跟上例的计算一样,此处略,得到样本统计量t=0.335(4)判断)判断v由于实际的样本统计量由于实际的样本统计量t=0.335临界值临界值t0.01(9)=2.821,所以不能拒绝原假设,可以认为,所以不能拒绝原假设,可以认为该类生产没有显著地高于标准。该结论与上例该类生产没有显著地高于标准。该结论与上例的结论相符。的结论相符。(本科)第7章假设检验ppt课件二、两个总体均值之差的检验二、两个总体均值之差的检验v两个总体均值之差的检验,就是对两个不同总两个总体均值之差的检验,就是对两个不同总体的均值之间的差异性是否显著所进行的检验。体的均值之间的差异性是否显著所进行的检验。为了分析的简化与方便,我们假定为了分析的简化与方便,我们假定x是取自于均是取自于均值为值为x、方差为、方差为的正态总体的正态总体X的一个样本,的一个样本,y是取自于均值为是取自于均值为y、方差、方差为为的正态总体的正态总体Y的一个样本,样本容量分别为的一个样本,样本容量分别为,且假定此两样,且假定此两样本相互独立。本相互独立。、为对应的样本为对应的样本均值与样本方差,显著性水平为均值与样本方差,显著性水平为。下面我们分。下面我们分总体方差已知和未知两种情况,来分析总体均总体方差已知和未知两种情况,来分析总体均值的差异显著性检验。值的差异显著性检验。(本科)第7章假设检验ppt课件(一)两总体方差(一)两总体方差已知已知双侧检验双侧检验v原假设为原假设为H0:x=y,备选假设为,备选假设为H1:xyv根据上面的假定和抽样分布理论,我们可以得根据上面的假定和抽样分布理论,我们可以得到:到:N(0,1)(7.3)v所以在原假设成立下,构造的检验统计量为:所以在原假设成立下,构造的检验统计量为:N(0,1)(7.4)(本科)第7章假设检验ppt课件v在显著性水平在显著性水平下,我们查标准正态分布表得到下,我们查标准正态分布表得到临界值临界值。将样本资料代入所构造的检验统计。将样本资料代入所构造的检验统计量,得到样本统计量量,得到样本统计量z。若。若,则拒绝原假,则拒绝原假设;反之,则不能拒绝原假设。设;反之,则不能拒绝原假设。(本科)第7章假设检验ppt课件左单侧检验左单侧检验v原假设为原假设为H0:x=y,备选假设为,备选假设为H1:xyv此时可从标准正态分布表查得的临界值为此时可从标准正态分布表查得的临界值为z1-。检验的拒绝域为:检验的拒绝域为:z-z1-。(本科)第7章假设检验ppt课件右单侧检验右单侧检验v原假设为原假设为H0:x=y,备选假设变为,备选假设变为H1:xz1-。(本科)第7章假设检验ppt课件(二)两总体方差(二)两总体方差未知但相等未知但相等v在两方差未知但相等的情况下,我们根据抽样在两方差未知但相等的情况下,我们根据抽样分布理论知:分布理论知:t(n1+n2-2)(7.5)v对于双、单侧检验,原假设都是相同的,均为对于双、单侧检验,原假设都是相同的,均为H0:x=y。只是在双侧检验时,备选假设。只是在双侧检验时,备选假设H1:xy;在左单侧检验时,备选假设为;在左单侧检验时,备选假设为H1:xy。(本科)第7章假设检验ppt课件v在原假设成立的情况下,根据上面的公式,我在原假设成立的情况下,根据上面的公式,我们可以构造如下的检验统计量:们可以构造如下的检验统计量:t(n1+n2-2)(7.6)v可以根据样本资料的数据,计算样本检验统计可以根据样本资料的数据,计算样本检验统计量的数值。量的数值。(本科)第7章假设检验ppt课件v对于双侧检验,可以从对于双侧检验,可以从t分布表中查得临界值分布表中查得临界值,此时原假设的拒绝域为:,此时原假设的拒绝域为:。反之就不能拒绝原假设。反之就不能拒绝原假设。v对于左、右单侧检验,从对于左、右单侧检验,从分布表中查得临界值分布表中查得临界值t1-(n1+n2-2);左单侧检验拒绝原假设的范围是:;左单侧检验拒绝原假设的范围是:t-t1-(n1+n2-2)。右单侧检验拒绝原假设的范围。右单侧检验拒绝原假设的范围为:为:t5。如果。如果nPi5,则将,则将nPi5的样本合的样本合并。并。(5)构造并计算统计量:当原假设为真时,样本)构造并计算统计量:当原假设为真时,样本实际频数实际频数fi应该与理论频数应该与理论频数nPi接近,即接近,即不应太大。根据不应太大。根据K皮尔逊的研究,可以构造皮尔逊的研究,可以构造如下的检验统计量如下的检验统计量(7.12)v其中其中k为待估计的参数个数。其余符号含义与为待估计的参数个数。其余符号含义与上述同。上述同。(本科)第7章假设检验ppt课件(6)计算临界值:在给定显著性水平)计算临界值:在给定显著性水平下,查下,查2分布表得到临界值分布表得到临界值。v这样就得到拒绝原假设的值域:这样就得到拒绝原假设的值域:(7)进行判断:如果计算的样本统计量)进行判断:如果计算的样本统计量2确实大确实大于于,那么就可以拒绝原假设,否则不能拒绝原,那么就可以拒绝原假设,否则不能拒绝原假设。假设。(本科)第7章假设检验ppt课件v【例【例7-10】欲检验某个骰子是否均匀,可以通】欲检验某个骰子是否均匀,可以通过检验各个点数的出现是否是随机的。我们随过检验各个点数的出现是否是随机的。我们随机投出骰子机投出骰子102次,将得到的点数记录下来;出次,将得到的点数记录下来;出现各个点数的次数见表现各个点数的次数见表7-3。表表7-3 7-3 骰子出现各种点数的次数骰子出现各种点数的次数点 数123456合计出现的次数191620151418102(本科)第7章假设检验ppt课件v解:记各个点数出现的次数为解:记各个点数出现的次数为X,其分布未知,其分布未知,依据题意我们可以对其分布建立假设,即依据题意我们可以对其分布建立假设,即H0:X服从均匀分布,也即服从均匀分布,也即X的分布满足的分布满足,;H1:X不服从均匀分布。不服从均匀分布。v在原假设下,各个点数出现的期望频数均为在原假设下,各个点数出现的期望频数均为(次)。根据(次)。根据(7.16)式可以得到:)式可以得到:(本科)第7章假设检验ppt课件v查表得到临界值为查表得到临界值为,因而,我们不能拒绝原假设,可以认为该骰子因而,我们不能拒绝原假设,可以认为该骰子是均匀的。是均匀的。(本科)第7章假设检验ppt课件(二)独立性检验(二)独立性检验v顾名思义,该检验主要是考察多个变量之间是顾名思义,该检验主要是考察多个变量之间是否有关联,如果变量之间没有关联性,那么就否有关联,如果变量之间没有关联性,那么就说变量之间是相互独立的。这里的变量主要是说变量之间是相互独立的。这里的变量主要是指定类、定序资料。为了分析变量之间的关联指定类、定序资料。为了分析变量之间的关联性,需要将资料整理成列联表的形式。性,需要将资料整理成列联表的形式。v列联表是多行多列纵横交错所形成的一个表体。列联表是多行多列纵横交错所形成的一个表体。我们以例子说明列联表的形式以及如何将独立我