[精选]统计学之总体参数的假设检验32207.pptx
《[精选]统计学之总体参数的假设检验32207.pptx》由会员分享,可在线阅读,更多相关《[精选]统计学之总体参数的假设检验32207.pptx(69页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学从数据到结论第六章 总体参数的假设检验l如果一个人说他从来没有骂过人。如果一个人说他从来没有骂过人。他能够证明吗?他能够证明吗?l要证明他没有骂过人,他必须出要证明他没有骂过人,他必须出示他从小到大每一时刻的录音录示他从小到大每一时刻的录音录像,所有书写的东西等等,还要像,所有书写的东西等等,还要证明这些物证是完全的、真实的、证明这些物证是完全的、真实的、没有间断的。这简直是不可能的。没有间断的。这简直是不可能的。l即使他找到一些证人,比如他的即使他找到一些证人,比如他的同学、家人和同事,那也只能够同学、家人和同事,那也只能够证明在那些证人在场的某些片刻,证明在那些证人在场的某些片刻,他
2、没有被听到骂人。他没有被听到骂人。l反过来,如果要证明这个人反过来,如果要证明这个人骂过人很容易,只要有一次骂过人很容易,只要有一次被抓住就足够了。被抓住就足够了。l看来,企图肯定什么事物很看来,企图肯定什么事物很难,而否定却要相对容易得难,而否定却要相对容易得多。这就是假设检验背后的多。这就是假设检验背后的哲学。哲学。l科学总往往是在否定中发展科学总往往是在否定中发展l在假设检验中,一般要设立在假设检验中,一般要设立一个一个原假设原假设(上面的(上面的“从来从来没骂过人没骂过人”就是一个例子);就是一个例子);l而设立该假设的动机主要是而设立该假设的动机主要是企图利用人们掌握的反映现企图利用
3、人们掌握的反映现实世界的数据来找出假设与实世界的数据来找出假设与现实之间的矛盾,从而否定现实之间的矛盾,从而否定这个假设。这个假设。l在多数统计教科书中在多数统计教科书中(除理除理论探讨外论探讨外)假设检验都是以假设检验都是以否定原假设为目标。否定原假设为目标。l如否定不了,说明证据不足,如否定不了,说明证据不足,无法否定原假设。但不能说无法否定原假设。但不能说明原假设正确。明原假设正确。l就像一两次没有听过他骂人就像一两次没有听过他骂人还远不能证明他从来没有骂还远不能证明他从来没有骂过人。过人。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l先先要要提提出出个个原原假假设设,比比如如某某正
4、正态态总总体体的的均均值值等等于于5(m m=5)。这这种种原原假假设设也也称称为为零假设零假设(null hypothesis),记为,记为H0。l与与此此同同时时必必须须提提出出备备选选假假设设(或或称称为为备备择择假假设设,alternative hypothesis),比比如如总总体体均均值值大大于于5(m m5)。备备选选假假设设记记为为H1或或Ha。形形式式上上,这这个个关关于于总总体体均值的均值的H0相对于相对于H1的检验记为的检验记为6.1 假设检验的过程和逻辑假设检验的过程和逻辑l备备选选假假设设应应该该按按照照实实际际世世界界所所代代表表的的方方向向来来确确定定,即即它它通
5、通常常是是被被认认为为可可能能比零假设更符合数据所代表的现实。比零假设更符合数据所代表的现实。l比比如如上上面面的的H1为为m m5;这这意意味味着着,至至少样本均值应该大于少样本均值应该大于5;l至于是否显著,依检验结果而定。至于是否显著,依检验结果而定。l检检验验结结果果显显著著(significant)意意味味着着有有理理由由拒拒绝绝零零假假设设。因因此此,假假设设检检验验也也被被称为称为显著性检验显著性检验(significant test)。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l有有了了两两个个假假设设,就就要要根根据据数数据据来来对对它它们进行判断。们进行判断。l数数据
6、据的的代代表表是是作作为为其其函函数数的的统统计计量量;它它在在检检验验中中被被称称为为检检验验统统计计量量(test statistic)。l根根据据零零假假设设(不不是是备备选选假假设设!),可可得得到到该该检检验验统统计计量量的的分分布布;再再看看这这个个统统计计量量的的数数据据实实现现值值(realization)属不属于小概率事件。属不属于小概率事件。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l也也就就是是说说把把数数据据代代入入检检验验统统计计量量,看看其其值值是是否否落落入入零零假假设设下下的的小小概概率范畴率范畴;l如如果果的的确确是是小小概概率率事事件件,那那么么就就有
7、有可可能能拒拒绝绝零零假假设设,或或者者说说“该该检检验显著,验显著,”l否否则则说说“没没有有足足够够证证据据拒拒绝绝零零假假设设”,或者,或者“该检验不显著。该检验不显著。”6.1 假设检验的过程和逻辑假设检验的过程和逻辑l注注意意:在在我我们们所所涉涉及及的的问问题题中中,零零假假设和备选假设在假设检验中并不对称。设和备选假设在假设检验中并不对称。l因因检检验验统统计计量量的的分分布布是是从从零零假假设设导导出出的的,因因此此,如如果果发发生生矛矛盾盾,就就对对零零假假设不利了。设不利了。l不不发发生生矛矛盾盾也也不不能能说说明明零零假假设设没没有有问问题。题。6.1 假设检验的过程和逻
8、辑假设检验的过程和逻辑l在在零零假假设设下下,检检验验统统计计量量取取其其实实现现值值及及(沿沿着着备备选选假假设设的的方方向向)更更加加极极端端值的概率称为值的概率称为p-值(值(p-value)。l如如果果得得到到很很小小的的p-值值,就就意意味味着着在在零零假设下小概率事件发生了。假设下小概率事件发生了。l如如果果小小概概率率事事件件发发生生,是是相相信信零零假假设设,还是相信数据呢?还是相信数据呢?l当然多半是相信数据,拒绝零假设。当然多半是相信数据,拒绝零假设。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l但但小小概概率率并并不不能能说说明明不不会会发发生生,仅仅仅仅发发生生的的
9、概概率率很很小小罢罢了了。拒拒绝绝正正确确零零假假设设的的错错误误常常被被称称为为第第一一类类错错误误(type I error)。l在在备备选选假假设设正正确确时时反反而而说说零零假假设设正正确确的的错错误误,称称为为第第二二类类错错误误(type II error)。在在本本书书的的假假设设检检验验问问题题中中,由由于于备备选选假假设设不不是是一一个个点点,所所以无法算出犯第二类错误的概率。以无法算出犯第二类错误的概率。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l零零假假设设和和备备选选假假设设哪哪一一个个正正确确,是是确确定定性性的的,没没有有概概率率可可言言。而而可可能能犯犯错错
10、误的是人。误的是人。l涉涉及及假假设设检检验验的的犯犯错错误误的的概概率率就就是是犯犯第第一一类类错错误误的的概概率率和和犯犯第第二二类类错错误误的的概率。概率。l负负责责任任的的态态度度是是无无论论做做出出什什么么决决策策,都应该给出该决策可能犯错误的概率。都应该给出该决策可能犯错误的概率。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l到到底底p-值值是是多多小小时时才才能能够够拒拒绝绝零零假假设设呢呢?也就是说,需要有什么是小概率的标准。也就是说,需要有什么是小概率的标准。l这这要要看看具具体体应应用用的的需需要要。但但在在一一般般的的统统计计书书和和软软件件中中,使使用用最最多多的的
11、标标准准是是在在零零假假设设下下(或或零零假假设设正正确确时时)根根据据样样本本所所得得的的数数据据来来拒拒绝绝零零假假设设的的概概率率应应小小于于0.05,当当然然也可能是也可能是0.01,0.005,0.001等等。等等。l这这种种事事先先规规定定的的概概率率称称为为显显著著性性水水平平(significant level),用字母,用字母a a来表示。来表示。6.1 假设检验的过程和逻辑假设检验的过程和逻辑la a并并不不一一定定越越小小越越好好,因因为为这这很很可可能能导导致致不不容容易易拒拒绝绝零零假假设设,使使得得犯犯第第二二类类错错误误的的概率增大。概率增大。l当当p-值值小小于
12、于或或等等于于a a时时,就就拒拒绝绝零零假假设设。所所以以,a a是是所所允允许许的的犯犯第第一一类类错错误误概概率率的的最最大大值值。当当p-值值小小于于或或等等于于a a时时,就就说说这这个检验是显著的。个检验是显著的。l无无论论统统计计学学家家用用多多大大的的a a作作为为显显著著性性水水平平都都不不能能脱脱离离实实际际问问题题的的背背景景。统统计计显显著著不不一定等价于实际显著。反过来也一样。一定等价于实际显著。反过来也一样。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l归纳起来,假设检验的逻辑步骤为:归纳起来,假设检验的逻辑步骤为:l1.写出零假设和备选假设;写出零假设和备选假
13、设;l2.确定检验统计量;确定检验统计量;l3.确定显著性水平确定显著性水平a a;l4.根据数据计算检验统计量的实现值;根据数据计算检验统计量的实现值;l5.根据这个实现值计算根据这个实现值计算p-值;值;l6.进进行行判判断断:如如果果p-值值小小于于或或等等于于a a,就就拒拒绝绝零零假假设设,这这时时犯犯(第第一一类类)错错误误的的概概率率最最多多为为a a;如如果果p-值值大大于于a a,就就不不拒拒绝绝零零假设,因为证据不足。假设,因为证据不足。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l实实际际上上,多多数数计计算算机机软软件件仅仅仅仅给给出出p-值值,而不给出而不给出a
14、a。这有很多方便之处。这有很多方便之处。l比比如如a a=0.05,而而假假定定所所得得到到的的p-值值等等于于0.001。这这时时如如果果采采用用p-值值作作为为新新的的显显著著性性水水平平,即即新新的的a a=0.001,于于是是就就可可以以说说,在显著性水平为在显著性水平为0.001时,拒绝零假设。时,拒绝零假设。l这这样样,拒拒绝绝零零假假设设时时犯犯错错误误的的概概率率实实际际只只是是千千分分之之一一而而不不是是旧旧的的a a所所表表明明的的百百分分之之五五。在在这这个个意意义义上上,p-值值又又称称为为观观测测的的显显著性水平(著性水平(observed significant l
15、evel)。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l在在统统计计软软件件输输出出p-值值的的位位置置,有有的的用用“p-value”,有有的的用用significant的的缩缩写写“Sig”就就是这个道理。是这个道理。l根根据据数数据据产产生生的的p-值值来来减减少少a a的的值值以以展展示示结果的精确性总是没有害处的。结果的精确性总是没有害处的。l这这好好比比一一个个身身高高180厘厘米米的的男男生生,可可能能愿愿意意被被认认为为高高于于或或等等于于180厘厘米米,而而不不愿愿意意说说他他高高于于或或等等于于155厘厘米米,虽虽然然这这第第二二种种说法数学上没有丝毫错误。说法数学上
16、没有丝毫错误。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l关关于于“临临界界值值”的的注注:作为概率的显著性水平a实际上相应于一个检验统计量取值范围的一个临临界界值值(critical value),它定义为,统计量取该值或更极端的值的概率等于a。也就是说,“统统计计量量的的实实现现值值比比临临界界值值更更极极端端”等等价价于于“p-值值小小于于a a”。使用临界值的概念进行的检验不计算p-值。只比较统计量的取值和临界值的大小。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l使使用用临临界界值值而而不不是是p-值值来来判判断断拒拒绝绝与与否否是是前前计计算算机机时时代代的的产产物物。当
17、当时时计计算算p-值值不不易易,只只采采用用临临界界值值的的概概念念。但但从从给给定定的的a a求求临临界界值值同同样样也也不不容容易易,好好在在习习惯惯上上仅仅仅仅在在教教科科书书中中列列出出相相应应于于特特定定分分布布的的几几个个有有限限的的a a临临界界值值(比比如如a a=0.05,a a=0.025,a a=0.01,a a=0.005,a a=0.001等等等等),或或者者根根据据分分布布表表反反过过来来查查临临界界值值(很很不不方方便便也也很很粗粗糙糙)。l现现在在计计算算机机软软件件大大都都不不给给出出a a和和临临界界值值,但但都都给给出出p-值值和和统统计计量量的的实实现现
18、值值,让让用用户户自己决定显著性水平是多少。自己决定显著性水平是多少。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l在在一一些些统统计计教教科科书书中中会会有有不不能能拒拒绝绝零零假假设设就就“接接受受零零假假设设”的的说说法法。这这种种说说法法是是不不严严格的。格的。l首首先先,如如果果你你说说“接接受受零零假假设设”,那那么么就就应应该该负负责责任任地地提提供供接接受受零零假假设设时时可可能能犯犯第第二二类类错错误误的的概概率率。这这就就要要算算出出在在备备选选假假设设正正确确的的情情况况下下错错误误接接受受零零假假设设的的概概率率。但但是是,这这只只有有在在备备选选假假设设仅仅仅仅是
19、是一一个个与与零零假假设设不不同的确定值(而不是范围)时才有可能。同的确定值(而不是范围)时才有可能。l多多数数基基本本统统计计教教科科书书的的备备选选假假设设是是一一个个范范围而根本无法确定犯第二类错误的概率。围而根本无法确定犯第二类错误的概率。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l在在许许多多统统计计教教科科书书中中,往往往往把把一一系系列列不不能能拒拒绝绝零零假假设设的的检检验验当当成成接接受受这这些些假设的通行证。假设的通行证。l比比如如不不能能拒拒绝绝某某样样本本的的正正态态性性就就变变成成了证明了该样本是正态的等等。了证明了该样本是正态的等等。l不不能能拒拒绝绝这这些些
20、零零假假设设,仅仅仅仅说说明明根根据据所所使使用用的的检检验验方方法法(或或检检验验统统计计量量)和和当当前前的的数数据据没没有有足足够够证证据据拒拒绝绝这这些些假设而已。假设而已。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l对对于于同同一一个个假假设设检检验验问问题题,往往往往都都有有多多个个检检验验统统计计量量;而而且且人人们们还还在在构构造造更优良的检验统计量。更优良的检验统计量。l人人们们不不可可能能把把所所有有的的目目前前存存在在的的和和将将来可能存在的检验都实施。来可能存在的检验都实施。l因因此此,只只能能够够说说,按按照照目目前前的的证证据据,不不足足以以拒拒绝绝零零假假设
21、设而而已已。后后面面将将会会用用例例子子说说明明“接接受受零零假假设设”的的说说法法是是不不妥妥当的。当的。6.2 对于正态总体均值的检验对于正态总体均值的检验6.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验l例例6.1一一个个顾顾客客买买了了一一包包标标有有500g重重的的一一包包红红糖糖,觉觉得得份份量量不不足足,于于是是找找到到监监督督部部门门;当当然然他他们们会会觉觉得得一一包包份份量量不不够够可可能能是是随随机机的的。于于是是监监督督部部门门就就去去商商店店称称了了50包包红红糖糖(数数据据在在sugar.txt);其其中中均均值值(平平均均重重量
22、量)是是498.35g;这这的的确确比比500g少少,但但这这是是否否能能够够说说明明厂厂家家生生产产的的这这批批红红糖糖平平均均起起来来不不够够份份量量呢呢?于于是是需需要要统统计计检检验验。可可以以画画出这些重量的直方图出这些重量的直方图50包红糖重量的直方图包红糖重量的直方图 6.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验l这这个个直直方方图图看看上上去去象象是是正正态态分分布布的的样样本本。不妨假定这一批袋装红糖有正态分布。不妨假定这一批袋装红糖有正态分布。l由由于于厂厂家家声声称称每每袋袋500g(标标明明重重量量),因因此此零零假假设设为为总总
23、体体均均值值等等于于500g(被被怀怀疑疑对对象总是放在零假设);象总是放在零假设);l而而且且由由于于样样本本均均值值少少于于500g(这这是是怀怀疑疑的的根根据据),把把备备选选假假设设定定为为总总体体均均值值少少于于500g(备备选选假假设设为为单单向向不不等等式式的的检检验验称称为为单尾检验单尾检验,为不等号为不等号“”的称为双尾检验的称为双尾检验)6.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验l检检验验统统计计量量就就是是第第四四章章引引进进的的作作为为对对均值的某种标准化的均值的某种标准化的l符符号号中中的的m m0通通常常表表示示为为零零假假
24、设设中中的的均均值值(这这里里是是500)。在在零零假假设设之之下下,它它有有自自由由度度为为n-1=49的的t分分布布。当当然然实实际际上上不不必必代代入入这这个个公公式式去去手手工工计计算算了了,让计算机去代劳好了。让计算机去代劳好了。6.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验l计计算算结结果果是是t=-2.696(也也称称为为t值值),同同时时得得到到p-值值为为0.005(由由于于计计算算机机输输出出的的为为双双尾尾检检验验的的p-值值,比比单单尾尾的的大大一一倍倍,应应该该除除以以2)。看看来来可可以以选选择择显显著著性性水水平平为为0.00
25、5,并并宣宣称称拒拒绝绝零零假假设设,而而错错误误拒拒绝绝的的概概率率为为0.005。统计量统计量t=-2.696相应于左边相应于左边尾概率(尾概率(p-值)值)0.005 6.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验l上上 面面 例例 子子 的的 备备 选选 假假 设设 为为 小小 于于(“”)某某个个值值的情况。的情况。l取取备备选选假假设设为为均均值值大大于于或或小小于于某某个个值值的的检检验验称称为为单单尾尾检检验验(one-tailed test,也也称称为为单单侧侧检检验验或或单单边边检检验验)。下下面面举举一一个个选选假假设设为为均均值大于
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 精选 统计学 总体 参数 假设检验 32207
限制150内