[精选]统计学之总体参数的假设检验32207.pptx
-
资源ID:87158018
资源大小:500.48KB
全文页数:69页
- 资源格式: PPTX
下载积分:20金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
[精选]统计学之总体参数的假设检验32207.pptx
统计学从数据到结论第六章 总体参数的假设检验l如果一个人说他从来没有骂过人。如果一个人说他从来没有骂过人。他能够证明吗?他能够证明吗?l要证明他没有骂过人,他必须出要证明他没有骂过人,他必须出示他从小到大每一时刻的录音录示他从小到大每一时刻的录音录像,所有书写的东西等等,还要像,所有书写的东西等等,还要证明这些物证是完全的、真实的、证明这些物证是完全的、真实的、没有间断的。这简直是不可能的。没有间断的。这简直是不可能的。l即使他找到一些证人,比如他的即使他找到一些证人,比如他的同学、家人和同事,那也只能够同学、家人和同事,那也只能够证明在那些证人在场的某些片刻,证明在那些证人在场的某些片刻,他没有被听到骂人。他没有被听到骂人。l反过来,如果要证明这个人反过来,如果要证明这个人骂过人很容易,只要有一次骂过人很容易,只要有一次被抓住就足够了。被抓住就足够了。l看来,企图肯定什么事物很看来,企图肯定什么事物很难,而否定却要相对容易得难,而否定却要相对容易得多。这就是假设检验背后的多。这就是假设检验背后的哲学。哲学。l科学总往往是在否定中发展科学总往往是在否定中发展l在假设检验中,一般要设立在假设检验中,一般要设立一个一个原假设原假设(上面的(上面的“从来从来没骂过人没骂过人”就是一个例子);就是一个例子);l而设立该假设的动机主要是而设立该假设的动机主要是企图利用人们掌握的反映现企图利用人们掌握的反映现实世界的数据来找出假设与实世界的数据来找出假设与现实之间的矛盾,从而否定现实之间的矛盾,从而否定这个假设。这个假设。l在多数统计教科书中在多数统计教科书中(除理除理论探讨外论探讨外)假设检验都是以假设检验都是以否定原假设为目标。否定原假设为目标。l如否定不了,说明证据不足,如否定不了,说明证据不足,无法否定原假设。但不能说无法否定原假设。但不能说明原假设正确。明原假设正确。l就像一两次没有听过他骂人就像一两次没有听过他骂人还远不能证明他从来没有骂还远不能证明他从来没有骂过人。过人。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l先先要要提提出出个个原原假假设设,比比如如某某正正态态总总体体的的均均值值等等于于5(m m=5)。这这种种原原假假设设也也称称为为零假设零假设(null hypothesis),记为,记为H0。l与与此此同同时时必必须须提提出出备备选选假假设设(或或称称为为备备择择假假设设,alternative hypothesis),比比如如总总体体均均值值大大于于5(m m5)。备备选选假假设设记记为为H1或或Ha。形形式式上上,这这个个关关于于总总体体均值的均值的H0相对于相对于H1的检验记为的检验记为6.1 假设检验的过程和逻辑假设检验的过程和逻辑l备备选选假假设设应应该该按按照照实实际际世世界界所所代代表表的的方方向向来来确确定定,即即它它通通常常是是被被认认为为可可能能比零假设更符合数据所代表的现实。比零假设更符合数据所代表的现实。l比比如如上上面面的的H1为为m m5;这这意意味味着着,至至少样本均值应该大于少样本均值应该大于5;l至于是否显著,依检验结果而定。至于是否显著,依检验结果而定。l检检验验结结果果显显著著(significant)意意味味着着有有理理由由拒拒绝绝零零假假设设。因因此此,假假设设检检验验也也被被称为称为显著性检验显著性检验(significant test)。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l有有了了两两个个假假设设,就就要要根根据据数数据据来来对对它它们进行判断。们进行判断。l数数据据的的代代表表是是作作为为其其函函数数的的统统计计量量;它它在在检检验验中中被被称称为为检检验验统统计计量量(test statistic)。l根根据据零零假假设设(不不是是备备选选假假设设!),可可得得到到该该检检验验统统计计量量的的分分布布;再再看看这这个个统统计计量量的的数数据据实实现现值值(realization)属不属于小概率事件。属不属于小概率事件。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l也也就就是是说说把把数数据据代代入入检检验验统统计计量量,看看其其值值是是否否落落入入零零假假设设下下的的小小概概率范畴率范畴;l如如果果的的确确是是小小概概率率事事件件,那那么么就就有有可可能能拒拒绝绝零零假假设设,或或者者说说“该该检检验显著,验显著,”l否否则则说说“没没有有足足够够证证据据拒拒绝绝零零假假设设”,或者,或者“该检验不显著。该检验不显著。”6.1 假设检验的过程和逻辑假设检验的过程和逻辑l注注意意:在在我我们们所所涉涉及及的的问问题题中中,零零假假设和备选假设在假设检验中并不对称。设和备选假设在假设检验中并不对称。l因因检检验验统统计计量量的的分分布布是是从从零零假假设设导导出出的的,因因此此,如如果果发发生生矛矛盾盾,就就对对零零假假设不利了。设不利了。l不不发发生生矛矛盾盾也也不不能能说说明明零零假假设设没没有有问问题。题。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l在在零零假假设设下下,检检验验统统计计量量取取其其实实现现值值及及(沿沿着着备备选选假假设设的的方方向向)更更加加极极端端值的概率称为值的概率称为p-值(值(p-value)。l如如果果得得到到很很小小的的p-值值,就就意意味味着着在在零零假设下小概率事件发生了。假设下小概率事件发生了。l如如果果小小概概率率事事件件发发生生,是是相相信信零零假假设设,还是相信数据呢?还是相信数据呢?l当然多半是相信数据,拒绝零假设。当然多半是相信数据,拒绝零假设。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l但但小小概概率率并并不不能能说说明明不不会会发发生生,仅仅仅仅发发生生的的概概率率很很小小罢罢了了。拒拒绝绝正正确确零零假假设设的的错错误误常常被被称称为为第第一一类类错错误误(type I error)。l在在备备选选假假设设正正确确时时反反而而说说零零假假设设正正确确的的错错误误,称称为为第第二二类类错错误误(type II error)。在在本本书书的的假假设设检检验验问问题题中中,由由于于备备选选假假设设不不是是一一个个点点,所所以无法算出犯第二类错误的概率。以无法算出犯第二类错误的概率。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l零零假假设设和和备备选选假假设设哪哪一一个个正正确确,是是确确定定性性的的,没没有有概概率率可可言言。而而可可能能犯犯错错误的是人。误的是人。l涉涉及及假假设设检检验验的的犯犯错错误误的的概概率率就就是是犯犯第第一一类类错错误误的的概概率率和和犯犯第第二二类类错错误误的的概率。概率。l负负责责任任的的态态度度是是无无论论做做出出什什么么决决策策,都应该给出该决策可能犯错误的概率。都应该给出该决策可能犯错误的概率。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l到到底底p-值值是是多多小小时时才才能能够够拒拒绝绝零零假假设设呢呢?也就是说,需要有什么是小概率的标准。也就是说,需要有什么是小概率的标准。l这这要要看看具具体体应应用用的的需需要要。但但在在一一般般的的统统计计书书和和软软件件中中,使使用用最最多多的的标标准准是是在在零零假假设设下下(或或零零假假设设正正确确时时)根根据据样样本本所所得得的的数数据据来来拒拒绝绝零零假假设设的的概概率率应应小小于于0.05,当当然然也可能是也可能是0.01,0.005,0.001等等。等等。l这这种种事事先先规规定定的的概概率率称称为为显显著著性性水水平平(significant level),用字母,用字母a a来表示。来表示。6.1 假设检验的过程和逻辑假设检验的过程和逻辑la a并并不不一一定定越越小小越越好好,因因为为这这很很可可能能导导致致不不容容易易拒拒绝绝零零假假设设,使使得得犯犯第第二二类类错错误误的的概率增大。概率增大。l当当p-值值小小于于或或等等于于a a时时,就就拒拒绝绝零零假假设设。所所以以,a a是是所所允允许许的的犯犯第第一一类类错错误误概概率率的的最最大大值值。当当p-值值小小于于或或等等于于a a时时,就就说说这这个检验是显著的。个检验是显著的。l无无论论统统计计学学家家用用多多大大的的a a作作为为显显著著性性水水平平都都不不能能脱脱离离实实际际问问题题的的背背景景。统统计计显显著著不不一定等价于实际显著。反过来也一样。一定等价于实际显著。反过来也一样。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l归纳起来,假设检验的逻辑步骤为:归纳起来,假设检验的逻辑步骤为:l1.写出零假设和备选假设;写出零假设和备选假设;l2.确定检验统计量;确定检验统计量;l3.确定显著性水平确定显著性水平a a;l4.根据数据计算检验统计量的实现值;根据数据计算检验统计量的实现值;l5.根据这个实现值计算根据这个实现值计算p-值;值;l6.进进行行判判断断:如如果果p-值值小小于于或或等等于于a a,就就拒拒绝绝零零假假设设,这这时时犯犯(第第一一类类)错错误误的的概概率率最最多多为为a a;如如果果p-值值大大于于a a,就就不不拒拒绝绝零零假设,因为证据不足。假设,因为证据不足。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l实实际际上上,多多数数计计算算机机软软件件仅仅仅仅给给出出p-值值,而不给出而不给出a a。这有很多方便之处。这有很多方便之处。l比比如如a a=0.05,而而假假定定所所得得到到的的p-值值等等于于0.001。这这时时如如果果采采用用p-值值作作为为新新的的显显著著性性水水平平,即即新新的的a a=0.001,于于是是就就可可以以说说,在显著性水平为在显著性水平为0.001时,拒绝零假设。时,拒绝零假设。l这这样样,拒拒绝绝零零假假设设时时犯犯错错误误的的概概率率实实际际只只是是千千分分之之一一而而不不是是旧旧的的a a所所表表明明的的百百分分之之五五。在在这这个个意意义义上上,p-值值又又称称为为观观测测的的显显著性水平(著性水平(observed significant level)。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l在在统统计计软软件件输输出出p-值值的的位位置置,有有的的用用“p-value”,有有的的用用significant的的缩缩写写“Sig”就就是这个道理。是这个道理。l根根据据数数据据产产生生的的p-值值来来减减少少a a的的值值以以展展示示结果的精确性总是没有害处的。结果的精确性总是没有害处的。l这这好好比比一一个个身身高高180厘厘米米的的男男生生,可可能能愿愿意意被被认认为为高高于于或或等等于于180厘厘米米,而而不不愿愿意意说说他他高高于于或或等等于于155厘厘米米,虽虽然然这这第第二二种种说法数学上没有丝毫错误。说法数学上没有丝毫错误。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l关关于于“临临界界值值”的的注注:作为概率的显著性水平a实际上相应于一个检验统计量取值范围的一个临临界界值值(critical value),它定义为,统计量取该值或更极端的值的概率等于a。也就是说,“统统计计量量的的实实现现值值比比临临界界值值更更极极端端”等等价价于于“p-值值小小于于a a”。使用临界值的概念进行的检验不计算p-值。只比较统计量的取值和临界值的大小。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l使使用用临临界界值值而而不不是是p-值值来来判判断断拒拒绝绝与与否否是是前前计计算算机机时时代代的的产产物物。当当时时计计算算p-值值不不易易,只只采采用用临临界界值值的的概概念念。但但从从给给定定的的a a求求临临界界值值同同样样也也不不容容易易,好好在在习习惯惯上上仅仅仅仅在在教教科科书书中中列列出出相相应应于于特特定定分分布布的的几几个个有有限限的的a a临临界界值值(比比如如a a=0.05,a a=0.025,a a=0.01,a a=0.005,a a=0.001等等等等),或或者者根根据据分分布布表表反反过过来来查查临临界界值值(很很不不方方便便也也很很粗粗糙糙)。l现现在在计计算算机机软软件件大大都都不不给给出出a a和和临临界界值值,但但都都给给出出p-值值和和统统计计量量的的实实现现值值,让让用用户户自己决定显著性水平是多少。自己决定显著性水平是多少。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l在在一一些些统统计计教教科科书书中中会会有有不不能能拒拒绝绝零零假假设设就就“接接受受零零假假设设”的的说说法法。这这种种说说法法是是不不严严格的。格的。l首首先先,如如果果你你说说“接接受受零零假假设设”,那那么么就就应应该该负负责责任任地地提提供供接接受受零零假假设设时时可可能能犯犯第第二二类类错错误误的的概概率率。这这就就要要算算出出在在备备选选假假设设正正确确的的情情况况下下错错误误接接受受零零假假设设的的概概率率。但但是是,这这只只有有在在备备选选假假设设仅仅仅仅是是一一个个与与零零假假设设不不同的确定值(而不是范围)时才有可能。同的确定值(而不是范围)时才有可能。l多多数数基基本本统统计计教教科科书书的的备备选选假假设设是是一一个个范范围而根本无法确定犯第二类错误的概率。围而根本无法确定犯第二类错误的概率。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l在在许许多多统统计计教教科科书书中中,往往往往把把一一系系列列不不能能拒拒绝绝零零假假设设的的检检验验当当成成接接受受这这些些假设的通行证。假设的通行证。l比比如如不不能能拒拒绝绝某某样样本本的的正正态态性性就就变变成成了证明了该样本是正态的等等。了证明了该样本是正态的等等。l不不能能拒拒绝绝这这些些零零假假设设,仅仅仅仅说说明明根根据据所所使使用用的的检检验验方方法法(或或检检验验统统计计量量)和和当当前前的的数数据据没没有有足足够够证证据据拒拒绝绝这这些些假设而已。假设而已。6.1 假设检验的过程和逻辑假设检验的过程和逻辑l对对于于同同一一个个假假设设检检验验问问题题,往往往往都都有有多多个个检检验验统统计计量量;而而且且人人们们还还在在构构造造更优良的检验统计量。更优良的检验统计量。l人人们们不不可可能能把把所所有有的的目目前前存存在在的的和和将将来可能存在的检验都实施。来可能存在的检验都实施。l因因此此,只只能能够够说说,按按照照目目前前的的证证据据,不不足足以以拒拒绝绝零零假假设设而而已已。后后面面将将会会用用例例子子说说明明“接接受受零零假假设设”的的说说法法是是不不妥妥当的。当的。6.2 对于正态总体均值的检验对于正态总体均值的检验6.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验l例例6.1一一个个顾顾客客买买了了一一包包标标有有500g重重的的一一包包红红糖糖,觉觉得得份份量量不不足足,于于是是找找到到监监督督部部门门;当当然然他他们们会会觉觉得得一一包包份份量量不不够够可可能能是是随随机机的的。于于是是监监督督部部门门就就去去商商店店称称了了50包包红红糖糖(数数据据在在sugar.txt);其其中中均均值值(平平均均重重量量)是是498.35g;这这的的确确比比500g少少,但但这这是是否否能能够够说说明明厂厂家家生生产产的的这这批批红红糖糖平平均均起起来来不不够够份份量量呢呢?于于是是需需要要统统计计检检验验。可可以以画画出这些重量的直方图出这些重量的直方图50包红糖重量的直方图包红糖重量的直方图 6.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验l这这个个直直方方图图看看上上去去象象是是正正态态分分布布的的样样本本。不妨假定这一批袋装红糖有正态分布。不妨假定这一批袋装红糖有正态分布。l由由于于厂厂家家声声称称每每袋袋500g(标标明明重重量量),因因此此零零假假设设为为总总体体均均值值等等于于500g(被被怀怀疑疑对对象总是放在零假设);象总是放在零假设);l而而且且由由于于样样本本均均值值少少于于500g(这这是是怀怀疑疑的的根根据据),把把备备选选假假设设定定为为总总体体均均值值少少于于500g(备备选选假假设设为为单单向向不不等等式式的的检检验验称称为为单尾检验单尾检验,为不等号为不等号“”的称为双尾检验的称为双尾检验)6.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验l检检验验统统计计量量就就是是第第四四章章引引进进的的作作为为对对均值的某种标准化的均值的某种标准化的l符符号号中中的的m m0通通常常表表示示为为零零假假设设中中的的均均值值(这这里里是是500)。在在零零假假设设之之下下,它它有有自自由由度度为为n-1=49的的t分分布布。当当然然实实际际上上不不必必代代入入这这个个公公式式去去手手工工计计算算了了,让计算机去代劳好了。让计算机去代劳好了。6.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验l计计算算结结果果是是t=-2.696(也也称称为为t值值),同同时时得得到到p-值值为为0.005(由由于于计计算算机机输输出出的的为为双双尾尾检检验验的的p-值值,比比单单尾尾的的大大一一倍倍,应应该该除除以以2)。看看来来可可以以选选择择显显著著性性水水平平为为0.005,并并宣宣称称拒拒绝绝零零假假设设,而而错错误误拒拒绝绝的的概概率率为为0.005。统计量统计量t=-2.696相应于左边相应于左边尾概率(尾概率(p-值)值)0.005 6.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验l上上 面面 例例 子子 的的 备备 选选 假假 设设 为为 小小 于于(“”)某某个个值值的情况。的情况。l取取备备选选假假设设为为均均值值大大于于或或小小于于某某个个值值的的检检验验称称为为单单尾尾检检验验(one-tailed test,也也称称为为单单侧侧检检验验或或单单边边检检验验)。下下面面举举一一个个选选假假设设为为均均值大于(值大于(“”)某个值的例子。)某个值的例子。6.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验l例例6.2(exh.txt)汽汽车车厂厂商商声声称称其其发发动动机机排排放放标标准准的的一一个个指指标标平平均均低低于于20个个单单位位。在在抽抽查查了了10台台发发动动机机之之后后,得得到到下下面面的的排排放放数数 据据:17.0、21.7、17.9、22.9、20.7、22.4、17.3、21.8、24.2、25.4。该该样样本本均均值值为为21.13。究究竟竟能能否否由由此此认认为为该该指指标标均均值值超过超过20?这次的假设检验问题就是?这次的假设检验问题就是6.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验l和和前前面面的的例例子子的的方方法法类类似似,可可以以发发现现p-值值为为0.1243(计计算算机机输输出出的的双双尾尾检检验验的的p-值值除除以以2),因因此此,没没有有证证据据否否定定零零假假设设。这这时时的的检检验验统统计计量量t=1.2336。也也可可以以画画出出类类似似于于图图6.2的的图图(图图6.3)这这时时的的t分分布布的的自由度为自由度为9。下面是结果的计算机输出:。下面是结果的计算机输出:统计量统计量t=1.2336相应于右边相应于右边尾概率(尾概率(p-值)值)0.1243 6.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验l注注意意:在在假假设设检检验验中中往往往往也也用用带带等等号号的的不不等式来表示零假设,比如上述的检验记为等式来表示零假设,比如上述的检验记为l但但这这里里用用于于计计算算p-值值的的零零假假设设还还是是m m=20;但但如如果果能能够够拒拒绝绝零零假假设设m m=20,那那么么对对于于任任何何m m小小于于20的的零零假假设设就就更更有有理理由由拒拒绝绝了了。这这和和以以拒拒绝绝零零假假设设为为初衷的假设检验思维方式是一致的。初衷的假设检验思维方式是一致的。6.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验l还还有有所所谓谓的的双双尾尾检检验验(two tailed test,也称为也称为双侧检验双侧检验或或双边检验双边检验)问题,即问题,即l在在这这种种情情况况下下,尾尾概概率率不不仅仅是是左左边边或或右右边边的的一一个个尾尾概概率率,而而是是两两边边尾尾概概率率之之和和。因因此此如如果果是是一一个个单单尾尾检检验验问问题题,用用了了双双尾尾检检验验的的模模式式,p-值值就就比比用用单单尾检验时大了一倍。尾检验时大了一倍。6.2.1 根据一个样本对其总体均值大小进行检验根据一个样本对其总体均值大小进行检验l如如果果上上面面发发动动机机排排放放指指标标例例子子的的检检验验问问题题改改为为是是否否该该发发动动机机的的排排放放指指标标均均值等于值等于20。即。即l这这时时t统统计计量量还还是是取取原原来来的的值值1.2336,但但p-值值为为0.12432=0.2486。图图6.3就就变变成图成图6.4的样子的样子统计量统计量t=1.2336,而,而p-值等于值等于左右尾概率之和,即左右尾概率之和,即0.24866.2.2 根据来自两个总体的独立样本对其总体均值的检验根据来自两个总体的独立样本对其总体均值的检验l例例6.3(数数据据:drug.txt)为为检检测测某某种种药药物物对对攻攻击击性性情情绪绪的的影影响响,对对处处理理组组的的100名名服服药药者者和和对对照照组组的的150名名非非服服药药者者进进行行心心理理测测试试,得得到到相相应应的的某某指指标标。要要检检验验处处理理组组指指标标的的总总体体均均值值m m1是是否否等等于于对对照照组组指指标标的的总总体体均均值值m m2。相相应应的假设检验问题为:的假设检验问题为:或6.2.2 根据来自两个总体的独立样本对其总体均值的检验根据来自两个总体的独立样本对其总体均值的检验l通通过过计计算算,t统统计计量量等等于于0.942,p-值值为为0.1735(输输出出中中的的双双尾尾检检验验p-值值的的一一半半)。因因此此无无法法拒拒绝绝零零假假设设,即即不不能能得得出出处处理理组组的的平平均均指指标标大大于于对对照照组组的的结结论论。计计算算机机输输出出的的相相应应表表格格(部部分分,删删除除了了置置信信区区间间部部分)为:分)为:6.2.2 根据来自两个总体的独立样本对其总体均值的检验根据来自两个总体的独立样本对其总体均值的检验l注注意意:这这个个输输出出的的前前面面三三列列用用Levene的的F-检检验验来来看看这这两两个个样样本本所所代代表表的的总总体体之之方方差差是是否否相相等等(零零假假设设为为相相等等)。第第一一行行是是该该检检验验的的零零假假设设:两两个个总总体体方方差差相相等等,而而第第二二行行为为备备选选假假设设:两两个个总总体体方方差差不不等等。如如果果该该检检验验显显著著,即即在在Sig列列中中的的该该Levene检检验验p-值值很很小小(这这里里是是0.008),就就应应该该看看第第二二行行备备选选假假设设的的t检检验验 输输 出出,这这 里里 是是 0.347;由由 于于 是是 单单 边边 检检 验验,p-值值 0.347/2=0.1735;如如果果Levene检检验验的的p-值值较较大大(本本例例并并不不大大),则则看看第第一一行行原原假假设设下下的的结结果果。之之所所以以要要检检验验总总体体方方差差,是是因因为为总体方差相同时使用的检验统计量与方差不同时使用的不同。总体方差相同时使用的检验统计量与方差不同时使用的不同。6.2.3 成对样本的问题成对样本的问题l例例6.4减减肥肥数数据据(diet.txt)。这这里里有有50对对数数据据。为为50人是减肥前后的重量人是减肥前后的重量l要比较要比较50个人在减肥前后的重量。个人在减肥前后的重量。l不不能能用用前前面面的的独独立立样样本本均均值值差差的的检检验验;这这是是因因为为两两个个样样本本并并不不独独立立。每每一一个个人人减减肥肥后后的的重重量量都都和和自自己己减减肥肥前前的的重重量量有有关关。但但不不同同人人之之间间却却是独立的。是独立的。l令令所所有有个个体体减减肥肥前前后后重重量量差差(减减肥肥前前重重量量减减去去减减肥肥后后重重量量)的的均均值值为为m mD;这这样样所所要要进进行行的的检检验为验为6.2.3 成对样本的问题成对样本的问题l我我们们可可以以把把两两个个样样本本中中配配对对的的观观测测值值逐逐个个相相减减,形形成成一一个个由由独独立立观观测测值值组组成成的的样样本本;然然后后用用单单样样本本检检验验方方法法,看看其其均均值值是是否否为为零。零。l在在相相减减之之后后公公式式和和单单样样本本均均值值检检验验无无异异。当当然然,如如果果直直接接选选用用软软件件中中成成对对样样本本均均值值的的检检验验,就就不不用用事事先先逐逐个个相相减减了了。这这里里也也有单尾和双尾检验。有单尾和双尾检验。l这这里里介介绍绍的的是是假假定定总总体体分分布布为为正正态态分分布布时时的的t检检验验。总总体体分分布布未未知知时时,应应该该利利用用第第十六章的非参数检验方法。十六章的非参数检验方法。6.2.3 成对样本的问题成对样本的问题l再再接接着着看看例例6.4。计计算算机机输输出出了了双双尾尾p-值值0.002,这这里里的的单单尾尾p-值值于于是是为为0.001。因因此此在在显显著著性性水水平平为为0.001时时,可可以以拒拒绝绝零零假假设设。也也就就是是说说,减减肥肥后后和和减减肥肥前前相相比比,平平均均重重量量显显著著要要轻轻。下下面面是是这这个个检检验验的的SPSS的的部部分分计计算算机机输输出出为为(删删去去了置信区间):了置信区间):6.3 对于比例的检验对于比例的检验6.3.1 对于离散变量总体比例的检验对于离散变量总体比例的检验l例例6.5(two.txt)为为评评价价电电视视的的收收视视率率,电电话话调调查查,在在某某一一节节目目播播出出的的时时候候,被被访访的的正正在在观观看看电电视视的的人人中中有有23的的正正在在观观看看这这个个节节目目。现现在在想想知知道道,这这是是否否和和该该节节目目的的制制作作人人所所期期望望的的p0=25有显著不足。有显著不足。l这这显显然然是是一一个个参参数数为为p的的二二项项分分布布问问题题。形形式式上上的假设检验问题是的假设检验问题是6.3.1 对于离散变量总体比例的检验对于离散变量总体比例的检验l如如果果n为为访访问问的的正正在在看看电电视视的的人人数数,x为为其其中中观观看该节目的人数,那么样本中的观看比例为看该节目的人数,那么样本中的观看比例为l检检验验统统计计量量则则是是在在零零假假设设下下当当大大样样本本时时近近似似有有标准正态分布的统计量标准正态分布的统计量6.3.1 对于离散变量总体比例的检验对于离散变量总体比例的检验l这个数值用手算也不费力气。请注意,这个数值用手算也不费力气。请注意,l前前面面第第五五章章提提起起过过,即即使使被被访访者者的的百百分分比比一一样样,但但样样本本少少的的信信息息就就少少。对对于于假假设设检检验验也也是是一一样样。样样本本量量对对于于假假设检验的结果就十分重要。设检验的结果就十分重要。l对对于于本本例例,现现在在还还未未给给出出样样本本量量n呢呢!下下面面看看看看不不同同的的样样本本量量会会得得到到什什么么结结果(假定果(假定x/n=0.23不变)不变)6.3.1 对于离散变量总体比例的检验对于离散变量总体比例的检验1.如如样样本本量量为为n=1500(和和数数据据给给的的一一样样),那那么么,上上面面的的检检验验得得到到的的p-值值为为0.0368。因因此此,可可以以认认为为(如如果果选选显显著著性性水水平平为为0.05的的话话)说收视率有说收视率有25是过分了。即拒绝零假设。是过分了。即拒绝零假设。2.如如样样本本量量为为n=100,那那么么,上上面面的的检检验验得得到到的的p-值值为为0.3221。因因此此,没没有有足足够够的的理理由由拒拒绝绝收收视视率率有有25的的零零假假设设(如如果果选选显显著著性性水水平平为为0.05的话)的话)注注意意,利利用用软软件件时时,上上面面的的p-值值计计算算往往往往在在公公式式中中加加上上用用连连续续变变量量近近似似离离散散变变量量分分布布时时常常用用的的连连续续性性纠纠正正,因因此此结结果果和和用用上上面公式直接手算的稍有不同。面公式直接手算的稍有不同。6.3.1 对于离散变量总体比例的检验对于离散变量总体比例的检验l下下面面是是对对于于n=1500时时,例例6.5的的SPSS输输出出。这这里里正正在在观观看看该该节节目目的的人人数数为为n1=345,而而1500人人中中观观看看其其他他节节目目的的人人数数为为n2=1155。样样本本中中收收视视比比例例为为n1/n345/15000.23。6.3.1 对于离散变量总体比例的检验对于离散变量总体比例的检验l前前面面对对总总体体比比例例的的检检验验所所用用的的公公式式利利用用了了二二项项分分布布的的大大样样本本正正态态近近似似;怎怎样样才才是是大大样样本本呢呢?这这和和第第五五章章求求比比例例的的置置信信区区间间时时大大样样本本的的近近似似标准类似,即当区间标准类似,即当区间l完完全全包包含含在在(0,1)区区间间内内部部时时,可可以以认认为为样样本足够大,能够用正态近似。本足够大,能够用正态近似。6.3.1 对于离散变量总体比例的检验对于离散变量总体比例的检验l对对于于两两个个样样本本,也也有有关关于于两两个个总总体体比比例例之之差差p1p2的的检检验验。还还拿拿收收视视率率为为例例。节节目目甲甲的的样样本本收收视视率率为为20,节节目目乙乙为为21,是是不不是是节节目目甲甲的的总总体体收收视视率率就就真真的的低低于于节目乙?即检验节目乙?即检验l这这里里的的零零假假设设意意味味着着节节目目甲甲和和节节目乙收视率相等。目乙收视率相等。6.3.1 对于离散变量总体比例的检验对于离散变量总体比例的检验l假假定定n1=1200,n2=1300,检检验验统统计计量量则则是是在在零零假假设设下下当当大大样样本本时时有有近似标准正态分布的统计量近似标准正态分布的统计量l得得到到p-值值等等于于0.2679。因因此此,在在显显著著性性水水平平即即使使是是0.1时时,也也没没有有足足够够证证据据可可以以拒拒绝绝“节节目目甲甲和和节节目目乙乙收视率相等收视率相等”的零假设。的零假设。6.3.2 对于连续变量比例的检验对于连续变量比例的检验l有有时时需需要要检检验验收收入入低低于于某某个个水水平平的的人人占占有有的的比比例例p是是否否和和预预期期的的p0一一样样。和和6.3.1节节一一样样,只只要要把把大大于于某某水水平平的的观观测测值值看看作作Bernoulli试试验验的的“成成功功”,而而把把小小于于某某水水平平的的观观测测值值看看成成“失失败败”,就就回回到到二二项项分分布布的的问问题题了了。当当然然,用用不不着着把把这这些些连连续续变变量量的的观观测测值值都都变变成成“成成功功”和和“失失败败”之之后后,再再数数各各有有多多少少。统统计计软软件件会会替替我我们们做做所所有有的的事事情。情。l下面通过一个例子来说明。下面通过一个例子来说明。6.3.2 对于连续变量比例的检验对于连续变量比例的检验l例例6.6 某某微微生生物物的的寿寿命命问问题题(数数据据life.txt)。这这里里有有某某微微生生物物在在一一种种污污染染环环境境下下生生存存的的寿寿命命数数据据(单单位位:小时小时)6.3.2 对于连续变量比例的检验对于连续变量比例的检验l问问题题是是存存活活时时间间低低于于2小小时时的的是是否否少少于于70%(存存活活时时间间多多于于2小小时时的的是是否否多多于于30%)?零零假假设设为为存存活活时时间间低低于于2小小时时的的少少于于或或等等于于70%,备备选选假假设设为为存存活活时时间间低低于于2小小时时的的多多于于70%。该该检检验用符号表示,对于验用符号表示,对于p00.7,6.3.2 对于连续变量比例的检验对于连续变量比例的检验l由计算机很容易得到检验结果由计算机很容易得到检验结果l这这说说明明,活活不不过过2小小时时的的有有52个个观观测测值值,所所占占的的比比例例为为90%。检检验验的的精精确确p-值值和和大大样样本本近近似似的的p-值值均均为为0.002。因因此此,可可以以拒拒绝绝“存存活时间低于活时间低于2小时的少于小时的少于70%”的零假设。的零假设。6.3.2 对于连续变量比例的检验对于连续变量比例的检验l这这个个检检验验的的假假设设还还可可以以有有另另一一种种等等价价形形式式。前前面面第第三三、四四章章介介绍绍过过样样本本和和总总体体的的a a-分分位位数数的的概概念念。例例6.6的的检检验验问问题题等等价价于于检检验验0.7分分位位数数q是是等等于于2(q0=2)还是小于)还是小于2;即:;即:l该该例例的的结结论论是是实实际际存存活活时时间间的的0.7分分位位数数q小于小于2小时。小时。6.3.2 对于连续变量比例的检验对于连续变量比例的检验l上上面面的的检检验验又又称称为为(推推广广的的)符符号号检检验验(sign test)。它它用用不不着着对对总总体体分分布布进进行行任任何何假假定定。而而狭狭义义的的符符号号检检验验是是指指上上面面的的p00.5或或者者(等等价价地地)q0等等于于中中位位数数的的情情况况。通通常常把把符符号号检检验验归归于于非非参参数数检检验验范范畴畴(参参见见后后面面介介绍绍非非参参数数检验的一章)。检验的一章)。6.4 从一个例子说明从一个例子说明“接受零假设接受零假设”的说法不妥的说法不妥l虽虽然然前前面面已已经经有有了了一一些些例例子子说说明明“接接受受零零假假设设”说说法法的的不不妥妥,但但还还可可能能会会有有些些人人对对于于在在检检验验结结果果不不显显著著时时只只能能说说“不不能能拒拒绝绝零零假假设设”而而不不能能说说“接接受受零零假假设设”感感到到不不解解。下下面面用用一一个个个个描描述述性性例例子子来来说说明。明。6.4 从一个例子说明从一个例子说明“接受零假设接受零假设”的说法不妥的说法不妥l例例6.7(数数据据 rice.txt)一一个个大大米米加加工工厂厂卖卖给给一一个个超超市市一一批批标标明明10kg重重的的大大米米。而而该该超超市市怀怀疑疑该该厂厂家家缺缺斤斤短短两两,对对10包包大大米米进进行行了了称称重重,得得到到下下面面结结果果(单单位位:千千克克)这这里里假假定定打打包包的的大大米米重重量量服服从从正正态分布。态分布。6.4 从一个例子说明从一个例子说明“接受零假设接受零假设”的说法不妥的说法不妥l由由于于发发生生分分歧歧,于于是是各各方方同同意意用用这这个个数数据据进进行行关关于于大大米米重重量量均均值值m m的的t检检验验;以以厂厂家家所所说说的的平平均均重重量量为为10kg作作为为零零假假设设,而而以以超超市市怀怀疑疑的的份份量量不不足足10kg作为备选假设:作为备选假设:l于于是是,超超市市、加加工工厂厂老老板板和和该该老老板板的的律师都进行了检验。结果是:律师都进行了检验。结果是:6.4 从一个例子说明从一个例子说明“接受零假设接受零假设”的说法不妥的说法不妥l1超超市市用用全全部部数数据据进进行行t检检验验,得得到到拒拒绝绝零零假假设设的的结结论论。他他们们根根据据计计算算得得到到:样样本本均均值值 为为 9.92kg,而而 p-值值 为为0.0106。因因此此超超市市认认为为,对对于于显显著著性性水水平平a a=0.05,应应该该拒绝零假设。拒绝零假设。6.4 从一个例子说明从一个例子说明“接受零假设接受零假设”的说法不妥的说法