第6章假设检验22年课件.ppt
6-1统计学统计学STATISTICS(第四版第四版)第6章假设检验22年课件 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望第第 6 章章 假设检验假设检验6.1 假设检验的基本原理假设检验的基本原理 6.2 一个总体参数的检验一个总体参数的检验6.3 两个总体参数的检验两个总体参数的检验yyyy-M-6-3统计学统计学STATISTICS(第四版第四版)学习目标学习目标l假设检验的基本思想和原理假设检验的基本思想和原理 l假设检验的步骤假设检验的步骤l一个总体参数的检验一个总体参数的检验l两个总体参数的检验两个总体参数的检验lP值的计算与应用值的计算与应用l用用Excel进行检验进行检验yyyy-M-6-4统计学统计学STATISTICS(第四版第四版)正常人的平均体温是正常人的平均体温是37oC吗?吗?当当问问起起健健康康的的成成年年人人体体温温是是多多少少时时,多多数数人人 的的 回回 答答 是是3737o oC C,这这似似乎乎已已经经成成了了一一种种共共识识。下下面面是是一一个个研研究究人人员员测测量量的的5050个个健健康康成成年年人人的的体体温数据温数据 37.136.936.937.136.436.936.636.236.736.937.636.737.336.936.436.137.136.636.536.737.136.236.337.536.937.036.736.937.037.136.637.236.436.637.336.137.137.036.636.936.737.236.337.136.736.837.037.036.137.0yyyy-M-6-5统计学统计学STATISTICS(第四版第四版)正常人的平均体温是正常人的平均体温是37oC吗?吗?根根据据样样本本数数据据计计算算的的平平均均值值是是36.836.8o oC C ,标标准准差差为为0.360.36o oC C 根根据据参参数数估估计计方方法法得得到到的的健健康康成成年年人人平平均均体体温温的的95%95%的的置置信信区区间间为为(36.7(36.7,36.9)36.9)。研研究究人人员员发发现现这个区间内并没有包括这个区间内并没有包括3737o oC C 因因此此提提出出“不不应应该该再再把把3737o oC C作作为为正正常常人人体体温温的的一个有任何特定意义的概念一个有任何特定意义的概念”我我们们应应该该放放弃弃“正正常常人人的的平平均均体体温温是是3737o oC”C”这这个个共共识识吗吗?本本章章的的内内容容就就将将提提供供一一套套标标准准统统计计程程序序来检验这样的观点来检验这样的观点yyyy-M-6.1 假设检验的基本原理假设检验的基本原理 6.1.1 怎样提出假设?怎样提出假设?6.1.2 怎样做出决策?怎样做出决策?6.1.3 怎样表述决策结果?怎样表述决策结果?第第 6 章章 假设检验假设检验yyyy-M-6.1.1 怎样提出假设?怎样提出假设?6.1 假设检验的基本原理假设检验的基本原理yyyy-M-6-8统计学统计学STATISTICS(第四版第四版)什么是假设什么是假设?(hypothesis)在参数检验中,对总体参数的具体数值所作的陈述n n就就一一个个总总体体而而言言,总总体体参参数数包包括括总总总总体体体体均均均均值值值值、比例比例比例比例、方差方差方差方差等等n n分析分析之前之前之前之前必需陈述必需陈述我认为这种新药的疗效我认为这种新药的疗效比原有的药物更有效比原有的药物更有效!yyyy-M-6-9统计学统计学STATISTICS(第四版第四版)什么是假设检验什么是假设检验?(hypothesis test)1.先先对对总总体体的的参参数数(或或分分布布形形式式)提提出出某某种种假假设设,然然后后利利用用样样本本信信息息判判断断假假设设是是否否成成立立的的统统计计方方法法2.有参数检验和有参数检验和非非参数检验参数检验3.逻辑上运用反证法,统计上依据小概率原理逻辑上运用反证法,统计上依据小概率原理n n小小概概率率是是在在一一次次试试验验中中,一一个个几几乎乎不不可可能能发发生生的的事件发生的概率事件发生的概率n n在在一一次次试试验验中中小小概概率率事事件件一一旦旦发发生生,我我们们就就有有理理由拒绝原假设由拒绝原假设yyyy-M-6-10统计学统计学STATISTICS(第四版第四版)原假设原假设(null hypothesis)1.1.又称又称“0“0假设假设”,研,研究者想收集证据予以反对的假究者想收集证据予以反对的假设,用设,用H H0 0表示表示2.2.所表达的含义总是指所表达的含义总是指参数没有变化或变量之间没有参数没有变化或变量之间没有参数没有变化或变量之间没有参数没有变化或变量之间没有关系关系关系关系 3.3.最初被假设是成立的,之后根据样本数据确定是否最初被假设是成立的,之后根据样本数据确定是否有足够的证据拒绝它有足够的证据拒绝它 4.4.总是有符号总是有符号 ,或或 n nH H0 0:=某一数值某一数值n nH H0 0:某一数值某一数值n nH H0 0:某一数值某一数值l l例如例如,H H0 0:10cm 10cmyyyy-M-6-11统计学统计学STATISTICS(第四版第四版)1.1.也也称称“研研究究假假设设”,”,研研究究者者想想收收集集证证据据予予以以支支持持的的假设,用假设,用H H1 1或或H Ha a表示表示2.2.所所表表达达的的含含义义是是总总体体参参数数发发生生了了变变化化或或变变量量之之间间有某种关系有某种关系3.3.备备择择假假设设通通常常用用于于表表达达研研究究者者自自己己倾倾向向于于支支持持的的看看法法,然然后后就就是是想想办办法法收收集集证证据据拒拒绝绝原原假假设设,以以支持备择假设支持备择假设 4.4.总是有符号总是有符号 ,或或 n nH H1 1:某一数值某一数值n nH H1 1:某一数值某一数值n nH H1 1:”或“”的假设检验,称为单侧检验或单尾检验(one-tailed test)n n备择假设的方向为备择假设的方向为“”,称为,称为右侧检验右侧检验右侧检验右侧检验 双侧检验与单侧检验双侧检验与单侧检验yyyy-M-6-13统计学统计学STATISTICS(第四版第四版)双侧检验与单侧检验双侧检验与单侧检验(假设的形式假设的形式)假假设双双侧检验单侧检验单侧检验左左侧检验右右侧检验原假设原假设H0:=0 0H0:0 0H0:0 0备择假设备择假设H1:0 0H1:0 0以总体均值的检验为例以总体均值的检验为例以总体均值的检验为例以总体均值的检验为例yyyy-M-6-14统计学统计学STATISTICS(第四版第四版)【例例例例6-16-1】一一种种零零件件的的生生产产标标准准是是直直径径应应为为10cm10cm,为为对对生生产产过过程程进进行行控控制制,质质量量监监测测人人员员定定期期对对一一台台加加工工机机床床检检查查,确确定定这这台台机机床床生生产产的的零零件件是是否否符符合合标标准准要要求求。如如果果零零件件的的平平均均直直径径大大于于或或小小于于10cm10cm,则则表表明明生生产产过过程程不不正正常常,必必须须进进行行调调整整。试试陈陈述述用用来检验生产过程是否正常的原假设和被择假设来检验生产过程是否正常的原假设和被择假设提出假设提出假设(例题分析例题分析)解解解解解解:研研研究究究者者者想想想收收收集集集证证证据据据予予予以以以证证证明明明的的的假假假设设设应应应该该该是是是“生生生产产产过过过程程程不不不正正正常常常”。建建建立立立的的的原原原假假假设设设和和和备备备择择择假假假设为设为设为 H HH0 0 0:10cm 10cm 10cm H HH1 1 1:10cm 10cm 10cm yyyy-M-6-15统计学统计学STATISTICS(第四版第四版)【例例例例6-26-2】某某品品牌牌洗洗涤涤剂剂在在它它的的产产品品说说明明书书中中声声称称:平平均均净净含含量量不不少少于于500500克克。从从消消费费者者的的利利益益出出发发,有有关关研研究究人人员员要要通通过过抽抽检检其其中中的的一一批批产产品品来来验验证证该该产产品品制制造造商商的的说说明明是是否否属属实实。试试陈陈述述用用于于检验的原假设与备择假设检验的原假设与备择假设提出假设提出假设(例题分析例题分析)解解解解解解:研研研究究究者者者抽抽抽检检检的的的意意意图图图是是是倾倾倾向向向于于于证证证实实实这这这种种种洗洗洗涤涤涤剂剂剂的的的平平平均均均净净净含含含量量量并并并不不不符符符合合合说说说明明明书书书中中中的的的陈陈陈述述述 。建建建立立立的的的原原原假假假设设设和备择假设为和备择假设为和备择假设为 H H H0 0 0:500 500 500 H H H1 1 1:500 500 500500g500g500g绿叶绿叶绿叶洗涤剂洗涤剂洗涤剂yyyy-M-6-16统计学统计学STATISTICS(第四版第四版)【例例例例6-36-3】一一家家研研究究机机构构估估计计,某某城城市市中中家家庭庭拥拥有有汽汽车车的的比比例例超超过过30%30%。为为验验证证这这一一估估计计是是否否正正确确,该该研研究究机机构构随随机机抽抽取取了了一一个个样样本本进进行行检检验验。试试陈述用于检验的原假设与备择假设陈述用于检验的原假设与备择假设提出假设提出假设(例题分析例题分析)解:解:解:解:解:解:研究者想收集证据予以支持的假研究者想收集证据予以支持的假研究者想收集证据予以支持的假设是设是设是“该城市中家庭拥有汽车的比例该城市中家庭拥有汽车的比例该城市中家庭拥有汽车的比例超过超过超过30%30%30%”。建立的原假设和备择假设。建立的原假设和备择假设。建立的原假设和备择假设为为为 H H H0 0 0:30%30%30%H H H1 1 1:30%30%30%yyyy-M-6-17统计学统计学STATISTICS(第四版第四版)1.原假设和备择假设是一个完备事件组,而且相互对立n n在在一一项项假假设设检检验验中中,原原假假设设和和备备择择假假设设必必有有一一个成立,而且只有一个成立个成立,而且只有一个成立2.先确定备择假设,再确定原假设 3.等号“=”总是放在原假设上 4.因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)提出假设提出假设(结论与建议结论与建议)yyyy-M-6.1.2 怎样做出决策?怎样做出决策?6.1 假设检验的基本原理假设检验的基本原理yyyy-M-6-19统计学统计学STATISTICS(第四版第四版)两类错误与显著性水平两类错误与显著性水平1.1.研究者总是希望能做出正确的决策,但由于决策是建立研究者总是希望能做出正确的决策,但由于决策是建立在样本信息的基础之上,而样本又是随机的,因而就有在样本信息的基础之上,而样本又是随机的,因而就有可能犯错误可能犯错误2.2.原假设和备择假设不能同时成立,决策的结果要么拒绝原假设和备择假设不能同时成立,决策的结果要么拒绝H H0 0,要么不拒绝,要么不拒绝H H0 0。决策时总是希望当原假设正确时没。决策时总是希望当原假设正确时没有拒绝它,当原假设不正确时拒绝它,但实际上很难保有拒绝它,当原假设不正确时拒绝它,但实际上很难保证不犯错误证不犯错误 3.3.第第类错误类错误(错误错误)n n原假设为正确时拒绝原假设原假设为正确时拒绝原假设n n第第类错误的概率记为类错误的概率记为,被称为显著性水平被称为显著性水平2.2.第第类错误类错误(错误错误)n n原假设为错误时未拒绝原假设原假设为错误时未拒绝原假设n n第第类错误的概率记为类错误的概率记为 (Beta)(Beta)yyyy-M-6-20统计学统计学STATISTICS(第四版第四版)两类错误的控制两类错误的控制1.1.一般来说,对于一个给定的样本,如果犯第一般来说,对于一个给定的样本,如果犯第 类错误类错误的代价比犯第的代价比犯第类错误的代价相对较高,则将犯第类错误的代价相对较高,则将犯第类错误的概率定得低些较为合理;反之,如果犯第类错误的概率定得低些较为合理;反之,如果犯第 类错误的代价比犯第类错误的代价比犯第类错误的代价相对较低,则将类错误的代价相对较低,则将犯第犯第类错误的概率定得高些类错误的概率定得高些2.2.一般来说,发生哪一类错误的后果更为严重,就应该一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。但由于犯第首要控制哪类错误发生的概率。但由于犯第 类错误类错误的概率是可以由研究者控制的,因此在假设检验中,的概率是可以由研究者控制的,因此在假设检验中,人们往往先控制第人们往往先控制第 类错误的发生概率类错误的发生概率yyyy-M-6-21统计学统计学STATISTICS(第四版第四版)显著性水平显著性水平 (significant level)1.事先确定的用于拒绝原假设事先确定的用于拒绝原假设H H0 0时所必须的证据时所必须的证据2.能够容忍的犯第能够容忍的犯第类错误的最大概率类错误的最大概率(上限值上限值)2.2.原假设为真时,拒绝原假设的概率原假设为真时,拒绝原假设的概率n n 抽样分布的拒绝域抽样分布的拒绝域3.3.表示为表示为 (alpha)(alpha)n n 常用的常用的 值有值有0.01,0.05,0.100.01,0.05,0.104.4.由研究者事先确定由研究者事先确定yyyy-M-6-22统计学统计学STATISTICS(第四版第四版)依据什么做出决策?依据什么做出决策?1.若假设为H0:=500,H1:I 临界值,拒绝临界值,拒绝H H0 0n n左侧检验:左侧检验:统计量统计量 -临界值,拒绝临界值,拒绝H H0 0yyyy-M-6-28统计学统计学STATISTICS(第四版第四版)用用P 值决策值决策(P-value)1.如果原假设为真,所得到的样本结果会像实际观测结果那么极端或更极端的概率P P值值值值告告告告诉诉诉诉我我我我们们们们:如如果果原原假假设设是是正正确确的的话话,我我们们得得到到得得到到目目前前这这个个样样本本数数据据的的可可能能性性有有多多大大,如果这个可能性很小,就应该拒绝原假设如果这个可能性很小,就应该拒绝原假设 2.被称为观察到的(或实测的)显著性水平3.决策规则:若p值,拒绝 H0yyyy-M-6-29统计学统计学STATISTICS(第四版第四版)双侧检验的双侧检验的P 值值 /2 2 /2 2 Z Z拒绝拒绝拒绝拒绝H H0 0拒绝拒绝拒绝拒绝H H0 00 0 0临界值临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量临界值临界值临界值1/2 1/2 1/2 P P P 值值值1/2 1/2 1/2 P P P 值值值yyyy-M-6-30统计学统计学STATISTICS(第四版第四版)左侧检验的左侧检验的P 值值 Z Z拒绝拒绝拒绝拒绝H H0 00 0 0临界值临界值临界值计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量P P P 值值值yyyy-M-6-31统计学统计学STATISTICS(第四版第四版)右侧检验的右侧检验的P 值值 Z Z拒绝拒绝拒绝拒绝H H0 00 0 0计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量计算出的样本统计量临界值临界值临界值P P P 值值值yyyy-M-6-32统计学统计学STATISTICS(第四版第四版)P值是关于数据的概率值是关于数据的概率1.1.P P值值原假设的对或错的概率无关原假设的对或错的概率无关2.2.它它反反映映的的是是在在某某个个总总体体的的许许多多样样本本中中某某一一类类数数据据出出现现的的经经常常程程度度,它它是是当当原原假假设设正正确确时时,得得到到目目前前这这个样本数据的概率个样本数据的概率n n比比如如,要要检检验验全全校校学学生生的的平平均均生生活活费费支支出出是是否否等等于于500500元元,检检验验的的假假设设为为H H0 0:=500=500;H H0 0:500 500。假假定定抽抽出出一一个个样样本本算算出出的的样样本本均均值值600600元元,得得到到的的值值为为P=0.02P=0.02,这这个个0.020.02是是指指如如果果平平均均生生活活费费支支出出真真的的是是500500元元的的话话,那那么么,从从该该总总体体中中抽抽出出一一个个均均值值为为600600的的样样本本的的概概率率仅仅为为0.020.02。如如果果你你认认为为这这个个概概率率太太小小了了,就就可可以以拒拒绝绝原原假假设设,因因为为如如果果原原假假设设正正确确的的话话,几几乎乎不不可可能能抓抓到到这这样样的的一一个个样样本本,既既然然抓抓到到了了,就表明这样的样本不在少数,所以原假设是不对的就表明这样的样本不在少数,所以原假设是不对的3.3.值越小,你拒绝原假设的理由就越充分值越小,你拒绝原假设的理由就越充分yyyy-M-6-33统计学统计学STATISTICS(第四版第四版)要要证证明明原原假假设设不不正正确确,P P值值要要多多小小,才才能能令令人人信信服呢?服呢?n n原原原原假假假假设设设设的的的的可可可可信信信信度度度度又又又又多多多多高高高高?如如果果H H0 0所所代代表表的的假假设设是是人人们们多多年年来来一一直直相相信信的的,就就需需要要很很强强的的证证据据(小的小的P P值值)才能说服他们才能说服他们n n拒拒拒拒绝绝绝绝的的的的结结结结论论论论是是是是什什什什么么么么?如如果果拒拒绝绝H H0 0而而肯肯定定H H1 1 ,你你就就需需要要有有很很强强的的证证据据显显示示要要支支持持H H1 1。比比如如,H H1 1代代表表要要花花很很多多钱钱把把产产品品包包装装改改换换成成另另一一种种包包装装,你你就就要要有有很很强强的的证证据据显显示示新新包包装装一一定定会会增增加加销销售量售量(因为拒绝因为拒绝H H0 0要花很高的成本要花很高的成本)多大的多大的P 值合适值合适?yyyy-M-6-34统计学统计学STATISTICS(第四版第四版)1.1.有有了了P P值值,我我们们并并不不需需要要用用5%5%或或1%1%这这类类传传统统的的显显著著性性水水平平。P P值值提提供供了了更更多多的的信信息息,它它让让我我们们可可以以选选择择任任意意水水平平来来评评估估结结果果是是否否具具有有统统计计上上的的显显著著性性,从从而而可根据我们的需要来决定是否要拒绝原假设可根据我们的需要来决定是否要拒绝原假设n n只只要要你你认认为为这这么么大大的的P P值值就就算算是是显显著著了了,你你就就可可以在这样的以在这样的P P值水平上拒绝原假设值水平上拒绝原假设2.2.传传统统的的显显著著性性水水平平,如如1%1%、5%5%、10%10%等等等等,已已经经被被人人们们普普遍遍接接受受为为“拒拒绝绝原原假假设设足足够够证证据据”的的标标准准,我我们们大大概概可可以以说说:10%10%代代表表有有“一一一一些些些些证证证证据据据据”不不利利于于原原假假设设;5%5%代代表表有有“适适适适度度度度证证证证据据据据”不不利利于于原原假假设设;1%1%代代表表有有“很强证据很强证据很强证据很强证据”不利于原假设不利于原假设固定显著性水平是否有意义固定显著性水平是否有意义yyyy-M-6-35统计学统计学STATISTICS(第四版第四版)1.1.用用P P值进行检验比根据统计量检验提供更多的信息值进行检验比根据统计量检验提供更多的信息2.2.统统计计量量检检验验是是我我们们事事先先给给出出的的一一个个显显著著性性水水平平,以以此此为为标标准准进进行行决决策策,无无法法知知道道实实际际的的显显著著性性水水平平究究竟是多少竟是多少n n比比如如,根根据据统统计计量量进进行行检检验验时时,只只要要统统计计量量的的值值落落在在拒拒绝绝域域,我我们们拒拒绝绝原原假假设设得得出出的的结结论论都都是是一一样样的的,即即结结果果显显著著。但但实实际际上上,统统计计量量落落在在拒拒绝绝域域不不同同的的地地方方,实实际际的的显显著著性性是是不不同同的的。比比如如,统统计计量量落落在在临临界界值值附附近近与与落落在在远远离离临临界界值值的的地地方方,实实际际的的显显著著性性就就有有较较大大差差异异。而而P P值值给给出出的的是是实实际际算算出出的的显显著著水水平平,它它告告诉诉我我们们实实际际的的显著性水平是多少显著性水平是多少P 值决策与统计量的比较值决策与统计量的比较yyyy-M-6-36统计学统计学STATISTICS(第四版第四版)拒绝拒绝拒绝拒绝H H0 0P 值决策与统计量的比较值决策与统计量的比较拒绝拒绝拒绝拒绝拒绝拒绝H HH0 00的两个统计量的不同显著性的两个统计量的不同显著性的两个统计量的不同显著性的两个统计量的不同显著性的两个统计量的不同显著性的两个统计量的不同显著性 Z Z拒绝拒绝拒绝拒绝H H0 00 0 0统计量统计量统计量统计量统计量统计量1 11 P PP1 11 值值值统计量统计量统计量统计量统计量统计量2 22 P PP2 22 值值值拒绝拒绝拒绝拒绝H H0 0临界值临界值临界值临界值临界值临界值yyyy-M-6.1.3 怎样表述决策结果?怎样表述决策结果?6.1 假设检验的基本原理假设检验的基本原理yyyy-M-6-38统计学统计学STATISTICS(第四版第四版)假设检验不能证明原假设正确假设检验不能证明原假设正确1.假假设设检检验验的的目目的的主主要要是是收收集集证证据据拒拒绝绝原原假假设设,而而支持你所倾向的备择假设支持你所倾向的备择假设2.假假设设检检验验只只提提供供不不利利于于原原假假设设的的证证据据。因因此此,当当拒拒绝绝原原假假设设时时,表表明明样样本本提提供供的的证证据据证证明明它它是是错错误误的的,当当没没有有拒拒绝绝原原假假设设时时,我我们们也也没没法法证证明明它它是是正正确确的的,因因为为假假设设检检验验的的程程序序没没有有提提供供它它正正确确的证据的证据n n这这与与法法庭庭上上对对被被告告的的定定罪罪类类似似:先先假假定定被被告告是是无无罪罪的的,直直到到你你有有足足够够的的证证据据证证明明他他是是有有罪罪的的,否否则则法法庭庭就就不不能能认认定定被被告告有有罪罪。当当证证据据不不足足时时,法法庭庭的的裁裁决决是是“被被告告无无罪罪”,但但这这里里也也没没有有证证明明被被告告就就是是清清白的白的yyyy-M-6-39统计学统计学STATISTICS(第四版第四版)假设检验不能证明原假设正确假设检验不能证明原假设正确1.1.假设检验得出的结论都是根据原假设进行阐述的假设检验得出的结论都是根据原假设进行阐述的n n我们要么拒绝原假设,要么不拒绝原假设我们要么拒绝原假设,要么不拒绝原假设2.2.当当不不能能拒拒绝绝原原假假设设时时,我我们们也也从从来来不不说说“接接接接受受受受原原原原假假假假设设设设”,因为没有证明原假设是真的,因为没有证明原假设是真的n n采采用用“接接受受”原原假假设设的的说说法法,则则意意味味着着你你证证明明了了原原假假设设是是正正确确的的3.3.没没有有足足够够的的证证据据拒拒绝绝原原假假设设并并不不等等于于你你已已经经“证证明明”了了原原假假设设是是真真的的,它它仅仅仅仅意意为为着着目目前前还还没没有有足足够够的的证证据据拒拒绝绝原原假假设设,只只表表示示手手头头上上这这个个样样本本提提供供的的证证据据还还不不足足以以拒绝原假设拒绝原假设n n比比如如,在在例例6.26.2中中,如如果果拒拒绝绝原原假假设设,表表明明样样本本提提供供的的证证据据证证明明该该品品牌牌洗洗涤涤剂剂的的净净含含量量与与说说明明书书所所标标识识的的不不相相符符。如如果果不不拒拒绝绝原原假假设设,只只能能说说这这个个样样本本提提供供的的证证据据还还不不足足证证明明净净含含量量不不是是500500克或克或500500克以上,并不等于证明了净含量就超过了克以上,并不等于证明了净含量就超过了500500克克4.4.“不不拒拒绝绝”的的表表述述方方式式实实际际上上意意味味着着没没有有得得出出明明确确的的结结论论yyyy-M-6-40统计学统计学STATISTICS(第四版第四版)假设检验不能证明原假设正确假设检验不能证明原假设正确1.“接受接受”的说法有时会产生误导的说法有时会产生误导n n这种说法似乎暗示着原假设已经被证明是正确的了这种说法似乎暗示着原假设已经被证明是正确的了n n实实事事上上,H H0 0的的真真实实值值我我们们永永远远也也无无法法知知道道,不不知知道道真实值是什么,又怎么能证明它是什么?真实值是什么,又怎么能证明它是什么?n nH H0 0只只是是对对总总体体真真实实值值的的一一个个假假定定值值,由由样样本本提提供供的的信息也就自然无法证明它是否正确信息也就自然无法证明它是否正确2.采采用用“不不拒拒绝绝”的的表表述述方方法法更更合合理理一一些些,因因为为这这种种表表述述意意味味着着样样本本提提供供的的证证据据不不够够强强大大,因因而而没没有有足足够够的的理理由由拒拒绝绝,这这不不等等于于已已经经证证明明原原假假设设正正确确 yyyy-M-6-41统计学统计学STATISTICS(第四版第四版)假设检验不能证明原假设正确假设检验不能证明原假设正确【例】比如原假设为H0:=10,从该总体中抽出一个随机样本,得到x=9.8,在=0.05的水平上,样本提供的证据没有推翻这一假设,我们说“接受”原假设,这意为着样本提供的证据已经证明=10是正确的。如果我们将原假设改为H0:=10.5,同样,在=0.05的水平上,样本提供的证据也没有推翻这一假设,我们又说“接受”原假设。但这两个原假设究竟哪一个是“真实的”呢?yyyy-M-6-42统计学统计学STATISTICS(第四版第四版)假设检验不能证明原假设正确假设检验不能证明原假设正确1.1.假假设设检检验验中中通通常常是是先先确确定定显显著著性性水水平平,这这就就等等于于控控制制了了第第 类类错错误误的的概概率率,但但犯犯第第类类错错误误的的概概率率却却是是不确定的不确定的2.2.在在拒拒绝绝H H0 0时时,犯犯第第类类错错误误的的概概率率不不超超过过给给定定的的显显著著性性水水平平,当当样样本本结结果果显显示示没没有有充充分分理理由由拒拒绝绝原原假假设时,也难以确切知道第设时,也难以确切知道第类错误发生的概率类错误发生的概率 3.3.采采用用“不不拒拒绝绝”而而不不采采用用“接接受受”的的表表述述方方式式,在在多数场合下便避免了多数场合下便避免了 错误发生的风险错误发生的风险n n因因为为“接接受受”所所得得结结论论可可靠靠性性将将由由第第类类错错误误的的概概率率 来来测测量量,而而 的的控控制制又又相相对对复复杂杂,有有时时甚甚至至根根本本无无法法知知道道的的值值,除除非非你你能能确确切切给给出出 ,否否则则就就不不宜宜表表述述成成“接接受受”原假设原假设yyyy-M-6-43统计学统计学STATISTICS(第四版第四版)假设检验不能证明原假设正确假设检验不能证明原假设正确 在实际检验中,针对一个具体的问题,将检验结果表述为“不拒绝”原假设,这似乎让人感到无所是从n n比比如如,你你想想购购买买一一批批产产品品,检检验验的的结结果果没没有有拒拒绝绝原原假假设设,即即达达到到合合同同规规定定的的标标准准要要求求,你你是是否否购购买买这这批批产产品品呢呢?这这时时,你你可可以以对对检检验验的的结结果果采采取取某某种种默默认认态态度度,退退一一步步说说,你你可可以以将将检检验验结结果果表表述述为为“可可可可以以以以接接接接受受受受”原原假假设设,你但这并不等于说你你但这并不等于说你“确实接受确实接受确实接受确实接受”它它yyyy-M-6-44统计学统计学STATISTICS(第四版第四版)统计上显著不一定有实际意义统计上显著不一定有实际意义1.当拒绝原假设时,我们称样本结果是统统计计上显著的上显著的(statistically Significant)2.当不拒绝原假设时,我们称样本结果是统统计上不显著的计上不显著的3.在“显著”和“不显著”之间没有清除的界限,只是在P值越来越小时,我们就有越来越强的证据,检验的结果也就越来越显著yyyy-M-6-45统计学统计学STATISTICS(第四版第四版)1.“显著的”(Significant)一词的意义在这里并不是“重重要要的的”,而是指“非非偶偶然然的的”2.一项检验在统计上是“显显著著的的”,意思是指:这样的(样本)结果不是偶然得到的,或者说,不是靠机遇能够得到的3.如果得到这样的样本概率(P)很小,则拒绝原假设n n在在这这么么小小的的概概率率下下竟竟然然得得到到了了这这样样的的一一个个样样本本,表表明明这这样样的的样样本本经经常常出出现现,所所以以,样样本本结果是显著的结果是显著的统计上显著不一定有实际意义统计上显著不一定有实际意义yyyy-M-6-46统计学统计学STATISTICS(第四版第四版)统计上显著不一定有实际意义统计上显著不一定有实际意义1.1.在在进进行行决决策策时时,我我们们只只能能说说P P值值越越小小,拒拒绝绝原原假假设设的的证据就越强,检验的结果也就越显著证据就越强,检验的结果也就越显著2.2.但但P P值值很很小小而而拒拒绝绝原原假假设设时时,并并不不一一定定意意味味着着检检验验的的结果就有实际意义结果就有实际意义n n因因为为假假设设检检验验中中所所说说的的“显显著著”仅仅仅仅是是“统统计计意意义义上上的的显显著著”n n一一个个在在统统计计上上显显著著的的结结论论在在实实际际中中却却不不见见得得就就很很重重要要,也也不意味着就有实际意义不意味着就有实际意义3.3.因因为为值值与与样样本本的的大大小小密密切切相相关关,样样本本量量越越大大,检检验验统统计计量量的的P P值值也也就就越越大大,P P值值就就越越小小,就就越越有有可可能能拒拒绝绝原假设原假设yyyy-M-6-47统计学统计学STATISTICS(第四版第四版)统计上显著不一定有实际意义统计上显著不一定有实际意义1.1.如果你主观上要想拒绝原假设那就一定能拒绝它如果你主观上要想拒绝原假设那就一定能拒绝它n n这类似于我们通常所说的这类似于我们通常所说的“欲加之罪,何患无词欲加之罪,何患无词欲加之罪,何患无词欲加之罪,何患无词”n n只要你无限制扩大样本量,几乎总能拒绝原假设只要你无限制扩大样本量,几乎总能拒绝原假设2.2.当样本量很大时,解释假设检验的结果需要小心当样本量很大时,解释假设检验的结果需要小心n n在在大大样样本本情情况况下下,总总能能把把与与假假设设值值的的任任何何细细微微差差别别都都能能查查出来,即使这种差别几乎没有任何实际意义出来,即使这种差别几乎没有任何实际意义3.3.在在实实际际检检验验中中,不不要要刻刻意意追追求求“统统计计上上的的”显显著著性性,也也不不要要把把统统计计上上的的显显著著性性与与实实际际意意义义上上的的显显著著性性混混同同起来起来n n一一个个在在统统计计上上显显著著的的结结论论在在实实际际中中却却不不见见得得很很重重要要,也也不不意为着就有实际意义意为着就有实际意义yyyy-M-6.2 一个总体参数的检验一个总体参数的检验 6.2.1 总体均值的检验总体均值的检验 6.2.2 总体比例的检验总体比例的检验 6.2.3 总体方差的检验总体方差的检验第第 6 章章 假设检验假设检验yyyy-M-6.2.1 总体均值的检验总体均值的检验 (大样本大样本)6.2 一个总体参数的检验一个总体参数的检验yyyy-M-6-50统计学统计学STATISTICS(第四版第四版)总体均值的检验总体均值的检验(大样本大样本)1.假定条件n n大样本大样本(n n 30)30)2.使用z检验统计量n n 2 2 已知:已知:n n 2 2 未知:未知:yyyy-M-6-51统计学统计学STATISTICS(第四版第四版)总体均值的检验总体均值的检验(2 已知已知)(例题分析例题分析大样本大样本)【例例例例6-46-4】一一种种罐罐装装饮饮料料采采用用自自动动生生产产线线生生产产,每每罐罐的的容容量量是是255ml255ml,标标准准差差为为5ml5ml。为为检检验验每每罐罐容容量量是是否否符符合合要要求求,质质检检人人员员在在某某天天生生产产的的饮饮料料中中随随机机抽抽取取了了4040罐罐进进行行检检验验,测测得得每每罐罐平平均均容容量量为为255.8ml255.8ml。取取显显著著性性水水平平=0.05=0.05 ,检检验验该该天天生生产产的的饮饮料料容容量量是是否否符合标准要求?符合标准要求?双侧检验双侧检验绿色绿色绿色绿色健康饮品健康饮品绿色绿色绿色绿色健康饮品255255255255255255yyyy-M-6-52统计学统计学STATISTICS(第四版第四版)总体均值的检验总体均值的检验(2 已知已知)(例题分析大样本例题分析大样本)H H0 0 :=255=255H H1 1 :255 255 =0.050.05n n =4040临界值临界值临界值临界值(c c):):检验统计量检验统计量检验统计量检验统计量:决策决策决策决策:结论结论结论结论:用用ExcelExcel中的【中的【NORMSDISTNORMSDIST】函数得到的双尾检验函数得到的双尾检验P=0.312945P=0.312945不拒绝不拒绝H H0 0没没有有证证据据表表明明该该天天生生产产的的饮饮料料不符合标准要求不符合标准要求 z01.96-1.960.005拒绝 H0拒绝 H00.005yyyy-M-6-53统计学统计学STATISTICS(第四版第四版)总体均值的检验总体均值的检验(z检验检验)(P 值的计算与应用值的计算与应用)第第1步:步:进入Excel表格界面,直接点击【fx】第第2步:步:在函数分类中点击【统计】,并在函数名 菜单下选择【NORMSDIST】,然后【确定】第第3步:步:将 z 的绝对值1.01录入,得到的函数值为 0.843752345 P值=2(1-0.843752345)=0.312495 P值远远大于,故不拒绝H0yyyy-M-6-54统计学统计学STATISTICS(第四版第四版)总体均值的检验总体均值的检验(2 未知未知)(例题分析例题分析大样本大样本)【例例例例6-56-5】一一种种机机床床加加工工的的零零件件尺尺寸寸绝绝对对平平均均误误差差为为1.35mm1.35mm。生生产产厂厂家家现现采采用用一一种种新新的的机机床床进进行行加加工工以以期期进进一一步步降降低低误误差差。为为检检验验新新机机床床加加工工的的零零件件平平均均误误差差与与旧旧机机床床相相比比是是否否有有显显著著降降低低,从从某某天天生生产产的的零零件件中中随随机机抽抽取取5050个个进进行行检检验验。利利用用这这些些样样本本数数据据,检检验验新新机机床床加加工工的的零零件件尺尺寸寸的的平平均均误误差差与与旧旧机机床床 相相 比比 是是 否否 有有 显显 著著 降降 低低?(=0.01)=0.01)左侧检验左侧检验5050个零件尺寸的误差数据个零件尺寸的误差数据个零件尺寸的误差数据个零件尺寸的误差数据 (mmmm)1.261.191.310.971.811.130.961.061.000.940.981.101.