八章假设检验与方差分析.pptx
正正如如一一个个法法庭庭宣宣告告某某一一判判决决为为“无无罪罪”而而不不为为“清清白白(innocent)”(innocent)”,统统计计检检验验的的结结论论也也应应为为“不拒绝不拒绝”而不为而不为“接受接受”。Jan Kmenta第1页/共136页假设检验假设检验1 假设检验的基本问题假设检验的基本问题 2 一个总体参数的检验一个总体参数的检验3 两个总体参数的检验两个总体参数的检验第2页/共136页假设检验在统计方法中的地位描述统计描述统计推断统计推断统计参数估计参数估计假设检验假设检验统计方法统计方法第3页/共136页第一节 假设检验的基本问题1 假设的陈述2 两类错误与显著性水平3 统计量与拒绝域4 利用P值进行决策5 统计显著性与实际显著性第4页/共136页请勿试图选出最合理的假设,只需要剔除无法证实的假设这就是假设检验的基础:证伪。参数估计是利用样本信息推断未知的总体参数,而假设检验则是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立。第5页/共136页假设的陈述假设的陈述第6页/共136页什么是假设?(hypothesis)对总体参数的具体数值所作的陈述,称为假设总体参数包括总体均值总体均值、比例比例、方差方差等分析之前之前必须陈述我认为这种新药的疗效我认为这种新药的疗效比原有的药物更有效比原有的药物更有效!第7页/共136页什么是假设检验?(hypothesis test)假设检验:先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程逻辑上运用反证法,统计上依据小概率原理第8页/共136页假设检验的基本思想.因此我们拒因此我们拒因此我们拒绝假设绝假设绝假设 =50=50=50.如果这是总如果这是总如果这是总体的假设均值体的假设均值体的假设均值样本均值样本均值样本均值 =50=50抽样分布抽样分布抽样分布H H H0 00这个值不像我这个值不像我这个值不像我们应该得到的们应该得到的们应该得到的样本均值样本均值样本均值.202020第9页/共136页总体总体假设检验的过程抽取随机样本抽取随机样本均值均值 x x =20=20我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 提出假设提出假设 拒绝假设 别无选择!作出决策作出决策第10页/共136页原假设与备择假设原假设与备择假设第11页/共136页原假设(null hypothesis)研究者想收集证据予以反对的假设又称“0假设”总是有符号 ,或4.表示为 H0H0:=某一数值 指定为符号=,或 例如,H0:10cm第12页/共136页为什么叫 0 假设?之之所所以以用用零零来来修修饰饰原原假假设设,其其原原因因是是原原假假设设的的内内容容总总是是表表示示没没有有差差异异或或没没有有改改变变,或变量间没有关系等等或变量间没有关系等等零假设总是一个与总体参数有关的问题,所以总是用希腊字母表示。关于样本统计量如样本均值或样本均值之差的零假设是没有意义的,因为样本统计量是已知的,当然能说出它们等于几或是否相等第13页/共136页研究者想收集证据予以支持的假设也称“研究假设”总是有符号 ,或 表示为 H1H1:某一数值,或 某一数值例如,H1:10cm,或 10cm备择假设(alternative hypothesis)第14页/共136页【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设提出假设(例题分析)解解解:研研研究究究者者者想想想收收收集集集证证证据据据予予予以以以证证证明明明的的的假假假设设设应应应该该该是是是“生产过程不正常生产过程不正常生产过程不正常”。建立的原假设和备择假设为。建立的原假设和备择假设为。建立的原假设和备择假设为 H HH0 0 0:10cm 10cm 10cm H HH1 1 1:10cm 10cm 10cm (双侧检验)(双侧检验)(双侧检验)第15页/共136页【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500g。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设提出假设(例题分析)解解解:研研研究究究者者者抽抽抽检检检的的的意意意图图图是是是倾倾倾向向向于于于证证证实实实这这这种种种洗洗洗涤涤涤剂剂剂的的的平平平均均均净净净含含含量量量并并并不不不符符符合合合说说说明明明书书书中中中的的的陈陈陈述述述 。建建建立的原假设和备择假设为立的原假设和备择假设为立的原假设和备择假设为 H H H0 0 0:500 500 500 H H H1 1 1:500 500”或“”的假设检验,称为单侧检验或单尾检验(one-tailed test)备择假设的方向为“”,称为右侧检验 单侧检验与双侧检验第23页/共136页单侧检验与双侧检验(假设的形式)以总体均值的检验为例以总体均值的检验为例第24页/共136页两类错误与显著性水平两类错误与显著性水平第25页/共136页假设检验的目的是要根据样本信息作出决策,也就是作出是否拒绝原假设而倾向于备择假设的决策。决策是建立在样本信息的基础上,而样本是随机的,因此有可能犯错误。理想的状态是:当原假设H H0 0正确时没有拒绝它;当原假设H H0 0不正确时拒绝它。第26页/共136页假设检验中的两类错误1.第类错误(弃真错误)原假设为正确时拒绝原假设第类错误的概率被称为显著性水平,记为2.第类错误(取伪错误)原假设为错误时未拒绝原假设第类错误的概率记为(Beta)第27页/共136页H H0 0:无罪无罪假设检验中的两类错误(决策结果)假设检验就好像一场审判过程假设检验就好像一场审判过程统计检验过程统计检验过程统计检验过程第28页/共136页 错误和 错误的关系12 你要同时减少两类错误的惟一办法是增加样本容量!减少抽样分布的分散性 和和 的关系就像的关系就像翘翘板,翘翘板,小小 就就大,大,大大 就小就小第29页/共136页第二类错误(取伪)是把不正确的原假设当做正确的接受而犯的错误。记概率为 第一类错误(弃真)是在原假设为真的情况下,检验统计量刚好落入小概率的拒绝区域,使我们下了拒绝原假设的结论。犯第一类错误的概率大小就等于显著性水平的大小。越小,犯第一类错误的可能性就越小。弃真取伪 和和 的关系就像的关系就像翘翘板,翘翘板,小小 就就大,大,大大 就小就小第30页/共136页两类错误的控制11一般来说,对于一个给定的样本,如果犯第类错误的代价比犯第类错误的代价相对较高,则将犯第类错误的概率定得低些较为合理;反之,如果犯第类错误的代价比犯第类错误的代价相对较低,则将犯第类错误的概率定得高些一般来说,发生哪一类错误的后果更为严重,就应该首要控制哪类错误发生的概率。但由于犯第类错误的概率是可以由研究者控制的,因此在假设检验中,人们往往先控制第类错误的发生概率第31页/共136页检验能力(power of test)拒绝一个错误的原假设的能力根据 的定义,是指没有拒绝一个错误的原假设的概率。这也就是说,1-则是指拒绝一个错误的原假设的概率,这个概率被称为检验能力,也被称为检验的势或检验的功效(power)可解释为正确地拒绝一个错误的原假设的概率此外,样本容量是另一个重要指标第32页/共136页显著性水平 (significant level)1.是一个概率值2.原假设为真时,拒绝原假设的概率抽样分布的拒绝域3.表示为(alpha)常用的 值有0.01,0.05,0.10,小概率的界限。4.由研究者事先确定(标准)第33页/共136页我们可以在事先确定用于拒绝原假设H0的证据必须强到何种程度。这等于说我们要求多小的P值。而这个P值就叫显著性水平,用表示显著性水平表示总体中某一类数据出现的经常程度假如我们选择,样本数据能拒绝原假设的证据要强到:当H0正确时,这种样本结果发生的频率不超过5%;如果我们选择=0.01,就是要求拒绝H0的证据要更强,这种样本结果发生的频率只有1%如果P值小于或等于,我们称该组数据不利于原假设的证据有的显著性水平显著性水平 (significant level)第34页/共136页significant(显著的)一词的意义在这里并不是“重要的”,而是指“非偶然的”在假设检验中,如果样本提供的证据拒绝原假设,我们说检验的结果是显著的,如果不拒绝原假设,我们则说结果是不显著的一项检验在统计上是“显著的”,意思是指:这样的(样本)结果不是偶然得到的,或者说,不是靠机遇能够得到的拒绝原假设,表示这样的样本结果并不是偶然得到的;不拒绝原假设(拒绝原假设的证据不充分),则表示这样的样本结果只是偶然得到的统计显著性(significant)第35页/共136页假设检验中的小概率原理 什么小概率?1.在一次试验中,一个几乎不可能发生的事件发生的概率(10%,5%,1%?)2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设3.小概率由研究者事先确定第36页/共136页统计量与拒绝域统计量与拒绝域第37页/共136页在一般的假设检验过程中,研究者倾向于通过样本信息提供对备择假设的支持,而倾向于作出“拒绝原假设”的结论。样本提供的信息繁杂,往往需要对这些信息进行压缩和提炼,检验统计量便是对样本信息进行压缩和概括的结果。第38页/共136页根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量对样本估计量标准化的依据是原假设H0为真点估计量的抽样分布 检验统计量(test statistic)标准化标准化的检验统计量(如的检验统计量(如Z Z*)第39页/共136页假设检验的基本原理根据检验统计量建立一个准则,依据这个准则(及 下的Z/2)和计算得到的检验统计量(Z*),研究者就可以决定是否拒绝原假设。能够拒绝原假设的检验统计量的所有可能取值的集合,称为拒绝域。是由显著性水平所围成的区域。(小概率区域概率为)(大概率区域概率为1-)根据给定的限制性水平确定的拒绝域的边界值,称为临界值。第40页/共136页显著性水平和拒绝域(双侧检验)抽样分布抽样分布抽样分布H HH000临界值临界值临界值临界值临界值临界值 /2/2 /2/2/2 拒绝拒绝拒绝H HH000拒绝拒绝拒绝H HH0001-1-1-置信水平置信水平置信水平拒绝域拒绝域拒绝域非拒绝域非拒绝域非拒绝域拒绝域拒绝域拒绝域第41页/共136页显著性水平和拒绝域(双侧检验)H H0 0临界值临界值临界值临界值/2/2/2/2 样本统计量样本统计量拒绝拒绝H H0 0拒绝拒绝H H0 0抽样分布抽样分布1-1-置信水平置信水平第42页/共136页显著性水平和拒绝域(双侧检验)H H0 0临界值临界值临界值临界值/2/2/2/2 样本统计量样本统计量拒绝拒绝H H0 0拒绝拒绝H H0 0抽样分布抽样分布1-1-置信水平置信水平第43页/共136页显著性水平和拒绝域(双侧检验)H H0 0临界值临界值临界值临界值/2/2/2/2 样本统计量样本统计量拒绝拒绝H H0 0拒绝拒绝H H0 0抽样分布抽样分布1-1-置信水平置信水平第44页/共136页显著性水平和拒绝域(单侧检验)H H0 0临界值临界值 拒绝拒绝H H0 0抽样分布抽样分布1-1-置信水平置信水平Region of RejectionRegion of RejectionRegion of Rejection非拒绝域非拒绝域非拒绝域Region of NonrejectionRegion of NonrejectionRegion of Nonrejection第45页/共136页显著性水平和拒绝域(左侧检验)H HH0 00临界值临界值临界值 拒绝拒绝拒绝H HH0 00抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平样本统计量样本统计量样本统计量第46页/共136页显著性水平和拒绝域(左侧检验)H HH0 00临界值临界值临界值 样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH0 00抽样分布抽样分布1-1-1-置信水平置信水平第47页/共136页显著性水平和拒绝域(右侧检验)H HH0 00临界值临界值临界值 样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH0 00抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平第48页/共136页显著性水平和拒绝域(右侧检验)H HH0 00临界值临界值临界值 样本统计量样本统计量样本统计量抽样分布抽样分布1-1-1-置信水平置信水平拒绝拒绝拒绝H HH0 00第49页/共136页决策规则给定显著性水平(误犯错的风险),查表得出相应的临界值z 或z/2/2,t 或t/2/2将检验统计量的值与 水平的临界值进行比较作出决策双侧检验:I统计量I 临界值,拒绝H0左侧检验:统计量 临界值,拒绝H0第50页/共136页利用 P 值 进行决策第51页/共136页什么是P 值?(P-value)如果原假设H0为真条件下,观测到至少和由样本计算值一样大的经验统计量值的条件概率。P值告诉我们:如果原假设是正确的话,我们得到得到目前这个样本数据的可能性有多大,如果这个可能性很小,就应该拒绝原假设。P值度量了数据对零假设有多大的支持:P值越小,支持越小。但是怎样的支持水平认为是小的被称为观察到的(或实测的)显著性水平决策规则:若p值5200 n=36临界值临界值(c):检验统计量检验统计量:拒绝拒绝H H0 0(P P=0.000088 0.000088 F ,则拒绝原假设H0,表明均值之间的差异是显著的,所检验的因素对观察值有显著影响若FF ,则不拒绝原假设H0,无证据表明所检验的因素对观察值有显著影响 第133页/共136页单因素方差分析表(基本结构)第134页/共136页单因素方差分析(例题分析)第135页/共136页感谢您的观看!第136页/共136页