八章假设检验的基本概念.pptx
第一节 检验假设与P值第1页/共52页 假设检验过去称显著性检验。它是利假设检验过去称显著性检验。它是利用小概率反证法思想,从问题的对立面用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题出发间接判断要解决的问题(H1)是否是否成立。然后在成立。然后在H0成立的条件下计算检验成立的条件下计算检验统计量,最后获得统计量,最后获得P值来判断值来判断。假设检验基本思想假设检验基本思想第2页/共52页问题实质上都是希望通过样本统计量与总体参数的差别,或两个样本统计量的差别,来推断总体参数是否不同。这种识别的过程,就是本章介绍的假设检验(hypothesis test)。第3页/共52页例81通过以往大规模调查,已知某地一般新生儿的头围均数为,标准差为。为研究某矿区新生儿的发育状况,现从该地某矿区随机抽取新生儿55人,测得其头围均数为,问该矿区新生儿的头围总体均数与一般新生儿头围总体均数是否不同?第4页/共52页 假假设设检检验验的的目目的的就就是是判判断断差差别别是是由哪种原因造成的。由哪种原因造成的。抽样误差造成的;抽样误差造成的;本质差异造成的。本质差异造成的。第5页/共52页一般新生儿头围矿区新生儿头围一种假设H0另一种假设H1抽样误差总体不同第6页/共52页 第二节 假设检验的基本步骤第7页/共52页s例81 通过以往大规模调查,已知某地一般新生儿的头围均数为,标准差为。为研究某矿区新生儿的发育状况,现从该地某矿区随机抽取新生儿55人,测得其头围均数为,问该矿区新生儿的头围总体均数与一般新生儿头围总体均数是否不同?第8页/共52页第9页/共52页H1的的内内容容直直接接反反映映了了检检验验单单双双侧侧。若若H1中中只只是是 0或或 0,则则此此检检验验为为单侧检验。它不仅考虑有无差异,而且还考虑差异的方向。单侧检验。它不仅考虑有无差异,而且还考虑差异的方向。单单双双侧侧检检验验的的确确定定,首首先先根根据据专专业业知知识识,其其次次根根据据所所要要解解决决的的问问题题来来确确定定。若若从从专专业业上上看看一一种种方方法法结结果果不不可可能能低低于于或或高高于于另另一一种种方方法法结结果果,此此时时应应该该用用单单侧侧检检验。一般认为双侧检验较保守和稳妥。验。一般认为双侧检验较保守和稳妥。第10页/共52页(3)检检验验水水准准,过过去去称称显显著著性性水水准准,是是预预先先规规定定的的概概率率值值,它它确确定定了了小小概概率率事件的标准。在实际工作中常取事件的标准。在实际工作中常取 =。可根据不同研究目的给予不同设置。可根据不同研究目的给予不同设置。第11页/共52页第12页/共52页 根据变量和资料类型、设计方根据变量和资料类型、设计方案、统计推断的目的、是否满足特案、统计推断的目的、是否满足特定条件等(如定条件等(如数据的分布类型数据的分布类型)选)选择相应的检验统计量。择相应的检验统计量。2.计算检验统计量计算检验统计量第13页/共52页 3.确定确定P值,下结论值,下结论如例81已得到P60)或已知时。检验统计量分别为P121 例8-2第20页/共52页P121 例8-2s例82(续例7-5)1995年,已知某地20岁应征男青年的平均身高为。2003年,在当地20岁应征男青年中随机抽取85人,平均身高为171.2 cm,标准差为,问2003年当地20岁应征男青年的身高与1995年相比是否不同?第21页/共52页P121 例8-2s检验界值u,u,u u,得P,按水准,拒绝H0,接受H1,2003年当地20岁应征男青年与1995年相比,差别有统计学意义。可认为2003年当地20岁应征男青年的身高有变化,比1995年增高了。第22页/共52页P121 例8-2s由例7-5可知,2003年当地20岁应征男青年身高总体均数的95%的可信区间为。该区间的下限已高于1995年身高的总体均数,也说明2003年20岁应征男青年增高了。第23页/共52页二、两样本比较的u检验(two-sampleu-test)适 用 于 两 样 本 含 量 较 大(如 n130且n230)时。检验统计量为P122 例8-3两均数之差的标准误的估计值第24页/共52页P122 例8-3两均数之差的标准误的估计值第25页/共52页由于u,u,|u|u,得P,按水准,拒绝H0,接受H1,两组间差别有统计学意义。可以认为试验组和对照组退热天数的总体均数不相等,两组的疗效不同。试验组的平均退热天数比对照组短。例7-7已计算了的95%的可信区间:天,给出了两总体均数差别的数量大小。P122 例8-3两均数之差的标准误的估计值第26页/共52页第四节 大样本率的假设检验第27页/共52页率的u检验的应用条件:1、n较大,如每组例数大于60例。2、样本p或1-p均不接近100%和0。3、np和n(1-p)均大于5。第28页/共52页一、单样本率的一、单样本率的 u u检验检验 适用于样本率与已知的总体率的比较 P123例例8-4第29页/共52页例例84 已知某地已知某地40岁以上成年男性高血压患病岁以上成年男性高血压患病率为率为8.5%(0),经健康教育数年后,随机),经健康教育数年后,随机抽取该地成年男性抽取该地成年男性1000名,查出高血压患者名,查出高血压患者55例,患病率(例,患病率(p)为)为5.5%。问经健康教育。问经健康教育后,该地成年男性高血压患病率是否有降低后,该地成年男性高血压患病率是否有降低?第30页/共52页 s单侧界值u,现|u|u,故P0.01,按水准拒绝H0,接受H1,差异有统计学意义,可认为经健康教育后,该地成年男性高血压患病率有所降低。第31页/共52页二、两个率比较的二、两个率比较的u检验检验 推断两个总体率是否相同推断两个总体率是否相同 P124例例8-5第32页/共52页例例85 某医院用黄芪注射液和胎盘球蛋白进行某医院用黄芪注射液和胎盘球蛋白进行穴位注射治疗小儿支气管哮喘病人,黄芪注穴位注射治疗小儿支气管哮喘病人,黄芪注射液治疗射液治疗117例,有效例,有效103例;胎盘球蛋白治例;胎盘球蛋白治疗疗55例,有效例,有效49例。试比较两种疗法有效率例。试比较两种疗法有效率有无差别有无差别 第33页/共52页 su,现|u|u,故P,按=检验水准接受H0,差异无统计学意义,尚不能认为两种疗法治疗小儿支气管哮喘的疗效有差别。第34页/共52页第五节 检验水准与两类错误 第35页/共52页I型错误和型错误和II型错误型错误 假假设设检检验验是是利利用用小小概概率率反反证证法法思思想想,从从问问题题的的对对立立面面(H0)出出发发间间接接判判断断要要解解决决的的问问题题(H1)是是否否成成立立,然然后后在在假假定定H0成成立立的的条条件件下下计计算算检检验验统统计计量量,最最后后根根据据P值值判判断断结结果果,此此推推断断结结论论具具有有概概率率性性,因因而而无无论论拒拒绝绝还还是是不不拒拒绝绝H0,都可能犯错误。详见表都可能犯错误。详见表8-1。第36页/共52页 I I 型错误:型错误:“实际无差别,但下了有差别的结论实际无差别,但下了有差别的结论”,假阳性错误假阳性错误。犯这种错误的。犯这种错误的概率是概率是(其值等于检验水准其值等于检验水准)IIII型错误型错误:“实际有差别,但下了不拒绝实际有差别,但下了不拒绝H H0 0的结论的结论”,假阴性错误假阴性错误。犯这种错误的。犯这种错误的概率是概率是(其值未知其值未知)。但但 n n 一定时,一定时,增大,增大,则减少则减少 。第37页/共52页可能发生的两类错误可能发生的两类错误第38页/共52页图图8-2 I型错误与型错误与II型错误示意图型错误示意图(以单侧以单侧u检验为检验为例例)第39页/共52页 1-1-:检验效能检验效能(powerpower):当当两总体确有差别,按两总体确有差别,按检验水准检验水准 所能发现这种差别所能发现这种差别的能力。的能力。第40页/共52页 减少(增加)I型错误,将会增加(减少)II型错误增大n 同时降低 与与 与与 间的关系第41页/共52页减少I型错误的主要方法:假设检验时设定 值。减少II型错误的主要方法:提高提高检验效能检验效能。提高提高检验效能的最有效方法:检验效能的最有效方法:增加样本量增加样本量。如何选择合适的样本量:选择合适的样本量:实验设计实验设计。第42页/共52页第六节第六节 单侧检验与双侧检验单侧检验与双侧检验 第43页/共52页图83 双侧u检验的检验水准 n图84 单侧u检验的检验水准 单侧检验 概念第44页/共52页 第七节 假设检验的统计意义与实际意义 第45页/共52页1.要有严密的研究设计,尤其是下要有严密的研究设计,尤其是下因果因果结论。结论。2.不同的资料应选用不同检验方法。不同的资料应选用不同检验方法。3.正确理解正确理解“显著性显著性”一词的含义一词的含义(用用统计学意义统计学意义一词一词替代替代)。第46页/共52页4.结论不能绝对化结论不能绝对化,提倡使用精确提倡使用精确P值值。5.注意统计注意统计“显著性显著性”与医学与医学/临床临床/生物生物 学学“显著性显著性”的区别的区别 第47页/共52页 6.可信区间与假设检验各自不同可信区间与假设检验各自不同的作用,要结合使用。的作用,要结合使用。一方面,可信区间亦可回答假设检验的问题,算得的可信区间若包含了H0,则按 水准,不拒绝H0;若不包含H0,则按 水准,拒绝H0,接受H1。第48页/共52页 另一方面,可信区间不但能回答差别有无统计学意义,而且还能比假设检验提供更多的信息,即提示差别有无实际的专业意义。第49页/共52页可信区间在统计推断上提供的信息第50页/共52页 虽然可信区间亦可回答假设检验的问题,并能提供更多的信息,但并不意味着可信区间能够完全代替假设检验。可信区间只能在预先规定的概率 检验水准 的前提下进行计算,而假设检验能够获得一较为确切的概率P值。第51页/共52页感谢您的观看!第52页/共52页