第七章 假设检验基础(2012).ppt
第七章第七章 假设检验基础假设检验基础李志春李志春新乡医学院公共卫生学院新乡医学院公共卫生学院主要内容主要内容第一节第一节 假设检验的概念与原理假设检验的概念与原理第二节第二节 t 检验检验第三节第三节 二项分布与泊松分布资料的二项分布与泊松分布资料的Z检验检验第四节第四节 假设检验与区间估计的关系假设检验与区间估计的关系第五节第五节 假设检验的功效假设检验的功效第六节第六节 正态性检验正态性检验第一节第一节 假设检验的概念与原理假设检验的概念与原理一、假设检验的思维逻辑一、假设检验的思维逻辑今天中午吃什么?今天中午吃什么?可选方案:面条、米饭可选方案:面条、米饭买小米手机吗?买小米手机吗?对手机评价:适合对手机评价:适合(买买)、不适合、不适合(不买不买)国庆节去八里沟怎样吗?国庆节去八里沟怎样吗?对景区的评价:好玩对景区的评价:好玩(去去)、不好玩、不好玩(不去不去)人们在日常生活中都在做人们在日常生活中都在做决策决策 n所有的决策都遵循相同的基本模式所有的决策都遵循相同的基本模式n陈述多种可供选择的方案(假设)陈述多种可供选择的方案(假设)n收集支持这些方案的证据收集支持这些方案的证据n根据证据的强弱做出决策根据证据的强弱做出决策n根据决定执行某种行为根据决定执行某种行为统计学中的统计学中的假设检验假设检验也是一种决策过程,同样遵循也是一种决策过程,同样遵循这一基本模式。这一基本模式。假设检验假设检验(hypothesis test)(hypothesis test)它将被选择的方案表述为它将被选择的方案表述为两种对立的假设两种对立的假设,然,然后后针对其中的一个假设收集证据针对其中的一个假设收集证据,根据,根据证据的证据的强弱强弱来决定来决定是否拒绝这个假设是否拒绝这个假设。假设检验假设检验,有时也称,有时也称显著性检验显著性检验(significance test),它是在两种相反的假设之间做出决定的,它是在两种相反的假设之间做出决定的一个过程。一个过程。例例7-1 已知北方农村儿童前囟门闭合月龄为已知北方农村儿童前囟门闭合月龄为14.114.1月月。某研究人员从东北某县(缺钙地区)抽取。某研究人员从东北某县(缺钙地区)抽取3636名儿名儿童,得前囟门闭合月龄均值为童,得前囟门闭合月龄均值为14.314.3月,标准差为月,标准差为5.085.08月。问该县儿童前囟门闭合月龄是否迟于一般月。问该县儿童前囟门闭合月龄是否迟于一般儿童?儿童?研究背景:研究缺钙对幼儿生长发育的影响研究背景:研究缺钙对幼儿生长发育的影响研究结果可供选择的结论(目前的假设)有哪些?研究结果可供选择的结论(目前的假设)有哪些?1.该县儿童总体平均闭合月龄与一般儿童没有差异该县儿童总体平均闭合月龄与一般儿童没有差异2.该县儿童总体平均闭合月龄迟于一般儿童该县儿童总体平均闭合月龄迟于一般儿童两种假设在统计上的含义两种假设在统计上的含义n抽样研究存在抽样研究存在抽样误差!抽样误差!总体均数=14.1样本1样本21=14.1样本1样本2样本3从总体总体1中抽样214.1从总体总体2中抽样均数与14.1之间的差异是抽样误差抽样误差造成均数与14.1之间的差异是本质差异本质差异造成1=14.1样本总体总体1214.1总体总体2?即:需要即:需要推断推断14.3与与14.1之间的之间的差异是由差异是由抽样误差抽样误差造成,还是造成,还是由由本质差异本质差异造成的?造成的?0=14.1统计上将前述两种差异表达为两种对立的假设两种对立的假设实际观察到的样本实际观察到的样本1现在用两个符号来分别代表前面的两个总体,现在用两个符号来分别代表前面的两个总体,0表示一般儿童平均闭合时间表示一般儿童平均闭合时间 1表示表示样本所来自的总体样本所来自的总体平均闭合时间平均闭合时间假设假设1:观察到的差异是由抽样误差抽样误差造成的即,1=0称为:称为:零假设零假设(Null Hypothesis),或或原假设原假设符号表示:符号表示:H0假设假设2:观察到的差异是由本质差异本质差异造成的即,1 0称为:称为:备择假设备择假设(Alternative Hypothesis)符号表示:符号表示:H1注意:所有的注意:所有的假设检验假设检验都是对都是对零假设零假设(H0)进行检验进行检验!在目前观察结果的状况下,收集在目前观察结果的状况下,收集“否定否定H0的证据的证据”,证据的强弱用概率证据的强弱用概率p表示,概率越小证据越强,否定表示,概率越小证据越强,否定H0的理由就越充分。的理由就越充分。备择假设备择假设:有时也叫研究假设,它表示研究者希:有时也叫研究假设,它表示研究者希望得到的结论。望得到的结论。研究者习惯称研究者习惯称备择假设备择假设为为“阳性结论阳性结论”;而将而将零假设零假设称为称为“阴性结论阴性结论”它是利用反证法思想,从问题的对立面它是利用反证法思想,从问题的对立面(H0)出发间接判断要解决的问题出发间接判断要解决的问题(H1)是否成立。是否成立。假设在假设在H0成立的条件下计算检验统计量,获成立的条件下计算检验统计量,获得得P值,根据小概率原理来判断是否值,根据小概率原理来判断是否否定否定H0。假设检验基本思想基本思想理解两点:反证法思想、小概率原理理解两点:反证法思想、小概率原理二、假设检验的基本步骤二、假设检验的基本步骤零假设零假设 H H0 0:=14.1=14.1备择假设备择假设 H H1 1:14.114.1检验水准(检验水准(size of a testsize of a test):定义小概率):定义小概率事件的水平,用事件的水平,用表示。表示。通常取通常取=0.05=0.05,有时取,有时取0.01.0.01.1.建立检验假设并确定检验水准建立检验假设并确定检验水准 本例,计算本例,计算t t检验的统计量检验的统计量t t自由度自由度:根据资料类型,目的等选择恰当的方法根据资料类型,目的等选择恰当的方法如如Z检验、检验、t检验、方差分析、卡方检验等检验、方差分析、卡方检验等2.2.选择恰当的统计检验方法,计算统计量选择恰当的统计检验方法,计算统计量3.3.确定确定P P值值P P值的定义值的定义 如果如果H H0 0成立的条件下,出现统计量目成立的条件下,出现统计量目前值及更不利于前值及更不利于H H0 0的数值的概率。的数值的概率。直观地看:就是统计量对应分布曲线下直观地看:就是统计量对应分布曲线下的的尾部面积。尾部面积。样本计算出来的样本计算出来的t值值P值示意图值示意图通过查表可以得到通过查表可以得到对应统计量的尾部对应统计量的尾部面积,即面积,即P值值4.4.做推断结论做推断结论假设检验的推断结论的出发点是:是否否定是否否定H H0 02.若若P P,则意味着在H0成立的条件下获得目前的情况不是一个小概率事件小概率事件,那么就还没有充足的理由否定还没有充足的理由否定H H0 0。于是做出不拒绝不拒绝H H0 0的决策。判断准则(小概率原理)判断准则(小概率原理)1.若若P P,则意味着在H0成立的条件下获得目前的情况是一个小概率事件小概率事件,根据“小概率原理”,有充分的理由怀疑H0的真实性,从而否定(拒绝)否定(拒绝)H H0 0,于是只能接受接受H H1 1。第二节第二节 t 检验检验假设检验的具体方法,通常以选定的检验假设检验的具体方法,通常以选定的检验统计量命名。常用的检验有:统计量命名。常用的检验有:t检验和检验和Z检检验。验。大家应掌握各种检验方法的用途、适大家应掌握各种检验方法的用途、适用条件和注意事项。用条件和注意事项。n应用条件应用条件n随机样本随机样本n来自正态总体来自正态总体n两样本均数比较时,要求两总体方差齐两样本均数比较时,要求两总体方差齐一、单样本资料的一、单样本资料的t t检验检验检验假设检验假设H H0 0 :=0 0,H H1 1 :0 0(单侧检验(单侧检验 0 0或或 0 0)统计量统计量:见例见例7-1 7-1 目的:目的:推断样本来自的总体均数与已知的总体推断样本来自的总体均数与已知的总体均数有无差别均数有无差别二、配对设计资料的二、配对设计资料的t检验检验 n配对设计主要形式配对设计主要形式n异体配对异体配对n自身配对自身配对 检验假设为检验假设为H H0 0:d d=0=0,H H1 1 :d d0 0当成立时,检验统计量当成立时,检验统计量 分析要点:分析要点:对每对的两个观察值之差进行分析,推断对每对的两个观察值之差进行分析,推断差值的总体均数是否为差值的总体均数是否为0例例72 某儿科采用静脉注射人血丙种球蛋白某儿科采用静脉注射人血丙种球蛋白治疗小儿急性毛细支气管炎。用药前后患儿治疗小儿急性毛细支气管炎。用药前后患儿血清中免疫球蛋白血清中免疫球蛋白IgG(mg/dl)含量如)含量如表表61所示。试问用药前后所示。试问用药前后IgG有无变化?有无变化?序号序号用药前用药前用药后用药后差值差值 1 1206.441678.44472.00 2 921.691293.36371.67 3 1294.081711.66417.58 4 945.361416.70471.34 5 721.361204.55483.19 6 692.321147.30454.97 7 980.011379.59399.58 8 691.011091.46400.45 9 910.391360.34449.9510 568.561091.83523.3711 1105.521728.03622.5112 757.431398.86641.44表表71 用药前后患儿血清中免疫球蛋白用药前后患儿血清中免疫球蛋白IgG(mg/dl)含量含量 检验假设:检验假设:H0:d=0,H1:d0 =0.05 n=12,d=5707.95,=d/n=5707.95/12=475.66 d2=2793182.166 n计算统计量计算统计量 =n n-1=12-1=11-1=12-1=11 查附表查附表2(t临界值表),临界值表),t0.05,11=2.201,得,得P0.20,在,在=0.05水平上不能拒绝水平上不能拒绝H0,差别无差别无统计学意义。统计学意义。所以尚不能认为两法测定结果不所以尚不能认为两法测定结果不同。同。三、两组独立样本资料的三、两组独立样本资料的t检验检验将受试对象随机分配成两个处理组,每一组随机将受试对象随机分配成两个处理组,每一组随机接受一种处理。一般把这样获得的两组资料视接受一种处理。一般把这样获得的两组资料视为代表两个不同总体的两份样本,据以推断它们为代表两个不同总体的两份样本,据以推断它们的总体均数是否相等。的总体均数是否相等。适用于完全随机设计的两样本均数的比适用于完全随机设计的两样本均数的比较。此类比较分为两种情况。较。此类比较分为两种情况。(一)(一)两样本所属总体方差相等两样本所属总体方差相等检验假设为:检验假设为:H0:1=2,H1:12已知当已知当H0成立时,检验统计量成立时,检验统计量 =n1+n22 n合并方差合并方差:例例74 某口腔科测得长春市某口腔科测得长春市1316岁居民男性岁居民男性20人的恒牙初期腭弓深度均值为人的恒牙初期腭弓深度均值为17.15mm,标准差标准差为为1.59mm;女性女性34人的均值为人的均值为16.92mm,标准,标准差为差为1.42mm。根据这份数据可否认为该市。根据这份数据可否认为该市1316岁居民腭弓深度有性别差异?岁居民腭弓深度有性别差异?检验假设检验假设H0:1=2 (男性与女性腭弓深度相同)男性与女性腭弓深度相同)H1:12(男性与女性腭弓深度不同(男性与女性腭弓深度不同)=0.05这里这里n1=20,mm,S1=1.59mm,n2=34,mm,S2=1.42mm。=n1+n22=20+342=52查附表查附表2(t临界值表),临界值表),t0.5,50=0.679,知知P0.5,在在=0.05水准上尚不能拒绝水准上尚不能拒绝H0。所以还不能认为。所以还不能认为该市该市1316岁居民腭弓深度有性别差异。岁居民腭弓深度有性别差异。(二)(二)两样本所属总体方差不等两样本所属总体方差不等Satterthwaite近似法近似法 检验假设为检验假设为 H0:1=2,H1:12计算统计量计算统计量t:n校正自由度校正自由度 例例75 为探讨硫酸氧钒对糖尿病性白内障的防治为探讨硫酸氧钒对糖尿病性白内障的防治作用,研究人员将已诱导糖尿病模型的作用,研究人员将已诱导糖尿病模型的20只大鼠只大鼠随机分为两组。一组用硫酸氧钒治疗随机分为两组。一组用硫酸氧钒治疗(DV组组),另,另一组作对照观察一组作对照观察(D组组),12周后测大鼠血糖含量周后测大鼠血糖含量(mmol/L)。结果为,)。结果为,DV组组12只,样本均数为只,样本均数为6.5mmol/L,标准差为标准差为1.34mmol/L;D组组8只,样本只,样本均数为均数为13.7mmol/L,标准差为标准差为4.21mmol/L。试问。试问两组动物血糖含量的总体均数是否相同?两组动物血糖含量的总体均数是否相同?检验假设检验假设H0:1=2,H1:12=0.05 查附表查附表2(t临界值表),得临界值表),得 ,知知P0.05,在在=0.05水平上拒绝水平上拒绝H0。所以可认为经硫酸氧。所以可认为经硫酸氧钒治疗的大鼠与未治疗大鼠的血糖含量不同。钒治疗的大鼠与未治疗大鼠的血糖含量不同。检验假设检验假设 H0:H1:1=n11,2=n21 四、两组独立样本资料的方差齐性检验四、两组独立样本资料的方差齐性检验 例例76 试检验例试检验例75 中两组(中两组(DV组与组与D组)组)大鼠接受相应处理大鼠接受相应处理12周后测得的血糖含量周后测得的血糖含量(mmol/L)是否具有方差齐性?)是否具有方差齐性?查附表查附表3.2,F0.05(7,11)=3.76,知知P25=0.05 计算统计量计算统计量 确定确定P P值和作推断值和作推断 Z Z=0.916(=0.916(单侧单侧)对应的单侧概率为对应的单侧概率为P=0.1788P=0.1788,因此,因此P P0.050.05,按,按=0.05=0.05水准,尚不能拒绝水准,尚不能拒绝H H0 0。可以认为。可以认为无菌化脓发生率达到了预定目标。无菌化脓发生率达到了预定目标。当两总体均数都大于当两总体均数都大于20时,依据时,依据Poisson分布近似正态分布的原理,可以应用分布近似正态分布的原理,可以应用Z检检验对其总体均数进行推断。验对其总体均数进行推断。检验假设检验假设H0:1=2,H1:12二、两组独立样本资料的二、两组独立样本资料的Z检验检验 n当两样本观测单位数相等时,检验统计量为当两样本观测单位数相等时,检验统计量为n两样本观测单位数不等时,检验统计量两样本观测单位数不等时,检验统计量 例例7-9 7-9 某某市市在在对对不不同同性性别别成成年年人人(1818岁岁以以上上)意意外外伤伤害害死死亡亡情情况况有有无无差差异异的的研研究究中中,随随机机抽抽取取了了该该市市20022002年年男男女女疾疾病病监监测测数数据据各各1010万万人人,因因意意外外伤伤害害死死亡亡的的人人数数男男女女分分别别为为5151人人和和2323人人。试试问问,20022002年年不不同同性性别别每每1010万万人人口口意意外外伤伤害害死死亡亡平平均均人人数是否相等?数是否相等?建立检验假设H0:1=2,H1:12=0.05 计算统计量确定P值和作推断 按=查附表2(t临界值表),知Z0.05/2=1.96,所以P1.96,P0.05,在,在=0.05的水平上拒绝的水平上拒绝H0。可以认为工艺改革前后粉尘浓度不同,改革。可以认为工艺改革前后粉尘浓度不同,改革工艺后粉尘浓度较低。工艺后粉尘浓度较低。第四节第四节 假设检验与区间估计的关系假设检验与区间估计的关系 1.置信区间具有假设检验的主要功能;置信区间具有假设检验的主要功能;双侧检验:双侧检验:显然,显然,H0:不在此区间之内。这与按照不在此区间之内。这与按照=0.05水准拒绝水准拒绝H0的推断结论是等价的。的推断结论是等价的。单侧检验单侧检验:结合例结合例71的资料,对东北某县农村儿童前囟门的资料,对东北某县农村儿童前囟门闭合月龄总体均数闭合月龄总体均数的的95%单侧置信区间的下单侧置信区间的下限为:限为:可以看到,可以看到,H0:被包含在区间(被包含在区间(12.869,)之内,所以不能拒绝)之内,所以不能拒绝H0。这与假设检验的。这与假设检验的结论也等价的。结论也等价的。2.2.置信区间可提供假设检验没有提供的信息;置信区间可提供假设检验没有提供的信息;3.假设检验提供,而置信区间不提供的信假设检验提供,而置信区间不提供的信息息。假设检验可以报告确切的假设检验可以报告确切的P值,从而值,从而较为精确地说明检验结论的概率保证。较为精确地说明检验结论的概率保证。第五节第五节 假设检验的功效假设检验的功效 一、假设检验的两类错误一、假设检验的两类错误 n第第类错误:拒绝原本正确的类错误:拒绝原本正确的H0,导致推断结,导致推断结论错误。论错误。n第第类错误类错误::不能拒绝原本错误的不能拒绝原本错误的H0,则导,则导致了另一种推断错误致了另一种推断错误。表表73 推断结论和两类错误推断结论和两类错误实际情况实际情况检验结果检验结果 拒绝拒绝H0 不拒绝不拒绝H0 H0真真第第类错误类错误()结论正确结论正确(1)H0 不真结论正确结论正确(1)第第类错误(类错误()1称为假设检验的功效(称为假设检验的功效(power of a test)。其)。其意义是,当所研究的总体与意义是,当所研究的总体与H0确有差别时,按检确有差别时,按检验水平验水平能够发现它(拒绝能够发现它(拒绝H0)的概率。如果)的概率。如果1=0.90,则意味着当,则意味着当H0不成立时,理论上在每不成立时,理论上在每100次抽样中,在次抽样中,在的检验水准上平均有的检验水准上平均有90次能次能拒绝拒绝H0。一般情况下对同一检验水准。一般情况下对同一检验水准,功效大,功效大的检验方法更可取。的检验方法更可取。二、假设检验的功效二、假设检验的功效 n一组样本资料一组样本资料t检验的功效检验的功效 其中其中n为样本含量,为样本含量,为容许误差(能发现为容许误差(能发现的最小差异)的最小差异)为总体标准差,为总体标准差,为检验水为检验水准准 例例7-117-11计算例计算例7-17-1检验的功效检验的功效1-1-。假定根据现有知识可以取假定根据现有知识可以取=5=5月,月,=0.5=0.5月,。月,。由标准正态分布表查这个数值所对应的上由标准正态分布表查这个数值所对应的上侧尾部面积侧尾部面积,得到得到=0.8531=0.8531,于是,于是,1-,1-=0.1469=0.1469。说明例。说明例7-17-1的检验功效太小,即发的检验功效太小,即发现现=0.5=0.5个月的差别的机会只有个月的差别的机会只有14.69%14.69%。n两组独立样本资料两组独立样本资料t检验的功效检验的功效 例例7-127-12试计算例试计算例7-47-4“长春市长春市13-1613-16岁居民男岁居民男性性2020人的恒牙初期腭弓深度人的恒牙初期腭弓深度”中检验的功效。中检验的功效。假定根据现有知识可以取假定根据现有知识可以取=1mm,=1mm,=1.5mm,=1.5mm,n n1 1=20,=20,n n2 2=34=34。由标准正态分布表查这个数值所对应的上侧由标准正态分布表查这个数值所对应的上侧尾部面积尾部面积,得到得到=0.3228=0.3228,于是,于是1-1-=0.6772=0.6772。n三、应用假设检验需要注意的问题三、应用假设检验需要注意的问题n应用检验方法必需符合其应用条件;应用检验方法必需符合其应用条件;n权衡两类错误的危害以确定权衡两类错误的危害以确定的大小;的大小;n正确理解正确理解P值的意义。值的意义。第六节第六节 正态性检验正态性检验 n图示法图示法 P-P图、图、Q-Q图图n统计检验法统计检验法 W检验、检验、D检验、矩法检验、矩法例例72 某儿科采用静脉注射人血丙种球蛋白某儿科采用静脉注射人血丙种球蛋白治疗小儿急性毛细支气管炎。用药前后患儿治疗小儿急性毛细支气管炎。用药前后患儿血清中免疫球蛋白血清中免疫球蛋白IgG(mg/dl)含量如)含量如表表61所示。试问用药前后所示。试问用药前后IgG有无变化?有无变化?序号序号用药前用药前用药后用药后差值差值 1 1206.441678.44472.00 2 921.691293.36371.67 3 1294.081711.66417.58 4 945.361416.70471.34 5 721.361204.55483.19 6 692.321147.30454.97 7 980.011379.59399.58 8 691.011091.46400.45 9 910.391360.34449.9510 568.561091.83523.3711 1105.521728.03622.5112 757.431398.86641.44表表71 用药前后患儿血清中免疫球蛋白用药前后患儿血清中免疫球蛋白IgG(mg/dl)含量含量W检验检验D检验检验矩法矩法矩法矩法