设检验基础精品文稿.ppt
设检验基础设检验基础第1页,本讲稿共81页统计分析(statistical analysis)统计描述(statistical description)统计推断(statistical inference)参数估计(parameter estimation)假设检验(hypothesis testing)集中趋势(central tendency)离散趋势(dispersion tendency)第2页,本讲稿共81页2假设检验的概念与原理 n n假设检验的思维逻辑假设检验的思维逻辑假设检验的思维逻辑假设检验的思维逻辑 某商家宣称他的一大批鸡蛋某商家宣称他的一大批鸡蛋“坏坏(变质变质)蛋率为蛋率为1%”1%”。对这。对这批鸡蛋的质量批鸡蛋的质量(即即“坏蛋率为坏蛋率为1%”1%”还是还是“坏蛋率高于坏蛋率高于1%”)1%”)做出判做出判断,断,在在“坏蛋率为坏蛋率为1%”1%”的前提下,的前提下,5 5个鸡蛋样品中出现一个个鸡蛋样品中出现一个“坏蛋坏蛋”的机会是很小的,的机会是很小的,“小概率事件在一次随机试验中不(大)可能发生”的。的。本章将要介绍的假设检验理论和方法,正是基于这一本章将要介绍的假设检验理论和方法,正是基于这一思维判断形式而发展出来的依据随机样本对于未知事物进思维判断形式而发展出来的依据随机样本对于未知事物进行判断和决策的规则。应用假设检验理论和方法,依据样行判断和决策的规则。应用假设检验理论和方法,依据样本提供的有限信息对总体做推断。本提供的有限信息对总体做推断。第3页,本讲稿共81页3 n n假设检验的基本步骤假设检验的基本步骤 例7-1 已知北方农村儿童前囟门闭合月龄为14.1月。某研究人员从东北某县抽取36名儿童,得囟门闭合月龄均值为14.3月,标准差为5.08月。问该县儿童前囟门闭合月龄的均数是否大于一般儿童?第4页,本讲稿共81页4n nH0:null hypothesis,零假设(原假设或无效假设);n nH1:alternative hypothesis,对立假设(备择假设);n n单双测(单尾/双尾 single tailed/double-tailed test)检验的选择第5页,本讲稿共81页5 n n假设检验的步骤:假设检验的步骤:1.1.建立检验假设,确定检验水准建立检验假设,确定检验水准 H H0 0:=14.1(=14.1(月月),总体上该县儿童前囟门闭合月龄的平均水平与一般,总体上该县儿童前囟门闭合月龄的平均水平与一般儿童的平均水平相同儿童的平均水平相同H H1 1 :14.1(14.1(月月),该县儿童前囟门闭合月龄的平均水平高于一般,该县儿童前囟门闭合月龄的平均水平高于一般儿童的平均水平儿童的平均水平检验水准检验水准(size of a test)(size of a test)=0.05=0.05 或或0.01 0.01 第6页,本讲稿共81页6 2.选择合适的检验方法,计算统计量 t检验的统计量t自由度:第7页,本讲稿共81页7 3.确定P值,做出推断 P值的意义是:如果总体状况和H0一致,统计量获得现有数值概率?自由度为35,查附表2,得到:单侧 。得知P0.5。第8页,本讲稿共81页8 假设检验的推断结论是对假设检验的推断结论是对“H H0 0是否真实是否真实”作出判断。作出判断。如果P值小于或等于检验水准,意味着在H0成立的前提下发生了小概率事件,根据“小概率事件在一次随机试验中不(大)可能发生”的推断原理,怀疑H0的真实性,从而做出拒绝(reject)H0的决策。因为H0与H1是对立的,既然拒绝H0,就只能接受H1。如果P值大于,在H0成立的假设下发生较为可能的事件,没有充足的理由对H0提出怀疑。于是做出不拒绝H0的决策。第9页,本讲稿共81页9 n n由于由于P P0.50.5,自然有,自然有P P0.050.05(即即)。这意味着,如果。这意味着,如果该县儿童前囟门闭合的平均月龄为该县儿童前囟门闭合的平均月龄为14.114.1月,观察到囟月,观察到囟门闭合月龄均值为门闭合月龄均值为14.314.3月的样本月的样本(以及均值更大的样以及均值更大的样本本)的可能性还是比较大的的可能性还是比较大的(概率大于概率大于0.50.5);没有理由对;没有理由对H0提出怀疑,于是做出不拒绝提出怀疑,于是做出不拒绝H0的推断结论。的推断结论。n n无论做出哪一种推断结论无论做出哪一种推断结论(接受或是拒绝接受或是拒绝H0),都面,都面临着发生判断错误的风险。这就是假设检验的两类错误临着发生判断错误的风险。这就是假设检验的两类错误 第10页,本讲稿共81页10第11页,本讲稿共81页11图7-1 假设检验示意图第12页,本讲稿共81页12n n随机样本n n来自正态分布总体n n均数比较时,要求两总体方差相等(方差齐性 homogeneity of variance)t检验 n t 分布的发现是统计学发展历史中的landmark第13页,本讲稿共81页13检验假设H0:=0,H1:0(单侧检验0或0)统计量:见例7-1 单样本资料的t检验第14页,本讲稿共81页14 实施的形式主要有:(1)将受试对象配成特征(主要非处理因素)相近的对子,同对的两个受试对象随机分别接受不同处理;(2)同一样品分成两份,随机分别接受不同处理(或测量)。配对设计配对设计(paired design)资料的资料的t检验检验第15页,本讲稿共81页15 检验假设为H0:d=0,H1:d0当成立时,检验统计量 第16页,本讲稿共81页16 n n例7-2 某地区随机抽取12名贫血的家庭,实施为期3个月的健康教育干预,干预前后的血红蛋白的测量结果如下表所示,试问干预前后该地区贫血儿童血红蛋白平均水平有无改变?第17页,本讲稿共81页17表7-2 健康教育干预前后血红蛋白NO.NO.干预前干预前干预后干预后差值差值NO.NO.干预前干预前干预后干预后 差值差值1 1363645459 97 74242707028282 24646646418188 8454545450 03 35353666613139 92525505025254 4575757570 010105555808025255 5656570705 51111515160609 96 660605555-5-51212595960601 1第18页,本讲稿共81页18 检验假设检验假设 HH0 0:d d=0=0,HH1 1:d d 0 0 =0.05=0.05 n n=12=12,1.建立检验假设,确定检验水准;第19页,本讲稿共81页19 2.2.计算统计量计算统计量第20页,本讲稿共81页20 查附表查附表2 2(t t临界值表临界值表),t t0.05/2,110.05/2,11=2.201=2.201,得,得P P0.050.200.20,在,在=0.05=0.05水平上不能拒绝水平上不能拒绝HH0 0。所以尚不能。所以尚不能认为两法测定结果不同。认为两法测定结果不同。2.计算统计量第25页,本讲稿共81页25 将受试对象随机分配成两个处理组,每一组随机接受的一种处理。一般把这样获得的两组资料视为代表两个不同总体的两份样本,据以推断它们的总体均数是否相等。在实际工作中按完全随机设计的两样本比较来对待。此类比较分为两种情况:两组独立样本资料的两组独立样本资料的t检验检验第26页,本讲稿共81页26n nN1(1,2)n nN2(2,2)样本所属总体方差相等第27页,本讲稿共81页27 n n两样本所属总体方差相等两样本所属总体方差相等检验假设为检验假设为已知当已知当HH0 0成立时,检验统计量成立时,检验统计量第28页,本讲稿共81页28 n n合并方差合并方差:第29页,本讲稿共81页29n n例7-4 某妇产医院的研究者探索孕期补充钙剂对血清骨钙素(ng/ml)的影响,选取孕妇的年龄、基础骨钙素值接近,孕周2628周的30名孕妇,随机分为两组,每组15名。试验组孕妇补充某种钙剂,对照组采用传统膳食。产后4050天内测定孕妇血清骨钙素的变化值(产后骨钙素与产前骨钙素的差值),结果如下:第30页,本讲稿共81页30n n试验组:10.2 8.9 10.1 9.2-0.8 10.6 6.5 11.2 9.3 8.0 10.7 9.5 12.7 14.4 11.9n n对照组:5.0 6.7-1.4 4.0 7.1-0.6 2.8 4.3 3.7 5.8 4.6 6.0 4.1 5.1 4.7问题:孕期补充钙剂和传统膳食的产妇的骨钙素改变值的总体均数有无差别?第31页,本讲稿共81页31 1.建立检验假设,确定检验水准:第32页,本讲稿共81页322.2.计算统计量;计算统计量;第33页,本讲稿共81页333.3.确定确定P P值,作出统计推断值,作出统计推断 第34页,本讲稿共81页34 二:两样本所属总体方差不等二:两样本所属总体方差不等二:两样本所属总体方差不等二:两样本所属总体方差不等(Satterthwaite近似法近似法)1.建立检验假设,确定检验水准;第35页,本讲稿共81页352.计算统计量;第36页,本讲稿共81页363.确定P值,作出推断。根据t分布接近t分布,确定P值。第37页,本讲稿共81页37 例例7-5 7-5 为探讨硫酸氧钒对糖尿病性白内障的防治作用,研为探讨硫酸氧钒对糖尿病性白内障的防治作用,研究人员将已诱导糖尿病模型的究人员将已诱导糖尿病模型的2020只大鼠随机分为两组。只大鼠随机分为两组。一组用硫酸氧钒治疗一组用硫酸氧钒治疗(DV(DV组组),另一组作对照观察,另一组作对照观察(D(D组组),1212周后测大鼠血糖含量周后测大鼠血糖含量(mmol/Lmmol/L)。结果为,。结果为,DVDV组组1212只,样本均数为只,样本均数为6.5mmol/L,6.5mmol/L,标准差为标准差为1.34mmol/L1.34mmol/L;DD组组8 8只,样本均数为只,样本均数为13.7mmol/L,13.7mmol/L,标准差为标准差为4.21mmol/L4.21mmol/L。试问两组动物血糖含量的总体均数是否相同?试问两组动物血糖含量的总体均数是否相同?第38页,本讲稿共81页38 1.建立检验假设,确定检验水准;第39页,本讲稿共81页392.计算统计量;第40页,本讲稿共81页40 查附表查附表2 2(t t临界值表临界值表):所以可认为经硫酸氧钒治疗的大鼠与未治疗大鼠的血糖含量不同。P0.05,在=0.05水平上拒绝H0。3.3.确定确定P值,作出推断。第41页,本讲稿共81页41n n例7-6 为比较特殊饮食与药物治疗改善血清胆固醇(mmol/L)的效果,将24名志愿者随机分为2组,每组12人,甲组为特殊饮食组,乙组为药物治疗组。受试者试验前后各测定一次血清胆固醇,差值的结果如下表:第42页,本讲稿共81页42GroupGroupNo.No.Mean(Standard deviation)Mean(Standard deviation)Specific dietSpecific diet12120.5592(0.6110)0.5592(0.6110)Drug treatmentDrug treatment12120.1467(0.2107)0.1467(0.2107)表7-6 两种降血清胆固醇措施差值的结果第43页,本讲稿共81页43问题:比较两种降血清胆固醇措施的效果是否相同?经方差齐性检验,两组方差不相等。故用Satterthwaite 近似法。1.建立检验假设,确定检验水准:第44页,本讲稿共81页442.计算统计量;第45页,本讲稿共81页45查附表查附表2 2(t t临界值表临界值表):所以可认为两种降血清胆固醇措施的效果有差异。P0.05,在=0.05水平上拒绝H0。3.确定P值,作出推断。值,作出推断。第46页,本讲稿共81页46 两组独立样本资料的方差齐性检验两组独立样本资料的方差齐性检验两组独立样本资料的方差齐性检验两组独立样本资料的方差齐性检验1.建立检验假设,确定检验水准:第47页,本讲稿共81页472.计算统计量;在H0成立的条件下,F统计量服从F分布3.确定P值,作出推断。第48页,本讲稿共81页48 例7-6 试检验例7-5 中两组(DV组与D组)大鼠接受相应处理12周后测得的血糖含量(mmol/L)是否具有方差齐性?查附表3.2,F0.05(7,11)=3.76,知P0.05,在=0.05水平上拒绝H0。可以认为两个总体方差不相等。第49页,本讲稿共81页49n n某口腔医院选择所在市4050岁慢性牙周炎患者36例,测得实验组(18人)菌斑指数mean为84.71,SD=8.14;非吸烟组(18人)菌斑指数的mean为82.20,SD=6.18检验两总体方差是否相等?第50页,本讲稿共81页501.建立检验假设,确定检验水准:第51页,本讲稿共81页512.计算统计量;3.确定P值,作出推断。0或25=0.05 第59页,本讲稿共81页59 计算统计量 按(7-13)式 确定P值和作推断 Z0.10=1.2816,知P0.10,按=0.05水准,尚不能拒绝H0。可以认为该地区达到了预定目标。第60页,本讲稿共81页60 当两总体均数都大于20时,依据Poisson分布近似正态分布的原理,可以应用Z检验对其总体均数进行推断。两组独立样本资料的两组独立样本资料的两组独立样本资料的两组独立样本资料的Z检验检验检验检验第61页,本讲稿共81页611.建立检验假设,确定检验水准:第62页,本讲稿共81页62 n n当两样本观测单位数相等时,检验统计量为n n两样本观测单位数不等时,检验统计量 2.计算检验统计量:3.确定P值,作出统计推断第63页,本讲稿共81页63 例7-11 甲、乙两检验师分别观察15名正常人末梢血嗜碱性白细胞数量。每张血片均观察200个视野。结果甲计数到嗜碱性白细胞26个,乙计数到29个。试问两位检验师检查结果是否一致?n n建立检验假设H0:1=2,H1:12=0.05第64页,本讲稿共81页64 计算统计量 按(7-14)式n n 确定P值和作推断 按=查附表2(t临界值表),知Z0.5/2=0.6745,所以P0.5,按=0.05水准不能拒绝H0。尚不能认为两检验师检查结果有差异。第65页,本讲稿共81页65 例7-12 某车间改革生产工艺前,测得三次粉尘浓度,每升空气中分别有38、29、36颗粉尘;改进工艺后,测取两次,分别为25、18颗粉尘。问工艺改革前后粉尘数有无差别?1.建立检验假设H0:1=2,H1:12=0.05 第66页,本讲稿共81页66 计算统计量计算统计量因因工工艺艺改改革革前前后后观观测测单单位位数数不不等等,故故分分别别计计算算其其均均数。数。,n n1 1=3=3 ,n n2 2=2=2 Z Z=2.7231.96=2.7231.96,P P0.050.05,在,在=0.05=0.05的水平上拒绝的水平上拒绝HH0 0。可。可以认为工艺改革前后粉尘浓度不同,改革工艺后粉尘以认为工艺改革前后粉尘浓度不同,改革工艺后粉尘浓度较低。浓度较低。第67页,本讲稿共81页67假设检验与区间估计的关系 n n置信区间具有假设检验的主要功能n n显然,H0:不在此区间之内。这与按照=0.05水准拒绝H0的推断结论是等价的。第68页,本讲稿共81页68 n n单侧检验 结合例7-1的资料,对东北某县农村儿童前囟门闭合月龄总体均数的95%单侧置信区间的下限为n n可以看到,H0:被包含在区间(12.869,)之内,所以不能拒绝H0。这与假设检验的结论也等价的。第69页,本讲稿共81页69 置信区间可提供假设检验没有提供的信息置信区间可提供假设检验没有提供的信息置信区间可提供假设检验没有提供的信息置信区间可提供假设检验没有提供的信息 置信区间在回答差别有无统计学意义的同时,还可置信区间在回答差别有无统计学意义的同时,还可置信区间在回答差别有无统计学意义的同时,还可置信区间在回答差别有无统计学意义的同时,还可以提示差别是否具有实际意义在图以提示差别是否具有实际意义在图以提示差别是否具有实际意义在图以提示差别是否具有实际意义在图7-47-47-47-4中,置信区间中,置信区间中,置信区间中,置信区间(1)(1)(1)(1)(3)(3)(3)(3)均不包含原假设均不包含原假设均不包含原假设均不包含原假设H H H H0 0 0 0,意味着相应的差异具有统计,意味着相应的差异具有统计,意味着相应的差异具有统计,意味着相应的差异具有统计学意义。学意义。学意义。学意义。(1)(1)(1)(1)还提示差异具有实际意义;还提示差异具有实际意义;还提示差异具有实际意义;还提示差异具有实际意义;(2)(2)(2)(2)提示可能具提示可能具提示可能具提示可能具有实际意义;有实际意义;有实际意义;有实际意义;(3)(3)(3)(3)提示实际意义不大。图中的提示实际意义不大。图中的提示实际意义不大。图中的提示实际意义不大。图中的(4)(4)(4)(4)与与与与(5)(5)(5)(5)均无统计学意义,但均无统计学意义,但均无统计学意义,但均无统计学意义,但(4)(4)(4)(4)提示样本量不足。提示样本量不足。提示样本量不足。提示样本量不足。(5)(5)(5)(5)属于可以属于可以属于可以属于可以接受原假设的情况。接受原假设的情况。接受原假设的情况。接受原假设的情况。第70页,本讲稿共81页70第71页,本讲稿共81页71 假设检验提供,而置信区间不提供的信息第72页,本讲稿共81页72假设检验的功效 n n假设检验的两类错误假设检验的两类错误 n n第类错误:拒绝原本正确的H0,导致推断结论错误。n n第类错误:不能拒绝原本错误的H0,则导致了另一种推断错误。第73页,本讲稿共81页73表7-3推断结论和两类错误实际情况检验结果拒绝H0不拒绝H0H0真第类错误()结论正确(1-)H0不真结论正确(1-)第类错误()第74页,本讲稿共81页74第75页,本讲稿共81页75n n1-1-称为假设检验的功效称为假设检验的功效(power of a testpower of a test)。其意义是,。其意义是,当所研究的总体与当所研究的总体与HH0 0确有差别时,按检验水平确有差别时,按检验水平能够能够发现它发现它(拒绝拒绝HH0 0)的概率。如果的概率。如果1-1-=0.90=0.90,则意味着当,则意味着当HH0 0不成立时,理论上在每不成立时,理论上在每100100次抽样中,在次抽样中,在的检验的检验水准上平均有水准上平均有9090次能拒绝次能拒绝HH0 0。一般情况下对同一检验。一般情况下对同一检验水准水准,功效大的检验方法更可取,功效大的检验方法更可取 假设检验的功效第76页,本讲稿共81页76 n n一组样本资料t检验的功效 第77页,本讲稿共81页77 n n例例7-14 7-14 计算例计算例7-17-1检验的功效检验的功效1-1-。n n假定根据现有知识可以取假定根据现有知识可以取=5=5月,月,=0.5=0.5月,。月,。n n由标准正态分布表查这个数值所对应的上侧尾部面由标准正态分布表查这个数值所对应的上侧尾部面积积,得到得到=0.8531=0.8531,于是,于是,1-,1-=0.1469=0.1469。说明例。说明例6-16-1的的检验功效太小,即发现检验功效太小,即发现=0.5=0.5个月的差别的机会只有个月的差别的机会只有14.69%14.69%。第78页,本讲稿共81页78 n n两组独立样本资料t检验的功效 第79页,本讲稿共81页79 例例7-16 7-16 试计算例试计算例7-97-9中检验的功效。中检验的功效。n n假定根据现有知识可以取假定根据现有知识可以取=0.15=0.15,1 1=0.76=0.76,2 2=0.96=0.96,由标准正态分布表查这个数值所对应的上侧尾部面积由标准正态分布表查这个数值所对应的上侧尾部面积,得得到到=0.0594=0.0594,于是,于是1-1-=0.9406=0.9406。第80页,本讲稿共81页80 应用假设检验需要注意的问题应用假设检验需要注意的问题在抽样研究中,研究设计、搜集数据和统计分析是一个整体。每一种假设检验方法都是与相应的研究设计相联系的应用检验方法必需符合其适用条件当样本量一定时,第类错误的概率变小,第类错误的概率就变大。正确理解P值的意义。第81页,本讲稿共81页81