总体均数的估计与假设检验二.ppt
总体均数的估计与假设检验二1现在学习的是第1页,共80页 假设检验过去称显著性检验。它是利用假设检验过去称显著性检验。它是利用小概率反证法思想,从问题的对立面小概率反证法思想,从问题的对立面(H0)出出发间接判断要解决的问题发间接判断要解决的问题(H1)是否成立。然是否成立。然后在后在H0成立的条件下计算检验统计量,最后成立的条件下计算检验统计量,最后获得获得P值来判断值来判断。第四节假设检验基本思想及步骤基本思想及步骤2现在学习的是第2页,共80页n例3-5某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?n130.83g/L140g/Ln原因:1.可能是总体均数不同n2.是抽样造成的3现在学习的是第3页,共80页4现在学习的是第4页,共80页H1的的内内容容直直接接反反映映了了检检验验单单双双侧侧。若若H1中中只只是是 0或或 0,则则此此检检验验为为单单侧侧检检验验。它它不不仅仅考考虑虑有无差异,而且还考虑差异的方向。有无差异,而且还考虑差异的方向。单单双双侧侧检检验验的的确确定定,首首先先根根据据专专业业知知识识,其其次次根根据据所所要要解解决决的的问问题题来来确确定定。若若从从专专业业上上看看一一种种方方法法结结果果不不可可能能低低于于或或高高于于另另一一种种方方法法结结果果,此此时时应应该该用用单单侧侧检检验验。一一般般认认为为双双侧侧检检验验较较保保守守和稳妥。和稳妥。5现在学习的是第5页,共80页(3)检检验验水水准准,过过去去称称显显著著性性水水准准,是是预预先先规规定定的的概概率率值值,它它确确定定了了小小概概率率事事件件的的标标准准。在在实实际际工工作作中中常常取取 =0.05。可可根根据据不不同同研研究究目的给予不同设置。目的给予不同设置。6现在学习的是第6页,共80页 根据变量和资料类型、设计方根据变量和资料类型、设计方案、统计推断的目的、是否满足特案、统计推断的目的、是否满足特定条件等(如定条件等(如数据的分布类型数据的分布类型)选)选择相应的检验统计量。择相应的检验统计量。2.计算检验统计量计算检验统计量7现在学习的是第7页,共80页 P的的含含义义是是指指从从H0规规定定的的总总体体随随机机抽抽样样,抽抽得得等等于于及及大大于于(或或/和和等等于于及及小小于于)现现有有样样本本获获得得的的检检验验统计量统计量(如如t、u等等)值的概率。值的概率。例例 3-5的的 P值值 可可 用用 图图 3-5说说 明明,P为为 在在=0=140g/L的的前前提提条条件件下下随随机机抽抽样样,其其t 小小于于及及等等于于-2.138和大于及等于和大于及等于2.138的概率。的概率。3.确定确定P值值8现在学习的是第8页,共80页图图3-5例例3-5中中P值示意图值示意图9现在学习的是第9页,共80页10现在学习的是第10页,共80页若若,是否也能下,是否也能下“无差别无差别”或或“相等相等”的结论?的结论?11现在学习的是第11页,共80页第五节第五节t 检验检验12现在学习的是第12页,共80页1 1、样本均数、样本均数 与已知某总体均数与已知某总体均数 比较的比较的t t检验检验 目的:推断一个未知总体均数 与已知总体均 数 是否有差别,用单样本设计。2 2、两个样本均数、两个样本均数 与与 比较的比较的t t检验检验目的:推断两个未知总体均数 与 是否有差 别,用成组设计。3 3、配对设计资料均数比较的、配对设计资料均数比较的t t检验检验目的:推断两个未知总体均数 与 是否有差别用配对设计。t 检验,亦称检验,亦称student t 检验检验,有下述情况有下述情况:13现在学习的是第13页,共80页对于大样本对于大样本,也可以近似用也可以近似用u检验。检验。14现在学习的是第14页,共80页nt检验和u检验的应用条件:n1.t检验应用条件:n样本含量n较小时(如n60)n(1)正态分布n(2)方差齐性(homogeneityofvariance)n2.u检验应用条件:n样本含量n较大,或n虽小但总体标准差已知n(1)正态分布n(2)方差齐性(homogeneityofvariance)15现在学习的是第15页,共80页一、单样本一、单样本t检验检验(onesample/groupt-test)即即样样本本均均数数(代代表表未未知知总总体体均均数数)与与已已知知总总体体均均数数 0(一一般般为为理理论论值值、标标准准值值或或经经过过大大量量观观察察所所得得稳稳定定值值等等)的的比比较较。其其检检验统计量按下式计算验统计量按下式计算16现在学习的是第16页,共80页例例3-5某某医医生生测测量量了了36名名从从事事铅铅作作业业男男性性工工人人的的血血红红蛋蛋白白含含量量,算算得得其其均均数数为为130.83g/L,标标准准差差为为25.74g/L。问问从从事事铅铅作业工人的血红蛋白是否不同于正常成年男性平均值作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?(1)建立检验假设,确定检验水准建立检验假设,确定检验水准H0:=0=140g/L,即铅作业男性工人平均血红,即铅作业男性工人平均血红蛋白含量与正常成年男性平均值相等蛋白含量与正常成年男性平均值相等H1:0=140g/L,即铅作业男性工人平均血红,即铅作业男性工人平均血红蛋白含量与正常成年男性平均值不等蛋白含量与正常成年男性平均值不等 =0.0517现在学习的是第17页,共80页(2)计算检验统计量计算检验统计量 18现在学习的是第18页,共80页(3)确定确定P值,作出推断结论值,作出推断结论 19现在学习的是第19页,共80页配对配对t 检验适用于配对设计的计量资料。检验适用于配对设计的计量资料。配配对对设设计计类类型型:两两同同质质受受试试对对象象分分别别接接受受两两种种不不同同的的处处理理;同同一一受受试试对对象象分分别别接接受受两两种种不不同同处处理理;同同一一受受试试对象对象(一种一种)处理前后。处理前后。二、配对二、配对t 检验检验(paired/matchedt-test)20现在学习的是第20页,共80页例例3-6为为比比较较两两种种方方法法对对乳乳酸酸饮饮料料中中脂脂肪肪含含量量测测定定结结果果是是否否不不同同,某某人人随随机机抽抽取取了了10份份乳乳酸酸饮饮料料制制品品,分分别别用用脂脂肪肪酸酸水水解解法法和和哥哥特特里里罗罗紫紫法法测测定定其其结结果果如如表表3-3第第(1)(3)栏栏。问问两两法法测测定定结结果果是是否否不同?不同?21现在学习的是第21页,共80页表表3-3两种方法对乳酸饮料中脂肪含量的测定结果两种方法对乳酸饮料中脂肪含量的测定结果(%)22现在学习的是第22页,共80页(1)建立检验假设,确定检验水准建立检验假设,确定检验水准H0:d0,即两种方法的测定结果相同,即两种方法的测定结果相同H1:d0,即两种方法的测定结果不同,即两种方法的测定结果不同=0.05(2)计算检验统计量计算检验统计量本例本例n=10,d=2.724,d2=0.8483,23现在学习的是第23页,共80页按公式按公式(3-16)(3)确定确定P值,作出推断结论值,作出推断结论查查附附表表2的的t界界值值表表得得P0.001。按按=0.05水水准准,拒拒绝绝H0,接接受受H1,有有统统计计学学意意义义。可可认认为为两两种种方方法法对对脂脂肪肪含含量量的测定结果不同,哥特里罗紫法测定结果较高的测定结果不同,哥特里罗紫法测定结果较高。24现在学习的是第24页,共80页 三、两样本三、两样本t t检验检验(two-sample/groupt-test)又称成组又称成组t 检验,适用于完全随机设计两样检验,适用于完全随机设计两样本均数的比较,此时人们关心的是两样本均数所本均数的比较,此时人们关心的是两样本均数所代表的两总体均数是否不等。两组完全随机设计代表的两总体均数是否不等。两组完全随机设计是将受试对象完全随机分配到两个不同处理组。是将受试对象完全随机分配到两个不同处理组。25现在学习的是第25页,共80页适用范围:适用范围:完全随机设计两样本均数的比较完全随机设计两样本均数的比较检验方法:依两总体方差是否齐性而定。检验方法:依两总体方差是否齐性而定。26现在学习的是第26页,共80页27现在学习的是第27页,共80页例例3-7为为研研究究国国产产四四类类新新药药阿阿卡卡波波糖糖胶胶囊囊的的降降血血糖糖效效果果,某某医医院院用用40名名II型型糖糖尿尿病病病病人人进进行行同同期期随随机机对对照照试试验验。试试验验者者将将这这些些病病人人随随机机等等分分到到试试验验组组(用用阿阿卡卡波波糖糖胶胶囊囊)和和对对照照组组(用用拜拜唐唐苹苹胶胶囊囊),分分别别测测得得试试验验开开始始前前和和8周周后后的的空空腹腹血血糖糖,算算得得空空腹腹血血糖糖下下降降值值见见表表3-4,能能否否认认为为该该国国产产四四类类新新药药阿阿卡卡波波糖糖胶胶囊囊与与拜拜唐唐苹苹胶胶囊囊对对空腹血糖的降糖效果不同?空腹血糖的降糖效果不同?28现在学习的是第28页,共80页29现在学习的是第29页,共80页(2)计算检验统计量计算检验统计量 30现在学习的是第30页,共80页(3)确定确定P值,作出推断结论值,作出推断结论31现在学习的是第31页,共80页若若变变量量变变换换后后总总体体方方差差齐齐性性 可可采采用用t 检检验验(如如两两样样本本几几何何均均数数的的t 检检验验,就就是是将将原原始始数数据取对数后进行据取对数后进行t 检验检验);若若变变量量变变换换后后总总体体方方差差仍仍然然不不齐齐 可可采采用用t 检验或检验或Wilcoxon秩和检验。秩和检验。若两总体方差不等(),?32现在学习的是第32页,共80页2.Cochran&Cox近似近似t 检验(检验(t检验)检验)调整 t 界值33现在学习的是第33页,共80页34现在学习的是第34页,共80页例例3-8在在上上述述例例3-7国国产产四四类类新新药药阿阿卡卡波波糖糖胶胶囊囊的的降降血血糖糖效效果果研研究究中中,测测得得用用拜拜唐唐苹苹胶胶囊囊的的对对照照组组20例例病病人人和和用用阿阿卡卡波波糖糖胶胶囊囊的的试试验验组组20例例病病人人,其其8周周时时糖糖化化血血红红蛋蛋白白HbA1c(%)下下降降值值如如表表3-5。问问用用两两种种不不同同药物的病人其药物的病人其HbA1c下降值是否不同?下降值是否不同?35现在学习的是第35页,共80页表3-5对照组和试验组HbA1c下降值(%)对对照照组组方方差差是是试试验验组组方方差差的的3.77倍倍,经经方方差差齐齐性性检检验验,认为两组的总体方差不等,故采用认为两组的总体方差不等,故采用近似近似t 检验检验。36现在学习的是第36页,共80页(1)建立检验假设,确定检验水准建立检验假设,确定检验水准(略略)(2)计算检验统计量计算检验统计量 37现在学习的是第37页,共80页(3)确定确定P值,作出推断结论。值,作出推断结论。查查t界值表界值表t0.05/2,19=2.093。由由t=0.9650.05。按按=0.05水水准准,不不拒拒绝绝H0,无无统统计计学学意意义义。还还不不能能认认为为用用两两种种不不同同药药物物的的病病人人其其HbA1c下下降值不同。降值不同。38现在学习的是第38页,共80页3.Satterthwaite近似近似t检验检验:Cochran&Cox法是对临界值校正法是对临界值校正而而Satterthwaite法法则是对自由度校正。则是对自由度校正。39现在学习的是第39页,共80页以=28.428、t=0.965查附表2的t界值表得0.20P0.40。结论同前。按按Satterthwaite法法对例对例3-8做检验,得做检验,得40现在学习的是第40页,共80页3.Welch法近似t检验Welch法也是对自由度进行校正。校正公式为41现在学习的是第41页,共80页对例3-8,如按Welch法,则以=29.429、t=0.965查附表2的t界值表得0.20P60),则可选用大样本u检验。50现在学习的是第50页,共80页n3.正确理解“显著性”一词的含义差别有或无统计学意义,过去称差别有或无“显著性”,是对样本统计量与总体参数或样本统计量之间的比较而言,相应推断为:可以认为或还不能认为两个或多个总体参数有差别。51现在学习的是第51页,共80页n4.结论不能绝对化因统计结论具有概率性质,故“肯定”、“一定”、“必定”等词不要使用。在报告结论时,最好列出检验统计量的值,尽量写出具体的P值或P值的确切范围,如写成P=0.040或0.02P0.05,而不简单写成P0.05,以便读者与同类研究进行比较或进行循证医学时采用Meta分析。52现在学习的是第52页,共80页n5.假设检验是为专业服务的,统计结论必须和专业结论有机地相结合,才能得出恰如其分、符合客观实际的最终结论。若统计结论和专业结论一致,则最终结论就和这两者均一致(即均有或均无意义);若统计结论和专业结论不一致,则最终结论需根据实际情况加以考虑。若统计结论有意义,而专业结论无意义,则可能由于样本含量过大或设计存在问题,那么最终结论就没有意义。53现在学习的是第53页,共80页6.可信区间与假设检验各自不同的作可信区间与假设检验各自不同的作用,要结合使用。用,要结合使用。一方面一方面,可信区间可信区间亦可回答亦可回答假设检验假设检验的的问题,算得的可信区间若包含了问题,算得的可信区间若包含了H0,则按,则按 水准,不拒绝水准,不拒绝H0;若不包含;若不包含H0,则按,则按 水准,水准,拒绝拒绝H0,接受,接受H1。54现在学习的是第54页,共80页 另一方面另一方面,可信区间不但能回答差,可信区间不但能回答差别有无统计学意义,而且还能比假设检别有无统计学意义,而且还能比假设检验提供更多的信息,即提示差别有无实验提供更多的信息,即提示差别有无实际的专业意义。际的专业意义。55现在学习的是第55页,共80页图图3-7可信区间在统计推断上提供的信息可信区间在统计推断上提供的信息56现在学习的是第56页,共80页 虽然虽然可信区间可信区间亦可回答亦可回答假设检验假设检验的的问题,并能提供更多的信息,但并不意问题,并能提供更多的信息,但并不意味着可信区间能够完全代替假设检验。味着可信区间能够完全代替假设检验。可信区间只能在预先规定的概率可信区间只能在预先规定的概率检验检验水准水准 的前提下进行计算,而假设检验的前提下进行计算,而假设检验能够获得一较为能够获得一较为确切的概率确切的概率P值值。57现在学习的是第57页,共80页第七节第七节正态性检验正态性检验和两样本方差比较的和两样本方差比较的F检验检验58现在学习的是第58页,共80页 t 检检验验的的应应用用条条件件是是正正态态总总体体且且方方差差齐齐性性;配配对对t 检检验验则则要要求求每每对对数数据据差差值值的的总总体体为为正正态总体。态总体。进进行行两两小小样样本本t检检验验时时,一一般般应应对对资资料料进进行行方差齐性检验,尤其两样本方差悬殊时。方差齐性检验,尤其两样本方差悬殊时。若若方方差差齐齐,采采用用一一般般的的t 检检验验;若若方方差差不不齐齐,则采用则采用t检验。检验。59现在学习的是第59页,共80页一、正态性检验一、正态性检验(normalitytest)1图示法:图示法:P-Pplot,Q-Qplot2矩法矩法偏度系数偏度系数(skewness),峰度系数峰度系数(kurtosis)。3 W 检验法检验法4 D 检验法检验法60现在学习的是第60页,共80页图图3-8例例3-1中中100个样本均数的个样本均数的P-P图图61现在学习的是第61页,共80页图图3-9例例3-1中中100个样本均数的个样本均数的Q-Q图图62现在学习的是第62页,共80页63现在学习的是第63页,共80页64现在学习的是第64页,共80页例例3-9 试用矩法对表试用矩法对表3-1中计算机模拟抽样所中计算机模拟抽样所得得100个样本均数进行正态性检验。个样本均数进行正态性检验。65现在学习的是第65页,共80页(2)计算检验统计量计算检验统计量66现在学习的是第66页,共80页二、两样本方差比较的二、两样本方差比较的F检验检验两小样本两小样本t检验时,检查两样本方差代表检验时,检查两样本方差代表的总体方差是否相等的总体方差是否相等(决定(决定t 检验的方法)检验的方法)。1.Levene检验检验2.F检验检验67现在学习的是第67页,共80页68现在学习的是第68页,共80页69现在学习的是第69页,共80页图图3-10不同自由度时不同自由度时F分布的图形分布的图形70现在学习的是第70页,共80页(2)计算检验统计量计算检验统计量例例3-10对对例例3-7,用用F 检检验验判判断断两两总总体体空腹血糖下降值的方差是否不等。空腹血糖下降值的方差是否不等。(1)建立检验假设,确定检验水准建立检验假设,确定检验水准71现在学习的是第71页,共80页(3)确定确定P值,作出推断结论值,作出推断结论72现在学习的是第72页,共80页三、变量变换三、变量变换常用的变量变换有对数变换、平方根变换、常用的变量变换有对数变换、平方根变换、倒数变换、平方根反正弦变换等,应根据资料性倒数变换、平方根反正弦变换等,应根据资料性质选择适当的变量变换方法。质选择适当的变量变换方法。73现在学习的是第73页,共80页74现在学习的是第74页,共80页75现在学习的是第75页,共80页76现在学习的是第76页,共80页小结小结1.均数的标准误与标准差的区别均数的标准误与标准差的区别77现在学习的是第77页,共80页2.两均数差别检验的比较:两均数差别检验的比较:大样本也可近似用u检验现在学习的是第78页,共80页3.假设检验的步骤及有关概念假设检验的步骤及有关概念(1)基基本本思思想想:“小小概概率率事事件件在在一一次次抽抽样样试验中几乎是不可能发生试验中几乎是不可能发生”的原理。的原理。(2)步骤:三部曲)步骤:三部曲(3)类错误、类错误、类错误类错误(4)检验效能()检验效能(1-)79现在学习的是第79页,共80页谢谢大家!80现在学习的是第80页,共80页