[精选]总体均数的估计与假设检验综述39835.pptx
本资料来源 第三章第三章 总体均数的估计和假设检验总体均数的估计和假设检验第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误 1.均数的抽样误差与样本均数的分布:均数的抽样误差与样本均数的分布:(1)均数的抽样误差均数的抽样误差是指样本均数与总体均数是指样本均数与总体均数之间的差异以及来自同一总体的样本均数之之间的差异以及来自同一总体的样本均数之间的差异。间的差异。例例3-1 若某市若某市1999年年18岁男生身高服从均数为岁男生身高服从均数为167.7cm,标准差为,标准差为5.3cm的正态分布。从该正态的正态分布。从该正态分布分布N(167.7,5.32)cm总体中随机抽样总体中随机抽样100次即共抽次即共抽取样本取样本g=100个,每次样本含量个,每次样本含量=10人,得到每人,得到每个样本均数及标准差如图个样本均数及标准差如图3-1和表和表3-1所示。所示。167.41 2.74165.56 6.57168.20 5.36165.69 5.09100个个n10图图31 1999年某市年某市18岁男生身高岁男生身高X XN N(167.7,5.32)抽样示意图抽样示意图表表3-1资料资料 组段组段 频数频数 频率()频率()累计频数累计频数 累计频率()累计频率()163 1 1 1 1 164 3 3 4 4 165 13 13 17 17 166 19 19 36 36 167 22 22 58 58 168 20 20 78 78 169 14 14 92 92 170 4 4 96 96 172 3 3 99 99 172173 1 1 100 100 合合 计计 100 100 随机随机抽样所得抽样所得100个样本均数的频数分布个样本均数的频数分布图图32 从正态分布总体从正态分布总体X XN N(167.7,5.32)随机随机抽样所得样本均数分布抽样所得样本均数分布平均身高平均身高(cm)cm)163 164 165 166 167 168 169 170 171 172 17325 20 15 10 5 0 样本数样本数(2)样本均数的分布:样本均数的分布:如果总体中的观察值的分布为正态分布,如果总体中的观察值的分布为正态分布,则样本均数的分布也是正态分布。则样本均数的分布也是正态分布。如果总体中的观察值的分布为非正态分如果总体中的观察值的分布为非正态分布,只要样本例数足够大(布,只要样本例数足够大(n60),则均数的),则均数的分布仍近似正态分布。分布仍近似正态分布。2.均数的标准误均数的标准误(standard error of mean):(1)意义意义:均数的标准误均数的标准误简称标准误简称标准误,是指样本均数的标准差,是指样本均数的标准差,衡量样本均数的离散程度。衡量样本均数的离散程度。(2)标准误的计算:标准误的计算:或或 (3)标准误与标准差及标准误与标准差及n的关系的关系:n大大 小;小;S小小 小。小。思考:如何降低均数的抽样误差?思考:如何降低均数的抽样误差?(4)标准误的应用标准误的应用:衡量均数的抽样误差衡量均数的抽样误差 衡量样本均数的可靠性衡量样本均数的可靠性 估计总体均数的可信区间估计总体均数的可信区间 均数的假设检验。均数的假设检验。思考:如何区别标准差和标准误?思考:如何区别标准差和标准误?3.标准误与标准差之间的区别与联系:标准误与标准差之间的区别与联系:标准误标准误 标准差标准差 说明说明 的离散度,的离散度,说明说明x 的离散度的离散度,衡量抽样误差衡量抽样误差,衡量个体差异,衡量个体差异,表示表示 的可靠性的可靠性,表示表示 的代表性,的代表性,n大,大,小,小,n大,大,s 趋于稳定,趋于稳定,估计估计的可信区间,的可信区间,估计参考值范围,估计参考值范围,均数的假设检验。均数的假设检验。计算计算CV 和和 。联系联系 n不变时,不变时,s 越大,越大,越大。越大。区别区别第二节第二节 t 分布分布一、一、t 分布的概念分布的概念 t 值的公式为值的公式为:从同一总体中抽取若干从同一总体中抽取若干n 相同的样本,并求出相同的样本,并求出样本均数,再代入样本均数,再代入t 值公式求得若干个值公式求得若干个 t 值值,将将 t 值值看成观察值,其分布称为看成观察值,其分布称为 t 分布。分布。u 分布分布:t 分布:分布:t 值为样本均数与总体均数之差与样本标准误的比值值为样本均数与总体均数之差与样本标准误的比值重要概念:重要概念:自由度用自由度用 表示,指计算某一统计量时变量表示,指计算某一统计量时变量取值不受限制的个数。取值不受限制的个数。一般情况下:一般情况下:n mn为计算某一统计量时用到的数据个数,为计算某一统计量时用到的数据个数,m为计算该统计量时用到的其他独立统计量个数,为计算该统计量时用到的其他独立统计量个数,或者计算该统计量时受到限制的条件数。或者计算该统计量时受到限制的条件数。“”为小写希腊字母读作为小写希腊字母读作 nju:自由度自由度 t 分布的用途分布的用途1.小样本时总体均数的估计,小样本时总体均数的估计,2.均数比较时的假设检验,均数比较时的假设检验,3.相关系数的假设检验。相关系数的假设检验。二、二、t 分布的特征分布的特征:(1)单峰;单峰;(2)t 值有正有负,均数为值有正有负,均数为0;(3)以以0为中心左右对称;为中心左右对称;(4)一簇曲线,每个自由度为一条曲线;一簇曲线,每个自由度为一条曲线;(5)自由度越小,峰越矮,尾越翘,随着自由度增自由度越小,峰越矮,尾越翘,随着自由度增加,加,t 分布曲线逐渐逼近标准正态分布曲线;分布曲线逐渐逼近标准正态分布曲线;(6)当自由度为无穷大时,当自由度为无穷大时,t 分布曲线和标准正态分布曲线和标准正态分布曲线完全吻合。分布曲线完全吻合。f(t)=(标准正态曲线标准正态曲线)=5=10.10.2-4-3-2-1012340.3 自由度分别为自由度分别为1、5、时的时的 t 分布分布三、三、t 分布的图形分布的图形(四、四、t 分布曲线下的面积分布分布曲线下的面积分布 t 界值表:见附表界值表:见附表2(804页)。页)。左侧为自由度,从左侧为自由度,从1;上方为概率,指曲线下尾部面积,分为单侧和双侧上方为概率,指曲线下尾部面积,分为单侧和双侧(单尾和双尾);(单尾和双尾);中间为中间为 t 值的绝对值,即图形中横坐标的位置。值的绝对值,即图形中横坐标的位置。单侧单侧t 界值的表示方法:界值的表示方法:双侧双侧t 界值的表示方法:界值的表示方法:t 0 tt 值表示意图值表示意图同一自由度时,同一自由度时,P P 值越小值越小 t 值越大;值越大;同一同一P P 值时,自由度越大值时,自由度越大 t 值越小;值越小;自由度自由度 时,时,t 值值u 值;值;当自由度当自由度10,单侧曲线下面积概率为,单侧曲线下面积概率为0.05时,时,t 值在横坐标上的位置是值在横坐标上的位置是1.812。或者理解为:在上述条件下进行抽样研究,或者理解为:在上述条件下进行抽样研究,95的的 t 值应小于值应小于1.812,大于和等于,大于和等于1.812者仅有者仅有5。的含义为:的含义为:的含义?的含义?01.812502.2282.51.8122.22812第三节第三节 总体均数总体均数()的估计的估计 一、可信区间的概念可信区间的概念 用样本指标估计总体指标称为参数估计,用样本指标估计总体指标称为参数估计,方法有点值估计和区间估计两种。方法有点值估计和区间估计两种。的点值估计:的点值估计:将样本均数作为将样本均数作为的估计值,由于抽样误差的估计值,由于抽样误差的存在,所以的存在,所以的点值估计准确度较低。的点值估计准确度较低。的的区间估计区间估计:考虑抽样误差并按一定的可信度计算包含考虑抽样误差并按一定的可信度计算包含在内的一个范围,称为在内的一个范围,称为区间估计区间估计,该范围称为,该范围称为可信区间可信区间,常用双侧,常用双侧95。可信限是指两个界值可信限是指两个界值二、总体均数可信区间的计算二、总体均数可信区间的计算1.单一总体均数的可信区间单一总体均数的可信区间(1)未知,未知,n 60,按,按 t 分布。分布。双侧双侧1可信区间可信区间(95%,)单侧单侧1可信区间可信区间 或或 例例3-2 在例在例3-1中抽得第中抽得第15号样本的均数号样本的均数 (cm),标准差,标准差 (cm),试求,试求 其总体均数的其总体均数的95%可信区间。可信区间。故该地故该地18岁男生身高均数的岁男生身高均数的95 可信区间为(可信区间为(164.35,169.55)(cm)。例:随机检查了例:随机检查了20名慢性胃炎脾虚男病人,其脉搏名慢性胃炎脾虚男病人,其脉搏均数为均数为74.3次次/分分,标准差为标准差为6.4次次/分,试估计该类病分,试估计该类病人脉搏总体均数的人脉搏总体均数的95可信区间。可信区间。本例本例n=20,=19,t0.05/2,19=2.093,95%可信区为:可信区为:(74.3-2.0936.4/,74.32.0936.4/)即即(71.3次次/分分,77.3次次/分分)。(2)未知,未知,n 60,按,按u分布。分布。双侧双侧1可信区间可信区间单侧单侧1可信区间可信区间 或或例例:随机检查随机检查140例成年男子的红细胞数得:例成年男子的红细胞数得:试估计该地成年男子红细胞数试估计该地成年男子红细胞数95可信区间。可信区间。(4.79 1.960.42/,4.79+1.960.42/)=(4.72 ,4.86 )例例3-3 某地抽得正常成人某地抽得正常成人200名,测得其血清胆固名,测得其血清胆固醇的均数为醇的均数为3.64 mmol/L,标准差为,标准差为1.20mmol/L,试估计该地正常成人血清胆固醇均数的试估计该地正常成人血清胆固醇均数的95%可信可信区间。区间。故该地正常成人血清胆固醇均数的故该地正常成人血清胆固醇均数的95%可信可信区间为(区间为(3.47,3.91)mmol/L。(3)已知,按已知,按 u 分布分布双侧双侧1可信区间可信区间单侧单侧1可信区间可信区间 或或2.2.两总体均数之差的可信区间两总体均数之差的可信区间双侧双侧1可信区间可信区间单侧单侧1可信区间可信区间 或或 为两均数之差标准误,计算公式:为两均数之差标准误,计算公式:为合并方差为合并方差 当两样本含量均大于当两样本含量均大于60,可用可用 u值代替值代替t值进行值进行估计,估计,也可用以下公式计算:也可用以下公式计算:例例3-4 为了解甲氨蝶呤为了解甲氨蝶呤(MTX)对外周血对外周血IL-2水水平的影响,某医生将平的影响,某医生将61名哮喘患者随机分为两组。名哮喘患者随机分为两组。其中对照组其中对照组29例例(),采用安慰剂;试验组,采用安慰剂;试验组32例例(),采用小剂量甲氨蝶呤,采用小剂量甲氨蝶呤(MTX)进行治疗。进行治疗。测得对照组治疗前测得对照组治疗前IL-2的均数为的均数为20.10 IU/ml(),标准差为标准差为7.02 IU/ml();试验组治疗前;试验组治疗前IL-2的的均数为均数为16.89 IU/ml(),标准差为,标准差为8.46 IU/ml()。问两组治疗前基线的。问两组治疗前基线的IL-2总体均数相差总体均数相差有多大?有多大?故两组治疗前基线的故两组治疗前基线的IL-2总体均数之差的总体均数之差的95可信区间为(可信区间为(0.79,7.21)IU/ml。三、可信区间的确切含义和两个要素三、可信区间的确切含义和两个要素 如果能够进行重复抽样试验,平均有如果能够进行重复抽样试验,平均有1的可信区间包含了总体参数,而不是总体参数落的可信区间包含了总体参数,而不是总体参数落在该范围的可能性为在该范围的可能性为1。可信区间的可信区间的两个要素两个要素:(1)准确度:包含总体参数的概率大小;准确度:包含总体参数的概率大小;(2)精密度:可信区间的长度。精密度:可信区间的长度。注意准确度和精密度的关系注意准确度和精密度的关系增加样本含量可提高精密度增加样本含量可提高精密度四、总体均数可信区间与参考值范围的区别;四、总体均数可信区间与参考值范围的区别;可信区间可信区间 参考值范围参考值范围 含义含义计算计算用途用途(双侧大样本)(双侧大样本)(95)估计总体均数估计总体均数判断个体指标判断个体指标正常与否正常与否是指包含是指包含在内的在内的 范围,或样本均数范围,或样本均数的分布范围。的分布范围。是指正常人某是指正常人某指标(观察值)指标(观察值)的波动的波动 范围。范围。第四节第四节 假设检验假设检验(hypothesis test)例例3-5 某医生测量了某医生测量了36名从事铅作业男性工人名从事铅作业男性工人的血红蛋白含量,算得其均数为的血红蛋白含量,算得其均数为130.83g/L,标准,标准差为差为25.74g/L。问从事铅作业工人的血红蛋白是否。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值不同于正常成年男性平均值140g/L?已知总体已知总体未知总体未知总体?图图34 例例35示意图示意图一、假设检验的概念:一、假设检验的概念:先对总体参数或分布作出某种假设先对总体参数或分布作出某种假设,然后用,然后用适当的方法计算检验统计量,根据该检验统计量适当的方法计算检验统计量,根据该检验统计量的分布理论的分布理论,推断假设推断假设是否拒绝是否拒绝。二、假设检验的种类:二、假设检验的种类:根据检验目的分为根据检验目的分为:差别性检验差别性检验、方差齐性检验、方差齐性检验、拟合优度检验、正态性检验、均衡性检验等。拟合优度检验、正态性检验、均衡性检验等。根据检验统计量命名分为根据检验统计量命名分为:三、假设检验的意义三、假设检验的意义:通过对事物通过对事物数量差异数量差异的比较分析,判断的比较分析,判断事物间有无事物间有无质量区别质量区别。四、假设检验的基本思想:四、假设检验的基本思想:小概率反证法思想。小概率反证法思想。五、五、假设检验的一般步骤假设检验的一般步骤 以例以例3-5为例,说明假设检验的一般步骤:为例,说明假设检验的一般步骤:1.建立假设,确定检验检验水准:建立假设,确定检验检验水准:(1)检验假设)检验假设 H0:=0,(2)备择假设)备择假设 H1:0,双侧检验。,双侧检验。注意注意:针对总体;针对总体;相互联系、相互对立,缺一不可;相互联系、相互对立,缺一不可;情况不同假设不同;情况不同假设不同;单、双侧检验时单、双侧检验时H1 不同。不同。单、双侧检验单、双侧检验两个指标两个指标比较时比较时,从从专业专业角度考虑:角度考虑:如果甲指标大于乙指标或甲指标小于乙指标如果甲指标大于乙指标或甲指标小于乙指标都可能发生则为都可能发生则为双侧检验双侧检验;如果甲指标不可能大于(或小于)乙指标如果甲指标不可能大于(或小于)乙指标,只只需检验是否小于(或大于)乙指标则为需检验是否小于(或大于)乙指标则为单侧检验单侧检验。表表33 样本均数(代表未知样本均数(代表未知 )与已知总体均数)与已知总体均数 比较的比较的t 检验检验目的目的 双侧检验双侧检验 是否是否 单侧检验单侧检验 是否是否 是否是否 检验水准符号为检验水准符号为,它是人为规定的小概率,它是人为规定的小概率事件的判断标准,即事件的判断标准,即H0拒绝与否的概率界限,或拒绝与否的概率界限,或犯第一类错误的概率,一般取犯第一类错误的概率,一般取0.05。2.选定检验方法,计算检验统计量:选定检验方法,计算检验统计量:检验方法的选择依据有:资料类型、设计方检验方法的选择依据有:资料类型、设计方案、检验目的、样本大小、分布类型、方差齐性案、检验目的、样本大小、分布类型、方差齐性以及检验方法的适用条件等等。以及检验方法的适用条件等等。本例选择单样本本例选择单样本 t 检验:检验:(为什么?为什么?)(3)检验水准)检验水准3.确定确定P值,作出推断和结论:值,作出推断和结论:P值的大小根据检验统计量的理论界值表查得。值的大小根据检验统计量的理论界值表查得。本例自由度本例自由度35,查,查 t 值表得值表得 t0.05/2,35=2.030,t0.02/2,35=2.438,2.030 2.138 2.438,故,故0.02P 时,无统计学意义,不拒绝时,无统计学意义,不拒绝H0;P 时,有统计学意义,拒绝时,有统计学意义,拒绝H0,接受,接受H1。本例本例P 0.05,即即P 60,t 分布接近分布接近u分布,分布,或者已知总体标准差(或者已知总体标准差()时均可采用)时均可采用 u 检验。检验。一、样本均数与总体均数比较一、样本均数与总体均数比较1.总体标准差已知:总体标准差已知:2.总体标准差未知,样本较大(总体标准差未知,样本较大(n 60):):3.总体标准差未知,样本较小总体标准差未知,样本较小(例(例35)二、二、配对设计资料的配对设计资料的 t 检验检验 配对设计配对设计包括异体配对和同体配对两种。包括异体配对和同体配对两种。异体配对是将两个条件相近的对象配成一对,异体配对是将两个条件相近的对象配成一对,然后随机化地接受两种处理;然后随机化地接受两种处理;模式:模式:甲组甲组 乙组乙组 随机随机 同体配对同体配对是对同一观察对象分别接受两种处理是对同一观察对象分别接受两种处理后的结果进行比较,又称自身配对,包括:后的结果进行比较,又称自身配对,包括:在两个部位用两种不同方法处理后进行比较;在两个部位用两种不同方法处理后进行比较;先后用两种方法处理后进行比较;先后用两种方法处理后进行比较;同一对象的检测标本用两种方法检测;同一对象的检测标本用两种方法检测;同一对象接受一种处理前后比较等。同一对象接受一种处理前后比较等。关于一种处理前后的比较是一种特殊的同体配对设计,关于一种处理前后的比较是一种特殊的同体配对设计,又可称为前后测量设计,见第十二章,又可称为前后测量设计,见第十二章,262页。页。配对配对 t 检验步骤如下检验步骤如下:(设定设定d为正态分布为正态分布)补充例子:补充例子:1:H0:=0;H1:0,单侧检验,单侧检验,=0.05,单侧。,单侧。2:计算计算 t 值:值:三棱莪术液抑瘤实验的结果三棱莪术液抑瘤实验的结果 对子数对子数 对照组对照组 注射药液组注射药液组 差值(差值()1 3.6 3.0 0.6 0.36 2 4.5 2.3 2.2 4.84 3 4.2 2.4 1.8 3.24 4 4.4 1.1 3.3 10.89 5 3.7 4.0 -0.3 0.09 6 5.6 3.7 1.9 3.61 7 7.0 2.7 4.3 18.49 8 4.1 1.9 2.2 4.84 9 5.0 2.6 2.4 5.75 10 4.5 1.3 3.2 10.24 合计合计 -21.6 62.36 3.确定确定P值,作出判断和结论:值,作出判断和结论:计算自由度计算自由度 =10 1=9,查,查 t 值表得单侧值表得单侧 因因5.1671.833,故,故P 0.05。按按 =0.05水准,拒绝水准,拒绝H0,接受,接受H1。可以认为。可以认为三棱莪术液有抑瘤作用。三棱莪术液有抑瘤作用。例例3-6 为比较两种方法对乳酸饮料中脂肪含量为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,随机抽取了测定结果是否不同,随机抽取了10份乳酸饮料制份乳酸饮料制品,分别用脂肪酸水解法和哥特里罗紫法测定品,分别用脂肪酸水解法和哥特里罗紫法测定其结果如表其结果如表3-5第第(1)(3)栏。问两法测定结果是否栏。问两法测定结果是否不同?不同?编号编号 哥特里罗紫法哥特里罗紫法 脂肪酸水解法脂肪酸水解法 差值差值d (1)(2)(3)(4)=(2)(3)1 0.840 0.580 0.260 2 0.591 0.509 0.082 3 0.674 0.500 0.174 4 0.632 0.316 0.316 5 0.687 0.337 0.350 6 0.978 0.517 0.461 7 0.750 0.454 0.296 8 0.730 0.512 0.218 9 1.200 0.997 0.203 10 0.870 0.506 0.364 2.724 表表3-5 两种方法对乳酸饮料中脂肪含量测定结果两种方法对乳酸饮料中脂肪含量测定结果(1)建立检验假设,确定检验水准)建立检验假设,确定检验水准 H0:=0;H1:0,=0.05,双侧检验。,双侧检验。(2)计算检验统计量:)计算检验统计量:(3)确定确定P值,作出判断和结论:值,作出判断和结论:查查t值表得值表得:按按=0.05水准拒绝水准拒绝 H0 ,接受接受H1,可以认为两,可以认为两种方法对脂肪含量的测定结果不同,哥特里种方法对脂肪含量的测定结果不同,哥特里-罗罗紫法的测定结果高于脂肪酸水解法。紫法的测定结果高于脂肪酸水解法。100例随机化随机化甲组乙组分为两组的简化模式分为两组的简化模式完全随机设计完全随机设计:三、完全随机设计两小样本均数比较三、完全随机设计两小样本均数比较 本设计是单因素两水平或多水平的实验设本设计是单因素两水平或多水平的实验设计类型。它是将受试对象完全按随机原则分配到计类型。它是将受试对象完全按随机原则分配到各处理组,试验结束后比较各组均数(或率)之各处理组,试验结束后比较各组均数(或率)之间的差别有无统计学意义,推论处理因素的效应。间的差别有无统计学意义,推论处理因素的效应。因素视为分组,水平即为组数。因素视为分组,水平即为组数。1.总体方差相等总体方差相等(且呈正态分布且呈正态分布)两小样本均数比较两小样本均数比较 表表36 试验组和对照组空腹血糖下降值(试验组和对照组空腹血糖下降值(mmol/L)试验组试验组X1 0.70 5.60 2.00 2.80 0.70 3.50 4.00 5.85 7.10 0.50n1=20 2.50 1.60 1.70 3.00 0.40 4.50 4.60 2.50 6.00 1.40对照组对照组X2 3.70 6.50 5.00 5.20 0.80 0.20 0.60 3.40 6.60 1.10n2=20 6.00 3.80 2.00 1.60 2.00 2.20 1.20 3.10 1.70 2.00例例3-7 为研究国产四类新药阿卡波糖胶囊的降血糖效果,为研究国产四类新药阿卡波糖胶囊的降血糖效果,某医院用某医院用40名名2型糖尿病病人进行同期随机对照试验。试型糖尿病病人进行同期随机对照试验。试验者将这些病人随机等分到试验组验者将这些病人随机等分到试验组(用阿卡波糖胶囊用阿卡波糖胶囊)和对和对照组照组(用拜糖平胶囊用拜糖平胶囊),分别测得试验开始前和,分别测得试验开始前和8周后的空周后的空腹血糖,算得空腹血糖下降值见表腹血糖,算得空腹血糖下降值见表3-6,能否认为该国产,能否认为该国产四类新药阿卡波糖胶囊与拜糖平胶囊对空腹血糖的降糖效四类新药阿卡波糖胶囊与拜糖平胶囊对空腹血糖的降糖效果不同?果不同?(1)H0:1=2;H1:1 2,=0.05,双侧检验。,双侧检验。(2)求求t值:值:本例本例 n1=20,S1=3.0601;n2=20,,S2=2.4205。代入公式,最终求得代入公式,最终求得 t=0.642(3)确定确定P值值,判断结论:判断结论:本例自由度为本例自由度为38,查,查 t 值表双侧得值表双侧得t0.5/2,38=0.681。0.642 0.50。按按=0.05水准不拒绝水准不拒绝H0,无统计学意义,还,无统计学意义,还不能认为两组降血糖效果不同。不能认为两组降血糖效果不同。两大样本均数比较:两大样本均数比较:当两样本较大,如均大于当两样本较大,如均大于60,可按正态分,可按正态分布原理采用布原理采用u检验。检验。2.方差不齐时的方差不齐时的Cochran&Cox近似近似 t 检验检验统计量统计量 界值界值说明:说明:(1)检验是在方差不齐时需对检验是在方差不齐时需对t 值的值的界值界值作校作校正的检验方法,正的检验方法,(2)当)当n1=n2时,可用时,可用 t 检验代替检验代替 检验,但是查检验,但是查 t 值表时自由度应改用(值表时自由度应改用(n-1)。)。(3)当)当n1=n2都较大时,可直接用都较大时,可直接用 t 检验或检验或 u 检验。检验。当当n1=n2 时,时,公式公式变为:变为:当当n1=n2 时,时,例例3-8 在上述例在上述例3-7国产四类新药阿卡波糖胶囊国产四类新药阿卡波糖胶囊的降血糖效果研究中,测得用拜糖平胶囊的对照组的降血糖效果研究中,测得用拜糖平胶囊的对照组20例病人和用阿卡波糖胶囊的试验组例病人和用阿卡波糖胶囊的试验组20例病人,其例病人,其8周时糖化血红蛋白周时糖化血红蛋白HbA1c(%)下降值如表下降值如表3-7。问。问用两种不同药物的病人其用两种不同药物的病人其HbA1c下降值是否不同?下降值是否不同?分组分组 n 对照组对照组 20 1.46 1.36 试验组试验组 20 1.13 0.70表表3-7 对照组和试验组对照组和试验组HbA1c下降值下降值(%)(1)建立检验假设,确定检验水准)建立检验假设,确定检验水准H0:1=2;H1:1 2,=0.05,双侧检验。,双侧检验。(2)计算检验统计量:)计算检验统计量:(3)确定确定P值值,判断结论:判断结论:本例本例n1=n2,故直接取自由度为,故直接取自由度为19,查,查 t 值表双值表双侧得侧得t0.05/2,19=2.093。0.965 0.05。按按=0.05水准不拒绝水准不拒绝H0,无统计学意义,还,无统计学意义,还不能认为两组病人的不能认为两组病人的HbA1c下降值下降值不同。不同。3.方差不齐时的方差不齐时的Satterthwaite近似近似 t 检验(略)检验(略)4.方差不齐时的方差不齐时的Welch近似近似 t 检验(略)检验(略)以上两种方法是对以上两种方法是对自由度进行校正自由度进行校正的近似的近似 t 检验。检验。第六节第六节 假设检验的注意事项假设检验的注意事项一、一、型错误和型错误和型错误型错误 由于假设检验结果的判断是采用小概率原由于假设检验结果的判断是采用小概率原理,在某个理,在某个水准上作出的,具有概率性质,因水准上作出的,具有概率性质,因此结果的判断不可能绝对准确。此结果的判断不可能绝对准确。将拒绝假设时所犯错误称为将拒绝假设时所犯错误称为型错误型错误,用用表示;表示;将接受假设时所犯错误称为将接受假设时所犯错误称为型错误型错误,用用表示。表示。两类错误的两类错误的关系关系:小小大;大;大大小。小。两类错误的两类错误的控制控制:差别性检验差别性检验:减少减少 控制控制型错误。型错误。方差齐性检验、拟合优度检验、正态性检验、方差齐性检验、拟合优度检验、正态性检验、均衡性检验等需要控制均衡性检验等需要控制型错误,应加大型错误,应加大,一,一般取般取0.10或或0.20。增大样本含量可同时减少两型错误。增大样本含量可同时减少两型错误。(1 )称为检验效能,其意义为,如果两总体)称为检验效能,其意义为,如果两总体确有差异,按确有差异,按 水准所能发现该差异的能力。水准所能发现该差异的能力。成立成立11图图36 型错误和型错误和型错误示意图型错误示意图 (以单侧以单侧u检验为例检验为例)界值界值成立成立 表表38 可能发生的两类错误可能发生的两类错误 假设检验的结果假设检验的结果 拒绝拒绝 “接受接受”成立成立 型错误型错误()推断正确推断正确(1)成立成立 推断正确推断正确(1)型错误型错误()客观实际客观实际二、二、假设检验中应注意的问题假设检验中应注意的问题1.注意假设检验的前提:可比性。注意假设检验的前提:可比性。2.注意正确选择检验方法注意正确选择检验方法 检验方法的选择依据有:资料类型、设计方检验方法的选择依据有:资料类型、设计方案、检验目的、样本大小、分布类型、方差齐性案、检验目的、样本大小、分布类型、方差齐性以及检验方法的适用条件等等。以及检验方法的适用条件等等。3.注意合理确定单、双侧检验:注意合理确定单、双侧检验:单、双侧的确定完全取决于专业知识,用单、双侧的确定完全取决于专业知识,用于两个指标比较的于两个指标比较的t 检验检验u 检验。单侧检验更容易检验。单侧检验更容易拒绝拒绝H0。4.注意科学地解释假设检验的结论:注意科学地解释假设检验的结论:(1)(1)假设检验的结论并非绝对正确。假设检验的结论并非绝对正确。(2)P(2)P值大小不代表差别大小。值大小不代表差别大小。(3)(3)注意差别大小有无专业上的实际意义。注意差别大小有无专业上的实际意义。6.影响假设检验结论的因素:影响假设检验结论的因素:(1)差别大小、()差别大小、(2)个体差异大小、()个体差异大小、(3)n大大小、小、(4 4)单、双侧检验、单、双侧检验、(5 5)检验水准等。)检验水准等。7.注意可信区间与假设检验的区别和联系注意可信区间与假设检验的区别和联系(1)可信区间是推断包含总体均数的范围,假设检验是)可信区间是推断包含总体均数的范围,假设检验是推断两总体均数是否不等。推断两总体均数是否不等。(2)可信区间与假设检验的结论一致)可信区间与假设检验的结论一致例例35 资料资料 从事铅作业工人血红蛋白总体均数的从事铅作业工人血红蛋白总体均数的95可信区间为可信区间为(122.12,139.54)不包括正常成年男性血红蛋白总体均)不包括正常成年男性血红蛋白总体均数数140g/L,故可认为,从事铅作业工人血红蛋白平均含量故可认为,从事铅作业工人血红蛋白平均含量低于正常成年男性血红蛋白。低于正常成年男性血红蛋白。(3)可信区间计算应预先规定概率,假设检验则可获得)可信区间计算应预先规定概率,假设检验则可获得较为确切的概率。较为确切的概率。(4)可信区间比与假设检验能提供更多的信息)可信区间比与假设检验能提供更多的信息H01图图37 可信区间在统计推断上提供的信息可信区间在统计推断上提供的信息有实际专业有实际专业意义的值意义的值65432第七节第七节 正态性检验检验与方差齐性检验正态性检验检验与方差齐性检验一、正态性检验一、正态性检验1.图示法图示法(1)概率图()概率图(P-P图)图图)图38(1)分位数图()分位数图(Q-Q图)图图)图392.计算法计算法(1)矩法)矩法(2)W检验法检验法(3)W检验法检验法(3)D检验法检验法偏度系数(偏度系数(coefficient of skewness)偏度是指分布不对称的程度和方向。偏度是指分布不对称的程度和方向。矩法检验矩法检验峰度系数(峰度系数(coefficient of kurtosis)峰度是指与正态分布相比峰的冒尖或扁平程度。峰度是指与正态分布相比峰的冒尖或扁平程度。在理想状态下,在理想状态下,对称分布对称分布,大于大于0为正偏态为正偏态,小于小于0为负偏态;为负偏态;对称分布对称分布,大于大于0为尖峭峰为尖峭峰,小于小于0为平阔峰。为平阔峰。u 检验检验偏度系数标准误偏度系数标准误峰度系数标准误峰度系数标准误例例39 对模拟随机抽样所得对模拟随机抽样所得100个样本均数进行个样本均数进行正态性检验:正态性检验:本例求得:本例求得:经查表,经查表,两者两者u值均小于值均小于0.684,故,故P大于大于0.50,不拒绝,不拒绝H0,还不能认为该资料不还不能认为该资料不服从正态分布。服从正态分布。二、两组方差齐性检验二、两组方差齐性检验 采用采用F检验,检验,F 值计算公式如下值计算公式如下:如果经检验方差齐性,则可采用如果经检验方差齐性,则可采用t 检验,否则检验,否则应采用应采用 检验检验、秩和检验或采用变量变换的法。秩和检验或采用变量变换的法。F F 分布分布:(1)定义公式:定义公式:、分别为两个相互独立的随机变量,分别为两个相互独立的随机变量,、分别为它们的自由度。分别为它们的自由度。分母自由度为分母自由度为10,分子自由度,分子自由度(m)分别为分别为4、10、50、时分布密度函数图形时分布密度函数图形f f(F)(F)F(2 2)分布曲线:)分布曲线:F F 分布为一簇单峰正偏态分布曲分布为一簇单峰正偏态分布曲线,取决于分子和分母两个自由度。线,取决于分子和分母两个自由度。分子自由度为分子自由度为10,分母自由度,分母自由度(n)分别为分别为 4、10、50、时分布密度函数的图形时分布密度函数的图形f f(F)(F)F(3)实际分析时)实际分析时F 值的计算:值的计算:(4)F 分布与分布与 t 分布、分布、u 分布的关系为:分布的关系为:(5)F分布曲线下的面积分布分布曲线下的面积分布 附表附表3 F界值表(界值表(806页)页)等。等。、MS为平均方差为平均方差例例310 对例对例37资料作方差齐性检验资料作方差齐性检验 ,查查F 界值表得界值表得 ,1.598 2.15,故故P小于小于0.10,拒绝,拒绝H0,接受接受H1可以认为两组总体可以认为两组总体方差不等。方差不等。(故该资料应采用(故该资料应采用 检验)检验),,三、三、变量变换变量变换 1.变量变换的意义:变量变换的意义:变量变换是指将原变量(原始数据)变换变量变换是指将原变量(原始数据)变换成某种函数值,达到正态分布、方差齐性、曲线成某种函数值,达到正态分布、方差齐性、曲线的直线化等目的,以满足分析方法对资料的要求。的直线化等目的,以满足分析方法对资料的要求。常用的变量变换方法有对数变换、平方根常用的变量变换方法有对数变换、平方根变换、倒数变换、平方根反正变换、倒数变换、平方根反正弦弦变换等变换等。2.变量变换的方法:变量变换的方法:(1)对数变换:对数变换:用于:用于:正态化变换正态化变换对数正态分布资料。对数正态分布资料。方差齐性变换方差齐性变换标准差与均数成比例或变异系标准差与均数成比例或变异系数接近某常数时的方差不齐资料。数接近某常数时的方差不齐资料。直线化变换直线化变换曲线关系资料。曲线关系资料。(2)平方根变换:平方根变换:或或 用于:用于:正态化变换正态化变换泊松分布资料、轻度偏态资料。泊松分布资料、轻度偏态资料。方差齐性变换方差齐性变换方差与均数呈正比关系时的方差与均数呈正比关系时的方差不齐资料。方差不齐资料。(3)平方根反正弦变换:)平方根反正弦变换:(1)用角度表示:)用角度表示:(2)用弧度表示:)用弧度表示:用于观察值为百分数且分布较偏的资料,特用于观察值为百分数且分布较偏的资料,特别是百分数离散度大的资料,可使资料接近正别是百分数离散度大的资料,可使资料接近正态分布,并达到方差齐性要求。态分布,并达到方差齐性要求。(3)倒数变换:)倒数变换:用于数据两端波动较大的资料,用于数据两端波动较大的资料,减少极端值的影响。减少极端值的影响。9、静夜四无邻,荒居旧业贫。3月-233月-23Friday,March 17,202310、雨中黄叶树,灯下白头人。15:54:3515:54:3515:543/17/2023 3:54:35 PM11、以我独沈久,愧君相见频。3月-2315:54:3515:54Mar-2317-Mar-2312、故人江海别,几度隔山川。15:54:3515:54:3515:54Friday,March 17,202313、乍见翻疑梦,相悲各问年。3月-233月-2315:54:3515:54:35March 17,202314、他乡生白发,旧国见青山。17 三月 20233:54:35 下午15:54:353月-2315、比不了得就不比,得不到的就不要。三月 233:54 下午3月-2315:54March 17,202316、行动出成果,工作出财富。2023/3/17 15:54:3515:54:3517 March 202317、做前,能够环视四周;做时,你只能或者最好沿着以脚为起点的射线向前。3:54:35 下午3:54 下午15:54:353