医学统计学--第三章总体均数的估计与假设检验.ppt
《医学统计学--第三章总体均数的估计与假设检验.ppt》由会员分享,可在线阅读,更多相关《医学统计学--第三章总体均数的估计与假设检验.ppt(130页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章第三章 总体均数的估计与假设检验总体均数的估计与假设检验Estimation of Population Mean Estimation of Population Mean and Hypothesis Testand Hypothesis Test 1ContentContent1.1.Sampling error and standard error of meanSampling error and standard error of mean2.2.t-distributiont-distribution3.3.Estimation of Population MeanEsti
2、mation of Population Mean4.4.t-testt-test5.5.Notice of hypothesis testNotice of hypothesis test 6.6.Normality test and homogeneity of varianceNormality test and homogeneity of variance test test2第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误3统计推断:由样本信息推断总体特征统计推断:由样本信息推断总体特征。样本统计指标样本统计指标(统计量)(统计量)总体统计指标总体统计指标(参数)(参数)
3、正态(分布)总体:正态(分布)总体:推断推断 !说明!说明!为说明抽样误差规律,先用一个实例,后为说明抽样误差规律,先用一个实例,后引出理论。引出理论。4图图3-11999年某市年某市18岁男生身高岁男生身高N(167.7,5.32)的抽样示意图的抽样示意图 5见见P3436表表3-16将将此此100个个样样本本均均数数看看成成新新变变量量值值,则则这这100个样本均数构成一个样本均数构成一新分布新分布,绘制直方图。,绘制直方图。图图3-2从正态分布总体从正态分布总体N(167.7,5.32)随机抽样所得样本均数分布随机抽样所得样本均数分布7 ,各样本均数各样本均数未必等于总体均数;未必等于总
4、体均数;各样本均数间存在差异;各样本均数间存在差异;样样本本均均数数的的分分布布为为中中间间多多,两两边边少少,左左右右基基本本对称。对称。样样本本均均数数的的变变异异范范围围较较之之原原变变量量的的变变异异范范围围大大大缩小。大缩小。可可算算得得这这100个个样样本本均均数数的的均均数数为为167.69cm、标标准准差为差为1.69cm。样本均数的抽样分布具有如下样本均数的抽样分布具有如下特点:特点:81、抽样误差:、抽样误差:由个体变异产生的、抽样造成的样由个体变异产生的、抽样造成的样本统计量与总体参数的差别本统计量与总体参数的差别 均数的抽样误差:均数的抽样误差:由于抽样造成的由于抽样造
5、成的样本均数与总体均数的差别样本均数与总体均数的差别 原因:原因:1 1)抽样)抽样 2 2)个体差异)个体差异9本书以本书以n=60n=60为界限为界限10表表示示样样本本统统计计量量抽抽样样误误差差大大小小的的统统计计指标。指标。均均数数标标准准误误:说说明明均均数数抽抽样样误误差差的的大小,总体计算公式大小,总体计算公式(3-1)2、标准误标准误(standarderror,SE)实质:样本均数的标准差实质:样本均数的标准差11数理统计证明:数理统计证明:12若用样本标准差若用样本标准差S 来估计来估计,(3-2)降低抽样误差的途径有降低抽样误差的途径有:通过增加样本含量通过增加样本含量
6、n;通过设计减少通过设计减少S。13第二节第二节t 分布分布(t-distribution)14nt分布概述n抽样误差的分布规律nn样本总体nt分布理论n手段(桥梁)目的15一、一、t 分布分布的概念的概念1617式中式中为自由度为自由度(degreeoffreedom,df)3实实际际工工作作中中,由由于于 未未知知,用用 代代替替,则则 不不再再服服从从标标准准正正态态分分布布,而而服从服从t t 分布。分布。18二、二、t 分布的图形与特征分布的图形与特征 分布只有一个参数,即自由度19图3-3不同自由度下的t 分布图201特征:特征:212 t界界值值表表:详详见见附附表表2,可可反反
7、映映t分分布布曲曲线下的面积。线下的面积。单侧概率或单尾概率:用单侧概率或单尾概率:用表示;表示;双侧概率或双尾概率:用双侧概率或双尾概率:用表示。表示。22-tt023举例举例:24第三节第三节 总体均数的估计总体均数的估计25一、参数估计一、参数估计 用样本统计量推断总体参数。用样本统计量推断总体参数。总体均数估计:总体均数估计:用样本均数(和用样本均数(和标准差)推断总体均数。标准差)推断总体均数。2627按按预预先先给给定定的的概概率率(1 )所所确确定定的的包包含未知总体参数的一个范围。含未知总体参数的一个范围。总总体体均均数数的的区区间间估估计计:按按预预先先给给定定的的概概率率(
8、1 )所所确确定定的的包包含含未未知知总总体体均均数数的的一个范围。一个范围。如如给给定定=0.05,该该范范围围称称为为参参数数的的95%可可信信区区间或置信区间;间或置信区间;如如给给定定=0.01,该该范范围围称称为为参参数数的的99%可可信信区区间或置信区间。间或置信区间。2区间估计区间估计(intervalestimation):28二、总体均数可信区间的计算二、总体均数可信区间的计算29n总体均数可信区间的计算n需考虑:n(1)总体标准差是否已知,n(2)样本含量n的大小n通常有两类方法:n(1)t分布法 (2)u分布法30 1.1.单一总体均数的可信区间单一总体均数的可信区间31
9、32P25,15号样本号样本333435例例3-3某地抽取正常成年人某地抽取正常成年人200名,测得名,测得其血清胆固醇的均数为其血清胆固醇的均数为3.64mmol/L,标准差标准差为为1.20mmol/L,估计该地正常成年人血清胆估计该地正常成年人血清胆固醇均数的固醇均数的95%可信区间。可信区间。36故故该该地地正正常常成成年年人人血血清清胆胆固固醇醇均均数数的的双双侧侧95%可信区间为可信区间为(3.47,3.81)mmol L。37383940例例3-4为为了了解解氨氨甲甲喋喋呤呤(MTX)对对外外周周血血IL-2水水平平的的影影响响,某某医医生生将将61名名哮哮喘喘患患者者随随机机分
10、分为为两两组组。其其中中对对照照组组29例例(),采采用用安安慰慰剂剂;实实验验组组32例例(),采采用用小小剂剂量量氨氨甲甲喋喋呤呤(MTX)进进行行治治疗疗。测测得得对对照照组组治治疗疗前前IL-2的的均均数数为为20.10IU/ml(),标标准准差差为为7.02IU/ml();试试验验组组治治疗疗前前IL-2的的均均数数为为16.89IU/ml(),标标准准差差为为8.46IU/ml()。问问两两组组治治疗疗前前基基线线的的IL-2总总体均数相差有多大?体均数相差有多大?41第一步:第一步:42能否下:两组能否下:两组IL-2的总体均数的总体均数“不同不同”或或“有差别有差别”的结论?的
11、结论?43三、可信区间的确切涵义三、可信区间的确切涵义44n1.95%的可信区间的理解:n(1)所要估计的总体参数有95%的可能在我们所估计的可信区间内。n(2)从正态总体中随机抽取100个样本,可算得100个样本均数和标准差,也可算得100个均数的可信区间,平均约有95个可信区间包含了总体均数。n(3)但在实际工作中,只能根据一次试验结果估计可信区间,我们就认为该区间包含了总体均数。45n2.可信区间的两个要素n(1)准确度:用可信度(1)表示:即区间包含总体均数的理论概率大小。n当然它愈接近1愈好,如99%的可信区间比95%的可信区间要好。n(2)精确度:即区间的宽度n区间愈窄愈好,如95
12、%的可信区间比99%的可信区间要好。46n当n确定时,上述两者互相矛盾。n提高准确度(可信度),则精确度降低n(可信区间会变宽),势必降低可信区间的实际应用价值,故不能笼统认为99%可信区间比95%可信区间要好。n相反,在实际应用中,95%可信区间更为常用。47n在可信度确定的情况下,增加样本含量可减小区间宽度,提高精确度。48四、总体均数可信区间四、总体均数可信区间与参考值范围的区别与参考值范围的区别49*也可用对应于双尾概率时也可用对应于双尾概率时),*也可用对应于也可用对应于双尾概率双尾概率时时)表表3-2总体均数的可信区间与参考值范围的区别总体均数的可信区间与参考值范围的区别50第四节
13、第四节t 检验检验511 1、样本均数、样本均数 与已知某总体均数与已知某总体均数 比较的比较的t t检验检验 目的:推断一个未知总体均数 与已知总体均 数 是否有差别,用单样本设计。2 2、两个样本均数、两个样本均数 与与 比较的比较的t t检验检验目的:推断两个未知总体均数 与 是否有差 别,用成组设计。3 3、配对设计资料均数比较的、配对设计资料均数比较的t t检验检验目的:推断两个未知总体均数 与 是否有差别用配对设计。t t 检验,亦称检验,亦称student student t t 检验检验,有下述情况有下述情况:52对于大样本对于大样本,也可以近似用也可以近似用u u检验。检验。
14、53nt检验和u检验的应用条件:n1.t检验应用条件:n样本含量n较小时(如n60)n(1)正态分布n(2)方差齐性(homogeneityofvariance)n2.u检验应用条件:n样本含量n较大,或n虽小但总体标准差已知n(1)正态分布n(2)方差齐性(homogeneityofvariance)54 假设检验过去称显著性检验假设检验过去称显著性检验。它是利它是利用小概率反证法思想,从问题的对立面用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题出发间接判断要解决的问题(H1)是否是否成立。然后在成立。然后在H0成立的条件下计算检验成立的条件下计算检验统计量,最后获得统计
15、量,最后获得P值来判断值来判断。假设检验基本思想及步骤基本思想及步骤55n例3-5某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?n130.83g/L140g/Ln原因:1.可能是总体均数不同n2.是抽样造成的5657H1的的内内容容直直接接反反映映了了检检验验单单双双侧侧。若若H1中中只只是是 0或或 0,则则此此检检验验为为单单侧侧检检验验。它它不仅考虑有无差异,而且还考虑差异的方向。不仅考虑有无差异,而且还考虑差异的方向。单单双双侧侧检检验验的的确确定定,首首
16、先先根根据据专专业业知知识识,其其次次根根据据所所要要解解决决的的问问题题来来确确定定。若若从从专专业业上上看看一一种种方方法法结结果果不不可可能能低低于于或或高高于于另另一一种种方方法法结结果果,此此时时应应该该用用单单侧侧检检验验。一一般般认认为为双双侧侧检检验验较较保保守守和稳妥。和稳妥。58(3)检检验验水水准准,过过去去称称显显著著性性水水准准,是是预预先先规规定定的的概概率率值值,它它确确定定了了小小概概率率事事件件的的标标准准。在在实实际际工工作作中中常常取取 =0.05。可可根根据据不同研究目的给予不同设置。不同研究目的给予不同设置。59 根据变量和资料类型、设计方根据变量和资
17、料类型、设计方案、统计推断的目的、是否满足特案、统计推断的目的、是否满足特定条件等(如定条件等(如数据的分布类型数据的分布类型)选)选择相应的检验统计量。择相应的检验统计量。2.计算检验统计量计算检验统计量60 P的的含含义义是是指指从从H0规规定定的的总总体体随随机机抽抽样样,抽抽得得等等于于及及大大于于(或或/和和等等于于及及小小于于)现现有有样样本本获获得得的的检检验统计量验统计量(如如t、u等等)值的概率。值的概率。例例 3-5的的 P值值 可可 用用 图图 3-5说说 明明,P为为 在在=0=140g/L的的前前提提条条件件下下随随机机抽抽样样,其其t 小小于于及及等等于于-2.13
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学统计学-第三章 总体均数的估计与假设检验 医学 统计学 第三 总体 估计 假设检验
限制150内