总体均数的估计与假设检验(11硕).ppt
《总体均数的估计与假设检验(11硕).ppt》由会员分享,可在线阅读,更多相关《总体均数的估计与假设检验(11硕).ppt(121页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、总体均数的估计与假设检验总体均数的估计与假设检验1内内 容容1.1.均数的抽样误差与标准误均数的抽样误差与标准误2.t2.t分布(分布(t-distributiont-distribution)3.3.总体均数的估计总体均数的估计4.t4.t检验检验5.5.假设检验注意事项假设检验注意事项6.6.正态性检验和两样本方差比较的正态性检验和两样本方差比较的F F检验检验2第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误3统计推断:由样本信息推断总体特征统计推断:由样本信息推断总体特征。样本统计指标样本统计指标(统计量)(统计量)总体统计指标总体统计指标(参数)(参数)正态(分布)总体:正
2、态(分布)总体:推断推断4 例例3-13-1 若某市若某市19991999年年1818岁男生身高服从均数岁男生身高服从均数=167.7cm=167.7cm、标准差、标准差 =5.3cm=5.3cm的正态分布。对该总的正态分布。对该总体进行随机抽样,每次抽体进行随机抽样,每次抽1010人,(人,(=10 =10),共抽得),共抽得100100个样本(个样本(=100 =100),计算得每个样本均数),计算得每个样本均数 及及标准差标准差 如图如图3-13-1和表和表3-13-1所示。所示。图图3-1 19993-1 1999年某市年某市1818岁男生身高岁男生身高NN(167.7,5.3(167
3、.7,5.32 2)的抽样示意图的抽样示意图 表表3.1 3.1 见见 P34-36 P34-365将将此此100100个个样样本本均均数数看看成成新新变变量量值值,则则这这100100个个样本均数构成一样本均数构成一新分布新分布,绘制直方图。,绘制直方图。图图3-2 3-2 从正态分布总体从正态分布总体NN(167.7,5.3(167.7,5.32 2)随机抽样所得样本均数分布随机抽样所得样本均数分布6 ,各样本均数,各样本均数 未必等于总体均数;未必等于总体均数;各样本均数间存在差异;各样本均数间存在差异;样样本本均均数数的的分分布布为为中中间间多多,两两边边少少,左左右右基基本本对称。对
4、称。样样本本均均数数的的变变异异范范围围较较之之原原变变量量的的变变异异范范围围大大大缩小。大缩小。可可算算得得这这100100个个样样本本均均数数的的均均数数为为167.69cm167.69cm、标标准差为准差为1.69cm1.69cm。样本均数的抽样分布具有如下样本均数的抽样分布具有如下特点:特点:71、抽样误差:、抽样误差:由个体变异与抽样的原因造成的样由个体变异与抽样的原因造成的样本统计量与总体参数的差别本统计量与总体参数的差别;均数的抽样误差:均数的抽样误差:由于抽样造成的由于抽样造成的样本均数与总体均数的差别样本均数与总体均数的差别;8本书以本书以n=60n=60为界限为界限9表表
5、示示样样本本统统计计量量抽抽样样误误差差大大小小的的统统计计指标。指标。均均数数标标准准误误:说说明明均均数数抽抽样样误误差差的的大小,总体计算公式大小,总体计算公式(3-1)2、标准误标准误(standarderror,SE)实质:样本均数的标准差实质:样本均数的标准差10数理统计证明:数理统计证明:11若用样本标准差若用样本标准差S S来估计来估计 ,(3-2)降低抽样误差的途径有降低抽样误差的途径有:通过增加样本含量通过增加样本含量n;通过设计减少通过设计减少S。12第二节第二节 t 分布分布(t-distribution)13t分布概述 抽样误差的分布规律 样本 总体 t分布 理论 手
6、段 (桥梁)目的14 一、一、t 分布分布的概念的概念1516 式中式中 为自由度为自由度(degree of freedom,df)3实实际际工工作作中中,由由于于 未未知知,用用 代代替替,则则 不不再再服服从从标标准准正正态态分分布布,而而服从服从t t 分布。分布。17二、二、t 分布的图形与特征分布的图形与特征 分布只有一个参数,即自由度18图3-3 不同自由度下的t 分布图191特征:特征:202 t界界值值表表:详详见见附附表表2,可可反反映映t分分布布曲曲线下的面积。线下的面积。单侧概率或单尾概率:用单侧概率或单尾概率:用 表示;表示;双侧概率或双尾概率:用双侧概率或双尾概率:
7、用 表示。表示。21-tt022举例:举例:23第三节第三节总体均数的估计总体均数的估计24一、参数估计一、参数估计 用样本统计量推断总体参数。用样本统计量推断总体参数。总体均数估计:总体均数估计:用样本均数(和标准用样本均数(和标准差)推断总体均数。差)推断总体均数。2526 按按预预先先给给定定的的概概率率(1 )所所确确定定的的包包含含未未知总体参数的一个范围。知总体参数的一个范围。总总体体均均数数的的区区间间估估计计:按按预预先先给给定定的的概概率率(1 )所所确确定定的的包包含含未未知知总总体体均均数数的的一一个个范范围。围。如如给给定定=0.05,=0.05,该该范范围围称称为为参
8、参数数的的95%95%可可信信区区间间或或置信区间;置信区间;如如给给定定=0.01,=0.01,该该范范围围称称为为参参数数的的99%99%可可信信区区间间或或置信区间。置信区间。2区间估计区间估计(intervalestimation):27总体均数可信区间的计算需考虑:(1)总体标准差是否已知,(2)样本含量n的大小通常有两类方法:(1)t分布法(2)u分布法二、总体均数二、总体均数 可信区间的计算可信区间的计算28 1.1.单一总体均数的可信区间单一总体均数的可信区间单侧1-可信区间则为:(1)s未知:按t分布 双侧1-可信区间则为:29 例3-2 在例3-1中抽得第15号样本得均数
9、(cm),标准差 (cm),求其总体均数的95可信区间。30313233例例3-33-3 某地抽取正常成年人某地抽取正常成年人200200名,名,测得其血清胆固醇的均数为测得其血清胆固醇的均数为3.643.64 mmol/Lmmol/L,标准差为,标准差为1.201.20mmol/Lmmol/L,估计,估计该地正常成年人血清胆固醇均数的该地正常成年人血清胆固醇均数的95%95%可信区间。可信区间。34 故故该该地地正正常常成成年年人人血血清清胆胆固固醇醇均均数数的的双双侧侧95%95%可信区间为可信区间为(3.47,3.81)mmol(3.47,3.81)mmol L L。352.2.两总体均
10、数之差的可信区间两总体均数之差的可信区间:从从 相等,相等,但但m m不等的两个正态总体不等的两个正态总体NN(1 1,2 2)和和NN(2 2,2 2)进行随机抽样。则两总体均数之差进行随机抽样。则两总体均数之差(m m1 1-m m2 2)的双侧的双侧1-1-可信区间可信区间为为3637同理,两总体均数之差同理,两总体均数之差(m m1 1-m m2 2)的单侧的单侧1-1-可信区间为可信区间为 当两样本的样本含量均较大时当两样本的样本含量均较大时(如如n n1 1和和n n2 2均大于均大于60)60),可按正态分布处理。,可按正态分布处理。38 例例3-4 3-4 为为了了解解氨氨甲甲
11、喋喋呤呤(MTX)(MTX)对对外外周周血血IL-2IL-2水水平平的的影影响响,某某医医生生将将6161名名哮哮喘喘患患者者随随机机分分为为两两组组。其其中中对对照照组组2929例例(),采采用用安安慰慰剂剂;实实验验组组3232例例(),采采用用小小剂剂量量氨氨甲甲喋喋呤呤(MTX)(MTX)进进行行治治疗疗。测测得得对对照照组组治治疗疗前前IL-2IL-2的的均均数数为为20.10 20.10 IU/ml IU/ml(),标标准准差差为为7.02 7.02 IU/ml IU/ml();试试验验组组治治疗疗前前IL-2IL-2的的均均数数为为16.89 16.89 IU/ml IU/ml(
12、),标标准准差差为为8.46 8.46 IU/ml IU/ml()。问问两两组组治治疗疗前前基基线线的的IL-2IL-2总总体均数相差有多大?体均数相差有多大?39第一步:第一步:40能否下:两组能否下:两组IL-2IL-2的总体均数的总体均数“不同不同”或或“有差别有差别”的结论?的结论?411.95%的可信区间的理解:(1)所要估计的总体参数有95%的可能性在我们所估计的可信区间内。(2)从正态总体中随机抽取100个样本,可算得100个样本均数和标准差,也可算得100个均数的可信区间,平均约有95个可信区间包含了总体均数。(3)但在实际工作中,只能根据一次试验结果估计可信区间,我们就认为该
13、区间包含了总体均数。三、可信区间的确切涵义三、可信区间的确切涵义42 2.可信区间的两个要素(1)准确度:用可信度(1)表示:即区间包含总体均数的理论概率大小。当然它愈接近1愈好,如99%的可信区间比95%的可信区间要好。(2)精确度:即区间的宽度 区间愈窄愈好,如95%的可信区间比99%的可信区间要好。43 当当n n确定时,上述两者互相矛盾。确定时,上述两者互相矛盾。提高准确度(可信度),则精确度降低提高准确度(可信度),则精确度降低(可信区间会变宽),势必降低可信区间的实际(可信区间会变宽),势必降低可信区间的实际应用价值,故不能笼统认为应用价值,故不能笼统认为99%99%可信区间比可信
14、区间比95%95%可信区间要好。可信区间要好。相反,在实际应用中,相反,在实际应用中,95%95%可信区间更为常用。可信区间更为常用。在可信度确定的情况下,增加样本含量可在可信度确定的情况下,增加样本含量可减小区间宽度,提高精确度。减小区间宽度,提高精确度。44*也可用对应于双尾概率时),*也可用对应于双尾概率时)表表3-2 3-2 总体均数的可信区间与参考值范围的区别总体均数的可信区间与参考值范围的区别四、总体均数可信区间与参考值范围的区别四、总体均数可信区间与参考值范围的区别45第四节第四节 t t 检验检验461 1、样本均数、样本均数 与已知某总体均数与已知某总体均数 比较的比较的t
15、t检验检验 目的:推断一个未知总体均数 与已知总体均 数 是否有差别,用单样本设计。2 2、两个样本均数、两个样本均数 与与 比较的比较的t t检验检验目的:推断两个未知总体均数 与 是否有差 别,用成组设计。3 3、配对设计资料均数比较的、配对设计资料均数比较的t t检验检验目的:推断两个未知总体均数 与 是否有差 别用配对设计。t t 检验,亦称检验,亦称student student t t 检验检验,有下述情况有下述情况:对于大样本对于大样本,也可以近似用也可以近似用u u检验。检验。47t检验和u检验的应用条件:1.t检验应用条件:样本含量n较小时(如n60)(1)资料服从正态分布(
16、2)方差齐性(homogeneity of variance)2.u 检验应用条件:样本含量n较大,或n虽小但总体标准差已知 (1)正态分布 (2)方差齐性(homogeneity of variance)48 假设检验过去称显著性检验。它是利假设检验过去称显著性检验。它是利用小概率反证法思想,从问题的对立面用小概率反证法思想,从问题的对立面(H H0 0)出发间接判断要解决的问题出发间接判断要解决的问题(H H1 1)是是否成立。根据否成立。根据H H0 0成立的前提成立的前提,计算检验计算检验统计量,最后获得统计量,最后获得P P值来判断。值来判断。假设检验假设检验基本思想及步骤49例3-
17、5 某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从从事事铅铅作作业业工工人人的的血血红红蛋蛋白白是否不同于正常成年男性平均值140g/L?130.83g/L 140g/L原因:1.可能是总体均数不同 2.是抽样造成的 501.1.建立检验假设,确定检验水准建立检验假设,确定检验水准 (选用单侧或双侧检验)(选用单侧或双侧检验)(1 1)无效假设又称零假设,记为)无效假设又称零假设,记为H H0 0;(2 2)备择假设又称对立假设,记为)备择假设又称对立假设,记为H H1 1。对于检验假设,须注意:对于检验假设,须注意:检验假设
18、是针对总体而言,而不是针对样本;检验假设是针对总体而言,而不是针对样本;H H0 0和和H H1 1是相互联系,对立的假设,后面的结是相互联系,对立的假设,后面的结论是根据论是根据H H0 0和和H H1 1作出的,因此两者不是可有可无,作出的,因此两者不是可有可无,而是缺一不可;而是缺一不可;51 H H1 1的的内内容容直直接接反反映映了了检检验验单单双双侧侧。若若H H1 1中中只只是是 0 0 或或 0 0,则则此此检检验验为为单单侧侧检检验验。它它不不仅仅考考虑虑有有无无差差异异,而而且还考虑差异的方向。且还考虑差异的方向。单单双双侧侧检检验验的的确确定定,首首先先根根据据专专业业知
19、知识识,其其次次根根据据所所要要解解决决的的问问题题来来确确定定。若若从从专专业业上上看看一一种种方方法法结结果果不不可可能能低低于于或或高高于于另另一一种种方方法法结结果果,此此时时应应该该用用单单侧侧检检验验。一一般般认认为为双双侧侧检检验验较较保保守守和稳妥。和稳妥。52(3 3)检检验验水水准准,过过去去称称显显著著性性水水准准,是是预预先先规规定定的的概概率率值值,它它确确定定了了小小概概率率事事件件的的标标准准。在在实实际际工工作作中中常常取取 =0.050.05。可可根根据据不不同同研研究究目目的的给给予不同设置。予不同设置。53 根根据据变变量量和和资资料料类类型型、设设计计方
20、方案案、统统计计推推断断的的目目的的、是是否否满满足足特特定定条条件件等等(如如数数据据的的分分布布类类型型)选选择择相相应应的的检检验统计量。验统计量。2.2.计算检验统计量计算检验统计量543.3.确定确定P P值值P P的含义的含义是指从是指从H H0 0规定的总体随机抽样,抽得规定的总体随机抽样,抽得等于及大于等于及大于(或或/和等于及小于和等于及小于)现有样本获得的现有样本获得的检验统计量检验统计量(如如t t、u u等等)值的概率。值的概率。例例3-53-5的的P P值可用图值可用图3-53-5说明,说明,P P为在为在=0=140g/L0=140g/L的前提条件下随机抽样,其的前
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 总体 估计 假设检验 11
限制150内