3.参数估计、假设检验.ppt
第四章第四章 参数估计参数估计戎芬戎芬主要内容:主要内容:抽样分布与抽样误差抽样分布与抽样误差总体均数的估计总体均数的估计总体率的估计总体率的估计几个重要概念的回顾:几个重要概念的回顾:总体:总体:样本:样本:统计量:统计量:参数:参数:统计分析统计分析 统计描述:统计描述:统计指标、统计图表统计指标、统计图表 统计推断统计推断:参数估计、假设检验参数估计、假设检验第一节第一节 抽样分布与抽样误差抽样分布与抽样误差一、样本均数的抽样分布与标准误一、样本均数的抽样分布与标准误 了解总体特征的最好方法是对总体了解总体特征的最好方法是对总体的每一个体进行观察、试验,但这在医的每一个体进行观察、试验,但这在医学研究实际中往往不可行。学研究实际中往往不可行。对无限总体不可能对所有个体逐一对无限总体不可能对所有个体逐一观察,对有限总体限于人力、财力、物观察,对有限总体限于人力、财力、物力、时间或个体过多等原因,不可能也力、时间或个体过多等原因,不可能也没必要对所有个体逐一研究。没必要对所有个体逐一研究。借助借助抽样研究抽样研究。抽抽 样样 研研 究究按照按照随机化随机化原则原则采用正确的采用正确的抽样方法抽样方法从总体中抽取从总体中抽取有代表性有代表性的一部分的一部分 组成样本组成样本用样本信息用样本信息推断推断总体特征的研究总体特征的研究统计推断统计推断 例例:欲了解某地欲了解某地20002000年正常成年男性血清总胆年正常成年男性血清总胆固醇的平均水平,随机抽取该地固醇的平均水平,随机抽取该地200200名正常成名正常成年男性作为样本。年男性作为样本。由于存在个体差异,抽得的样本均数不太可由于存在个体差异,抽得的样本均数不太可能恰好等于总体均数。能恰好等于总体均数。由个体变异和抽样造成的由个体变异和抽样造成的样本统计量样本统计量与与总体总体参数参数的差异,称为的差异,称为抽样误差抽样误差。这些来自同一总体的若干样本统计量间,这些来自同一总体的若干样本统计量间,也存在抽样误差。也存在抽样误差。在抽样研究中,抽样误差是不可避免的。在抽样研究中,抽样误差是不可避免的。由于其产生的根本原因是生物个体的变异性由于其产生的根本原因是生物个体的变异性,故抽样误差分布具有一定的规律性。,故抽样误差分布具有一定的规律性。抽样误差抽样误差从总体均数从总体均数 为为155.4cm155.4cm,标准差标准差 为为5.3cm5.3cm的的正态分布总体中随机抽样。样本大小为正态分布总体中随机抽样。样本大小为3030。n=30 .从正态总体从正态总体 抽样得到的抽样得到的10001000个样本,个样本,将将10001000个样本均数看成新变量,构成新的分布,个样本均数看成新变量,构成新的分布,这这10001000个样本个样本均数的频数分布均数的频数分布(n ni i=30)=30)如下:如下:Mean=155.426 Std=0.966样本均数的分布样本均数的分布特点:特点:各样本均数不一定等于总体均数各样本均数不一定等于总体均数样本均数间存在差异样本均数间存在差异样本均数的分布规律:样本均数的分布为样本均数的分布规律:样本均数的分布为中间多,两边少,中间多,两边少,围绕总体均数围绕总体均数上下波动,上下波动,左右基本对称左右基本对称样本均数的变异样本均数的变异较之原变量的变异大大减较之原变量的变异大大减小,小,(这这10001000个样本均数的均数为个样本均数的均数为155.4155.4、标、标准差为准差为0.966)0.966),由样本均数的标准差描述,由样本均数的标准差描述 在非正态分布总体中可进行类似抽样。在非正态分布总体中可进行类似抽样。样本均数的规律性样本均数的规律性随机的随机的在概率意义下是有规律的在概率意义下是有规律的-抽样分布抽样分布通过大量重复抽样,借助频数表描述通过大量重复抽样,借助频数表描述样本均数的变异规律样本均数的变异规律(抽样分布抽样分布)与个体观察值与个体观察值变异规律有关变异规律有关即使只有一个样本资料,也可由样本资料即使只有一个样本资料,也可由样本资料的个体观察值的变异规律间接得到样本均的个体观察值的变异规律间接得到样本均数的变异规律数的变异规律抽样分布抽样分布小结:小结:抽样误差抽样误差抽样误差抽样误差Sampling error Sampling error 由于个体差异和抽样引起的样本统计量由于个体差异和抽样引起的样本统计量与总体参数之间的差异或各样本统计量与总体参数之间的差异或各样本统计量之间的差异。之间的差异。来源来源:个体变异个体变异抽样抽样表现表现样本统计量与总体参数间的差异样本统计量与总体参数间的差异样本统计量间的差异样本统计量间的差异 的总体均数为的总体均数为;而;而 的标准差比原个体值的标准差比原个体值的标准差要小,为区别两者,的标准差要小,为区别两者,的标准差用的标准差用 表示。表示。样本均数的标准差称样本均数的标准差称均数的标准误均数的标准误(standard(standard error of mean,SEM)error of mean,SEM),简称标准误(简称标准误(SE)SE)。标准误意义:反映样本均数抽样误差的大小,标准误意义:反映样本均数抽样误差的大小,SESE越大,均数的抽样误差越大,说明样本均越大,均数的抽样误差越大,说明样本均数与总体均数间的变异越大。数与总体均数间的变异越大。标准误标准误可证明均数标准误可证明均数标准误在在实实际际工工作作中中 常常未未知知,用用S S来来估估计计。均均数数标标准准误估计值误估计值 均均数数标标准准误误大大小小与与标标准准差差大大小小成成正正比比,与与样样本本含量含量n n的平方根成反比。的平方根成反比。标准误标准误含义含义 :样本均数的标准差:样本均数的标准差计算:计算:(标准误的估计值标准误的估计值)P P2323例例4-14-1:某地:某地120120名正常成人血清铜含量资料,其名正常成人血清铜含量资料,其 X X =14.46umol/L,s=2.26umol/L=14.46umol/L,s=2.26umol/L,求其标准误,求其标准误注意:注意:X X 、S S X X均为样本均数的标准误均为样本均数的标准误(标准误的理论值标准误的理论值)标准误与标准差的关系标准误与标准差的关系标准误标准误 与标准差成正比;与标准差成正比;标准误标准误 与样本含量与样本含量n n的平方根成反比(说明的平方根成反比(说明增大样本含量可以减少抽样误差);增大样本含量可以减少抽样误差);标准误与标准差的意义不同(标准差反映标准误与标准差的意义不同(标准差反映了变量值的离散程度,标准误则反映了均了变量值的离散程度,标准误则反映了均数的离散程度数的离散程度)。)。)。)。注意区别:注意区别:小小 结结标准误的应用标准误的应用反映抽样误差的大小(样本均数的离散程度;反映抽样误差的大小(样本均数的离散程度;样本均数与总体均数的接近程度;均数的代表样本均数与总体均数的接近程度;均数的代表性如何。)说明样本均数推论总体均数的可靠性如何。)说明样本均数推论总体均数的可靠性。(标准误越小,可靠性越好;反之,标准性。(标准误越小,可靠性越好;反之,标准误越大,可靠性越差)误越大,可靠性越差)估计总体均数的可信区间(参数估计)。估计总体均数的可信区间(参数估计)。用于均数的假设检验。用于均数的假设检验。减小抽样误差的方法减小抽样误差的方法增大样本含量增大样本含量n n ;选择标准差较小的指标。选择标准差较小的指标。由中心极限定理可由中心极限定理可得到如下结论:得到如下结论:若若 服从正态分布服从正态分布 则则 服从正态分布服从正态分布 若若 不服从正态分布不服从正态分布 n n大:则大:则 近似服从正态分布近似服从正态分布 n n小:则小:则 为非正态分布为非正态分布标准差和标准误的区别标准差和标准误的区别标准差标准误意义描述观察值的变异程度。其值越小,观察值的变异程度越小,均数的代表性越好描述样本均数的变异程度,说明抽样误差的大小。其值越小,估计总体均数的可靠性越大计算用途描述资料的频数分布状况,可用于制定医学参考值范围,计算变异系数和标准误用于表示抽样误差大小、总体均数的区间估计和均数的假设检验等二、二、t t 分布及其应用分布及其应用若若某某一一随随机机变变量量X X服服从从总总体体均均数数为为、总总体体标标准准差为差为 的正态分布的正态分布N(N(,2 2)由于样本均数服从总体均数为由于样本均数服从总体均数为、总体标准差、总体标准差为为 的正态分布的正态分布N(N(,)n n为计算某一统计量用到的数据个数,为计算某一统计量用到的数据个数,m m为计算该为计算该统计量用到其它独立统计量的个数。统计量用到其它独立统计量的个数。t t分布最早由英国统计学家分布最早由英国统计学家W.S.W.S.GossetGosset于于19081908年以年以“StudentStudent”笔名发表,故又称笔名发表,故又称Students t-distributionStudents t-distribution。它的发现,开创了小样本统计推断的新纪元。它的发现,开创了小样本统计推断的新纪元。总体为总体为N N的的m m个样本(样本大小为个样本(样本大小为n n)的)的t t 值值t t分布的特征:分布的特征:以以0 0为中心的对称分布;为中心的对称分布;与与U U分布比,曲线低平;分布比,曲线低平;t t分布是一簇曲线,形态与自由度(分布是一簇曲线,形态与自由度(n-1n-1)有关。)有关。t t分布与分布与标准正态分布的标准正态分布的比较比较 1.1.二者都是单峰分布,以二者都是单峰分布,以0 0为中心左右对称。为中心左右对称。2.2.自由度自由度v v较小时,较小时,t t分布与标准正态分布相分布与标准正态分布相差较大,并且差较大,并且t t分布曲线的尾部面积大于标分布曲线的尾部面积大于标准正态分布曲线的尾部面积。准正态分布曲线的尾部面积。3.3.当当 逐渐增大时,逐渐增大时,t t分布逐渐逼近标准正态分布逐渐逼近标准正态分布,当分布,当=时,时,t t分布完全成为标准正态分布完全成为标准正态分布。分布。t t分布的界值分布的界值 给定自由度给定自由度v v,t t分布曲线的双侧尾部面积为分布曲线的双侧尾部面积为 时对时对应的应的t t值,记为值,记为 并称其为并称其为t t的双侧界值的双侧界值 单侧界值单侧界值 :一侧尾部面积为:一侧尾部面积为 时对应的时对应的t t值值对称性得:单侧曲线下面积对称性得:单侧曲线下面积=2*=2*双侧曲线下面积双侧曲线下面积给定曲线下面积对应的界值与自由度有关给定曲线下面积对应的界值与自由度有关同样的尾部面积,同样的尾部面积,t t分布的界值要大于标准正态分分布的界值要大于标准正态分布的界值布的界值 t t分布的界值分布的界值 t t分布界值示意图,分布界值示意图,表示阴影的面积表示阴影的面积 01-12-2-33f(t)t t分布曲线下的面积规律:分布曲线下的面积规律:中间中间95%95%的的t t值:值:-t-t0.05/20.05/2,t t0.05/20.05/2,中间中间99%99%的的t t值:值:-t-t0.01/20.01/2,t t0.01/20.01/2,单尾概率:一侧尾部面积单尾概率:一侧尾部面积双尾概率:双侧尾部面积双尾概率:双侧尾部面积(1)(1)自由度(自由度()一定时,一定时,p p与与t t成反比成反比;(2)(2)概率(概率(p p)一定时,)一定时,与与t t成反比成反比;三、样本率的抽样分布与标准误三、样本率的抽样分布与标准误 样本率与总体率存在着抽样误差,其大小用样本率与总体率存在着抽样误差,其大小用率的标准误来描述,用率的标准误来描述,用 p p表示。表示。例:例:某医院用某方剂治疗慢性肝炎某医院用某方剂治疗慢性肝炎160160例,例,有效率为有效率为86.2586.25,求其标准误。,求其标准误。3232第二节第二节 总体均数的估计总体均数的估计计量资料统计推断计量资料统计推断一般包括以下两个方面:一般包括以下两个方面:参数估计:参数估计:用样本指标估计总体指标用样本指标估计总体指标 (1)(1)点估计:用样本统计量直接作为总体参数的估计值点估计:用样本统计量直接作为总体参数的估计值 优点优点:简单简单 缺点:没有考虑抽样误差缺点:没有考虑抽样误差 (2)(2)区间估计区间估计:按预先给定的概率按预先给定的概率确定一个包含未知总确定一个包含未知总体参数的范围,称为参数的可信区间或置信区间体参数的范围,称为参数的可信区间或置信区间(confidence(confidence interval,CIinterval,CI),常用常用95%95%的可信区间的可信区间 假设检验假设检验 总体均数的区间估计总体均数的区间估计 可信区间的含义:可信区间的含义:按一定的可信度由样本均数计算的总体均数按一定的可信度由样本均数计算的总体均数 可能所在的范围,这个范围称为总体均数的可能所在的范围,这个范围称为总体均数的 可信区间。可信区间。95%95%可信区间表示该区间包含总体均数可信区间表示该区间包含总体均数 的的 概率为概率为95%95%。若作若作100100次抽样算得次抽样算得100100个可信区间,平均有个可信区间,平均有 9595个可信区间包含个可信区间包含(估计正确),有(估计正确),有5 5个个 可信区间不包含可信区间不包含(估计错误)。(估计错误)。总体均数可信区间的计算计算方法:计算方法:l 已知,按已知,按u u分布。分布。l 未知,但未知,但n n足够大,按足够大,按u u分布。分布。l 未知,且未知,且n n较小,按较小,按t t分布。分布。1.1.已知时,总体均数双侧可信区间为已知时,总体均数双侧可信区间为:2.2.未知但未知但n n较大较大时,按时,按u u分布计算总体均数的分布计算总体均数的可信区间可信区间3.3.未知且未知且n n较小较小时,按时,按t t分布计算总体均数的分布计算总体均数的可信区间可信区间 例例:某某地地抽抽取取正正常常成成年年人人200200名名,测测得得其其血血清清胆胆 固固 醇醇 均均 数数 为为 3.64 3.64 mmolmmol/L/L,标标 准准 差差 为为1.20mmol/L1.20mmol/L,估估计计该该地地正正常常成成年年人人血血清清胆胆固固醇均数醇均数95%95%可信区间。可信区间。本例本例 =3.64=3.64、S=1.20S=1.20、n=200n=200、=0.0849=0.0849,=(3.47=(3.47,3.81)(mmol3.81)(mmol L)L)该该地地正正常常成成年年人人血血清清胆胆固固醇醇均均数数双双侧侧95%95%可信区间为可信区间为(3.47,3.81)mmol(3.47,3.81)mmol L L。区间估计的准确度:区间估计的准确度:说对的可能性大小,说对的可能性大小,用用 (1-(1-)来衡量。来衡量。99%99%的可信区间好于的可信区间好于95%95%的可信区间的可信区间(n,Sn,S一定时)一定时)。区间估计的精确度:区间估计的精确度:指区间范围的宽窄,范围越宽指区间范围的宽窄,范围越宽精确度越差。精确度越差。99%99%的可信区间的可信区间差于差于95%95%的可信区间的可信区间(n,Sn,S一定时)一定时)。准确度与精确度的关系:准确度与精确度的关系:在准确度确定的情况下,在准确度确定的情况下,增加增加样本含量样本含量可提高精确度。可提高精确度。可信区间的要素可信区间的要素总体均数可信区间与参考值范围的区别总体均数可信区间与参考值范围的区别总体均数可信区间总体均数可信区间参考值范围参考值范围含义含义按预先给定的概率,确定未知参数按预先给定的概率,确定未知参数 的可能范围。实际上一次抽样算得的的可能范围。实际上一次抽样算得的可信区间要么包含总体均数,要么不可信区间要么包含总体均数,要么不包含。包含。95%CI估计错误的概率估计错误的概率0.05.总体均数的波动范围总体均数的波动范围“正常人正常人”的解剖,生理,的解剖,生理,生化某项指标的波动范生化某项指标的波动范围。围。个体值的波动范围个体值的波动范围计算计算公式公式 未知:未知:已知或已知或 未知但未知但n60:或或正态分布正态分布偏态分布偏态分布 PX P100 X用途用途总体均数的区间估计总体均数的区间估计绝大多数绝大多数(如如95%)观察对象观察对象某项指标的分布范围某项指标的分布范围第三节第三节 总体率的估计总体率的估计点估计:样本率作为总体率的估计值点估计:样本率作为总体率的估计值区间估计:按一定概率区间估计:按一定概率,以样本率来估计总体率的,以样本率来估计总体率的1-1-可信区间。可信区间。1.1.正态近似法:正态近似法:当当n n足够大,且足够大,且npnp和和n(1-p)n(1-p)均大于均大于5 5时:时:p pu u.s.sp p P31P31例例4-104-10:某医师用自拟中药方治疗高血压患者某医师用自拟中药方治疗高血压患者107107例,有效例,有效6969例,有效率为例,有效率为64.6964.69,试估计其总,试估计其总体有效率的体有效率的9595CICI。2.2.查表法:查表法:n n50 50 查百分率的可信区间表(查百分率的可信区间表(P P114114附表附表3 3)例:某医院用中药治疗脑血管梗塞患者例:某医院用中药治疗脑血管梗塞患者4040例,其中例,其中3333例治疗有效,有效率为例治疗有效,有效率为82.582.5,试估计其总体,试估计其总体有效率的有效率的9595CICI。n=40 xn=40 x7 7 时无效率的时无效率的9595CICI为为(8(8 ,3333)n=40 xn=40 x3333时有效率的时有效率的9595CICI为为(67(67 ,9292)第五章第五章 假设检验概述假设检验概述 由样本信息推断总体特征,除了参数估由样本信息推断总体特征,除了参数估计外,还会遇到这样的问题:计外,还会遇到这样的问题:某一样本均数是否来自于已知均数总体某一样本均数是否来自于已知均数总体?两个不同样本均数是否来自均数相同的总?两个不同样本均数是否来自均数相同的总体等?体等?要回答这类问题,更多的是用统计推断要回答这类问题,更多的是用统计推断的另一方面的另一方面假设检验假设检验(hypothesis test)(hypothesis test)。第一节第一节 假设检验的分类、思维方法与步骤假设检验的分类、思维方法与步骤例:已知健康成年男子的脉搏均数为72次/分。某医生在某山区随机调查30名健康男子,求得脉搏均数为74.2次/分,标准差6.5次/分。能否认为该山区成年男子脉搏均数高于一般成年男性的脉搏均数(72次/分)?观观测测到到的的样样本本均均数数与与总总体体均均数数间间或或两两样样本本均均数数间差异的可能原因:间差异的可能原因:1.1.总体均数不同(即两者来自不同的总体)总体均数不同(即两者来自不同的总体)2.2.总体均数相同,差别由抽样造成。总体均数相同,差别由抽样造成。需要通过统计学需要通过统计学假设检验假设检验来判断。来判断。假设检验是用来推断样本与样本,样本与总体假设检验是用来推断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的的差异是由抽样误差引起还是本质差别造成的统计推断方法。统计推断方法。假设检验的基本思想假设检验的基本思想 小概率反证法思想小概率反证法思想小小概概率率思思想想:指指小小概概率率事事件件(P P0.010.01或或P P0.05 ,则不拒绝,则不拒绝H H0 0;注意:假设检验的结论是概率性推断!注意:假设检验的结论是概率性推断!不不拒拒绝绝H H0 0,不不代代表表H H0 0一一定定成成立立;同同理理,拒拒绝绝H H0 0 ,也不能认为,也不能认为H H0 0一定不成立。一定不成立。0-1.9601.96095%2.5%2.5%接受域接受域拒绝域拒绝域拒绝域拒绝域假设检验假设检验一、假设检验的两类错误一、假设检验的两类错误 假假设设检检验验采采用用小小概概率率反反证证法法的的思思想想,根根据据样样本本统统计计量量作作出出的的推推断断结结论论具具有有概概率率性性,因因此此其其结结论论不不可可能能完完全全正确,可能发生下面两类错误正确,可能发生下面两类错误:型型错错误误:拒拒绝绝了了实实际际上上是是成成立立的的H H0 0,犯犯“弃弃真真”的的错误。其概率大小用错误。其概率大小用 表示,表示,可取单侧亦可取双侧。可取单侧亦可取双侧。型型错错误误:不不拒拒绝绝实实际际上上是是不不成成立立的的H H0 0,其其概概率率大大小小用用 表表示示。只只取取单单侧侧,其其大大小小一一般般未未知知,只只有有在在已已知知两总体差值两总体差值,及及 n n 时,才能估算出来。时,才能估算出来。第二节第二节 假设检验的两类错误和注意事项假设检验的两类错误和注意事项 型错误与型错误与型错误的定义如下表:型错误的定义如下表:引申的几个概念:引申的几个概念:v型型错错误误与与型型错错误误的的关关系系:愈小,愈大;反 之 愈大,愈小。若要同时减小以及,唯一的方法就是增加n。若重点减少,一般取=0.05 或 0.01;若重点减少,一般取=0.10 或 0.20。v 检检验验效效能能:1称为检验效能,是指两总体确有差异,按规定检验水准能够发现该差异的能力如10.90,意味着若两总体确有差别,则理论上在100次检验中,平均有90次能够得出有统计学意义的结论。二、假设检验的注意事项二、假设检验的注意事项1 1、要有严密的抽样设计、要有严密的抽样设计2 2、选用的假设检验的方法应符合其应用条件、选用的假设检验的方法应符合其应用条件3 3、单侧检验和双侧检验(单侧检验更容易得出有差别、单侧检验和双侧检验(单侧检验更容易得出有差别的结论,因为单侧的结论,因为单侧t t界值界值 双侧双侧t t界值)界值)4 4、结论不能绝对化,有无差别是相对的(、结论不能绝对化,有无差别是相对的(型和型和型型错误)错误)5 5、正确理解、正确理解P P值,实际差别大小与统计学意义的区别值,实际差别大小与统计学意义的区别6 6、假设检验和可信区间的关系、假设检验和可信区间的关系例如:当例如:当 0.050.05,u u2.12.1时,时,P0.05P0.01P0.01,不拒绝,不拒绝H H0 0。当当 不同时,得出的结论可能是相反的。不同时,得出的结论可能是相反的。可信区间与假设检验有各自不同的作用,可信区间与假设检验有各自不同的作用,要结合使用:要结合使用:p一方面,可信区间亦可回答假设检验的问题一方面,可信区间亦可回答假设检验的问题l 若算得的可信区间若包含了若算得的可信区间若包含了H H0 0,则按则按 水准,不拒水准,不拒绝绝H H0 0;l 若不包含若不包含H H0 0,则按则按 水准,拒绝水准,拒绝H H0 0,接受,接受H H1 1。p另一方面,可信区间可提示差别有无实际的专业意义。另一方面,可信区间可提示差别有无实际的专业意义。即可信区间不但能回答差别有无统计学意义,而且还即可信区间不但能回答差别有无统计学意义,而且还能比假设检验提供更多的专业信息。能比假设检验提供更多的专业信息。可信区间比假设检验提供更多信息可信区间比假设检验提供更多信息(1)(2)(3)(4)(5)有统计意义有统计意义无统计意义无统计意义有实际意义可能有实际意义无实际意义样本太小可接受H0有实际意义的值H0附图附图 可信区间在统计推断上提供的信息可信区间在统计推断上提供的信息可信区间可信区间 虽然虽然可信区间可信区间亦可回答亦可回答假设检验假设检验的问题,的问题,并能提供更多的信息,但并不意味着可信并能提供更多的信息,但并不意味着可信区间能够完全代替假设检验。可信区间只区间能够完全代替假设检验。可信区间只能在预先规定的概率能在预先规定的概率 检验水准检验水准 的前提的前提下进行计算,而假设检验能够获得一较为下进行计算,而假设检验能够获得一较为确切的概率确切的概率P P值。值。对数变换对数变换平方根变换平方根变换平方根反正弦变换平方根反正弦变换倒数变换倒数变换第三节第三节 正态性检验与数据变换正态性检验与数据变换 正态性检验:正态性检验:WW检验检验(n50)(n0.10P0.10,不能认为两总体均数不相等,此时若推不能认为两总体均数不相等,此时若推断有错,其错误的概率为(断有错,其错误的概率为()。)。A A大于大于0.10 B0.10 B,而而 未知未知C C小于小于0.10 D0.10 D1-,1-,而而 未知未知2 2某地正常成年男子红细胞的普查结果,均数为某地正常成年男子红细胞的普查结果,均数为480480万万/mm/mm3 3,标准差为标准差为41.041.0万万/mm/mm3 3,后者反映(后者反映()A A个体变异个体变异 B B抽样误差抽样误差 C C总体均数不同总体均数不同 D D均数间变异均数间变异3.3.两个样本均数比较,经两个样本均数比较,经t t检验,差异有统计学意义,检验,差异有统计学意义,p p越小,说明(越小,说明()A A两样本均数差别越大两样本均数差别越大 B B两总体差别越大两总体差别越大C C越有理由认为两总体均数不同越有理由认为两总体均数不同 D D越有理由认为两样本均数不同越有理由认为两样本均数不同 4.4.()小,表示用该样本均数估计总体均数的可靠性大。)小,表示用该样本均数估计总体均数的可靠性大。A.CV B.S C.D.R E.A.CV B.S C.D.R E.四分位间距四分位间距5.5.在同一总体随机抽样,其他条件不变,样本含量越大,则在同一总体随机抽样,其他条件不变,样本含量越大,则_。A.A.样本标准差样本标准差s s越大越大 B.B.样本标准差样本标准差s s越小越小 C.C.总体均数的总体均数的95%95%可信区间越窄可信区间越窄 D.D.总体均数的总体均数的95%95%可信区可信区间越宽间越宽 E.E.样本标准差样本标准差s s越小,总体均数的越小,总体均数的95%95%可信区间越窄可信区间越窄6.6.在同一总体随机抽样,样本含量在同一总体随机抽样,样本含量n n固定时,固定时,越小,总体均数越小,总体均数可信区间可信区间_。A.A.越宽越宽 B.B.越窄越窄 C.C.宽窄不变宽窄不变 D.D.宽窄还与宽窄还与 有关有关 E.E.以上说法都不对以上说法都不对 三、简答题三、简答题 1.1.标准差与标准误的区别与联系?标准差与标准误的区别与联系?2.2.标准正态分布与标准正态分布与t t分布有何不同?分布有何不同?3.3.均数的可信区间与参考值范围有何不同?均数的可信区间与参考值范围有何不同?四、计算分析题四、计算分析题 某地随机抽样调查了部分健康成人的红细胞某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果如下表数和血红蛋白量,结果如下表1 1:请就该资料:请就该资料:(1 1)说明女性的红细胞数与血红蛋白的变异)说明女性的红细胞数与血红蛋白的变异程度何者为大?程度何者为大?(2 2)计算男性两项指标的抽样误差。)计算男性两项指标的抽样误差。(3 3)试估计该地健康成年女性红细胞数的均)试估计该地健康成年女性红细胞数的均数。数。表表1.1.某年某地健康成年人的红细胞数和血红蛋白含量某年某地健康成年人的红细胞数和血红蛋白含量指标指标性别性别例数例数均数均数标准差标准差标准值标准值红细胞红细胞(10101212/L/L)男男3603604.664.660.580.584.844.84女女2552554.184.180.290.294.334.33血红蛋白血红蛋白(g/Lg/L)男男360360134.5134.57.17.1140.2140.2女女255255117.6117.610.210.2124.7124.7