《总体均数的估计与假设检验第3.ppt》由会员分享,可在线阅读,更多相关《总体均数的估计与假设检验第3.ppt(82页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、uu均数的抽样误差与标准误均数的抽样误差与标准误uu t 分布分布uu总体均数的估计总体均数的估计uu t 检验检验uu假设检验的注意事项假设检验的注意事项uu正态性检验和两样本方差比较的正态性检验和两样本方差比较的F检验检验讲课内容讲课内容1第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误2u了解总体特征的最好方法是对总体的每一了解总体特征的最好方法是对总体的每一个体进行观察、试验,但这在医学研究实个体进行观察、试验,但这在医学研究实际中往往不可行。际中往往不可行。u对对无限总体无限总体不可能对所有个体逐一观察,不可能对所有个体逐一观察,对对有限总体有限总体限于人力、财力、物力、时
2、间限于人力、财力、物力、时间或个体过多等原因,不可能也没必要对所或个体过多等原因,不可能也没必要对所有个体逐一研究有个体逐一研究(如对一批罐头质量检查如对一批罐头质量检查)。u借助借助抽样研究抽样研究。3u欲了解某地欲了解某地18岁男生身高值的平均水平,岁男生身高值的平均水平,随机抽取该地随机抽取该地10名男生身高值作为名男生身高值作为样本样本。u由于由于个体变异与抽样个体变异与抽样的影响,抽得的样本的影响,抽得的样本均数不太可能等于总体均数,造成样本均数不太可能等于总体均数,造成样本统统计量与总体参数间的差异计量与总体参数间的差异(表现为来自同一表现为来自同一总体的若干样本统计量间的差异总体
3、的若干样本统计量间的差异),称为,称为抽抽样误差样误差。u抽样误差是不可避免的。抽样误差是不可避免的。u抽样误差是有规律的。抽样误差是有规律的。41999年某市年某市18岁男生身高值岁男生身高值XiN(,2)=167.7cm=5.3cm样本号样本号1167.412.742165.566.573168.205.3699169.405.57100165.695.09ni=105样本均数抽样分布具有如下特点:样本均数抽样分布具有如下特点:u各样本均数未必等于总体均数各样本均数未必等于总体均数u各样本均数间存在差异各样本均数间存在差异u样本均数围绕样本均数围绕=167.69cm呈正态分布呈正态分布u样
4、本均数变异度样本均数变异度()较原总体个较原总体个体值变异度体值变异度(=5.3cm)大大缩小大大缩小67中心极限定理中心极限定理(centrallimittheorem)从均数为从均数为、标准差为、标准差为 的总体中独立随机的总体中独立随机抽样,当样本含量抽样,当样本含量n较大时,较大时,样本均数的分布将趋于正态分布样本均数的分布将趋于正态分布此分布的均数为此分布的均数为 标准差为标准差为8中心极限定理中心极限定理(centrallimittheorem)若若Xi服从正态分布服从正态分布则则服从正态分布服从正态分布若若Xi不服从正态分布不服从正态分布n大大(n60):则:则近似服从正态分布近
5、似服从正态分布n小小(n60)按按u分布原理分布原理2.两总体均数之差的可信区间两总体均数之差的可信区间251.单一总体均数的单一总体均数的1可信区间可信区间双侧双侧(1)未知未知单侧单侧26故该地故该地18岁男生身高均数的岁男生身高均数的95%可信区间为可信区间为(164.35,169.55)cm。=167.7cm双尾双尾例例在例在例3-1中抽得第中抽得第15号样本的号样本的=166.95(cm),S=3.64(cm),求其总体均数的求其总体均数的95%可信区间。可信区间。166.952.2621.1511=164.35169.55(cm)271.单一总体均数的单一总体均数的1可信区间可信区
6、间双侧双侧单侧单侧(2)已知已知或或 未知但未知但n足够大足够大:28例例某地抽取正常成年人某地抽取正常成年人200名,测得其血名,测得其血清胆固醇均数为清胆固醇均数为3.64mmol/L,标准差为,标准差为1.20mmol/L,估计该地正常成年人血清胆,估计该地正常成年人血清胆固醇均数固醇均数95%可信区间。可信区间。292.两总体均数之差的两总体均数之差的1可信区间可信区间双侧双侧单侧单侧30三、可信区间的确切含义三、可信区间的确切含义u从从1999年某市年某市18岁男生身高值总体岁男生身高值总体N(=167.7cm,=5.3cm)中随机抽取中随机抽取100个样本个样本计算了计算了100个
7、估计个估计的的95%CIu其中有其中有95个个CI包含包含了了有有5个不包含个不包含=167.7cm20号号161.00165.5731号号161.17167.3354号号168.05171.0076号号167.71174.8482号号167.98174.2731来自来自N(0,1)的的100个样本所计算的个样本所计算的95%可信区间示意可信区间示意32u如如果果能能够够进进行行重重复复抽抽样样试试验验,平平均均有有(1)的的可可信信区区间间包包含含了了总总体体参参数数,而而不不是是总总体体参参数数落落在在该该范范围围的的可可能能性性为为(1)。u在实际工作中,只能根据一次试验结果计在实际工作
8、中,只能根据一次试验结果计算一个可信区间,算一个可信区间,就认为该区间包含了相应就认为该区间包含了相应总体参数,总体参数,该结论犯错误的概率该结论犯错误的概率。u可信区间一旦形成,它要么包含总体参数,可信区间一旦形成,它要么包含总体参数,要么不包含总体参数,二者必居其一,无概要么不包含总体参数,二者必居其一,无概率可言。可信度是事前概率。率可言。可信度是事前概率。可信区间的确切含义可信区间的确切含义33u正确性正确性:可信度:可信度1,即区间包含总体参,即区间包含总体参数数的理论概率大小,愈接近的理论概率大小,愈接近1愈好。愈好。u精确性精确性:区间的宽度,区间愈窄愈好。区间的宽度,区间愈窄愈
9、好。u当样本含量为定值时,上述两者互相矛盾。当样本含量为定值时,上述两者互相矛盾。若只顾提高可信度,则可信区间会变宽。若只顾提高可信度,则可信区间会变宽。评价可信区间估计的优劣:评价可信区间估计的优劣:34四、可信区间与参考值范围的区别四、可信区间与参考值范围的区别u可信区间用于估计可信区间用于估计总体参数总体参数,总体参数只,总体参数只有一个有一个。u参考值范围用于估计参考值范围用于估计个体值个体值的分布范围,的分布范围,个体值有很多个体值有很多。u95%可信区间中的可信区间中的95%是是可信度可信度,即所求可,即所求可信区间包含总体参数的可信程度为信区间包含总体参数的可信程度为95%。u9
10、5%参考值范围中的参考值范围中的95%是一个是一个比例比例,即,即所求参考值范围包含了所求参考值范围包含了95%的正常人。的正常人。35第四节第四节 t 检验检验36例例某某医医生生测测量量了了36名名从从事事铅铅作作业业男男性性工工人人的的血血红红蛋蛋白白含含量量,算算得得其其均均数数为为130.83g/L,标标准准差差为为25.74g/L。问问从从事事铅铅作作业业工工人人的的血血红红蛋蛋白是否不同于正常成年男性平均值白是否不同于正常成年男性平均值140g/L?u样本均数与总体均数间差异的原因:样本均数与总体均数间差异的原因:1.总体均数不同总体均数不同?2.总体均数相同,差异由抽样误差造成
11、总体均数相同,差异由抽样误差造成?u统计推断方法统计推断方法假设检验假设检验(hypothesistest)37u反反证证法法根根据据研研究究目目的的建建立立假假设设H0,先先假假设设H0是是正正确确的的,再再分分析析样样本本提提供供的的信信息息是是否否支支持持H0,即即在在H0成成立立的的条条件件下下计计算算检检验验统统计计量,获得相应量,获得相应P值,根据值,根据P值大小来判断。值大小来判断。u小小概概率率事事件件原原理理小小概概率率事事件件(P0.05)在在一一次次抽抽样样中中发发生生的的可可能能性性很很小小,如如果果它它发发生生了了,则则有有理理由由怀怀疑疑H0的的正正确确性性,认认为
12、为H1成成立立,该结论可能犯该结论可能犯5%的错误。的错误。一、假设检验的基本思想一、假设检验的基本思想381.建立检验假设,确定检验水准建立检验假设,确定检验水准(1)H0零假设零假设(nullhypothesis)(2)H1备择假设备择假设(alternativehypothesis)(3)检验水准检验水准(sizeofatest)二、假设检验的基本步骤二、假设检验的基本步骤u针对总体而不是针对样本而言针对总体而不是针对样本而言uH0:某两个总体参数相等,:某两个总体参数相等,仅一种情况仅一种情况H1:某两个总体参数不等,某两个总体参数不等,有多种情况有多种情况H0与与H1的内容不能互换,
13、否则无法决定的内容不能互换,否则无法决定拒绝多种情况中的哪一种情况拒绝多种情况中的哪一种情况39uH0:1=2H1:12或或1t0.05/2,35=2.030P0.05按按=0.05水准,拒绝水准,拒绝H0,接受,接受H1,有统计学,有统计学意义。可认为从事铅作业男性工人的平均血意义。可认为从事铅作业男性工人的平均血红蛋白含量低于正常成年男性的。红蛋白含量低于正常成年男性的。46-2.0302.0300 =350.0250.025 t0.05/2,35=2.030 P(|t|2.030)=0.05 t值值47(二二)配对样本配对样本t检验检验(pairedt-test)-变量为配对两组之差的变
14、量为配对两组之差的d配对设计配对设计两同质受试对象分别接受两种不同处理两同质受试对象分别接受两种不同处理同一受试对象分别接受两种不同处理同一受试对象分别接受两种不同处理前后测量设计前后测量设计同一受试对象分别前后接受一种处理同一受试对象分别前后接受一种处理48491.建立检验假设,确定检验水准建立检验假设,确定检验水准H0:d=0,两种方法的测定结果相同,两种方法的测定结果相同H1:d0,=0.052.计算检验统计量计算检验统计量503.确定确定P值,作出推断结论值,作出推断结论t=7.925t0.001/2,9=4.781P0.001按按=0.05水准,拒绝水准,拒绝H0,接受,接受H1,有
15、统计,有统计学意义。两种方法对脂肪含量的测定结果学意义。两种方法对脂肪含量的测定结果不同,哥特里罗紫法测定结果较高。不同,哥特里罗紫法测定结果较高。51(三三)两样本两样本t检验检验(twosamplet-test)1.总体方差相等的总体方差相等的t检验检验52研究目的:阿卡波糖胶囊降血糖效果研究目的:阿卡波糖胶囊降血糖效果试验设计:同期随机试验设计:同期随机对照对照试验试验受试对象:受试对象:40名名II型糖尿病病人型糖尿病病人试验组:阿卡波糖胶囊试验组:阿卡波糖胶囊对照组:拜唐苹胶囊对照组:拜唐苹胶囊观测指标:试验观测指标:试验8周后空腹血糖下降值周后空腹血糖下降值(1)建立检验假设,确定
16、检验水准建立检验假设,确定检验水准H0:1=2H1:1 2=0.05 53(2)计算检验统计量计算检验统计量=n1+n2 2=(20+20 1)=3854按按=0.05水准,不拒绝水准,不拒绝H0,无统计学,无统计学意义。意义。还不能认为还不能认为阿卡波糖胶囊与拜唐阿卡波糖胶囊与拜唐苹胶囊对降低苹胶囊对降低II型糖尿病病人空腹血糖型糖尿病病人空腹血糖的效果的效果不同不同。(3)确定确定P值,作出推断结论值,作出推断结论552.总体方差不相等的总体方差不相等的t检验检验u数据变换后进行数据变换后进行t检验检验u秩转换的非参数检验秩转换的非参数检验(第第8章章)u近似近似t检验检验t检验检验56n
17、Cochran&Cox法法(1950)对临界值校正对临界值校正nSatterthwaite法法(1946)对自由度校正对自由度校正nWelch法法(1947)对自由度校正对自由度校正t检验检验57第五节第五节 两均数的等效检验两均数的等效检验equivalencetestfortwomeans58例例研究某新药对高血脂患者胆固醇的降低作研究某新药对高血脂患者胆固醇的降低作用是否用是否相同于相同于标准药物,标准药物,设定设定等效界值等效界值=0.52mmol/L即即就认为两药物等效就认为两药物等效59 (1)建立检验假设,确定检验水准建立检验假设,确定检验水准H0:两药物不等效两药物不等效H1:
18、两药物等效两药物等效=0.0560(2)计算检验统计量计算检验统计量=n1+n2 2=102+100 2=20061 t=3.569 t0.001/2,200=3.340P 0.001。按按=0.05水准,水准,拒绝拒绝H0,接受,接受H1,有统计学意义。,有统计学意义。新药与标准药物对降低胆固醇的疗效相同新药与标准药物对降低胆固醇的疗效相同(3)确定确定P 值,作出推断结论值,作出推断结论62u值须在等效试验前根据专业知识予以确定值须在等效试验前根据专业知识予以确定应用等效检验的注意事项应用等效检验的注意事项研究者可把专业上或公认有临床实际意义研究者可把专业上或公认有临床实际意义的差值作为等
19、效界值的差值作为等效界值。如:。如:血压血压值为值为0.67kPa(5mmHg),胆固醇胆固醇值为值为0.52mmol/L(20mg/dl),白细胞白细胞值为值为0.5 109/L(500个个/mm3)。难以确定时可用难以确定时可用0.2 0.5倍标准差作为参考倍标准差作为参考63 第六节第六节 假设检验的注意事项假设检验的注意事项64一、一、I型错误和型错误和II型错误型错误65健康人与肝病病人的肝大指数分布健康人与肝病病人的肝大指数分布(所拟合的两个正态曲线各按所拟合的两个正态曲线各按100%面积绘制)面积绘制)肝肝大大指指数数健康人健康人H0肝病病人肝病病人H1第一类错误第一类错误a误诊
20、率误诊率(假阳性率假阳性率)第二类错误第二类错误b漏诊率漏诊率(假阴性率假阴性率)6.17.08.456891011 4 大,大,小;小;大,大,小。增加小。增加n可同时缩小可同时缩小,。66u 可取单尾亦可取双尾可取单尾亦可取双尾。uII型错误的概率大小用型错误的概率大小用 表示表示,只取单尾,只取单尾,值的大小一般未知,须在知道两总体差值值的大小一般未知,须在知道两总体差值(如如 12等等)、及及n时,才能算出。时,才能算出。u1称称检检验验效效能能(powerofatest),过过去去称把称把握度。为当两总体确有差异,按检验水准握度。为当两总体确有差异,按检验水准 所能发现该差异的能力。
21、所能发现该差异的能力。1只取单尾。只取单尾。u拒绝拒绝H0,只可能犯,只可能犯I型错误,不可能犯型错误,不可能犯II型型错误;不拒绝错误;不拒绝H0,只可能犯,只可能犯II型错误,不型错误,不可能犯可能犯I型错误。型错误。67二、假设检验应注意的问题二、假设检验应注意的问题1.要有严密的研究设计要有严密的研究设计组间应均衡,具有可比性,除对比的主要因组间应均衡,具有可比性,除对比的主要因素素(如临床试验用新药和对照药如临床试验用新药和对照药)外,其它可外,其它可能影响结果的因素能影响结果的因素(如年龄、性别、病程、如年龄、性别、病程、病情轻重等病情轻重等)在对比组间应相同或相近。在对比组间应相
22、同或相近。68u配对设计计量资料:配对配对设计计量资料:配对t检验。检验。u完全随机设计两样本计量资料:完全随机设计两样本计量资料:小样本小样本(任一任一ni60)且方差齐且方差齐:两样本两样本t检验检验方差不齐方差不齐:近似近似t 检验检验大样本大样本(所有所有ni60):u检验。检验。2.不同资料应选用不同检验方法不同资料应选用不同检验方法693.正确理解正确理解“significance”一词的含义一词的含义u过去称差别有或无过去称差别有或无“显著性显著性”,易造成,易造成两两样本统计量之间比较相差很大的误解。样本统计量之间比较相差很大的误解。u现在称差别有或无现在称差别有或无“统计学意
23、义统计学意义”,相应推断为:可以认为或还不能认为两相应推断为:可以认为或还不能认为两个或多个总体参数有差别。个或多个总体参数有差别。704.结论不能绝对化结论不能绝对化u因统计结论具有概率性质,故因统计结论具有概率性质,故“肯定肯定”、“一定一定”、“必定必定”等词不要使用。等词不要使用。u在报告结论时,最好列出检验统计量的在报告结论时,最好列出检验统计量的值,尽量写出具体值,尽量写出具体P值,而不简单写成值,而不简单写成P 0.05,以便读者与同类研究进行比,以便读者与同类研究进行比较或进行循证医学时采用较或进行循证医学时采用Meta分析。分析。715.统计统计“有意义有意义”与医学与医学“
24、有意义有意义”u统计统计“有意义有意义”对应统计结论,医学对应统计结论,医学“有意有意义义”对应专业结论。对应专业结论。u统计结论有意义,专业结论无意义,最统计结论有意义,专业结论无意义,最终终结论没有意义,样本含量过大或设计存在结论没有意义,样本含量过大或设计存在问题。问题。u统计结论无意义,专业结论有意义,检统计结论无意义,专业结论有意义,检查查设计是否合理、样本含量是否足够。设计是否合理、样本含量是否足够。726.可信区间与假设检验区别和联系可信区间与假设检验区别和联系u可信区间可回答假设检验问题可信区间可回答假设检验问题H0:=0=140g/L铅作业男性工人的平均血红蛋铅作业男性工人的
25、平均血红蛋白含量与正常成年男性的相等白含量与正常成年男性的相等H1:0=0.05铅作业男性工人平均血红蛋白含量铅作业男性工人平均血红蛋白含量总体总体均数均数 的的95%CI为为(122.12,139.54)g/L,未包括未包括 0=140g/L按按=0.05水准,拒绝水准,拒绝H0,接受,接受H1。73u可信区间说明可信区间说明量的大小量的大小即推断总体均数即推断总体均数所在范围,假设检验推断所在范围,假设检验推断质的不同质的不同即判即判断两总体均数是否不等。断两总体均数是否不等。u可信区间不但能回答差别有无统计学意可信区间不但能回答差别有无统计学意义,还能提示差别有无实际专业意义。义,还能提
26、示差别有无实际专业意义。u可信区间不能够完全代替假设检验。可可信区间不能够完全代替假设检验。可信区间只能在预先规定概率信区间只能在预先规定概率 的前提下的前提下进行计算,而假设检验能获得一较为确进行计算,而假设检验能获得一较为确切的切的P值。值。74第七节第七节*正态性检验正态性检验和两样本方差比较的和两样本方差比较的F检验检验75两小样本两小样本t检验前提条件:检验前提条件:相应的两总体为正态总体相应的两总体为正态总体两总体方差相等,即方差齐性两总体方差相等,即方差齐性配对配对t检验前提条件:检验前提条件:每对数据每对数据差值差值的总体为正态总体的总体为正态总体76一、正态性检验一、正态性检
27、验(了解了解)1.图示法图示法u概率图概率图(probability-probabilityplot)以实际累积频率以实际累积频率(X)对正态分布理论累积频率对正态分布理论累积频率(Y)作散点图作散点图u分位数图分位数图(quantile-quantileplot)以实际分位数以实际分位数(X)对正态分布理论分位数对正态分布理论分位数()作散点图作散点图u如果实际值与理论值吻合,图中散点几乎如果实际值与理论值吻合,图中散点几乎都在一直线上,可认为该资料服从正态分布都在一直线上,可认为该资料服从正态分布77(168-167.69)/1.69=0.18(164-167.69)/1.69=-2.18
28、(172-167.69)/1.69=2.55782.计算法计算法u偏偏度度(skewness)指指分分布布不不对对称称的的程程度度和和方方向向,用偏度系数,用偏度系数(总体总体:1样本样本:g1)衡量。衡量。1=0对称对称 1 0正偏态正偏态 1 0负偏态负偏态u峰度峰度(kurtosis)指分布与正态曲线相比的冒指分布与正态曲线相比的冒尖或扁平程度,用峰度系数尖或扁平程度,用峰度系数(总体总体:2样本样本:g2)衡量。衡量。2=0正态峰正态峰 2 0尖峭峰尖峭峰 2 0平阔峰平阔峰u当当同同时时满满足足对对称称和和正正态态峰峰两两个个条条件件时时,才才能能认为该资料服从正态分布。认为该资料服
29、从正态分布。79u对偏度和峰度各用一个指标评定,其中以对偏度和峰度各用一个指标评定,其中以矩法矩法(methodofmoment)效率最高效率最高u对偏度和峰度用一个指标综合评定对偏度和峰度用一个指标综合评定H0:1=0且且 2=0,总体服从正态分布,总体服从正态分布H0:10且且 20,总体不服从正态分布,总体不服从正态分布=0.10(减少(减少型错误)型错误)80二、两样本方差比较的二、两样本方差比较的F检验检验u第一个样本方差既可能大于也可能小于第第一个样本方差既可能大于也可能小于第二二个样本方差,是个样本方差,是双侧检验。双侧检验。u公式规定以较大方差作分子,公式规定以较大方差作分子,F必然大于必然大于1。附表附表3仅给出不对称仅给出不对称F分布右侧界值分布右侧界值 81研究目的:阿卡波糖胶囊降血糖效果研究目的:阿卡波糖胶囊降血糖效果试验设计:同期随机对照试验试验设计:同期随机对照试验受试对象:受试对象:40名名II型糖尿病病人型糖尿病病人试验组:阿卡波糖胶囊试验组:阿卡波糖胶囊对照组:拜唐苹胶囊对照组:拜唐苹胶囊观测指标:试验观测指标:试验8周后糖化血红蛋白下降值周后糖化血红蛋白下降值82
限制150内