《三总体均数的估计与假设检验.pptx》由会员分享,可在线阅读,更多相关《三总体均数的估计与假设检验.pptx(90页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、会计学1三总体均数的估计与假设检验三总体均数的估计与假设检验2第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误第1页/共90页3u了解总体特征的最好方法是对总体的每一了解总体特征的最好方法是对总体的每一个体进行观察、试验,但这在医学研究实个体进行观察、试验,但这在医学研究实际中往往不可行。际中往往不可行。u对对无限总体无限总体不可能对所有个体逐一观察,不可能对所有个体逐一观察,对对有限总体有限总体限于人力、财力、物力、时间限于人力、财力、物力、时间或个体过多等原因,不可能也没必要对所或个体过多等原因,不可能也没必要对所有个体逐一研究有个体逐一研究(如对一批罐头质量检查如对一批罐头质量
2、检查)。u借助借助抽样研究抽样研究。第2页/共90页4u欲了解某地欲了解某地18岁男生身高值的平均水平,岁男生身高值的平均水平,随机抽取该地随机抽取该地10名男生身高值作为名男生身高值作为样本样本。u由于由于个体变异与抽样个体变异与抽样的影响,抽得的样本的影响,抽得的样本均数不太可能等于总体均数,造成样本均数不太可能等于总体均数,造成样本统统计量与总体参数间的差异计量与总体参数间的差异(表现为来自同一表现为来自同一总体的若干样本统计量间的差异总体的若干样本统计量间的差异),称为,称为抽抽样误差样误差。u抽样误差是不可避免的。抽样误差是不可避免的。u抽样误差是有规律的。抽样误差是有规律的。第3页
3、/共90页51999年某市年某市18岁男生身高岁男生身高值值XiN(,2)=167.7cm=5.3cm样本号样本号1167.412.742165.566.573168.205.3699169.405.57100165.695.09ni=10第4页/共90页6样本均数抽样分布具有如下特点:样本均数抽样分布具有如下特点:u各样本均数未必等于总体均数各样本均数未必等于总体均数u各样本均数间存在差异各样本均数间存在差异u样本均数围绕样本均数围绕=167.69cm呈正态分布呈正态分布u样本均数变异度样本均数变异度()较原总体个较原总体个体值变异度体值变异度(=5.3cm)大大缩小大大缩小第5页/共90页
4、7第6页/共90页8中心极限定理中心极限定理(central limit theorem)从均数为从均数为、标准差为、标准差为 的总体中独立随机的总体中独立随机抽样,当样本含量抽样,当样本含量n较大时,较大时,样本均数的分布将趋于正态分布样本均数的分布将趋于正态分布 此分布的均数为此分布的均数为 标准差为标准差为第7页/共90页9中心极限定理中心极限定理(centrallimittheorem)若若Xi服从正态分布服从正态分布则则服从正态分布服从正态分布若若Xi不服从正态分布不服从正态分布n大大(n60):则:则近似服从正态分布近似服从正态分布n小小(n60)按按u分布原理分布原理2.两总体均
5、数之差的可信区间两总体均数之差的可信区间第24页/共90页261.单一总体均数的单一总体均数的1可信区间可信区间双侧双侧(1)未知未知单侧单侧第25页/共90页27故该地故该地18岁男生身高均数的岁男生身高均数的95%可信区间为可信区间为(164.35,169.55)cm。=167.7cm双尾双尾例例在例在例3-1中抽得第中抽得第15号样本的号样本的=166.95(cm),S=3.64(cm),求其总体均数的求其总体均数的95%可信区间。可信区间。166.952.2621.1511=164.35169.55(cm)第26页/共90页281.单一总体均数的单一总体均数的1可信区间可信区间双侧双侧
6、单侧单侧(2)已知已知或或 未知但未知但n足够大足够大:第27页/共90页29例例某地抽取正常成年人某地抽取正常成年人200名,测得其血名,测得其血清胆固醇均数为清胆固醇均数为3.64mmol/L,标准差为,标准差为1.20mmol/L,估计该地正常成年人血清胆,估计该地正常成年人血清胆固醇均数固醇均数95%可信区间。可信区间。第28页/共90页302.两总体均数之差的两总体均数之差的1可信区间可信区间双侧双侧单侧单侧第29页/共90页31三、可信区间的确切含义三、可信区间的确切含义u从从1999年某市年某市18岁男生身高值总体岁男生身高值总体N(=167.7cm,=5.3cm)中中随随机机抽
7、抽取取100个个样本样本计算了计算了100个估计个估计的的95%CIu其中有其中有95个个CI包含包含了了有有5个不包含个不包含=167.7cm20号号 161.00165.57 31号号 161.17167.3354号号 168.05171.00 76号号 167.71174.8482号号167.98174.27第30页/共90页来自来自N(0,1)的的100个样本所计算的个样本所计算的95%可信区间示可信区间示意意第31页/共90页33u如如果果能能够够进进行行重重复复抽抽样样试试验验,平平均均有有(1)的的可可信信区区间间包包含含了了总总体体参参数数,而而不不是是总总体体参参数数落落在在
8、该该范范围围的的可可能能性性为为(1)。u在实际工作中,只能根据一次试验结果计在实际工作中,只能根据一次试验结果计算一个可信区间,算一个可信区间,就认为该区间包含了相应就认为该区间包含了相应总体参数,总体参数,该结论犯错误的概率该结论犯错误的概率。u可信区间一旦形成,它要么包含总体参数,可信区间一旦形成,它要么包含总体参数,要么不包含总体参数,二者必居其一,无概要么不包含总体参数,二者必居其一,无概率可言。可信度是事前概率。率可言。可信度是事前概率。可信区间的确切含义可信区间的确切含义第32页/共90页34u正确性正确性:可信度:可信度1,即区间包含总体参,即区间包含总体参数数的理论概率大小,
9、愈接近的理论概率大小,愈接近1愈好。愈好。u精确性精确性:区间的宽度,区间愈窄愈好。区间的宽度,区间愈窄愈好。u当样本含量为定值时,上述两者互相矛盾。当样本含量为定值时,上述两者互相矛盾。若只顾提高可信度,则可信区间会变宽。若只顾提高可信度,则可信区间会变宽。评价可信区间估计的优劣:评价可信区间估计的优劣:第33页/共90页35四、可信区间与参考值范围的区别四、可信区间与参考值范围的区别u可信区间用于估计可信区间用于估计总体参数总体参数,总体参数只,总体参数只有一个有一个。u参考值范围用于估计参考值范围用于估计个体值个体值的分布范围,的分布范围,个体值有很多个体值有很多。u95%可信区间中的可
10、信区间中的95%是是可信度可信度,即所求可,即所求可信区间包含总体参数的可信程度为信区间包含总体参数的可信程度为95%。u95%参考值范围中的参考值范围中的95%是一个是一个比例比例,即,即所求参考值范围包含了所求参考值范围包含了95%的正常人。的正常人。第34页/共90页36第四节第四节 t 检验检验第35页/共90页37例例某某医医生生测测量量了了36名名从从事事铅铅作作业业男男性性工工人人的的血血红红蛋蛋白白含含量量,算算得得其其均均数数为为130.83g/L,标标准准差差为为25.74g/L。问问从从事事铅铅作作业业工工人人的的血血红红蛋蛋白是否不同于正常成年男性平均值白是否不同于正常
11、成年男性平均值140g/L?u样本均数与总体均数间差异的原因:样本均数与总体均数间差异的原因:1.总体均数不同总体均数不同?2.总体均数相同,差异由抽样误差造成总体均数相同,差异由抽样误差造成?u统计推断方法统计推断方法假设检验假设检验(hypothesistest)第36页/共90页381.进行检验假设进行检验假设假设样本来自某一特定总体假设样本来自某一特定总体2.确定检验水准确定检验水准确定最大允许误差确定最大允许误差3.选定检验方法计算检验统计量选定检验方法计算检验统计量计算样本与总体的偏离程度计算样本与总体的偏离程度4.计算与统计量对应的计算与统计量对应的P值值5.作出结论作出结论根据
12、小概率反证法思想作出推断根据小概率反证法思想作出推断假设检验一般步骤假设检验一般步骤第37页/共90页39t检验检验(Studentst-test)设计设计完全随机设计单样本完全随机设计单样本完全随机设计两样本完全随机设计两样本配对设计配对设计要求要求1.n较小较小(单组单组60或两组合计或两组合计60)2.样本随机地取自样本随机地取自正态总体正态总体3.两样本均数比较时所对应两总体两样本均数比较时所对应两总体方差相等方差相等(homogeneityofvariance)第38页/共90页40例例某某医医生生测测量量了了36名名从从事事铅铅作作业业男男性性工工人人的的血血红红蛋蛋白白含含量量,
13、算算得得其其均均数数为为130.83g/L,标标准准差差为为25.74g/L。问问从从事事铅铅作作业业工工人人的的血血红红蛋蛋白白是是否否不不同同于于正正常常成成年年男男性性平平均均值值140g/L?一、单样本一、单样本t检验检验1.建立检验假设,确定检验水准建立检验假设,确定检验水准H0:=0=140g/L铅作业男性工人的平均血红蛋铅作业男性工人的平均血红蛋白含量与正常成年男性的相白含量与正常成年男性的相等等H1:0=0.05第39页/共90页412.计算检验统计量计算检验统计量3.确定确定P值,作出推断结论值,作出推断结论|2.138|t0.05/2,35=2.030P2或或12单单侧侧检
14、检验验H0:1=2H1:12双侧检验。双侧检验。单双侧检验主要根据专业知识预先确定。单双侧检验主要根据专业知识预先确定。双侧检验较保守和稳妥。双侧检验较保守和稳妥。u检检验验水水准准:预预先先规规定定的的拒拒绝绝假假设设H0时时的的最最大允许误差大允许误差,它确定了小概率事件标准。,它确定了小概率事件标准。在实际工作中常取在实际工作中常取0.05,但并非一成不变。,但并非一成不变。第65页/共90页67u应根据变量和资料类型、设计方案、统应根据变量和资料类型、设计方案、统计推断的目的、方法的适用条件等选择计推断的目的、方法的适用条件等选择检验统计量。检验统计量。u所有检验统计量都是在所有检验统
15、计量都是在H0成立的前提条成立的前提条件下计算出来的。件下计算出来的。u检验统计量大小反映样本与总体的偏离检验统计量大小反映样本与总体的偏离程度(如程度(如t值反映样本均数与总体均数值反映样本均数与总体均数的偏离程度,以标准误进行标准化)的偏离程度,以标准误进行标准化)2.计算检验统计量计算检验统计量 第66页/共90页68uP值是决策的依据值是决策的依据uP的含义是指从的含义是指从H0规定的总体中随机抽样,规定的总体中随机抽样,其检验统计量等于及大于现有样本的检验其检验统计量等于及大于现有样本的检验统计量的概率。即从统计量的概率。即从H0假设总体中随机抽假设总体中随机抽到差别至少等于现有样本
16、差别的机会到差别至少等于现有样本差别的机会。u根据获得的事后概率根据获得的事后概率P,与事先规定的,与事先规定的概率概率检验水准检验水准 进行比较,看其是否为进行比较,看其是否为小概率事件而得出结论。小概率事件而得出结论。3.确定确定P值,作出推断结论值,作出推断结论第67页/共90页69uP,按按 检验水准,拒绝检验水准,拒绝H0,接受,接受H1有统计学意义有统计学意义(统计结论统计结论)statisticalsignificance可认为可认为不同,不同,高于高于(专业结论专业结论)uP,按,按 检验水准,不拒绝检验水准,不拒绝H0无统计学意义无统计学意义(统计结论统计结论)nostati
17、sticalsignificance还不能认为还不能认为不同不同(专业结论专业结论)不拒绝不拒绝H0不等于接受不等于接受H0,因此时证据不足,因此时证据不足第68页/共90页70三、三、I型错误和型错误和II型错误型错误第69页/共90页健康人与肝病病人的肝大指数分布健康人与肝病病人的肝大指数分布(所拟合的两个正态曲线各按所拟合的两个正态曲线各按100%面积绘制)面积绘制)肝肝大大指指数数健康人健康人H0肝病病人肝病病人H1第一类错误第一类错误a误诊率误诊率(假阳性率假阳性率)第二类错误第二类错误b漏诊率漏诊率(假阴性率假阴性率)6.17.08.456891011 4 大,大,小;小;大,大,
18、小。增加小。增加n可同时缩小可同时缩小,。第70页/共90页72u 可取单尾亦可取双尾可取单尾亦可取双尾。uII型错误的概率大小用型错误的概率大小用 表示表示,只取单尾,只取单尾,值值的的大大小小一一般般未未知知,须须在在知知道道两两总总体体差差值值(如如 12等等)、及及n时,才能算出。时,才能算出。u1称称检检验验效效能能(powerofatest),过过去称把去称把握度。为当两总体确有差异,按检验水准握度。为当两总体确有差异,按检验水准 所所能能发发现现该该差差异异的的能能力力。1只只取取单单尾。尾。u拒绝拒绝H0,只可能犯,只可能犯I型错误,不可能犯型错误,不可能犯II型型错误;不拒绝
19、错误;不拒绝H0,只可能犯,只可能犯II型错误,不型错误,不可能犯可能犯I型错误。型错误。第71页/共90页73四、假设检验应注意的问题四、假设检验应注意的问题1.要有严密的研究设计要有严密的研究设计组间应均衡,具有可比性,除对比的主要因组间应均衡,具有可比性,除对比的主要因素素(如临床试验用新药和对照药如临床试验用新药和对照药)外,其它可外,其它可能影响结果的因素能影响结果的因素(如年龄、性别、病程、如年龄、性别、病程、病情轻重等病情轻重等)在对比组间应相同或相近。在对比组间应相同或相近。第72页/共90页74u配对设计计量资料:配对配对设计计量资料:配对t检验。检验。u完全随机设计两样本计
20、量资料:完全随机设计两样本计量资料:小样本小样本(任一任一ni60)且方差齐且方差齐:两样本两样本t检验检验方差不齐方差不齐:近似近似t 检检验验大样本大样本(所有所有ni60):u检验。检验。2.不同资料应选用不同检验方法不同资料应选用不同检验方法第73页/共90页753.正确理解正确理解“significance”一词的含义一词的含义u过去称差别有或无过去称差别有或无“显著性显著性”,易造成,易造成两两样本统计量之间比较相差很大的误解。样本统计量之间比较相差很大的误解。u现在称差别有或无现在称差别有或无“统计学意义统计学意义”,相应推断为:可以认为或还不能认为两相应推断为:可以认为或还不能
21、认为两个或多个总体参数有差别。个或多个总体参数有差别。第74页/共90页764.结论不能绝对化结论不能绝对化u因统计结论具有概率性质,故因统计结论具有概率性质,故“肯定肯定”、“一定一定”、“必定必定”等词不要使用。等词不要使用。u在报告结论时,最好列出检验统计量的在报告结论时,最好列出检验统计量的值,尽量写出具体值,尽量写出具体P值,而不简单写成值,而不简单写成P0.05,以便读者与同类研究进行比,以便读者与同类研究进行比较或进行循证医学时采用较或进行循证医学时采用Meta分析。分析。第75页/共90页775.统计统计“有意义有意义”与医学与医学“有意义有意义”u统计统计“有意义有意义”对应
22、统计结论,医学对应统计结论,医学“有意有意义义”对应专业结论。对应专业结论。u统计结论有意义,专业结论无意义,最统计结论有意义,专业结论无意义,最终终结论没有意义,样本含量过大或设计存在结论没有意义,样本含量过大或设计存在问题。问题。u统计结论无意义,专业结论有意义,检统计结论无意义,专业结论有意义,检查查设计是否合理、样本含量是否足够。设计是否合理、样本含量是否足够。第76页/共90页786.可信区间与假设检验区别和联系可信区间与假设检验区别和联系u可信区间可回答假设检验问题可信区间可回答假设检验问题H0:=0=140g/L铅作业男性工人的平均血红蛋铅作业男性工人的平均血红蛋白含量与正常成年
23、男性的相等白含量与正常成年男性的相等H1:0=0.05铅作业男性工人平均血红蛋白含量铅作业男性工人平均血红蛋白含量总体总体均数均数 的的95%CI为为(122.12,139.54)g/L,未包括未包括 0=140g/L按按=0.05水准,拒绝水准,拒绝H0,接受,接受H1。第77页/共90页79u可信区间说明可信区间说明量的大小量的大小即推断总体均数即推断总体均数所在范围,假设检验推断所在范围,假设检验推断质的不同质的不同即判即判断两总体均数是否不等。断两总体均数是否不等。u可信区间不但能回答差别有无统计学意可信区间不但能回答差别有无统计学意义,还能提示差别有无实际专业意义。义,还能提示差别有
24、无实际专业意义。u可信区间不能够完全代替假设检验。可可信区间不能够完全代替假设检验。可信区间只能在预先规定概率信区间只能在预先规定概率 的前提下的前提下进行计算,而假设检验能获得一较为确进行计算,而假设检验能获得一较为确切的切的P值。值。第78页/共90页80第七节第七节*正态性检验正态性检验和两样本方差比较的和两样本方差比较的F检验检验第79页/共90页81两小样本两小样本t检验前提条件:检验前提条件:相应的两总体为正态总体相应的两总体为正态总体两总体方差相等,即方差齐性两总体方差相等,即方差齐性配对配对t检验前提条件:检验前提条件:每对数据每对数据差值差值的总体为正态总体的总体为正态总体第
25、80页/共90页82一、正态性检验一、正态性检验(了解了解)1.图示法图示法u概率图概率图(probability-probabilityplot)以实际累积频率以实际累积频率(X)对正态分布理论累积频率对正态分布理论累积频率(Y)作散点图作散点图u分位数图分位数图(quantile-quantileplot)以实际分位数以实际分位数(X)对正态分布理论分位数对正态分布理论分位数()作散点图作散点图u如果实际值与理论值吻合,图中散点几乎如果实际值与理论值吻合,图中散点几乎都在一直线上,可认为该资料服从正态分布都在一直线上,可认为该资料服从正态分布第81页/共90页83(168-167.69)/
26、1.69=0.18(164-167.69)/1.69=-2.18(172-167.69)/1.69=2.55第82页/共90页842.计算法计算法u偏偏度度(skewness)指指分分布布不不对对称称的的程程度度和和方方向向,用偏度系数,用偏度系数(总体总体:1样本样本:g1)衡量。衡量。1=0对对称称 10正正偏偏态态 10负负偏偏态态u峰度峰度(kurtosis)指分布与正态曲线相比的冒指分布与正态曲线相比的冒尖或扁平程度,用峰度系数尖或扁平程度,用峰度系数(总体总体:2样本样本:g2)衡量。衡量。2=0正正态态峰峰 20尖尖峭峭峰峰 20平平阔阔峰峰u当当同同时时满满足足对对称称和和正正
27、态态峰峰两两个个条条件件时时,才才能能认为该资料服从正态分布。认为该资料服从正态分布。第83页/共90页85u对偏度和峰度各用一个指标评定,其中以对偏度和峰度各用一个指标评定,其中以矩法矩法(methodofmoment)效率最高效率最高u对偏度和峰度用一个指标综合评定对偏度和峰度用一个指标综合评定H0:1=0且且 2=0,总体服从正态分布,总体服从正态分布H0:10且且 20,总体不服从正态分布,总体不服从正态分布=0.10(减少(减少型错误)型错误)第84页/共90页86二、两样本方差比较的二、两样本方差比较的F检验检验u第一个样本方差既可能大于也可能小于第第一个样本方差既可能大于也可能小
28、于第二二个样本方差,是个样本方差,是双侧检验。双侧检验。u公式规定以较大方差作分子,公式规定以较大方差作分子,F必然大于必然大于1。附表附表3仅给出不对称仅给出不对称F分布右侧界值分布右侧界值 第85页/共90页87研究目的:阿卡波糖胶囊降血糖效果研究目的:阿卡波糖胶囊降血糖效果试验设计:同期随机对照试验试验设计:同期随机对照试验受试对象:受试对象:40名名II型糖尿病病人型糖尿病病人试验组:阿卡波糖胶囊试验组:阿卡波糖胶囊对照组:拜唐苹胶囊对照组:拜唐苹胶囊观测指标:试验观测指标:试验8周后糖化血红蛋白下降值周后糖化血红蛋白下降值第86页/共90页88(1)建立检验假设,确定检验水准。建立检
29、验假设,确定检验水准。(2)计算检验统计量计算检验统计量(3)确定确定P值,作出推断结论值,作出推断结论3.7752.15=F0.10(20,19)P0.10按按=0.10水准,拒绝水准,拒绝H0,接受,接受H1,有统计,有统计学意义。可认为对照组和试验组病人试验学意义。可认为对照组和试验组病人试验8周后糖化血红蛋白下降值总体方差不等。周后糖化血红蛋白下降值总体方差不等。第87页/共90页89uu均数的抽样误差与标准误均数的抽样误差与标准误均数的抽样误差与标准误均数的抽样误差与标准误uu t t 分布分布分布分布uu总体均数的估计总体均数的估计总体均数的估计总体均数的估计uu t t 检验检验检验检验uu假设检验的注意事项假设检验的注意事项假设检验的注意事项假设检验的注意事项uu正态性检验和两样本方差比较的正态性检验和两样本方差比较的正态性检验和两样本方差比较的正态性检验和两样本方差比较的F F检验检验检验检验讲课内容讲课内容讲课内容讲课内容第88页/共90页90谢 谢 !第89页/共90页
限制150内