统计学抽样误差与统计推断课件.ppt
关于统计学抽样误差与统关于统计学抽样误差与统计推断计推断现在学习的是第1页,共30页统计推断的过程统计推断的过程样样样样本本本本总体总体总体总体样本统计量样本统计量样本统计量样本统计量如:样本均值、如:样本均值、如:样本均值、如:样本均值、比例、方差比例、方差比例、方差比例、方差总体均值、比总体均值、比例、方差等例、方差等现在学习的是第2页,共30页教学要求掌握:总体均数的估计;假设检验基本思想、掌握:总体均数的估计;假设检验基本思想、步骤和注意事项,各种步骤和注意事项,各种t t、u u检验的方法检验的方法 与应用。与应用。熟悉:熟悉:抽样误差及规律,抽样误差及规律,t t分布的特征和规分布的特征和规 律。律。了解:了解:方差齐性检验方差齐性检验现在学习的是第3页,共30页抽样误差抽样误差(sampling error)19岁男大学生身高总体岁男大学生身高总体 现在学习的是第4页,共30页抽样分布抽样分布 抽样分布示意图抽样分布示意图现在学习的是第5页,共30页 中心极限定理中心极限定理 当当样样本含量很大的情况下,无本含量很大的情况下,无论论原始原始测测量量变变量服从什量服从什么分布,么分布,的抽的抽样样分布分布均均近似正近似正态态。抽样分布抽样分布 抽样分布示意图抽样分布示意图现在学习的是第6页,共30页抽样分布与总体分布的关系抽样分布与总体分布的关系总总 体体正态分布正态分布非正态分布非正态分布大样本大样本大样本大样本小样本小样本小样本小样本正态分布正态分布正态分布正态分布非正态分布非正态分布现在学习的是第7页,共30页现在学习的是第8页,共30页现在学习的是第9页,共30页标准误标准误(standard error)衡量样本均数的衡量样本均数的可靠性可靠性 估计总体均数的估计总体均数的可信区间可信区间用于均数的用于均数的假设检验假设检验现在学习的是第10页,共30页 例例4.1 在在某某地地随随机机抽抽查查成成年年男男子子140人人,计计算算得得红红细细胞胞均均数数4.771012/L,标标准准差差0.38 1012/L,试计算均数的标准误。,试计算均数的标准误。现在学习的是第11页,共30页 分分 布布 (t distribution)1908年年,英英国国统统计计学学家家 W.S.Gosset 以以笔笔名名“Student”首首次提出次提出t分布概念。分布概念。现在学习的是第12页,共30页t t 分布的概念分布的概念现在学习的是第13页,共30页t t分布的概率密度函数分布的概率密度函数(扩展)扩展)式中式中 为伽玛函数为伽玛函数 现在学习的是第14页,共30页t分布的特征分布的特征1 1、t t分布同标分布同标准正态分布一准正态分布一样,是以样,是以0 0为为中心的对称中心的对称分布。分布。2 2、同标准正、同标准正态分布曲线不态分布曲线不同,同,t t 分布曲分布曲线不是一条而线不是一条而是一簇曲线。是一簇曲线。3 3、t t 分布曲线分布曲线的形态,随自的形态,随自由度由度的不同的不同而不同。而不同。现在学习的是第15页,共30页-tt0现在学习的是第16页,共30页参数估计参数估计总体均数的估计总体均数的估计Estimation of Parameter现在学习的是第17页,共30页参数估计的意义参数估计的意义 参数估计的形式有两种:参数估计的形式有两种:1 1、点(值)估计、点(值)估计(point estimation)2 2、区间估计区间估计(interval estimation )现在学习的是第18页,共30页 参数估计参数估计点估计:不考虑抽样误差,如点估计:不考虑抽样误差,如区间估计:考虑抽样误差区间估计:考虑抽样误差现在学习的是第19页,共30页区间估计区间估计(interval estimation)(1-1-)95%区间估计区间估计是按是按概率概率(1 1),确定,确定一个包含总体参数的范围。称为参数一个包含总体参数的范围。称为参数的的可信区间可信区间(confidence interval,(confidence interval,CI)CI)现在学习的是第20页,共30页区间估计的方法区间估计的方法:总体标准差总体标准差已知已知总体标准差总体标准差未知未知 总体标准差总体标准差未知,但未知,但n n 足够大足够大 现在学习的是第21页,共30页 例例4.2 4.2 某某医医生生测测得得2525名名动动脉脉粥粥样样硬硬化化患患者者血血浆浆纤纤维维蛋蛋白白原原含含量量的的均均数数为为3.32 3.32 g/Lg/L,标标准准差差为为0.57 0.57 g/Lg/L,试试计计算算该该种种病病人人血血浆浆纤纤维维蛋蛋白白原原含含量量总总体体均均数数的的95%95%可信区间。可信区间。下限:下限:上限:上限:现在学习的是第22页,共30页 例例4.3 4.3 试试计计算算例例4.14.1中中该该地地成成年年男男子子红红细细胞胞总总体体均均数数的的95%95%可信区间。可信区间。下限:下限:上限:上限:现在学习的是第23页,共30页总体方差的区间估计总体方差的区间估计(扩展)扩展)总体方差可总体方差可信区间为信区间为:1111 自由度为自由度为自由度为自由度为n n-1-1的的的的 现在学习的是第24页,共30页来自来自N N(0,1)(0,1)的的100100个样本所计算的个样本所计算的95%95%可信区间示意可信区间示意 现在学习的是第25页,共30页可信区间估计的优劣95%第一个要素是准确性,又称可第一个要素是准确性,又称可靠性,为可信度靠性,为可信度1-1-的大小,的大小,显然显然1-1-然愈接近愈好。然愈接近愈好。在实际工作中要根据研究目在实际工作中要根据研究目的和需要来定,常用的可信的和需要来定,常用的可信度为度为90%90%、95%95%和和99%99%,但不以此为限。但不以此为限。90%99%第二个要素是估计精确第二个要素是估计精确性,常用可信区间上下性,常用可信区间上下限的范围衡量,当然区限的范围衡量,当然区间的宽度愈窄愈好。精间的宽度愈窄愈好。精确性与变量的变异度、确性与变量的变异度、样本量和样本量和1-1-的取值等的取值等因素有关。因素有关。个体的变异度越大个体的变异度越大范围越宽范围越宽个体的变异度越小个体的变异度越小范围越窄范围越窄准确性与精确性相互牵准确性与精确性相互牵制:若要提高可信度,制:若要提高可信度,可取较小的可取较小的值,但此时值,但此时必然使可信区间的宽度变必然使可信区间的宽度变长,导致精确性下降。长,导致精确性下降。从两方面评价从两方面评价:现在学习的是第26页,共30页归纳总结:归纳总结:(讨论)(讨论)1 1、标准误与标准差的区别?、标准误与标准差的区别?2 2、总体均数可信区间与医学参考值范、总体均数可信区间与医学参考值范围的区别?围的区别?现在学习的是第27页,共30页标准差与标准误的区别标准差与标准误的区别现在学习的是第28页,共30页总体均数可信区间与参考值范围的区别总体均数可信区间与参考值范围的区别估计绝大多数(如)估计绝大多数(如)观察对象某项指标的分布观察对象某项指标的分布范围范围估计总体均数的可信区间估计总体均数的可信区间用用途途正态分布:正态分布:偏态分布:偏态分布:未知:未知:已知或已知或未知但未知但n n 较大:较大:用或用或计计算算公公式式“正常人正常人”的解剖、生理、的解剖、生理、生化指标的波动范围生化指标的波动范围 个体值的波动范围个体值的波动范围按预先给定的概率,确定为参数的范按预先给定的概率,确定为参数的范围。实际上可能包含了总体均数也可围。实际上可能包含了总体均数也可能没包含能没包含总体参数的波动范围总体参数的波动范围含含义义参数值的范围参数值的范围总体均数可信区间总体均数可信区间区区别别现在学习的是第29页,共30页感感谢谢大大家家观观看看现在学习的是第30页,共30页