《统计学抽样误差和统计推断PPT课件.ppt》由会员分享,可在线阅读,更多相关《统计学抽样误差和统计推断PPT课件.ppt(30页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于统计学抽样误差与统关于统计学抽样误差与统计推断计推断第一张,PPT共三十页,创作于2022年6月统计推断的过程统计推断的过程样样样样本本本本总体总体总体总体样本统计量样本统计量样本统计量样本统计量如:样本均值、如:样本均值、如:样本均值、如:样本均值、比例、方差比例、方差比例、方差比例、方差总体均值、比例、总体均值、比例、方差等方差等第二张,PPT共三十页,创作于2022年6月教学要求掌握:总体均数的估计;假设检验基本思想、掌握:总体均数的估计;假设检验基本思想、步骤和注意事项,各种步骤和注意事项,各种t t、u u检验的方法检验的方法 与应用。与应用。熟悉:熟悉:抽样误差及规律,抽样误差
2、及规律,t t分布的特征和规分布的特征和规 律。律。了解:了解:方差齐性检验方差齐性检验第三张,PPT共三十页,创作于2022年6月抽样误差抽样误差(sampling error)19岁男大学生身高总体岁男大学生身高总体 第四张,PPT共三十页,创作于2022年6月抽样分布抽样分布 抽样分布示意图抽样分布示意图第五张,PPT共三十页,创作于2022年6月 中心极限定理中心极限定理 当当样样本含量很大的情况下,无本含量很大的情况下,无论论原始原始测测量量变变量服从什么量服从什么分布,分布,的抽的抽样样分布分布均均近似正近似正态态。抽样分布抽样分布 抽样分布示意图抽样分布示意图第六张,PPT共三十
3、页,创作于2022年6月抽样分布与总体分布的关系抽样分布与总体分布的关系总总 体体正态分布正态分布非正态分布非正态分布大样本大样本大样本大样本小样本小样本小样本小样本正态分布正态分布正态分布正态分布非正态分布非正态分布第七张,PPT共三十页,创作于2022年6月第八张,PPT共三十页,创作于2022年6月第九张,PPT共三十页,创作于2022年6月标准误标准误(standard error)衡量样本均数的衡量样本均数的可靠性可靠性 估计总体均数的估计总体均数的可信区间可信区间用于均数的用于均数的假设检验假设检验第十张,PPT共三十页,创作于2022年6月 例例4.1 在在某某地地随随机机抽抽查
4、查成成年年男男子子140人人,计计算算得得红红细细胞胞均均数数4.771012/L,标标准准差差0.38 1012/L,试计算均数的标准误。,试计算均数的标准误。第十一张,PPT共三十页,创作于2022年6月 分分 布布 (t distribution)1908年年,英英国国统统计计学学家家 W.S.Gosset 以以笔笔名名“Student”首首次次提出提出t分布概念。分布概念。第十二张,PPT共三十页,创作于2022年6月t t 分布的概念分布的概念第十三张,PPT共三十页,创作于2022年6月t t分布的概率密度函数分布的概率密度函数(扩展)扩展)式中式中 为伽玛函数为伽玛函数 第十四张
5、,PPT共三十页,创作于2022年6月t分布的特征分布的特征1 1、t t分布同标分布同标准正态分布一准正态分布一样,是以样,是以0 0为为中心的对称分中心的对称分布。布。2 2、同标准正、同标准正态分布曲线不态分布曲线不同,同,t t 分布曲分布曲线不是一条线不是一条而是一簇曲而是一簇曲线。线。3 3、t t 分布曲线分布曲线的形态,随自的形态,随自由度由度的不同的不同而不同。而不同。第十五张,PPT共三十页,创作于2022年6月-tt0第十六张,PPT共三十页,创作于2022年6月参数估计参数估计总体均数的估计总体均数的估计Estimation of Parameter第十七张,PPT共三
6、十页,创作于2022年6月参数估计的意义参数估计的意义 参数估计的形式有两种:参数估计的形式有两种:1 1、点(值)估计、点(值)估计(point estimation)2 2、区间估计区间估计(interval estimation )第十八张,PPT共三十页,创作于2022年6月 参数估计参数估计点估计:不考虑抽样误差,如点估计:不考虑抽样误差,如区间估计:考虑抽样误差区间估计:考虑抽样误差第十九张,PPT共三十页,创作于2022年6月区间估计区间估计(interval estimation)(1-1-)95%区间估计区间估计是按是按概率概率(1 1),确定一,确定一个包含总体参数的范围。
7、称为参数个包含总体参数的范围。称为参数的的可信区间可信区间(confidence interval,(confidence interval,CI)CI)第二十张,PPT共三十页,创作于2022年6月区间估计的方法区间估计的方法:总体标准差总体标准差已知已知总体标准差总体标准差未知未知 总体标准差总体标准差未知,但未知,但n n 足够大足够大 第二十一张,PPT共三十页,创作于2022年6月 例例4.2 4.2 某某医医生生测测得得2525名名动动脉脉粥粥样样硬硬化化患患者者血血浆浆纤纤维维蛋蛋白白原原含含量量的的均均数数为为3.32 3.32 g/Lg/L,标标准准差差为为0.57 0.57
8、 g/Lg/L,试试计计算算该该种种病病人人血血浆浆纤纤维维蛋蛋白白原原含含量量总总体体均均数数的的95%95%可可信区间。信区间。下限:下限:上限:上限:第二十二张,PPT共三十页,创作于2022年6月 例例4.3 4.3 试试计计算算例例4.14.1中中该该地地成成年年男男子子红红细细胞胞总总体体均均数数的的95%95%可信区间。可信区间。下限:下限:上限:上限:第二十三张,PPT共三十页,创作于2022年6月总体方差的区间估计总体方差的区间估计(扩展)扩展)总体方差可总体方差可信区间为信区间为:1111 自由度为自由度为自由度为自由度为n n-1-1的的的的 第二十四张,PPT共三十页,
9、创作于2022年6月来自来自N N(0,1)(0,1)的的100100个样本所计算的个样本所计算的95%95%可信区间示意可信区间示意 第二十五张,PPT共三十页,创作于2022年6月可信区间估计的优劣95%第一个要素是准确性,又称第一个要素是准确性,又称可靠性,为可信度可靠性,为可信度1-1-的大小,的大小,显然显然1-1-然愈接近愈好。在然愈接近愈好。在实际工作中要根据研究目的实际工作中要根据研究目的和需要来定,常用的可信度和需要来定,常用的可信度为为90%90%、95%95%和和99%99%,但不,但不以此为限。以此为限。90%99%第二个要素是估计精确第二个要素是估计精确性,常用可信区
10、间上下性,常用可信区间上下限的范围衡量,当然区限的范围衡量,当然区间的宽度愈窄愈好。精间的宽度愈窄愈好。精确性与变量的变异度、确性与变量的变异度、样本量和样本量和1-1-的取值等的取值等因素有关。因素有关。个体的变异度越大个体的变异度越大范围越宽范围越宽个体的变异度越小个体的变异度越小范围越窄范围越窄准确性与精确性相互牵准确性与精确性相互牵制:若要提高可信度,制:若要提高可信度,可取较小的可取较小的值,但此时值,但此时必然使可信区间的宽度必然使可信区间的宽度变长,导致精确性下降。变长,导致精确性下降。从两方面评价从两方面评价:第二十六张,PPT共三十页,创作于2022年6月归纳总结:归纳总结:
11、(讨论)(讨论)1 1、标准误与标准差的区别?、标准误与标准差的区别?2 2、总体均数可信区间与医学参考值范围、总体均数可信区间与医学参考值范围的区别?的区别?第二十七张,PPT共三十页,创作于2022年6月标准差与标准误的区别标准差与标准误的区别第二十八张,PPT共三十页,创作于2022年6月总体均数可信区间与参考值范围的区别总体均数可信区间与参考值范围的区别估计绝大多数(如)估计绝大多数(如)观察对象某项指标的分布观察对象某项指标的分布范围范围估计总体均数的可信区间估计总体均数的可信区间用用途途正态分布:正态分布:偏态分布:偏态分布:未知:未知:已知或已知或未知但未知但n n 较大:较大:用或用或计计算算公公式式“正常人正常人”的解剖、生理、的解剖、生理、生化指标的波动范围生化指标的波动范围 个体值的波动范围个体值的波动范围按预先给定的概率,确定为参数的范按预先给定的概率,确定为参数的范围。实际上可能包含了总体均数也可围。实际上可能包含了总体均数也可能没包含能没包含总体参数的波动范围总体参数的波动范围含含义义参数值的范围参数值的范围总体均数可信区间总体均数可信区间区区别别第二十九张,PPT共三十页,创作于2022年6月感感谢谢大大家家观观看看第三十张,PPT共三十页,创作于2022年6月
限制150内