【教学课件】第04章抽样误差与假设检验.ppt
《【教学课件】第04章抽样误差与假设检验.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第04章抽样误差与假设检验.ppt(23页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 第四章第四章 抽样误差与假设检验抽样误差与假设检验 (Sampling Sampling E Error and rror and H Hypothesis ypothesis T Testest)哈尔滨医科大学哈尔滨医科大学 李康李康 第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误 一、均数的抽样误差一、均数的抽样误差 在医学研究中,在医学研究中,绝绝大多数情况是由大多数情况是由样样本信息研本信息研究究总总体。由于个体存在差异,因此通体。由于个体存在差异,因此通过样过样本推本推论总论总体体时时会存在一定的会存在一定的误误差,如差,如样样本均数本均数 往往不等于往往不等于总总体均
2、数体均数 ,这这种由抽种由抽样样造成的造成的样样本均数与本均数与总总体均体均数的差异称数的差异称为为抽抽样误样误差差。对于抽样研究,抽样误差。对于抽样研究,抽样误差不可避免。不可避免。二、抽样误差的分布二、抽样误差的分布 理理论论上可以上可以证证明:若从正明:若从正态总态总体体 中,反中,反复多次随机抽取复多次随机抽取样样本含量固定本含量固定为为n 的的样样本,那么本,那么这这些些样样本均数本均数 也服从正也服从正态态分布,即分布,即 的的总总体均数体均数仍仍为为 ,样样本均数的本均数的标标准差准差为为 。抽样分布抽样分布 抽样分布示意图抽样分布示意图 中心极限定理中心极限定理:当当样样本含量
3、很大的情况下,无本含量很大的情况下,无论论原始原始测测量量变变量服量服从什么分布,从什么分布,的抽的抽样样分布分布均均近似正近似正态态。抽样分布抽样分布 抽样分布示意图抽样分布示意图 三、标准误(三、标准误(Standard ErrorStandard Error)样本均数的标准差称为标准误。样本均数的标准差称为标准误。样样本均数的本均数的变变异越小异越小说说明估明估计计越精确,越精确,因此可以用标准误表因此可以用标准误表示抽样误差的大小:示抽样误差的大小:实际中总体标准差实际中总体标准差 往往未知,故只能求往往未知,故只能求得样本均数标准误的估计值得样本均数标准误的估计值 :例例4.1 在在
4、某某地地随随机机抽抽查查成成年年男男子子140人人,计计算算得得红红细细胞胞均均数数4.771012/L,标标准准差差0.38 1012/L,试试计计算均数的标准误。算均数的标准误。标标准准误误是是抽抽样样分分布布的的重重要要特特征征之之一一,可可用用于于衡衡量量抽抽样样误误差差的的大大小小,更更重重要要的的是是可可以以用用于于参参数数的的区区间估计和对不同组之间的参数进行比较。间估计和对不同组之间的参数进行比较。第二节第二节 总体均数的估计总体均数的估计 一、可信区间的概念一、可信区间的概念(Confidence IntervalConfidence Interval)区间估计:区间估计:指
5、按预先给定的概率,计算出一个区间,指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。事先给定的概率使它能够包含未知的总体均数。事先给定的概率 称为可信度,通常取称为可信度,通常取 。参数估计参数估计点估计:不考虑抽样误差,如点估计:不考虑抽样误差,如区间估计:考虑抽样误差区间估计:考虑抽样误差二、可信区间的计算二、可信区间的计算(一)(一)已知已知一般情况一般情况其中其中 为标准正态分布的双侧界值。为标准正态分布的双侧界值。可信区间:可信区间:标准正态分布(二)(二)未知未知 通常未知,这时可以用其估计量通常未知,这时可以用其估计量S 代替,但代替,但 已已不不再再服服从从标标准
6、准正正态态分分布布,而而是是服服从著名的从著名的 t 分布。分布。图图4-2 4-2 不同自由度的不同自由度的 t 分布图分布图 可信区间的计算可信区间的计算:计计算算可可信信区区间间的的原原理理与与前前完完全全相相同同,仅仅仅仅是是两两侧概率的界值有些差别。即侧概率的界值有些差别。即可信区间:可信区间:需需要要注注意意:在在小小样样本本情情况况下下,应应用用这这一一公公式式的的条条件件是是原原始始变变量量服服从从正正态态分分布布。在在大大样样本本情情况况下下(如(如n100),100),也可以用也可以用 替换替换 近似计算。近似计算。例例4.2 4.2 某某医医生生测测得得2525名名动动脉
7、脉粥粥样样硬硬化化患患者者血血浆浆纤纤维维蛋蛋白白原原含含量量的的均均数数为为3.32 3.32 g/Lg/L,标标准准差差为为0.57 0.57 g/Lg/L,试试计计算算该该种种病病人人血血浆浆纤纤维维蛋蛋白白原原含含量量总总体体均均数数的的95%95%可信区间。可信区间。下限:下限:上限:上限:例例4.3 4.3 试试计计算算例例4.14.1中中该该地地成成年年男男子子红红细细胞胞总总体体均数的均数的95%95%可信区间。可信区间。本本例例属属于于大大样样本本,可可采采用用正正态态近近似似的的方方法法计计算算可可信信区区间间。因因为为 ,则则95%95%可可信区间为:信区间为:下限:下限
8、:上限:上限:三、模拟实验三、模拟实验 模拟抽样成年男子红细胞数。设定模拟抽样成年男子红细胞数。设定:产生产生100100个随机样本,分别计算其个随机样本,分别计算其95%95%的可信区间,的可信区间,结果用图示的方法表示。从图可以看出:绝大多数结果用图示的方法表示。从图可以看出:绝大多数可信区间包含总体参数可信区间包含总体参数 ,只有,只有6 6个可信区间个可信区间没有包含总体参数(用星号标记)。没有包含总体参数(用星号标记)。图图4-4-2 2 模拟抽样成年男子红细胞数模拟抽样成年男子红细胞数100100次的次的95%95%可信区间示意图可信区间示意图 *第三节第三节 假设检验的意义和步骤
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学课件 教学 课件 04 抽样误差 假设检验
限制150内