抽样误差和假设检验.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《抽样误差和假设检验.ppt》由会员分享,可在线阅读,更多相关《抽样误差和假设检验.ppt(24页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于抽样误差与假设检验第一张,PPT共二十四页,创作于2022年6月 第一节第一节 均数的抽样误差与标准误均数的抽样误差与标准误 一、均数的抽样误差一、均数的抽样误差 在医学研究中,在医学研究中,绝绝大多数情况是由大多数情况是由样样本信息研究本信息研究总总体。体。由于个体存在差异,因此通由于个体存在差异,因此通过样过样本推本推论总论总体体时时会存在一定会存在一定的的误误差,如差,如样样本均数本均数 往往不等于往往不等于总总体均数体均数 ,这这种由抽种由抽样样造成的造成的样样本均数与本均数与总总体均数的差异称体均数的差异称为为抽抽样误样误差差。对于。对于抽样研究,抽样误差不可避免。抽样研究,抽样
2、误差不可避免。第二张,PPT共二十四页,创作于2022年6月 二、抽样误差的分布二、抽样误差的分布 理理论论上可以上可以证证明:若从正明:若从正态总态总体体 中,反复多次随中,反复多次随机抽取机抽取样样本含量固定本含量固定为为n 的的样样本,那么本,那么这这些些样样本均数本均数 也服从正也服从正态态分布,即分布,即 的的总总体均数仍体均数仍为为 ,样样本均数的本均数的标标准差准差为为 。抽样分布抽样分布 抽样分布示意图抽样分布示意图第三张,PPT共二十四页,创作于2022年6月 中心极限定理中心极限定理:当当样样本含量很大的情况下,无本含量很大的情况下,无论论原始原始测测量量变变量服从什么分量
3、服从什么分布,布,的抽的抽样样分布分布均均近似正近似正态态。抽样分布抽样分布 抽样分布示意图抽样分布示意图第四张,PPT共二十四页,创作于2022年6月 三、标准误(三、标准误(Standard ErrorStandard Error)样本均数的标准差称为标准误。样本均数的标准差称为标准误。样样本均数的本均数的变变异越异越小小说说明估明估计计越精确,越精确,因此可以用标准误表示抽样误因此可以用标准误表示抽样误差的大小:差的大小:实际中总体标准差实际中总体标准差 往往未知,故只能求得样本往往未知,故只能求得样本均数标准误的估计值均数标准误的估计值 :第五张,PPT共二十四页,创作于2022年6月
4、 例例4.1 在在某某地地随随机机抽抽查查成成年年男男子子140人人,计计算算得得红红细细胞胞均均数数4.771012/L,标标准准差差0.38 1012/L,试试计计算算均均数数的标准误。的标准误。标标准准误误是是抽抽样样分分布布的的重重要要特特征征之之一一,可可用用于于衡衡量量抽抽样样误误差差的的大大小小,更更重重要要的的是是可可以以用用于于参参数数的的区区间间估估计计和和对对不不同组之间的参数进行比较。同组之间的参数进行比较。第六张,PPT共二十四页,创作于2022年6月 第二节第二节 总体均数的估计总体均数的估计 一、可信区间的概念一、可信区间的概念(Confidence Interv
5、alConfidence Interval)区间估计:区间估计:指按预先给定的概率,计算出一个区间,指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。事先给定的概率使它能够包含未知的总体均数。事先给定的概率 称为可信度,通常取称为可信度,通常取 。参数估计参数估计点估计:不考虑抽样误差,如点估计:不考虑抽样误差,如区间估计:考虑抽样误差区间估计:考虑抽样误差第七张,PPT共二十四页,创作于2022年6月二、可信区间的计算二、可信区间的计算(一)(一)已知已知一般情况一般情况其中其中 为标准正态分布的双侧界值。为标准正态分布的双侧界值。可信区间:可信区间:第八张,PPT共二十四页,
6、创作于2022年6月标准正态分布(二)(二)未知未知 通常未知,这时可以用其估计量通常未知,这时可以用其估计量S 代替,但代替,但 已已不不再再服服从从标标准准正正态态分分布布,而而是是服服从从著著名名的的 t 分布。分布。图图4-2 4-2 不同自由度的不同自由度的 t 分布图分布图 第九张,PPT共二十四页,创作于2022年6月 可信区间的计算可信区间的计算:计计算算可可信信区区间间的的原原理理与与前前完完全全相相同同,仅仅仅仅是是两两侧侧概概率率的界值有些差别。即的界值有些差别。即可信区间:可信区间:需需要要注注意意:在在小小样样本本情情况况下下,应应用用这这一一公公式式的的条条件件是是
7、原原始始变变量量服服从从正正态态分分布布。在在大大样样本本情情况况下下(如如n100),100),也可以用也可以用 替换替换 近似计算。近似计算。第十张,PPT共二十四页,创作于2022年6月 例例4.2 4.2 某某医医生生测测得得2525名名动动脉脉粥粥样样硬硬化化患患者者血血浆浆纤纤维维蛋蛋白白原原含含量量的的均均数数为为3.32 3.32 g/Lg/L,标标准准差差为为0.57 0.57 g/Lg/L,试试计计算算该该种种病人血浆纤维蛋白原含量总体均数的病人血浆纤维蛋白原含量总体均数的95%95%可信区间。可信区间。下限:下限:上限:上限:第十一张,PPT共二十四页,创作于2022年6
8、月 例例4.3 4.3 试试计计算算例例4.14.1中中该该地地成成年年男男子子红红细细胞胞总总体体均均数数的的95%95%可信区间。可信区间。本本例例属属于于大大样样本本,可可采采用用正正态态近近似似的的方方法法计计算算可可信信区区间间。因为因为 ,则,则95%95%可信区间为:可信区间为:下限:下限:上限:上限:第十二张,PPT共二十四页,创作于2022年6月 三、模拟实验三、模拟实验 模拟抽样成年男子红细胞数。设定模拟抽样成年男子红细胞数。设定:产生产生100100个随机样本,分别计算其个随机样本,分别计算其95%95%的可信区间,结果用的可信区间,结果用图示的方法表示。从图可以看出:绝
9、大多数可信区间包含图示的方法表示。从图可以看出:绝大多数可信区间包含总体参数总体参数 ,只有,只有6 6个可信区间没有包含总体参数个可信区间没有包含总体参数(用星号标记)。(用星号标记)。第十三张,PPT共二十四页,创作于2022年6月 图图4-4-2 2 模拟抽样成年男子红细胞数模拟抽样成年男子红细胞数100100次的次的95%95%可信区间示意图可信区间示意图 *第十四张,PPT共二十四页,创作于2022年6月 第三节第三节 假设检验的意义和步骤假设检验的意义和步骤 (H Hypothesis ypothesis T Test)est)统计统计推断的另一个重要内容,目的是推断的另一个重要内
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样误差 假设检验
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内