第四章抽样误差与假设检验.ppt





《第四章抽样误差与假设检验.ppt》由会员分享,可在线阅读,更多相关《第四章抽样误差与假设检验.ppt(38页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、流行病与卫生统计学教研室流行病与卫生统计学教研室金英良金英良本章主要内容本章主要内容:第一节第一节 均数的抽样误差与标准误差均数的抽样误差与标准误差第二节第二节 总体均数的估计总体均数的估计第三节第三节 假设检验的意义和步骤假设检验的意义和步骤第一节第一节 均数的抽样误差与标准误差均数的抽样误差与标准误差 假假定定某某年年某某地地所所有有13岁岁女女学学生生身身高高服服从从总总体体均均数数=155.4cm,总总体体标标准准差差=5.3cm的的正正态态分分布布N(155.4,5.32)。随随机机抽抽取取30人人为为一一个个样样本本(n=30),并并计计算算样样本本的的均均数数和和标标准准差差,共
2、共抽抽取取100次次,可可以以得得到到100份份样样本本,每每份份样样本本可可以以计计算算相应的均数和标准差。相应的均数和标准差。1.156.7 5.162.158.1 5.213.155.6 5.324.5.99.154.6 5.156.100.156.6 5.25 =155.4cm=5.3cm X S一一百百个个样样本本抽样误差抽样误差(smplingsmpling error)error)这种由抽样造成的这种由抽样造成的样本统计量样本统计量与与总体参数总体参数之间的差之间的差异成为抽样误差异成为抽样误差.总体总体样本样本 随机抽样随机抽样 统计量统计量统计量统计量 参参参参 数数数数 只
3、要有个体变异和随机抽样研究,只要有个体变异和随机抽样研究,抽样误差就是抽样误差就是不可避免不可避免的。的。若从正态总体若从正态总体N(,2)中,反复多次随机抽取样本中,反复多次随机抽取样本含量固定为含量固定为n的样本,那么这些样本均数的样本,那么这些样本均数 也服从正态也服从正态分布。样本均数分布。样本均数 的总体均数仍为的总体均数仍为,样本均数的标准样本均数的标准差为差为 ,其计算公式为:其计算公式为:中心极限定理中心极限定理SAMPLE 1:x11 x12 x13 x14.x1nSAMPLE 2:x21 x22 x23 x24.x2nSAMPLE k:xk1 xk2 xk3 xk4.xkn
4、原始总体k个样本均数的频数分布图标准误标准误(standard(standard error,SEerror,SE)样本均数的标准差。样本均数的标准差。它反映了来自同一总体的样本均数之间的离散程度以它反映了来自同一总体的样本均数之间的离散程度以及样本均数和总体均数的差异程度及样本均数和总体均数的差异程度,即均数的抽样误差即均数的抽样误差的大小。的大小。统计上用标准误来衡量抽样误差的大小!统计上用标准误来衡量抽样误差的大小!由于在实际工作中,总体标准差由于在实际工作中,总体标准差往往未知,而是用样往往未知,而是用样本标准差本标准差S来代替来代替,故只能求得样本均数标准误的估计故只能求得样本均数标
5、准误的估计值值S X,其计算公式为:其计算公式为:估计估计例例 4.1 某市随机抽查成年男子某市随机抽查成年男子140人,得人,得红细胞均数红细胞均数4.771012/L,标准差,标准差0.381012/L,计算其标准误。,计算其标准误。第二节第二节 总体均数的估计总体均数的估计1.统计推断(统计推断(statistical inference)在总体中随机抽取一在总体中随机抽取一定数量观察单位作为样本进行抽样研究,然后由样本信定数量观察单位作为样本进行抽样研究,然后由样本信息推断总体特征,这一过程称为统计推断。息推断总体特征,这一过程称为统计推断。一、可信区间的概念一、可信区间的概念统计推断
6、统计推断参数估计参数估计假设检验假设检验点估计点估计区间估计(可信区间)区间估计(可信区间)2.参数估计(参数估计(parameter estimation)是指由样本统计量是指由样本统计量估计总体参数,是统计推断的一个重要内容。估计总体参数,是统计推断的一个重要内容。(1)点估计()点估计(point estimation)用样本统计量直接作为总体参数的估计值。用样本统计量直接作为总体参数的估计值。(2)区间估计()区间估计(interval estimation)又称可信区间又称可信区间(置信区间,(置信区间,CI)按预先给定的概率,计算出一个区间,使它能够包含未按预先给定的概率,计算出一
7、个区间,使它能够包含未知的总体均数。知的总体均数。=155.4cm身高(身高(cm)总体均数的总体均数的95%可信区间,平可信区间,平均有均有95个可信区间包括了总体个可信区间包括了总体均数均数,只有只有5个可信区间不包个可信区间不包括括,即估计错误。即估计错误。进行进行100次抽样,每次样本量为次抽样,每次样本量为n=30,利用样本均数利用样本均数和标准差估计总体均数范围。和标准差估计总体均数范围。3.可信区间有两个要素:可信区间有两个要素:(1)准确度(准确度(accuracy)可信度的大小,即可信区间可信度的大小,即可信区间包容包容的概率大小(的概率大小(1-)。)。(2)精密度(精密度
8、(precision)反映在区间的长度,区间长反映在区间的长度,区间长度越小精密度越高。度越小精密度越高。一般情况下,一般情况下,95%的可信区间更为常用。的可信区间更为常用。在可信度确定的情况下,增加样本量,可减少区间长在可信度确定的情况下,增加样本量,可减少区间长度,提高精密度。度,提高精密度。t分布分布是是t检验的基础,亦称检验的基础,亦称 student t检验,是计量资检验,是计量资料中最常用的假设检验方法。料中最常用的假设检验方法。戈塞特戈塞特(William Sealey Gosset)英英国国著著名名统统计计学学家家。出出生生于于英英国国肯肯特特郡郡坎坎特特伯伯雷雷市市,求求学
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四章 抽样误差与假设检验 第四 抽样误差 假设检验

限制150内