第四章 抽样误差与假设检验.pptx





《第四章 抽样误差与假设检验.pptx》由会员分享,可在线阅读,更多相关《第四章 抽样误差与假设检验.pptx(38页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、流行病与卫生统计学教研室流行病与卫生统计学教研室金英良金英良本章主要内容本章主要内容: :第一节第一节 均数的抽样误差与标准误差均数的抽样误差与标准误差第二节第二节 总体均数的估计总体均数的估计第三节第三节 假设检验的意义和步骤假设检验的意义和步骤第一节第一节 均数的抽样误差与标准误差均数的抽样误差与标准误差 假定某年某地所有假定某年某地所有13岁女学生身高服从总体岁女学生身高服从总体均数均数=155.4cm,总体标准差总体标准差=5.3cm的正态分的正态分布布N(155.4,5.32)。)。随机抽取随机抽取30人为一个样本人为一个样本(n=30),),并计算样本的均数和标准差,共抽取并计算样
2、本的均数和标准差,共抽取100次,可以得到次,可以得到100份样本,每份样本可以计算份样本,每份样本可以计算相应的均数和标准差。相应的均数和标准差。1. 156.7 5.162. 158.1 5.213. 155.6 5.324. 5. 99. 154.6 5.156. 100. 156.6 5.25 =155.4cm=5.3cm X S一百个样本一百个样本抽样误差抽样误差( (smplingsmpling error) error) 这种由抽样造成的这种由抽样造成的样本统计量样本统计量与与总体参数总体参数之间的之间的差异成为抽样误差差异成为抽样误差. .样本样本 随机抽样随机抽样 只要有个体
3、变异和随机抽样研究,只要有个体变异和随机抽样研究,抽样误差就是抽样误差就是不可避免不可避免的。的。若从正态总体若从正态总体N(, 2)中,反复多次随机抽取样本中,反复多次随机抽取样本含量固定为含量固定为n的样本,那么这些样本均数的样本,那么这些样本均数 也服从正态也服从正态分布。样本均数分布。样本均数 的总体均数仍为的总体均数仍为,样本均数的标准样本均数的标准差为差为 ,其计算公式为:其计算公式为:XXX中心极限定理中心极限定理21kiiXXXknSAMPLE 1:x11 x12 x13 x14.x1nSAMPLE 2:x21 x22 x23 x24.x2nSAMPLE k:xk1 xk2 x
4、k3 xk4.xkn2X1XkX原始总体k个样本均数的频数分布图标准误标准误(standard (standard error,SEerror,SE) ) 样本均数的标准差。样本均数的标准差。它反映了来自同一总体的样本均数之间的离散程度以它反映了来自同一总体的样本均数之间的离散程度以及样本均数和总体均数的差异程度及样本均数和总体均数的差异程度, ,即均数的抽样误差即均数的抽样误差的大小。的大小。统计上用标准误来衡量抽样误差的大小!统计上用标准误来衡量抽样误差的大小!由于在实际工作中,总体标准差由于在实际工作中,总体标准差往往未知,而是用样往往未知,而是用样本标准差本标准差S来代替来代替,故只能
5、求得样本均数标准误的估故只能求得样本均数标准误的估计值计值S X ,其计算公式为:其计算公式为:XSSnXn估计估计例例 4.1 某市随机抽查成年男子某市随机抽查成年男子140人,人,得红细胞均数得红细胞均数4.771012/L,标准差,标准差0.381012/L,计算其标准误。,计算其标准误。)/10(032. 014038. 0S12LnSx第二节第二节 总体均数的估计总体均数的估计1.统计推断(统计推断(statistical inference)在总体中随机抽取在总体中随机抽取一定数量观察单位作为样本进行抽样研究,然后由样本一定数量观察单位作为样本进行抽样研究,然后由样本信息推断总体特
6、征,这一过程称为统计推断。信息推断总体特征,这一过程称为统计推断。一、可信区间的概念一、可信区间的概念统计推断统计推断参数估计参数估计假设检验假设检验点估计点估计区间估计(可信区间)区间估计(可信区间)2.参数估计(参数估计(parameter estimation)是指由样本统计量是指由样本统计量估计总体参数,是统计推断的一个重要内容。估计总体参数,是统计推断的一个重要内容。(1)点估计()点估计(point estimation)用样本统计量直接作为总体参数的估计值。用样本统计量直接作为总体参数的估计值。(2)区间估计()区间估计(interval estimation)又称可信区间又称可
7、信区间(置信区间,(置信区间,CI)按预先给定的概率,计算出一个区间,使它能够包含未按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。知的总体均数。=155.4cm身高(身高(cm)总体均数的总体均数的95%可信区间,平可信区间,平均有均有95个可信区间包括了总体个可信区间包括了总体均数均数,只有只有5个可信区间不包个可信区间不包括括,即估计错误。即估计错误。进行进行100次抽样,每次样本量为次抽样,每次样本量为n=30,利用样本均数利用样本均数和标准差估计总体均数范围。和标准差估计总体均数范围。3.可信区间有两个要素:可信区间有两个要素:(1)准确度(准确度(accuracy)可
8、信度的大小,即可信区可信度的大小,即可信区间包容间包容的概率大小(的概率大小(1-)。)。(2)精密度(精密度(precision)反映在区间的长度,区间反映在区间的长度,区间长度越小精密度越高。长度越小精密度越高。一般情况下,一般情况下,95%的可信区间更为常用。的可信区间更为常用。在可信度确定的情况下,增加样本量,可减少区间长在可信度确定的情况下,增加样本量,可减少区间长度,提高精密度。度,提高精密度。t分布分布是是t检验的基础,亦称检验的基础,亦称 student t检验,是计量资检验,是计量资料中最常用的假设检验方法。料中最常用的假设检验方法。戈塞特戈塞特(William Sealey
9、 Gosset) 英国著名统计学家。出生英国著名统计学家。出生于英国肯特郡坎特伯雷市,求于英国肯特郡坎特伯雷市,求学于曼彻斯特学院和牛津大学,学于曼彻斯特学院和牛津大学,主要学习化学和数学。主要学习化学和数学。二、总体均数可信区间的计算二、总体均数可信区间的计算 1899年作为一名酿酒师进入爱尔兰的都柏林一家年作为一名酿酒师进入爱尔兰的都柏林一家啤酒厂工作,在那里他涉及到有关酿造过程的数据处啤酒厂工作,在那里他涉及到有关酿造过程的数据处理问题。理问题。 由于酿酒厂的规定禁止戈塞特发表关于酿酒过程由于酿酒厂的规定禁止戈塞特发表关于酿酒过程变化性的研究成果,因此戈塞特不得不于变化性的研究成果,因此
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四章抽样误差与假设检验

限制150内