抽样误差与假设检验精.ppt
《抽样误差与假设检验精.ppt》由会员分享,可在线阅读,更多相关《抽样误差与假设检验精.ppt(38页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、抽样误差与假设检验第1页,本讲稿共38页本章主要内容本章主要内容:第一节第一节 均数的抽样误差与标准误差均数的抽样误差与标准误差第二节第二节 总体均数的估计总体均数的估计第三节第三节 假设检验的意义和步骤假设检验的意义和步骤第2页,本讲稿共38页第一节第一节 均数的抽样误差与标准误差均数的抽样误差与标准误差 假假定定某某年年某某地地所所有有13岁岁女女学学生生身身高高服服从从总总体体均均数数=155.4cm,总总体体标标准准差差=5.3cm的的正正态态分分布布N(155.4,5.32)。随随机机抽抽取取30人人为为一一个个样样本本(n=30),并并计计算算样样本本的的均均数数和和标标准准差差,
2、共共抽抽取取100次次,可可以以得得到到100份份样样本,每份样本可以计算相应的均数和标准差。本,每份样本可以计算相应的均数和标准差。第3页,本讲稿共38页1.156.7 5.162.158.1 5.213.155.6 5.32 99.154.6 5.15100.156.6 5.25 =155.4cm=5.3cm X S一一百百个个样样本本第4页,本讲稿共38页抽样误差抽样误差(smpling error)(smpling error)这种由抽样造成的这种由抽样造成的样本统计量样本统计量与与总体参数总体参数之间的差异之间的差异成为抽样误差成为抽样误差.总体总体样本样本 随机抽样随机抽样 统计量
3、统计量统计量统计量 参参 数数 只要有个体变异和随机抽样研究,抽样只要有个体变异和随机抽样研究,抽样误差就是误差就是不可避免不可避免的。的。第5页,本讲稿共38页若从正态总体若从正态总体N(,2)中,反复多次随机抽取样本含量固)中,反复多次随机抽取样本含量固定为定为n的样本,那么这些样本均数的样本,那么这些样本均数 也服从正态分布。样本也服从正态分布。样本均数均数 的总体均数仍为的总体均数仍为,样本均数的标准差为,样本均数的标准差为 ,其计算其计算公式为:公式为:中心极限定理中心极限定理第6页,本讲稿共38页SAMPLE 1:x11 x12 x13 x14.x1nSAMPLE 2:x21 x2
4、2 x23 x24.x2nSAMPLE k:xk1 xk2 xk3 xk4.xkn原始总体k个样本均数的频数分布图第7页,本讲稿共38页标准误标准误(standard error,SE)(standard error,SE)样本均数的标准差。样本均数的标准差。它反映了来自同一总体的样本均数之间的离散程度以及它反映了来自同一总体的样本均数之间的离散程度以及样本均数和总体均数的差异程度样本均数和总体均数的差异程度,即均数的抽样误差的大小。即均数的抽样误差的大小。统计上用标准误来衡量抽样误差的大小!统计上用标准误来衡量抽样误差的大小!第8页,本讲稿共38页由于在实际工作中,总体标准差由于在实际工作中
5、,总体标准差往往未知,而是用样本标准差往往未知,而是用样本标准差S来代替来代替,故只能求得样本均数标准误的估计值,故只能求得样本均数标准误的估计值S X,其计,其计算公式为:算公式为:估计估计第9页,本讲稿共38页例例 4.1 某市随机抽查成年男子某市随机抽查成年男子140人,得红人,得红细胞均数细胞均数4.771012/L,标准差,标准差0.381012/L,计算其标准误。,计算其标准误。第10页,本讲稿共38页第二节第二节 总体均数的估计总体均数的估计1.统计推断(统计推断(statistical inference)在总体中随机抽取一定在总体中随机抽取一定数量观察单位作为样本进行抽样研究
6、,然后由样本信息推断数量观察单位作为样本进行抽样研究,然后由样本信息推断总体特征,这一过程称为统计推断。总体特征,这一过程称为统计推断。一、可信区间的概念一、可信区间的概念统计推断统计推断参数估计参数估计假设检验假设检验点估计点估计区间估计(可信区间)区间估计(可信区间)第11页,本讲稿共38页2.参数估计(参数估计(parameter estimation)是指由样本统计量估计是指由样本统计量估计总体参数,是统计推断的一个重要内容。总体参数,是统计推断的一个重要内容。(1)点估计()点估计(point estimation)用样本统计量直接作为总体参数的估计值。用样本统计量直接作为总体参数的
7、估计值。(2)区间估计()区间估计(interval estimation)又称可信区间(置信区又称可信区间(置信区间,间,CI)按预先给定的概率,计算出一个区间,使它能够包含未知的按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。总体均数。第12页,本讲稿共38页=155.4cm身高(身高(cm)总体均数的总体均数的95%可信区间,平均有可信区间,平均有95个可信区间包括了总体均数个可信区间包括了总体均数,只有,只有5个可信区间不包括个可信区间不包括,即估计错,即估计错误。误。进行进行100次抽样,每次样本量为次抽样,每次样本量为n=30,利用样本均数和标准,利用样本均数和标准差
8、估计总体均数范围。差估计总体均数范围。第13页,本讲稿共38页3.可信区间有两个要素:可信区间有两个要素:(1)准确度(准确度(accuracy)可信度的大小,即可信区间包容可信度的大小,即可信区间包容的概率大小(的概率大小(1-)。)。(2)精密度(精密度(precision)反映在区间的长度,区间长度反映在区间的长度,区间长度越小精密度越高。越小精密度越高。一般情况下,一般情况下,95%的可信区间更为常用。的可信区间更为常用。在可信度确定的情况下,增加样本量,可减少区间长度,提在可信度确定的情况下,增加样本量,可减少区间长度,提高精密度。高精密度。第14页,本讲稿共38页t分布分布是是t检
9、验的基础,亦称检验的基础,亦称 student t检验,是计量资料中检验,是计量资料中最常用的假设检验方法。最常用的假设检验方法。戈塞特戈塞特(William Sealey Gosset)英英国国著著名名统统计计学学家家。出出生生于于英英国国肯肯特特郡郡坎坎特特伯伯雷雷市市,求求学学于于曼曼彻彻斯斯特特学学院院和和牛牛津津大大学学,主主要要学习化学和数学。学习化学和数学。二、总体均数可信区间的计算二、总体均数可信区间的计算第15页,本讲稿共38页 1899年年作作为为一一名名酿酿酒酒师师进进入入爱爱尔尔兰兰的的都都柏柏林林一一家家啤啤酒酒厂厂工工作,在那里他涉及到有关酿造过程的数据处理问题。作
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样误差 假设检验
限制150内