第3节均数的抽样误差和总体均数估计2013临本.ppt
《第3节均数的抽样误差和总体均数估计2013临本.ppt》由会员分享,可在线阅读,更多相关《第3节均数的抽样误差和总体均数估计2013临本.ppt(59页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第3节均数的抽样误节均数的抽样误差和总体均数估计差和总体均数估计2013临本临本现在学习的是第1页,共59页1.参数估计参数估计 包括:点估计与区间估计包括:点估计与区间估计2.假设检验假设检验统计推断的两部分内容:统计推断的两部分内容:统计推断:用样本信息推论总体的特征。统计推断:用样本信息推论总体的特征。现在学习的是第2页,共59页总体总体样本样本随机抽取部分观察单位随机抽取部分观察单位?推断推断inferenceinference参数估计参数估计现在学习的是第3页,共59页一、均数的抽样误差与标准误一、均数的抽样误差与标准误现在学习的是第4页,共59页2009年某市年某市18岁男生身高
2、岁男生身高N(167.7,5.32)的抽样示意图的抽样示意图 现在学习的是第5页,共59页将将此此100个个样样本本均均数数看看成成新新变变量量值值,则则这这100个个样样本本均数构成均数构成一新分布一新分布,绘制频数图,绘制频数图从正态分布总体从正态分布总体N(167.7,5.32)随机抽样所得样本均数分布随机抽样所得样本均数分布现在学习的是第6页,共59页 ,各样本均数各样本均数 未必等于总体均数;未必等于总体均数;各样本均数间存在差异;各样本均数间存在差异;样本均数的分布为中间多,两边少,左右基本对称。样本均数的分布为中间多,两边少,左右基本对称。样样本本均均数数的的变变异异范范围围较较
3、之之原原变变量量的的变变异异范范围围大大大大缩小。缩小。可可算算得得这这100个个样样本本均均数数的的均均数数为为167.69cm、标标准准差差为为1.69cm。样本均数分布具有如下样本均数分布具有如下特点:特点:现在学习的是第7页,共59页从正态分布总体从正态分布总体 中以固定中以固定 n 抽样时,样本均数抽样时,样本均数 的的分布仍服从正态分布分布仍服从正态分布 。当样本含量当样本含量 n 足够大时,即使从偏态分布总体中以固定足够大时,即使从偏态分布总体中以固定 n 抽样,抽样,其样本均数的分布也近似服从正态分布。其样本均数的分布也近似服从正态分布。理论上可以证明,理论上可以证明,现在学习
4、的是第8页,共59页抽样误差:抽样误差:由个体变异产生的、抽样造成的样本统计由个体变异产生的、抽样造成的样本统计量与总体参数的差别量与总体参数的差别 原因:原因:1 1)抽样)抽样 2 2)个体差异)个体差异现在学习的是第9页,共59页由于由于变异变异的存在,的存在,抽样研究抽样研究所造成的样本所造成的样本均数与总体均数的差异,以及各样本均数均数与总体均数的差异,以及各样本均数间的差异称为间的差异称为均数的抽样误差均数的抽样误差。抽样误差在抽样研究中是不可避免的,但抽样误差在抽样研究中是不可避免的,但只要严格遵循随机化抽样只要严格遵循随机化抽样的原则,就能估计抽样误差的大小的原则,就能估计抽样
5、误差的大小。1.均数的抽样误差的概念均数的抽样误差的概念现在学习的是第10页,共59页表示表示样本统计量样本统计量抽样误差大小的统计指标。抽样误差大小的统计指标。标标准准误误:说说明明抽抽样样误误差差的的大大小小,总总体体计计算公式算公式2、标准误、标准误(standard error,SE)实质:样本均数的标准差实质:样本均数的标准差现在学习的是第11页,共59页若用样本标准差若用样本标准差s 来估计来估计 ,(7-28)n当样本例数当样本例数n一定时,标准误与标准差呈正比一定时,标准误与标准差呈正比n当标准差一定时,标准误与样本含量当标准差一定时,标准误与样本含量n的平方根的平方根呈反比。
6、呈反比。通过增加样本含量通过增加样本含量n来降低抽样误差。来降低抽样误差。现在学习的是第12页,共59页抽抽样样调调查查150名名3岁岁女女孩孩的的身身高高均均数数为为92.79cm,标标准准差差为为4.61cm,则则其其标标准准误误是是多多少少?例子例子:现在学习的是第13页,共59页1 1、反映样本均数的可靠性;、反映样本均数的可靠性;2 2、估计总体均数的置信区间;、估计总体均数的置信区间;3 3、用于均数的假设检验。、用于均数的假设检验。标准误的应用:标准误的应用:现在学习的是第14页,共59页指标意义应用标准差(s)衡量变量值变异程度,s越大表示变量值变异程度越大,s越小表示变量值变
7、异程度越小描述正态分布(近似正态分布)资料的频数分布;医学参考值范围的估计标准误()样本均数的变异程度,表示抽样误差的大小。标准误越大表示抽样误差越大,样本均数的可靠性越小;标准误越小表示抽样误差越小,样本均数的可靠性越大总体均数区间估计;两个或多个总体均数间比较的假设检验标准差和标准误的区别标准差和标准误的区别现在学习的是第15页,共59页现在学习的是第16页,共59页二、二、t 分布分布(一)(一)t分布概念分布概念 现在学习的是第17页,共59页随机变量随机变量X XN N(,2 2)标准正态分布标准正态分布N N(0 0,1 12 2)z变换现在学习的是第18页,共59页现在学习的是第
8、19页,共59页 式中式中 为自由度为自由度(degree of freedom,df)3实际工作中,由于实际工作中,由于 未知,用未知,用 代替,则代替,则 不再服从标准正态分布,而服从不再服从标准正态分布,而服从t t 分布。分布。现在学习的是第20页,共59页均数均数标准正态分布标准正态分布N N(0 0,1 12 2)Student Student t t分布分布自由度:自由度:n n-1-1现在学习的是第21页,共59页0t 分布分布一簇曲线一簇曲线一簇曲线一簇曲线0N(0,1)n n足够大时,足够大时,足够大时,足够大时,(1)(1)(2)(2)(3)(3)以固定以固定 n 随机抽
9、样随机抽样英国统计学家英国统计学家GossetGosset现在学习的是第22页,共59页(二)(二)t 分布的图形与特征分布的图形与特征 分布只有一个参数,即自由度现在学习的是第23页,共59页图图 不同自由度下的不同自由度下的t 分布图分布图现在学习的是第24页,共59页t 分布与标准正态分布分布与标准正态分布现在学习的是第25页,共59页现在学习的是第26页,共59页1特征:特征:现在学习的是第27页,共59页2、t界值表:界值表:详见详见P312,可反映,可反映t分布曲线下的面积。分布曲线下的面积。单侧概率或单尾概率:用单侧概率或单尾概率:用 表示;表示;双侧概率或双尾概率:用双侧概率或
10、双尾概率:用 表示。表示。现在学习的是第28页,共59页-tt0现在学习的是第29页,共59页 由由t t界值表可知:界值表可知:相同自由度时,相同自由度时,t t越大,概率越大,概率P P越越 小。小。相同相同t t值时,双侧概率是单侧概率的两倍。值时,双侧概率是单侧概率的两倍。=时,时,t t 分布即为分布即为Z Z分布,故分布,故t t界值表中最界值表中最后一行是后一行是Z Z界值。界值。现在学习的是第30页,共59页t分布的分位数分布的分位数(双侧双侧t界值界值)/2/21-t/2,-t/2,现在学习的是第31页,共59页 1-t,t分布的分位数分布的分位数(单侧单侧t界值界值)现在学
11、习的是第32页,共59页举例:举例:现在学习的是第33页,共59页三、总体均数的置信区间估计三、总体均数的置信区间估计用样本统计量推断总体参数。用样本统计量推断总体参数。总体均数估计:总体均数估计:用样本均数推断总体均数。用样本均数推断总体均数。现在学习的是第34页,共59页1.点估计点估计(point estimation):n用相应样本统计量直接作为其总体参数的用相应样本统计量直接作为其总体参数的估计值。如用估计值。如用 估计估计、s估计估计 等。其方法虽简等。其方法虽简单,但未考虑抽样误差的大小。单,但未考虑抽样误差的大小。现在学习的是第35页,共59页 按按预预先先给给定定的的概概率率
12、(1 )所所确确定定的的包包含含未未知知总总体体参数的一个范围。参数的一个范围。总总体体均均数数的的区区间间估估计计:按按预预先先给给定定的的概概率率(1 )所所确定的包含未知总体均数的一个范围。确定的包含未知总体均数的一个范围。n 如如给给定定=0.05,该该范范围围称称为为参参数数的的95%可可信信区区间间或或置置信区间;信区间;n 如如给给定定=0.01,该该范范围围称称为为参参数数的的99%可可信信区区间间或或置信区间。置信区间。2区间估计区间估计(interval estimation):现在学习的是第36页,共59页计算总体均数可信区间计算总体均数可信区间n需考虑:需考虑:(1)总
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 节均数 抽样误差 总体 估计 2013
限制150内