均数的抽样误差和总体均数估计临本.ppt
《均数的抽样误差和总体均数估计临本.ppt》由会员分享,可在线阅读,更多相关《均数的抽样误差和总体均数估计临本.ppt(62页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于均数的抽样误差关于均数的抽样误差和总体均数估计临本和总体均数估计临本现在学习的是第1页,共62页n 参数估计 包括:点估计与区间估计2. 假设检验统计推断的两部分内容:统计推断:用样本信息推论总体的特征。现在学习的是第2页,共62页样本随机抽取部分观察单位 ? 推断inferenceX参数估计现在学习的是第3页,共62页一、均数的抽样误差与标准误现在学习的是第4页,共62页2009年某市18岁男生身高N(167.7, 5.32)的抽样示意图 现在学习的是第5页,共62页 将此100个样本均数看成新变量值,则这100个样本均数构成一新分布,绘制频数图从正态分布总体N(167.7, 5.32)
2、随机抽样所得样本均数分布现在学习的是第6页,共62页 ,各样本均数 未必等于总体均数; 各样本均数间存在差异; 样本均数的分布为中间多,两边少,左右基本对称。 样本均数的变异范围较之原变量的变异范围大大缩小。可算得这100个样本均数的均数为167.69cm、标准差为1.69cm。XX 样本均数分布具有如下特点:现在学习的是第7页,共62页8n从正态分布总体从正态分布总体 中以固定中以固定 n 抽样时,样本均数抽样时,样本均数 的分的分布仍服从正态分布布仍服从正态分布 。n n当样本含量当样本含量 n 足够大时,即使从偏态分布总体中以固定足够大时,即使从偏态分布总体中以固定 n 抽样,抽样,其样
3、本均数的分布也近似服从正态分布。其样本均数的分布也近似服从正态分布。 ),(2NX),(2XNnNX2,n理论上可以证明,现在学习的是第8页,共62页抽样误差:抽样误差: 由个体变异产生的、抽样造成的样本统计由个体变异产生的、抽样造成的样本统计量与总体参数的差别量与总体参数的差别 原因:原因:1 1)抽样)抽样 2 2)个体差异)个体差异现在学习的是第9页,共62页n由于由于变异变异的存在,的存在,抽样研究抽样研究所造成的样本所造成的样本均数与总体均数的差异,以及各样本均数均数与总体均数的差异,以及各样本均数间的差异称为间的差异称为均数的抽样误差均数的抽样误差。n抽样误差在抽样研究中是不可避免
4、的,但抽样误差在抽样研究中是不可避免的,但只要严格遵循随机只要严格遵循随机化抽样的原则,就能估计抽样误差的大小化抽样的原则,就能估计抽样误差的大小。1.均数的抽样误差的概念现在学习的是第10页,共62页表示样本统计量抽样误差大小的统计指标。标准误:说明抽样误差的大小,总体计算公式Xn2、标准误(standard error, SE)实质:样本均数的标准差现在学习的是第11页,共62页若用样本标准差s 来估计 , (7-28)XSSnn当样本例数n一定时,标准误与标准差呈正比n当标准差一定时,标准误与样本含量n的平方根呈反比。通过增加样本含量n来降低抽样误差。现在学习的是第12页,共62页抽样调
5、查150名3岁女孩的身高均数为92.79cm,标准差为4.61cm,则其标准误是多少?例子:0.38snxscm现在学习的是第13页,共62页1、反映样本均数的可靠性;2、估计总体均数的置信区间;3、用于均数的假设检验。现在学习的是第14页,共62页指标意义应用标准差(s)衡量变量值变异程度,s越大表示变量值变异程度越大,s越小表示变量值变异程度越小描述正态分布(近似正态分布)资料的频数分布;医学参考值范围的估计标准误( )样本均数的变异程度,表示抽样误差的大小。标准误越大表示抽样误差越大,样本均数的可靠性越小;标准误越小表示抽样误差越小,样本均数的可靠性越大总体均数区间估计;两个或多个总体均
6、数间比较的假设检验XS标准差和标准误的区别现在学习的是第15页,共62页现在学习的是第16页,共62页二、t 分布(一)t分布概念 现在学习的是第17页,共62页随机变量XN(,2)标准正态分布N(0,12)z变换Xz现在学习的是第18页,共62页现在学习的是第19页,共62页, 1XXXtnSSn 式中 为自由度(degree of freedom, df) 3实际工作中,由于 未知,用 代替,则 不再服从标准正态分布,而服从t 分布。 XXS() /XXS现在学习的是第20页,共62页均数标准正态分布N(0,12)),(2nN1,nvSXnSXtXStudent t分布自由度:n-1XnX
7、z/现在学习的是第21页,共62页0t 分布一簇曲线),(2 NX),(2XN X0N(0,1)XXu XsXt Xun足够大时,分布分布分布分布ut(1)(2)(3)以固定 n 随机抽样英国统计学家Gosset现在学习的是第22页,共62页(二)t 分布的图形与特征 分布只有一个参数,即自由度t现在学习的是第23页,共62页 t-5.0-4.0-3.0-2.0-1.00.01.02.03.04.05.0(标准正态曲线)=5=1f(t)图 不同自由度下的t 分布图现在学习的是第24页,共62页t 分布与标准正态分布现在学习的是第25页,共62页现在学习的是第26页,共62页1特征: 现在学习的
8、是第27页,共62页 3t 界界值值表表:详详见见附附表表2,可可反反映映t 分分布布曲曲下下的的面面积积。 单单侧侧概概率率或或单单尾尾概概率率:用用,t表表示示; 双双侧侧概概率率或或双双尾尾概概率率:用用2、 t界值表:详见P312,可反映t分布曲线下的面积。单侧概率或单尾概率:用 表示;双侧概率或双尾概率:用 表示。 表表示示; 双双侧侧概概率率或或双双尾尾概概率率:用用/2,t表表示示。 现在学习的是第28页,共62页-tt0现在学习的是第29页,共62页 由t界值表可知: 相同自由度时,t越大,概率P越 小。 相同t值时,双侧概率是单侧概率的两倍。 =时,t 分布即为Z分布,故t界
9、值表中最后一行是Z界值。现在学习的是第30页,共62页t分布的分位数分布的分位数(双侧双侧t界值界值)/2/21-t/2,-t/2,现在学习的是第31页,共62页,ttP,ttP1-t,t分布的分位数分布的分位数(单侧单侧t界值界值)现在学习的是第32页,共62页举例: 现在学习的是第33页,共62页三、总体均数的置信区间估计用样本统计量推断总体参数。总体均数估计:用样本均数推断总体均数。现在学习的是第34页,共62页n 点估计(point estimation):n用相应样本统计量直接作为其总体参数的估计值。如用 估计、s估计 等。其方法虽简单,但未考虑抽样误差的大小。X现在学习的是第35页
10、,共62页 按预先给定的概率(1)所确定的包含未知总体参数的一个范围。 总体均数的区间估计:按预先给定的概率(1)所确定的包含未知总体均数的一个范围。n 如给定=0.05,该范围称为参数的95%可信区间或置信区间;n 如给定=0.01,该范围称为参数的99%可信区间或置信区间。2区间估计(interval estimation):现在学习的是第36页,共62页计算总体均数可信区间计算总体均数可信区间n需考虑:需考虑: (1)总体标准差)总体标准差 是否已知,是否已知, (2)样本含量)样本含量n的大小的大小n通常有两类方法:通常有两类方法: (1)t分布法分布法 (2)z分布法分布法现在学习的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样误差 总体 估计
限制150内