医学统计学李琳琳参数估计.pptx
《医学统计学李琳琳参数估计.pptx》由会员分享,可在线阅读,更多相关《医学统计学李琳琳参数估计.pptx(57页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 统计推断是统计学学习的主要任务之一,期间,经常会采用抽样调查的方法。抽样调查的目的不在于了解部分单位的情况,只是作为一种手段,从而认识总体的数量特征。引引 言言第1页/共57页总体总体总体总体样本样本样本样本样本统计量样本统计量样本统计量样本统计量参数估计参数估计参数估计参数估计误差第2页/共57页教教 学学 内内 容容抽样研究与抽样误差总体均数的参数估计率的抽样误差和区间估计第3页/共57页第4页/共57页 通过电脑模拟实验从正态总体 N(74.5,5.62)中抽取一个样本含量为10的样本,比较样本均数与总体均数以及样本标准差与总体标准差的异同;重复抽样100100次,结果又如何?样本均数
2、的分布有什么特征?【电脑模拟实例电脑模拟实例】t distribution第5页/共57页 从上边电脑模拟实验我们可以发现,我们抽样得到的100个样本均数各不相同,与总体均数74.5也不相同;此外,得到的100个标准差各不相同,与总体标准差5.6也不相同。原因何在?我们从总体中抽取一个样本含量为10的样本(即抽样研究),会产生误差(抽样误差)。案例解析案例解析 第6页/共57页误差(error):指测量值和真值之间的差别。抽样误差(sampling error):在抽样研究中,因抽样造成的样本统计量与样本统计量、样本统计量与总体参数的差别统称为抽样误差。原因:个体变异特征:A 不可避免性 B
3、可控性第7页/共57页 借助于电脑模拟实验,研究样本均数的抽样分布。以样本均数作为一个新的变量,借助于频数分布图来看看样本均数的分布特征。【抽样分布抽样分布】第8页/共57页图5-1 100个样本均数的频数分布图第9页/共57页以样本均数作为随机变量,有以下特点:(1)各样本均数未必等于总体均数。(2)样本均数之间存在差异。(3)样本均数的分布很有规律,围绕着总体均数,中间多、两边少,左右基本对称。(4)样本均数的变异范围较之原变量的变异范围大大缩小。第10页/共57页数理统计研究表明,抽样误差具有一定的规律性,可以用特定的指标来描述。样本均数的标准差(简称标准误标准误,standard er
4、ror,SE)是描述均数的抽样误差大小的指标。标准误的概念第11页/共57页标准误的理论值标准误的理论值的估计值标准误的计算s抽样误差抽样误差n抽样误差抽样误差 前提:无限总体完全随机抽样第12页/共57页【例5-1】随机抽取了60名成年男性,得到其脉搏均数为72次/分,标准差为5.8次/分,试计算其抽样误差。=0.75(次/分)第13页/共57页中心极限定理中心极限定理 .从正态分布资料中,随机抽取例数n的样本,其样本均数也服从正态分布;当n足够大时(n50),从偏态总体中抽样,其均数也近似于正态分布。2.从正态分布资料中,随机抽取例数n的样本,其样本均数的总体均数也为,其标准差为。第14页
5、/共57页 =50=50=50 =10=10=10总体分布总体分布总体分布总体分布总体分布总体分布n n=4=4抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布Xn n=16=16第15页/共57页当样本含量足够当样本含量足够大时大时(n n 550)0),样本均值的抽样样本均值的抽样分布逐渐趋于正分布逐渐趋于正态分布态分布偏态分偏态分布总体布总体X X第16页/共57页标准误的用途1.衡量样本均数的可靠性 由于均数标准误越小,均数的抽样误差越小,样本均数就越可靠。2.估计总体均数的置信区间。3.用于均数的假设检验。第17页/共57页标准误和标准差的区别与联系第18页/共57页 t t分布的概
6、念分布的概念 对于正态变量X N(,2)N(0,1)第19页/共57页抽出无数个样本含量为n的样本随机抽样均数标准差为 如果我们从一个总体中抽取无数个样本含量n足够大的样本,样本均数的分布服从正态分布:均数标准差为第20页/共57页 若未知,人们只能用S代替,从而以 代替 ,显然 ,它不再服从标准正态分布。W.S.Gosett于1908年用笔名student研究了它的分布规律,称之为t分布。第21页/共57页 n-1Z分布t分布第22页/共57页图2 不同自由度的t分布曲线 第23页/共57页1.t分布是一簇曲线。t分布有一个参数。2.t分布曲线以0为中心,左右对称;越小,曲线越扁平。3.t分
7、布曲线较标准正态曲线要扁平些,逐渐增大,t分布曲线逐渐的逼近于标准正态曲线,若,则t分布曲线和标准正态曲线完全吻合。4.t分布曲线下的面积分布有一定规律(P380)。t t分布图形的特点第24页/共57页生物医学研究的统计方法 第4章第25页/共57页图5-3 自由度等于20时的t分布曲线2.086-2.086第26页/共57页单侧概率的单侧概率的t t 临界值临界值,记作,记作t t(,)双侧概率的双侧概率的t t 临界值临界值,记作,记作t t(/2,)第27页/共57页第28页/共57页统计方法描述统计描述统计推断统计推断统计参数估计参数估计假设检验假设检验区间估计区间估计点值估计点值估
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计学 李琳琳 参数估计
限制150内