4参数估计-黑白.pdf





《4参数估计-黑白.pdf》由会员分享,可在线阅读,更多相关《4参数估计-黑白.pdf(64页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、4.参数估计 抽样分布与标准误 Z分布与t 分布 总体参数的估计 4.1抽样分布与抽样误差 抽样研究的目的是用样本信息推断总体特征,即用样本资料计算的统计指标推断总体参数 常用的统计推断方法有:参数估计(总体均数和总体概率的估计)假设检验 总体总体总体总体样本样本随机抽样随机抽样统计量参 数统计推断统计推断如:样本均数如:样本均数样本标准差样本标准差S样本率样本率 P如:总体均数如:总体均数总体标准差总体标准差总体率总体率x统计推断:抽样研究中用样本统计量来推论总体参数的过程。参数估计参数估计:用样本统计量来估计总体参数用样本统计量来估计总体参数(总体均数和总体概率)的大小。(总体均数和总体概
2、率)的大小。假设检验:又称显著性检验,方法:均数假设检验:又称显著性检验,方法:均数z 检验检验 、t 检验、方差分析,检验、方差分析,2检验、秩和检检验、秩和检验等验等.相关概念:定量变量资料:对每个观察单位用定量的方法测定某项指标数量的大小所收集的资料。定性变量资料:将观察单位按照不同性质或类别进行分类,所收集得到的资料。总体:根据研究目的确定的同质研究对象的全体或研究对象某项变量值的集合。样本:总体中随机抽取的一部分研究对象的某项变量值的集合。参数:描述总体特征的统计指标叫总体参数。统计量:从样本计算出来的描述样本特征的统计指标。4.1.14.1.1样本均数 样本均数的抽样分布与抽样误差
3、样本均数的抽样分布与抽样误差 标准误标准误 第四军医大学卫生统计学教研室1.样本均数的抽样分布样本均数的抽样分布抽样试验抽样试验从正态分布总体从正态分布总体N N(5.00,0.505.00,0.502 2)中,每)中,每次随机抽取样本含量次随机抽取样本含量n n5 5,并计算其均数与,并计算其均数与标准差;重复抽取标准差;重复抽取10001000次,获得次,获得10001000份样本份样本;计算;计算10001000份样本的均数与标准差,并对份样本的均数与标准差,并对10001000份样本的均数作直方图。份样本的均数作直方图。按上述方法再做样本含量按上述方法再做样本含量n n1010、样本、
4、样本含量含量n n3030的抽样实验;比较计算结果。的抽样实验;比较计算结果。第四军医大学卫生统计学教研室第四军医大学卫生统计学教研室第四军医大学卫生统计学教研室抽样试验(抽样试验(n n=5=5)第四军医大学卫生统计学教研室第四军医大学卫生统计学教研室第四军医大学卫生统计学教研室抽样试验(抽样试验(n n=10=10)抽样试验(抽样试验(n n=30=30)第四军医大学卫生统计学教研室第四军医大学卫生统计学教研室第四军医大学卫生统计学教研室10001000份样本抽样计算结果份样本抽样计算结果n n=30=30n n=10=10n n=5=5样本样本含量含量n n5.005.005.005.0
5、04.994.99均数的均数的均数均数0.09200.09200.15800.15800.22120.2212均数标准差均数标准差0.09130.09130.500.505.005.000.15810.15810.500.505.005.000.22360.22360.500.505.005.00总体标总体标准差准差 总体的总体的均数均数nnS现将现将1000个样本均数看成新的随机变量绘制频数分布图个样本均数看成新的随机变量绘制频数分布图,如下如下第四军医大学卫生统计学教研室第四军医大学卫生统计学教研室第四军医大学卫生统计学教研室3个抽样实验结果图示0501001502002503003504
6、004503.713.924.124.334.544.744.955.155.365.575.775.986.19均数频数0501001502002503003504004503.713.924.124.334.544.744.955.155.365.575.775.986.19均数频数0501001502002503003504004503.713.924.124.334.544.744.955.155.365.575.775.986.19均数频数2212.0;5 XSn0920.0;30 XSn1580.0;10 XSn样本均数的抽样分布具有以下特点:1.各样本均数未必等于总体均数;2.样
7、本均数之间存在差异;3.样本均数的分布很有规律,围绕着总体均数,中间多、两边少,左右基本对称,也服从正态分布;4样本均数的变异较之原变量的变异大大缩小。抽样实验小结抽样实验小结样本均数围绕总体均数上下波动。样本均数围绕总体均数上下波动。随着样本含量的增大,样本均数的变异程随着样本含量的增大,样本均数的变异程度(样本均数的标准差即标准误)也逐渐减度(样本均数的标准差即标准误)也逐渐减小小。从正态总体从正态总体N N(,2 2)中抽取很多个样本含中抽取很多个样本含量量n n相同的样本,获得样本均数的分布仍近相同的样本,获得样本均数的分布仍近似呈正态分布似呈正态分布N(,2/n)。非正态总体样本均数
8、的抽样实验非正态总体样本均数的抽样实验 图(a)是一个正偏峰的分布,用电脑从中随机抽取样本含量分别为5,10,30和50的样本各1000次,计算样本均数并绘制4个直方图。图(b)(e)显示,当样本量n较小时,样本均数的分布当然并非正态分布,样本量足够大时(例如,n 50),样本均数的分布近似于正态分布。PERCENT030 x MIDPOINT0.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.83.94.04.14
9、.24.34.44.54.64.74.84.95.0图图(a)x n=5PERCENT030mm MIDPOINT0.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.83.94.04.14.24.34.44.54.64.74.84.95.0图图b(n=5)xn=10PERCENT030mm MIDPOINT0.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.61.71.
10、81.92.02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.83.94.04.14.24.34.44.54.64.74.84.95.0图图c(n=10)xn=30PERCENT030mm MIDPOINT0.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.83.94.04.14.24.34.44.54.64.74.84.95.0图图d(n=30)xn=50P
11、ERCENT030mm MIDPOINT0.00.10.20.30.40.50.60.70.80.91.01.11.21.31.41.51.61.71.81.92.02.12.22.32.42.52.62.72.82.93.03.13.23.33.43.53.63.73.83.94.04.14.24.34.44.54.64.74.84.95.0图图e(n=50)x中心极限定理central limit theorem从正态总体N(,2)中抽取很多个样本含量n相同的样本,所得样本均数的分布仍近似呈正态分布。从非正态总体中抽取样本,当样本含量n比较大时,所得样本均数的分布也近似呈正态分布。2、均数
12、的抽样误差(Sampling error of mean)1.概念:从总体中随机抽样时,样本均数与总体均数或样本均数与样本均数之间的差异,称作均数的抽样误差。2.产生抽样误差的原因:是因为总体中的个体之间存在变异。抽样误差是不可避免的,但其大小可以估计。均数抽样误差大小以均数的标准误表示。3、均数的标准误(standard error of mean)样本均数的标准差叫均数的标准误 1)符号:以 表示。实际应用中,常属未知,无法计算 ,故常以 作为 的估计值。2)计算:x x xsxnsnsxx 例例 2000年某研究者随机调查某地健康成年男子年某研究者随机调查某地健康成年男子27人,得到血红
13、蛋白量的均数为人,得到血红蛋白量的均数为125 g/L,标准,标准差为差为15 g/L。试估计该样本均数的抽样误差。试估计该样本均数的抽样误差。)/(89.22715LgnsSx 3)意义:它是描述均数抽样误差大小的指标,反映样本含量相同的样本均数的离散趋势或变异程度。越大,说明样本均数 的波动范围越大或抽样误差越大,由样本均数推论总体均数时的可靠性越差。xx 4)均数标准误的应用 (1)说 明 均 数 抽 样 误 差 的 大 小,记为 。(2)结合均数推断总体均数的置信区间。(3)用均数标准误进行均数的假设检验。SExxsx 或或4.1.2 样本频率 实验:在一口袋内装有形状、重量完全相同的
14、黑球和白球,已知黑球比例为20%(总体概率=20%),从口袋中每摸一次看清颜色后放回去,搅匀后再摸,重复摸球35次(n=35),计算摸到黑球的百分比(样本频率pi)。重复这样的实验100次,每次得到100个黑球的比例分别为14.4%,19.8%,20.2%,22.5%,等,将其频数分布列于下表。表表5-3 总体概率为总体概率为20%时的随机抽样结果(时的随机抽样结果(ni=35)黑球比例%样本频数%5.0 3 3.0 8.0 7 7.0 11.0 5 5.0 14.0 8 8.0 17.0 16 16.0 20.0 22 22.0 22.0 15 15.0 25.0 7 7.0 28.0 7
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 参数估计 黑白

限制150内