第五章+参数估计.ppt
《第五章+参数估计.ppt》由会员分享,可在线阅读,更多相关《第五章+参数估计.ppt(81页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 统计学Statistics教 学 课 件(PowerPoint)刘建华 漳州师范学院经济学系 不像其他科学,统计从来不打算使不像其他科学,统计从来不打算使自己完美无缺,统计意味着你永远自己完美无缺,统计意味着你永远不需要确定无疑。不需要确定无疑。Gudmund R.Iversen第 5 章 参数估计o5.1 参数估计的一般问题参数估计的一般问题 o5.2 一个总体参数的区间估计一个总体参数的区间估计o5.3 两个总体参数的区间估计两个总体参数的区间估计o5.4 样本容量的确定样本容量的确定学习目标1.1、估计量与估计值的概念、估计量与估计值的概念2.2、点估计与区间估计的区别、点估计与区间估
2、计的区别3.3、评价估计量优良性的标准、评价估计量优良性的标准4.4、一个总体参数的区间估计方法、一个总体参数的区间估计方法5.5、两个总体参数的区间估计方法、两个总体参数的区间估计方法6.6、样本容量的确定方法、样本容量的确定方法参数估计在统计方法中的地位5.1 参数估计的一般问题一、估计量与估计值一、估计量与估计值二、点估计与区间估计二、点估计与区间估计三、评价估计量的标准三、评价估计量的标准1.估计量:用于估计总体参数的随机变量n如样本均值,样本比率、样本方差等n例如:样本均值就是总体均值 的一个估计量2.参数用 表示,估计量用 表示3.估计值:估计参数时计算出来的统计量的具体值n如果样
3、本均值 x=80,则80就是的估计值一、估计量与估计值(estimator&estimated value)二、点估计和区间估计(一)点估计(point estimate)1.用样本的估计量直接作为总体参数的估计值n例如:用样本均值直接作为总体均值的估计n例如:用两个样本均值之差直接作为总体均值之差的估计2.没有给出估计值接近总体参数程度的信息3.点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等2、区间估计(interval estimate)在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到的根据样本统计量的抽样分布能够对样本统计量与总体参数
4、的接近程度给出一个概率度量n比如,某班级平均分数在7585之间,置信水平是95%样本统计量样本统计量样本统计量样本统计量 (点估计点估计点估计点估计)置信区间置信区间置信区间置信区间置信下限置信下限置信下限置信下限置信上限置信上限置信上限置信上限区间估计的图示 x95%95%的样本的样本的样本的样本 -1.96-1.96 x x +1.96+1.96 x x99%99%的样本的样本的样本的样本 -2.58-2.58 x x +2.58+2.58 x x90%90%的样本的样本的样本的样本 -1.65-1.65 x x +1.65+1.65 x x将构造置信区间的步骤重复很多次,置信区间包含总体
5、参数真值的次数所占的比率称为置信水平 1.表示为(1-n 为是总体参数未在区间内的比率3.常用的置信水平值有 99%,95%,90%n相应的相应的 为0.01,0.05,0.10置信水平 1.由样本统计量所构造的总体参数的估计区间称为置信区间2.统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 3.用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值n我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个置信区间(confidence interval)置信区间与置
6、信水平 样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布(1-(1-)%)%区间包含了区间包含了区间包含了区间包含了%的区间未包含的区间未包含的区间未包含的区间未包含 1 1 /2 2 /2 2置信区间(95%的置信区间)重复构造出重复构造出重复构造出重复构造出 的的的的2020个个个个置信区间置信区间置信区间置信区间 点估计值点估计值点估计值点估计值影响区间宽度的因素1、总体数据的离散程度,用来测度2、样本容量,3、置信水平(1-),影响 z 的大小三、评价估计量的标准三、评价估计量的标准无偏性(unbiasedness)o无无偏偏性性:估计量抽样分布的数学期望等于被
7、估计的总体参数 P P()B BA A无偏无偏无偏无偏无偏无偏有偏有偏有偏有偏有偏有偏有效性(efficiency)有效性:有效性:对同一总体参数的两个无偏点估计 量,有更小标准差的估计量更有效 AB 的抽样分布的抽样分布的抽样分布的抽样分布的抽样分布的抽样分布 的抽样分布的抽样分布的抽样分布的抽样分布P P()一致性(consistency)o一一致致性性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数AB较小的样本容量较小的样本容量较小的样本容量较小的样本容量较大的样本容量较大的样本容量较大的样本容量较大的样本容量P P()5.2 一个总体参数的区间估计一、总体均值的区间估计一、
8、总体均值的区间估计二、总体比率的区间估计二、总体比率的区间估计三、总体方差的区间估计三、总体方差的区间估计一个总体参数的区间估计总体参数总体参数符号表示符号表示样本统计量样本统计量均均值值比率比率方差方差一、总体均值的区间估计 (大样本)o假定条件n总体服从正态分布n如果不是正态分布,可由正态分布来近似(n 30)2.使用正态分布统计量 zp总体均值总体均值 在在1-1-置信水平下的置信水平下的置信区间为置信区间为总体均值的区间估计(例题分析)【例例例例 】一一家家食食品品生生产产企企业业以以生生产产袋袋装装食食品品为为主主,为为对对产产量量质质量量进进行行监监测测,企企业业质质检检部部门门经
9、经常常要要进进行行抽抽检检,以以分分析析每每袋袋重重量量是是否否符符合合要要求求。现现从从某某天天生生产产的的一一批批食食品品中中随随机机抽抽取取了了2525袋袋,测测得得每每袋袋重重量量如如下下表表所所示示。已已知知产产品品重重量量的的分分布布服服从从正正态态分分布布,且且总总体体标标准准差差为为10g10g。试试估估计计该该批批产产品品平平均均重重量量的的置信区间,置信水平为置信区间,置信水平为95%95%25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116
10、.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3总体均值的区间估计(例题分析)解解解解:已已知知 N N(,10102 2),n n=25,=25,1-1-=95%95%,z z/2/2=1.96=1.96。根根据样本数据计算得:据样本数据计算得:总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为该食品平均重量的置信区间为该食品平均重量的置信区间为101.44g109.28g101.44g109.28g总体均值的区间估计(例题分析)【例例例例】一一家家保保险险公公司司收收集集到到由由3636投投保保个个人人组组成成的的随随机
11、机样样本本,得得到到每每个个投投保保人人的的年年龄龄(周周岁岁)数数据据如如下下表表。试建立投保人年龄试建立投保人年龄90%90%的置信区间的置信区间 36个投保人年龄的数据个投保人年龄的数据 233539273644364246433133425345544724342839364440394938344850343945484532总体均值的区间估计(例题分析)解解解解:已已知知n n=36,=36,1-1-=90%90%,z z/2/2=1.645=1.645。根根据据样样本本数数据据计算得:计算得:总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为投保人平均年龄
12、的置信区间为投保人平均年龄的置信区间为37.3737.37岁岁41.6341.63岁岁二、总体均值的区间估计(小样本)o1.假定条件n总体服从正态分布,且方差()未知n小样本(n 30)p使用 t 分布统计量p总体均值 在1-置信水平下的置信区间为t 分布 t t 分分布布是是类类似似正正态态分分布布的的一一种种对对称称分分布布,它它通通常常要要比比正正态态分分布布平平坦坦和和分分散散。一一个个特特定定的的分分布布依依赖赖于于称称之之为为自自由由度度的的参参数数。随随着着自自由由度度的的增增大大,分分布布也也逐逐渐渐趋于正态分布趋于正态分布 x x xt t 分布与标准正态分布的比较分布与标准
13、正态分布的比较t t 分布分布标准正态分布标准正态分布t t不同自由度的不同自由度的t t分布分布标准正态分布标准正态分布t t(dfdf=13)=13)t t(dfdf=5)=5)z z总体均值的区间估计(例题分析)【例例例例】已已知知某某种种灯灯泡泡的的寿寿命命服服从从正正态态分分布布,现现从从一一批批灯灯泡泡中中随随机机抽抽取取1616只只,测测得得其其使使用用寿寿命命(小小时时)如如下。建立该批灯泡平均使用寿命下。建立该批灯泡平均使用寿命95%95%的置信区间的置信区间16灯泡使用寿命的数据灯泡使用寿命的数据 15101520148015001450148015101520148014
14、90153015101460146014701470总体均值的区间估计(例题分析)解:解:解:解:已知已知 N N(,2 2),n n=16,1-=16,1-=95%=95%,t t/2/2=2.131=2.131 根据样本数据计算得:根据样本数据计算得:,总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为该该种种灯灯泡泡平平均均使使用用寿寿命命的的置置信信区区间间为为1476.81476.8小小时时1503.21503.2小时小时总体分布总体分布样本容量样本容量已知已知未知未知正态分布正态分布大样本大样本小样本小样本非正态分布非正态分布大样本大样本三、总体比率的区间估
15、计o1.假定条件n总体服从二项分布n可以由正态分布来近似p使用正态分布统计量 zppp总体比率总体比率总体比率 在在在1-1-1-置信水平下置信水平下置信水平下的置信区间为的置信区间为的置信区间为总体比率的区间估计(例题分析)【例例例例】某某城城市市想想要要估估计计下下岗岗职职工工中中女女性性所所占占的的比比率率,随随机机地地抽抽取取了了100100名名下下岗岗职职工工,其其中中6565人人为为女女性性职职工工。试试以以95%95%的的置置信信水水平平估估计计该该城城市市下下岗岗职职工工中中女女性性比比率率的置信区间的置信区间解解解解:已已知知 n n=100=100,p p65%65%,1
16、1-=95%95%,z z/2/2=1.96=1.96该该城城市市下下岗岗职职工工中中女女性性比比率率的的置置信信区间为区间为55.65%74.35%55.65%74.35%四、总体方差的区间估计1、估计一个总体的方差或标准差2、假设总体服从正态分布3、总体方差 2 的点估计量为s2,且4、总体方差在1-置信水平下的置信区间为总体方差的区间估计(图示)1-1-1-1-总体方差总体方差总体方差1-1-1-的置信区间的置信区间的置信区间自由度为自由度为自由度为自由度为n n-1-1的的的的 分布分布分布分布总体方差的区间估计(例题分析)【例例例例】一一家家食食品品生生产产企企业业以以生生产产袋袋装
17、装食食品品为为主主,现现从从某某天天生生产产的的一一批批食食品品中中随随机机抽抽取取了了2525袋袋,测测得得每每袋袋重重量量如如下下表表所所示示。已已知知产产品品重重量量的的分分布布服服从从正正态态分分布布。以以95%95%的置信水平建立该种食品重量方差的置信区间的置信水平建立该种食品重量方差的置信区间 25袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.5 98.4 93.3总体方差的区
18、间估计(例题分析)解解解解:已知已知n n2525,1-1-95%,95%,根据样本数据计算得根据样本数据计算得 s s2 2=93.21=93.21 2 2置信度为置信度为95%95%的置信区间为的置信区间为 该企业生产的食品总体重量标准差的的置信区该企业生产的食品总体重量标准差的的置信区间为间为7.54g13.43g7.54g13.43g5.3 两个总体参数的区间估计一、两个总体均值之差的区间估计一、两个总体均值之差的区间估计二、两个总体比率之差的区间估计二、两个总体比率之差的区间估计三、两个总体方差比的区间估计三、两个总体方差比的区间估计一、两个总体参数的区间估计总体参数总体参数符号表示
19、符号表示样本统计量样本统计量均值之差比率之差方差比(一)两个总体均值之差的估计(独立大样本)1、假定条件n两个总体都服从正态分布,1、2已知n若不是正态分布,可以用正态分布来近似(n130和n230)n两个样本是独立的随机样本2、使用正态分布统计量 z两个总体均值之差的估计(大样本)3、1,2已知时,两个总体均值之差1-2在1-置信水平下的置信区间为4 4、1 1、2 2未知时,未知时,两个总体均值之差两个总体均值之差 1 1-2 2在在1-1-置信水平下的置信区间为置信水平下的置信区间为两个总体均值之差的估计(例题分析)【例例】某地区教育委员会想估计两所中学的学生高考时的英语平均分数之差,为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 参数估计
限制150内