(05)第5章 参数估计(精品).ppt
《(05)第5章 参数估计(精品).ppt》由会员分享,可在线阅读,更多相关《(05)第5章 参数估计(精品).ppt(97页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、作者作者 贾俊平贾俊平统计学统计学统统 计计 学学(第三版第三版)200820082008年8月5-2统计学统计学STATISTICS(第三版第三版)不象其他科学,统计从来不打算使自己完美无缺,统计意味着你永远不需要确定无疑。Gudmund R.Iversen统计名言统计名言2008年8月第第 5 章章 参数估计参数估计5.1 参数估计的基本原理参数估计的基本原理 5.2 一个总体参数的区间估计一个总体参数的区间估计5.3 两个总体参数的区间估计两个总体参数的区间估计5.4 样本量的确定样本量的确定2008年8月5-4统计学统计学STATISTICS(第三版第三版)学习目标学习目标l参数估计的
2、基本原理参数估计的基本原理l点估计与区间估计点估计与区间估计l评价估计量优良性的标准评价估计量优良性的标准l一个总体参数的区间估计方法一个总体参数的区间估计方法l两个总体参数的区间估计方法两个总体参数的区间估计方法l样本量的确定方法样本量的确定方法2008年8月5-5统计学统计学STATISTICS(第三版第三版)参数估计在统计方法中的地位参数估计在统计方法中的地位2008年8月5-6统计学统计学STATISTICS(第三版第三版)大学生每周上网花多少时间?大学生每周上网花多少时间?为为了了解解学学生生每每周周上上网网花花费费的的时时间间,中中国国人人民民大大学学公公共共管管理理学学院院的的4
3、 4名名本本科科生生对对全全校校部部分分本本科科生生做做了了问问卷卷调调查查。调调查查的的对对象象为为中中国国人人民民大大学学在在校校本本科科生生,调调查查内内容容包包括括上上网网时时间间、途途径径、支支出出、目目的的、关关心心的的校校园园网网内内容容,以以及及学学生生对对收收费费的的态态度度,包包括括收收费费方式、价格等方式、价格等问问卷卷调调查查由由调调查查员员直直接接到到宿宿舍舍发发放放并并当当场场回回收收。对对四四个个年年级级中中每每年年级级各各发发6060份份问问卷卷,其其中中男男、女女生生各各3030份份。共共收收回回有有效效问问卷卷共共200200份份。其其中中有有关关上上网网时
4、时间方面的数据经整理如下表所示间方面的数据经整理如下表所示 2008年8月5-7统计学统计学STATISTICS(第三版第三版)大学生每周上网花多少时间?大学生每周上网花多少时间?回答类别回答类别回答类别回答类别人数(人)人数(人)人数(人)人数(人)频率(频率(频率(频率(%)3小时以下小时以下321636小时小时3517.569小时小时3316.5912小时小时2914.512小时以上小时以上7135.5合计合计合计合计200200100100平均上网时间为平均上网时间为8.588.58小时,标准差为小时,标准差为0.690.69小时。全校学生每周小时。全校学生每周的平均上网时间是多少?每
5、周上网时间在的平均上网时间是多少?每周上网时间在1212小时以上的学生比小时以上的学生比例是多少?你做出估计的理论依据是什么?例是多少?你做出估计的理论依据是什么?2008年8月5.1 参数估计的基本原理参数估计的基本原理 5.1.1 点估计与区间估计点估计与区间估计 5.1.2 评价估计量的标准评价估计量的标准第第 5 章章 参数估计参数估计2008年8月5.1.1 点估计与区间估计点估计与区间估计5.1 参数估计的一般问题参数估计的一般问题2008年8月5-10统计学统计学STATISTICS(第三版第三版)1.参参数数估估计计(parameter(parameter estimation
6、)estimation)就就是是用用样样本本统统计计量去估计总体的参数量去估计总体的参数2.估计量:用于估计总体参数的统计量的名称估计量:用于估计总体参数的统计量的名称n n如样本均值,样本比例,样本方差等如样本均值,样本比例,样本方差等n n例如例如:样本均值就是总体均值样本均值就是总体均值 的一个估计量的一个估计量3.参数用参数用 表示,估计量表示,估计量用用 表示表示4.估计值:估计参数时计算出来的统计量的具体值估计值:估计参数时计算出来的统计量的具体值n n如果样本均值如果样本均值 x x=80=80,则,则8080就是就是 的估计值的估计值估计量与估计值估计量与估计值(estimat
7、or&estimated value)2008年8月5-11统计学统计学STATISTICS(第三版第三版)点估计点估计(point estimate)1.用样本的估计量的某个取值直接作为总体参数的估计值 例例如如:用用样样本本均均值值直直接接作作为为总总体体均均值值的的估估计计;用用两个样本均值之差直接作为总体均值之差的估计两个样本均值之差直接作为总体均值之差的估计2.无法给出估计值接近总体参数程度的信息n n由由于于样样本本是是随随机机的的,抽抽出出一一个个具具体体的的样样本本得得到到的的估计值很可能不同于总体真值估计值很可能不同于总体真值n n一一个个点点估估计计量量的的可可靠靠性性是是
8、由由它它的的抽抽样样标标准准误误差差来来衡衡量量的的,这这表表明明一一个个具具体体的的点点估估计计值值无无法法给给出出估估计的可靠性的度量计的可靠性的度量 2008年8月5-12统计学统计学STATISTICS(第三版第三版)区间估计区间估计(interval estimate)1.1.在在点点估估计计的的基基础础上上,给给出出总总体体参参数数估估计计的的一一个个估估计计区区间,该区间由样本统计量加减估计误差而得到间,该区间由样本统计量加减估计误差而得到2.2.根根据据样样本本统统计计量量的的抽抽样样分分布布能能够够对对样样本本统统计计量量与与总总体体参数的接近程度给出一个概率度量参数的接近程
9、度给出一个概率度量n n比如,某班级平均分数在比如,某班级平均分数在75758585之间,置信水平是之间,置信水平是95%95%样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量 (点估计点估计点估计点估计点估计点估计)置信区间置信区间置信区间置信区间置信下限置信下限置信下限置信下限置信上限置信上限置信上限置信上限2008年8月5-13统计学统计学STATISTICS(第三版第三版)区间估计的图示区间估计的图示 x95%95%的样本的样本的样本的样本 -1.96-1.96 x x +1.96+1.96 x x99%99%的样本的样本的样本的样本 -2.58-2.58 x x +2.5
10、8+2.58 x x90%90%的样本的样本的样本的样本 -1.65-1.65 x x +1.65+1.65 x x2008年8月5-14统计学统计学STATISTICS(第三版第三版)1.将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例,也称置信度 2.表示为(1-n n 为是总体参数为是总体参数未在未在区间内的比例区间内的比例 3.常用的置信水平值有 99%,95%,90%n n相应的相应的 为为0.010.01,0.050.05,0.100.10置信水平置信水平(confidence level)2008年8月5-15统计学统计学STATISTICS(第三版第三版
11、)1.由样本估计量构造出的总体参数在一定置信水平由样本估计量构造出的总体参数在一定置信水平下的估计区间下的估计区间2.统计学家在某种程度上确信这个区间会包含真正统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间的总体参数,所以给它取名为置信区间3.如果用某种方法构造的所有区间中有如果用某种方法构造的所有区间中有95%95%的区间的区间包含总体参数的真值,包含总体参数的真值,5%5%的区间不包含总体参数的区间不包含总体参数的真值,那么,用该方法构造的区间称为置信水的真值,那么,用该方法构造的区间称为置信水平为平为95%95%的置信区间。同样,其他置信水平的区的置信区间。
12、同样,其他置信水平的区间也可以用类似的方式进行表述间也可以用类似的方式进行表述置信区间的表述置信区间的表述(confidence interval)2008年8月5-16统计学统计学STATISTICS(第三版第三版)1.总总体体参参数数的的真真值值是是固固定定的的,而而用用样样本本构构造造的的区区间间则则是是不不固固定定的的,因因此此置置信信区区间间是是一一个个随随机机区区间间,它它会会因因样样本本的的不不同同而而变变化化,而而且且不不是是所所有有的区间都包含总体参数的区间都包含总体参数2.实实际际估估计计时时往往往往只只抽抽取取一一个个样样本本,此此时时所所构构造造的的是是与与该该样样本本
13、相相联联系系的的一一定定置置信信水水平平(比比如如95%)95%)下下的的置置信信区区间间。我我们们只只能能希希望望这这个个区区间间是是大大量量包包含含总总体体参参数数真真值值的的区区间间中中的的一一个个,但但它它也也可可能是少数几个不包含参数真值的区间中的一个能是少数几个不包含参数真值的区间中的一个置信区间的表述置信区间的表述(confidence interval)2008年8月5-17统计学统计学STATISTICS(第三版第三版)1.1.当当抽抽取取了了一一个个具具体体的的样样本本,用用该该样样本本所所构构造造的的区区间间是是一一个个特特定定的的常常数数区区间间,我我们们无无法法知知道
14、道这这个个样样本本所所产产生生的的区区间间是是否否包包含含总总体体参参数数的的真真值值,因因为为它它可可能能是是包包含含总总体体均均值值的的区区间间中中的的一一个个,也也可可能能是是未未包包含含总总体体均均值值的那一个的那一个2.2.一一个个特特定定的的区区间间总总是是“包包含含”或或“绝绝对对不不包包含含”参参数数的的真真值值,不不存存在在“以以多多大大的的概概率率包包含含总总体体参参数数”的的问问题题3.3.置置信信水水平平只只是是告告诉诉我我们们在在多多次次估估计计得得到到的的区区间间中中大大概概有有多多少少个个区区间间包包含含了了参参数数的的真真值值,而而不不是是针针对对所所抽抽取取的
15、这个样本所构建的区间而言的的这个样本所构建的区间而言的 置信区间的表述置信区间的表述(confidence interval)2008年8月5-18统计学统计学STATISTICS(第三版第三版)置信区间的表述置信区间的表述(95%的置信区的置信区间间)从均值为从均值为从均值为从均值为185185的总体中抽出的总体中抽出的总体中抽出的总体中抽出n=10n=10的的的的2020个样本构造出个样本构造出个样本构造出个样本构造出 的的的的2020个个个个置信区间置信区间置信区间置信区间 我没有抓住参数!我没有抓住参数!点估计值点估计值点估计值点估计值 2008年8月5-19统计学统计学STATIST
16、ICS(第三版第三版)1.1.使使用用一一个个较较大大的的置置信信水水平平会会得得到到一一个个比比较较宽宽的的置置信信区区间间,而而使使用用一一个个较较大大的的样样本本则则会会得得到到一一个个较较准准确确(较较窄窄)的的区区间间。直直观观地地说说,较较宽宽的的区区间间会会有有更更大大的的可可能能性包含参数性包含参数2.2.但实际应用中,过宽的区间往往没有实际意义但实际应用中,过宽的区间往往没有实际意义l l比比如如,天天气气预预报报说说“在在一一年年内内会会下下一一场场雨雨”,虽虽然然这这很很有有把把握握,但但有有什什么么意意义义呢呢?另另一一方方面面,要要求求过过于于准准确确(过过窄窄)的的
17、区区间间同同样样不不一一定定有有意意义义,因因为为过过窄窄的的区区间间虽虽然然看看上上去去很很准准确确,但但把把握握性性就就会会降降低低,除除非非无无限限制制增增加加样样本本量量,而而现现实中样本量总是有限的实中样本量总是有限的3.3.区间估计总是要给结论留点儿余地区间估计总是要给结论留点儿余地 置信区间的表述置信区间的表述(confidence interval)2008年8月5.1.2 评价估计量的标准评价估计量的标准5.1 参数估计的一般问题参数估计的一般问题2008年8月5-21统计学统计学STATISTICS(第三版第三版)无偏性无偏性(unbiasedness)无偏性:无偏性:估计
18、量抽样分布的数学期望等于被 估计的总体参数P P P()B BA A无偏无偏无偏无偏无偏无偏有偏有偏有偏有偏有偏有偏2008年8月5-22统计学统计学STATISTICS(第三版第三版)有效性有效性(efficiency)有效性:有效性:对同一总体参数的两个无偏点估计 量,有更小标准差的估计量更有效 AB 的抽样分布的抽样分布的抽样分布的抽样分布 的抽样分布的抽样分布的抽样分布的抽样分布P P()2008年8月5-23统计学统计学STATISTICS(第三版第三版)一致性一致性(consistency)一致性:一致性:随着样本量的增大,估计量的 值越来越接近被估计的总体参数AB较小的样本量较小
19、的样本量较小的样本量较小的样本量较大的样本量较大的样本量较大的样本量较大的样本量P P()2008年8月5.2 一个总体参数的区间估计一个总体参数的区间估计 5.2.1 总体均值的区间估计总体均值的区间估计 5.2.2 总体比例的区间估计总体比例的区间估计 5.2.3 总体方差的区间估计总体方差的区间估计第第 5 章章 参数估计参数估计2008年8月5.2.1 总体均值的区间估计总体均值的区间估计5.2 一个总体参数估计的区间估计一个总体参数估计的区间估计2008年8月5-26统计学统计学STATISTICS(第三版第三版)一个总体参数的区间估计一个总体参数的区间估计总体参数总体参数符号表示符
20、号表示样本统计量样本统计量均均值值比例比例方差方差2008年8月5-27统计学统计学STATISTICS(第三版第三版)总体均值区间的一般表达式总体均值区间的一般表达式1.总体均值的置信区间是由样本均值加减估计误差总体均值的置信区间是由样本均值加减估计误差得到的得到的2.估计误差由两部分组成:一是点估计量的标准误估计误差由两部分组成:一是点估计量的标准误差,它取决于样本统计量的抽样分布。二是估计差,它取决于样本统计量的抽样分布。二是估计时所要的求置信水平为时,统计量分布两侧面积时所要的求置信水平为时,统计量分布两侧面积为的分位数值,它取决于事先所要求的可靠程度为的分位数值,它取决于事先所要求的
21、可靠程度3.总体均值在置信水平下的置信区间可一般性地表总体均值在置信水平下的置信区间可一般性地表达为达为 样本均值样本均值分位数值分位数值样本均值的标准误差样本均值的标准误差2008年8月5-28统计学统计学STATISTICS(第三版第三版)总体均值的区间估计总体均值的区间估计(大样本的估计大样本的估计)1.1.假定条件假定条件n n总体服从正态分布总体服从正态分布,且方差且方差()已已知知n n如果不是正态分布,可由正态分布来近似如果不是正态分布,可由正态分布来近似 (n n 30)30)2.使用正态分布统计量使用正态分布统计量 z z3.总体均值总体均值 在在1-1-置信水平下的置信水平
22、下的置信区间为置信区间为2008年8月5-29统计学统计学STATISTICS(第三版第三版)总体均值的区间估计总体均值的区间估计(大样本的估计大样本的估计)【例例例例】一一家家保保险险公公司司收收集集到到由由3636个个投投保保人人组组成成的的随随机机样样本本,得得到到每每个个投投保保人人的的年年龄龄(单单位位:周周岁岁)数数据据如下表。试建立投保人年龄如下表。试建立投保人年龄90%90%的置信区间的置信区间 3636个投保人年龄的数据个投保人年龄的数据个投保人年龄的数据个投保人年龄的数据 233539273644364246433133425345544724342839364440394
23、9383448503439454845322008年8月5-30统计学统计学STATISTICS(第三版第三版)总体均值的区间估计总体均值的区间估计(大样本的估计大样本的估计)解解解解:已已知知n n=36,=36,1-1-=90%90%,z z/2/2=1.645=1.645。根根据据样样本本数数据计算得:据计算得:,总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为投保人平均年龄的置信区间为投保人平均年龄的置信区间为37.3737.37岁岁41.6341.63岁岁2008年8月5-31统计学统计学STATISTICS(第三版第三版)总体均值的区间估计总体均值的区间估
24、计(小样本的估计小样本的估计)1.假定条件n n总体服从正态分布总体服从正态分布,但方差但方差()未知未知n n小样本小样本 (n n 30)30)2.使用 t 分布统计量3.总体均值 在1-置信水平下的置信区间为2008年8月5-32统计学统计学STATISTICS(第三版第三版)总体均值的区间估计总体均值的区间估计(小样本的估计小样本的估计)【例例例例 】一一家家食食品品生生产产企企业业以以生生产产袋袋装装食食品品为为主主,为为对对产产量量质质量量进进行行监监测测,企企业业质质检检部部门门经经常常要要进进行行抽抽检检,以以分分析析每每袋袋重重量量是是否否符符合合要要求求。现现从从某某天天生
25、生产产的的一一批批食食品品中中随随机机抽抽取取了了2525袋袋,测测得得每每袋袋重重量量如如下下表表所所示示。已已知知产产品品重重量量的的分分布布服服从从正正态态分分布布,且且总总体体标标准准差差为为1010克克。试试估估计计该该批批产产品品平平均均重重量量的的置信区间,置信水平为置信区间,置信水平为95%95%2525袋食品的重量袋食品的重量袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.5 95.0108.8115.6100.0123.5102.0101.6102.2116.6 95.4 97.8108.6105.0136.8102.8101.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 05第5章 参数估计精品 05 参数估计 精品
限制150内