第五章统计推断参数估计.ppt
《第五章统计推断参数估计.ppt》由会员分享,可在线阅读,更多相关《第五章统计推断参数估计.ppt(88页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章第五章 参数估计参数估计n n第一第一节 参数估参数估计的基本原理的基本原理n n第二第二节 一个一个总体参数的区体参数的区间估估计n n第三第三节 两个两个总体参数的区体参数的区间估估计n n第四第四节 样本容量的确定本容量的确定学习目标学习目标1.1.估计量与估计值的概念估计量与估计值的概念2.2.点估计与区间估计的区别点估计与区间估计的区别3.3.评价估计量优良性的标准评价估计量优良性的标准4.4.一个总体参数的区间估计方法一个总体参数的区间估计方法5.5.两个总体参数的区间估计方法两个总体参数的区间估计方法6.6.样本容量的确定方法样本容量的确定方法参数估计在统计方法中的地位参数
2、估计在统计方法中的地位统计推断的过程统计推断的过程样样本本总体总体样本统计量样本统计量样本统计量例如:样本均例如:样本均例如:样本均值、比例、方值、比例、方值、比例、方差差差总体均值、比总体均值、比例、方差等例、方差等一、估计量与估计值一、估计量与估计值二、点估计与区间估计二、点估计与区间估计三、评价估计量的标准三、评价估计量的标准第一第一节 参数估计的基本参数估计的基本原理原理30 一月 202361.1.估计量:估计量:估计量:估计量:用于估计总体参数的样本统计量用于估计总体参数的样本统计量用于估计总体参数的样本统计量用于估计总体参数的样本统计量n n如样本均值、样本比例如样本均值、样本比
3、例如样本均值、样本比例如样本均值、样本比例(成数成数成数成数)、样本方差等、样本方差等、样本方差等、样本方差等n n例如例如例如例如:样本均值就是总体均值样本均值就是总体均值样本均值就是总体均值样本均值就是总体均值 的一个估计量的一个估计量的一个估计量的一个估计量2.2.估计值:估计值:估计值:估计值:估计参数时计算出来的统计量的具估计参数时计算出来的统计量的具估计参数时计算出来的统计量的具估计参数时计算出来的统计量的具体值体值体值体值n n如果样本均值如果样本均值如果样本均值如果样本均值 x x =80=80,则,则,则,则8080就是就是就是就是 的估计值的估计值的估计值的估计值uu注:注
4、:注:注:有时,对估计量和估计值并不刻意区分,都称有时,对估计量和估计值并不刻意区分,都称有时,对估计量和估计值并不刻意区分,都称有时,对估计量和估计值并不刻意区分,都称为估计,根据上下文很容易明确其指代为估计,根据上下文很容易明确其指代为估计,根据上下文很容易明确其指代为估计,根据上下文很容易明确其指代一、估计量与估计值一、估计量与估计值(estimator&estimated value)随机随机随机随机变量变量变量变量30 一月 20237二、点估计与区间估计二、点估计与区间估计矩估计法矩估计法最小二乘法最小二乘法最大似然法最大似然法顺序统计量法顺序统计量法估 计 方 法点 估 计区间估
5、计30 一月 20238点估计点估计(point estimate)1.1.做做做做法法法法:用用用用样样样样本本本本估估估估计计计计量量量量的的的的值值值值直直直直接接接接作作作作为为为为总总总总体体体体参参参参数数数数的的的的估计值估计值估计值估计值 例例例例:用用用用样样样样本本本本均均均均值值值值直直直直接接接接作作作作为为为为总总总总体体体体均均均均值值值值的的的的估估估估计计计计;用样本成数直接作为总体成数的估计用样本成数直接作为总体成数的估计用样本成数直接作为总体成数的估计用样本成数直接作为总体成数的估计 例例例例:用用用用两两两两个个个个样样样样本本本本均均均均值值值值之之之之
6、差差差差直直直直接接接接作作作作为为为为总总总总体体体体均均均均值之差的估计值之差的估计值之差的估计值之差的估计2.2.缺缺缺缺点点点点:没没没没有有有有考考考考虑虑虑虑抽抽抽抽样样样样误误误误差差差差的的的的大大大大小小小小;没没没没有有有有给给给给出出出出估估估估计值接近总体参数的程度计值接近总体参数的程度计值接近总体参数的程度计值接近总体参数的程度3.3.点点点点估估估估计计计计的的的的方方方方法法法法有有有有矩矩矩矩估估估估计计计计法法法法、顺顺顺顺序序序序统统统统计计计计量量量量法法法法、最最最最大似然法、最小二乘法等大似然法、最小二乘法等大似然法、最小二乘法等大似然法、最小二乘法等
7、区间估计区间估计(interval estimate)1.1.在在点点估估计计的的基基础础上上,给给出出总总体体参参数数估估计计的的一一个个区区间间范围,该区间由样本统计量加减抽样误差而得到的范围,该区间由样本统计量加减抽样误差而得到的2.2.根根据据样样本本统统计计量量的的抽抽样样分分布布能能够够对对样样本本统统计计量量与与总总体参数的接近程度给出一个概率度量体参数的接近程度给出一个概率度量n n比如,某班级平均分数在比如,某班级平均分数在75758585之间,置信水平是之间,置信水平是95%95%样本统计量样本统计量 (点估计点估计)置信区间置信区间置信下限置信下限置信上限置信上限区间估计
8、的图示区间估计的图示X95%95%的样本的样本 -1.96-1.96 x x +1.96+1.96 x x99%99%的样本的样本 -2.58-2.58 x x +2.58+2.58x x90%90%的样本的样本 -1.65-1.65 x x +1.65+1.65 x x1.1.将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 2.2.表示为(1-n n 为是总体参数未在区间内的比例为是总体参数未在区间内的比例 3.3.常用的置信水平值有 99%,95%,90%n n相应的相应的相应的相应的 为为0.010.01,0.050.05,0.100.10置信水平置
9、信水平 1.1.由样本统计量所构造的总体参数的估计区间称由样本统计量所构造的总体参数的估计区间称为置信区间为置信区间2.2.统计学家在某种程度上确信这个区间会包含真统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间正的总体参数,所以给它取名为置信区间 3.3.用一个具体的样本所构造的区间是一个特定的用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值否包含总体参数的真值n n我们只能是希望这个区间是大量包含总体参数真我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也
10、可能是少数几个不包值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个含参数真值的区间中的一个置信区间置信区间(confidence interval)置信区间与置信水平置信区间与置信水平 均值的抽样分布均值的抽样分布(1-(1-)%)%区间包含了区间包含了%的区间未包含的区间未包含 1-1-/2 2/2 2影响区间宽度的因素影响区间宽度的因素1.总体数据的离散程度,用来测度2.2.样本容量,3.置信水平(1-),影响 z 的大小 常用置信水平常用置信水平常用置信水平常用置信水平 及及及及 值值值值30 一月 202315置信水平置信水平 1-/2/290%0.100.051.6
11、4595%0.050.0251.9699%0.010.0052.5830 一月 202316评价估计量的标准评价估计量的标准30 一月 202317无偏性无偏性(unbiasedness)n n无无无无偏偏偏偏性性性性:估估估估计计计计量量量量(随随随随机机机机变变变变量量量量)的的的的数数数数学学学学期期期期望望望望等等等等于于于于被被被被估估估估计计计计的的的的总总总总体体体体参参参参数数数数n n中心极限定理证明了:中心极限定理证明了:中心极限定理证明了:中心极限定理证明了:样本平均数和样本成数都满足无偏性样本平均数和样本成数都满足无偏性样本平均数和样本成数都满足无偏性样本平均数和样本成
12、数都满足无偏性 P P()B BA A无偏无偏无偏无偏无偏无偏有偏有偏有偏有偏有偏有偏总体参数总体参数总体参数总体参数30 一月 202318有效性有效性(efficiency)有有有有效效效效性性性性:对对对对同同同同一一一一总总总总体体体体参参参参数数数数的的的的两两两两个个个个无无无无偏偏偏偏点点点点估估估估计计计计量量量量,有有有有更更更更小小小小标准差的估计量更有效标准差的估计量更有效标准差的估计量更有效标准差的估计量更有效 AB 的抽样分布的抽样分布的抽样分布的抽样分布 的抽样分布的抽样分布的抽样分布的抽样分布P P()样本平均样本平均样本平均样本平均数比中位数比中位数比中位数比中
13、位数更有效数更有效数更有效数更有效30 一月 202319一致性一致性(consistency)n n一致性:一致性:一致性:一致性:随着样本容量的增大,估计量的值越来越接随着样本容量的增大,估计量的值越来越接随着样本容量的增大,估计量的值越来越接随着样本容量的增大,估计量的值越来越接近被估计的总体参数近被估计的总体参数近被估计的总体参数近被估计的总体参数n n大数定律已经证明了:大数定律已经证明了:大数定律已经证明了:大数定律已经证明了:样本平均数和样本比例都满足样本平均数和样本比例都满足样本平均数和样本比例都满足样本平均数和样本比例都满足一致性一致性一致性一致性 AB较小的样本容量较小的样
14、本容量较小的样本容量较小的样本容量较大的样本容量较大的样本容量较大的样本容量较大的样本容量P P()一.总体均值的区间估计二.总体比例的区间估计三.总体方差的区间估计第二第二节 一个总体参数一个总体参数的区间估计的区间估计一个总体参数的区间估计一个总体参数的区间估计总体参数总体参数总体参数总体参数符号表示符号表示符号表示符号表示样本统计量样本统计量样本统计量样本统计量均均值值比例比例方差方差总体均值的区间估计总体均值的区间估计(正态总体、正态总体、已知,或非正态总体、大样本已知,或非正态总体、大样本)总体均值的区间估计总体均值的区间估计n n1.1.假定条件假定条件n n总体服从正态分布总体服
15、从正态分布,且方差且方差()已知已知n n如果不是正态分布,可由正态分布来近似如果不是正态分布,可由正态分布来近似 (n n 30)30)2.2.使用正态分布统计量使用正态分布统计量3.3.总体均值总体均值总体均值总体均值 在在在在1-1-置信水平下的置信水平下的置信水平下的置信水平下的置信区间为置信区间为置信区间为置信区间为总体均值的区间估计总体均值的区间估计(例题分析例题分析)【例例】一一家家保保险险公公司司收收集集到到由由36投投保保个个人人组组成成的的随随机机样样本本,得得到到每每个个投投保保人人的的年年龄龄(周周岁岁)数数据据如如下下表表。试试建建立立投投保保人人年年龄龄90%的置信
16、区间的置信区间 3636个投保人年龄的数据个投保人年龄的数据个投保人年龄的数据个投保人年龄的数据 233539273644364246433133425345544724342839364440394938344850343945484532总体均值的区间估计总体均值的区间估计(例题分析例题分析)解解:已已知知n n=36,=36,1-1-=90%90%,z z/2/2=1.645=1.645。根根据据样样本本数数据计算得:据计算得:,总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为投保人平均年龄的置信区间为投保人平均年龄的置信区间为37.3737.37岁岁41.63
17、41.63岁岁总体均值的区间估计总体均值的区间估计(例题分析例题分析)【例例】一一家家食食品品生生产产企企业业以以生生产产袋袋装装食食品品为为主主,为为对对产产量量质质量量进进行行监监测测,企企业业质质检检部部门门经经常常要要进进行行抽抽检检,以以分分析析每每袋袋重重量量是是否否符符合合要要求求。现现从从某某天天生生产产的的一一批批食食品品中中随随机机抽抽取取了了2525袋袋,测测得得每每袋袋重重量量如如下下表表所所示示。已已知知产产品品重重量量的的分分布布服服从从正正态态分分布布,且且总总体体标标准准差差为为1010克克。试试估估计计该该批批产产品品平平均均重重量量的的置信区间,置信水平为置
18、信区间,置信水平为95%95%2525袋食品的重量袋食品的重量袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3总体均值的区间估计总体均值的区间估计(例题分析例题分析)解解:已已知知 N N(,10102 2),n n=25,=25,1-1-=95%95%,z z/2/2=1.96=1.96。根根据样本数据计算得:据样本数据计算得:总体均值总体均值 在在1-1-置信水平下的置信区间
19、为置信水平下的置信区间为该食品平均重量的置信区间为该食品平均重量的置信区间为101.44101.44克克109.28109.28克之克之总体均值的区间估计总体均值的区间估计(正态总体、正态总体、未知、小样本未知、小样本)总体均值的区间估计总体均值的区间估计(小样本小样本)n n1.假定条件n n总体服从正态分布总体服从正态分布,且方差且方差()未知未知n n小样本小样本 (n n 30)30)2.2.使用 t 分布统计量3.总体均值 在1-置信水平下的置信区间为t 分布分布 分分布布是是类类似似正正态态分分布布的的一一种种对对称称分分布布,它它通通常常要要比比正正态态分分布布平平坦坦和和分分散
20、散。一一个个特特定定的的分分布布依依赖赖于于称称之之为为自自由由度度的的参参数数。随随着着自自由由度度的的增增大大,分分布布也也逐逐渐渐趋趋于正态分布于正态分布 X X Xt t 分布与标准正态分布的比较分布与标准正态分布的比较t t 分布分布标准正态分布标准正态分布t t不同自由度的不同自由度的t t分布分布标准正态分布标准正态分布t t(dfdf=13)=13)t t(dfdf=5)=5)Z Z总体均值的区间估计总体均值的区间估计(例题分析例题分析)【例例】已已知知某某种种灯灯泡泡的的寿寿命命服服从从正正态态分分布布,现现从从一一批批灯灯泡泡中中随随机机抽抽取取16只只,测测得得其其使使用
21、用寿寿命命(小小时时)如如下下。建建立立该该批批灯灯泡泡平平均使用寿命均使用寿命95%的置信区间的置信区间1616灯泡使用寿命的数据灯泡使用寿命的数据灯泡使用寿命的数据灯泡使用寿命的数据 1510152014801500145014801510152014801490153015101460146014701470总体均值的区间估计总体均值的区间估计(例题分析例题分析)解解:已已知知 N N(,2 2),n n=16,=16,1-1-=95%95%,t t/2/2=2.131=2.131。根据样本数据计算得:根据样本数据计算得:,总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的
22、置信区间为该该种种灯灯泡泡平平均均使使用用寿寿命命的的置置信信区区间间为为1476.81476.8小小时时1503.21503.2小时小时总体比例的区间估计总体比例的区间估计总体比例的区间估计总体比例的区间估计n n1.1.假定条件假定条件n n总体服从二项分布总体服从二项分布n n可以由正态分布来近似可以由正态分布来近似n n大样本大样本2.2.使用正态分布统计量使用正态分布统计量3.3.3.总体比例总体比例总体比例 在在在1-1-1-置信水平下置信水平下置信水平下的置信区间为的置信区间为的置信区间为总体比例的区间估计总体比例的区间估计(例题分析例题分析)【例例】某某城城市市想想要要估估计计
23、下下岗岗职职工工中中女女性性所所占占的的比比例例,随随机机抽抽取取了了100100个个下下岗岗职职工工,其其中中6565人人为为女女性性职职工工。试试以以95%95%的的置置信信水水平平估估计计该该城城市市下下岗岗职职工工中中女女性性比比例例的的置置信区间信区间解解:已已知知 n n=100=100,p p65%65%,1 1-=95%95%,z z/2/2=1.96=1.96该该城城市市下下岗岗职职工工中中女女性性比比例例的的置置信信区间为区间为55.65%74.35%55.65%74.35%总体方差的区间估计总体方差的区间估计总体方差的区间估计总体方差的区间估计n n1.估计一个总体的方差
24、或标准差n n2.假设总体服从正态分布3.3.总体方差 2 2 的点估计量为S2 2,且4.总体方差在1-置信水平下的置信区间为总体方差的区间估计总体方差的区间估计(图示图示)1-1-总体方差总体方差总体方差1-1-1-的置信区间的置信区间的置信区间自由度为自由度为n n-1-1的的 总体方差的区间估计总体方差的区间估计(例题分析例题分析)【例例】一一家家食食品品生生产产企企业业以以生生产产袋袋装装食食品品为为主主,现现从从某某天天生生产产的的一一批批食食品品中中随随机机抽抽取取了了25袋袋,测测得得每每袋袋重重量量如如下下表表7所所示示。已已知知产产品品重重量量的的分分布布服服从从正正态态分
25、分布布。以以95%的置信水平建立该种食品重量方差的置信区间的置信水平建立该种食品重量方差的置信区间 2525袋食品的重量袋食品的重量袋食品的重量袋食品的重量 112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3总体方差的区间估计总体方差的区间估计(例题分析例题分析)解解:已已 知知 n n 2525,1-1-95%95%,根根 据据 样样 本本 数数 据据 计计 算算 得得 s s2 2=93.21=93.2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 统计 推断 参数估计
限制150内