《统计学第4章参数估计精品文稿.ppt》由会员分享,可在线阅读,更多相关《统计学第4章参数估计精品文稿.ppt(42页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学第4章参数估计第1页,本讲稿共42页4.1.1 4.1.1 估计量与估计值估计量与估计值1.1.估估计计量量:在在参参数数估估计计中中,用用于于估估计计总总体体参参数数的的统统计计量的名称量的名称.n例如例如:样本均值就是总体均值的一个估计量样本均值就是总体均值的一个估计量 参数用参数用 表示,估计量表示,估计量用用 表示表示2.2.估计值估计值:估计参数时算出来的统计量的具体值:估计参数时算出来的统计量的具体值n如果样本均值如果样本均值 x x=80=80,则,则8080就是就是 的估计值的估计值第2页,本讲稿共42页4.1.2 参数估计的方法参数估计的方法估估 计计 方方 法法点点
2、估估 计计区间估计区间估计第3页,本讲稿共42页一个总体参数的估计一个总体参数的估计总体参数总体参数符号表示符号表示样本统计量样本统计量均均值值比例比例方差方差第4页,本讲稿共42页1.点估计点估计用用样样本本的的估估计计量量 的的值值直直接接作作为为总总体体参参数数 的估计值的估计值例例如如:用用样样本本均均值值 直直接接作作为为总总体体均均值值 的估计值的估计值.没有给出估计值接近总体参数程度的信息没有给出估计值接近总体参数程度的信息第5页,本讲稿共42页2.2.区间估计区间估计在在点点估估计计的的基基础础上上,给给出出总总体体参参数数估估计计的的一一个个区区间间范范围围,该该区区间间由由
3、样样本本统统计计量量加加减减抽抽样样误差而得到的误差而得到的.根根据据样样本本统统计计量量的的抽抽样样分分布布能能够够对对样样本本统统计计量量与与总体参数的接近程度给出一个概率度量总体参数的接近程度给出一个概率度量.如某班级平均分数在如某班级平均分数在75758585之间,置信水平是之间,置信水平是95%95%第6页,本讲稿共42页4.1.3.评价估计量的标准评价估计量的标准第7页,本讲稿共42页1.1.无偏性:无偏性:无偏性:无偏性:设总体的参数为设总体的参数为,其,其,其,其估计量为估计量为 ,如如如如果果果果 ,即即即即估估估估计计计计量量量量 的的的的数数数数学学学学期期期期望望望望等
4、等等等于被估计的总体参数,我们称估计量于被估计的总体参数,我们称估计量于被估计的总体参数,我们称估计量于被估计的总体参数,我们称估计量 是参数是参数的无偏估计量。的无偏估计量。的无偏估计量。的无偏估计量。例如;总体例如;总体例如;总体例如;总体X X:(:(3 4 53 4 5)(3333)3 3 (3434)3.5 3.5 3.5 3.5 (35353535)4 4(4343)3.5 (443.5 (44)4 4 (45454545)4.54.54.54.5(5353)4 4 (54545454)4.5 4.5 (5555)5 5 5 5第8页,本讲稿共42页o无偏性无偏性:估计量抽样分布的
5、数学期望等于被:估计量抽样分布的数学期望等于被 估计的总体参数估计的总体参数.P P()B BA A偏偏偏偏偏偏偏偏偏偏偏偏第9页,本讲稿共42页 样本平均数是总体平均数样本平均数是总体平均数的无偏估计的无偏估计量。量。以无偏性来评判估计量是很合理的。一个好的以无偏性来评判估计量是很合理的。一个好的以无偏性来评判估计量是很合理的。一个好的以无偏性来评判估计量是很合理的。一个好的估计量就某一个具体的估计值而言,可能不等于估计量就某一个具体的估计值而言,可能不等于估计量就某一个具体的估计值而言,可能不等于估计量就某一个具体的估计值而言,可能不等于总体参数值,但平均来看有向估计的总体参数集总体参数值
6、,但平均来看有向估计的总体参数集总体参数值,但平均来看有向估计的总体参数集总体参数值,但平均来看有向估计的总体参数集中的趋势。中的趋势。中的趋势。中的趋势。NEXT第10页,本讲稿共42页2.有效性有效性:对同一总体参数的两个无偏点估计量对同一总体参数的两个无偏点估计量 ,有更小标准差的估计量更有效有更小标准差的估计量更有效 AB 的抽样分布的抽样分布的抽样分布的抽样分布 的抽样分布的抽样分布的抽样分布的抽样分布P P()均值均值均值均值中位数中位数中位数中位数第11页,本讲稿共42页3.一一致致性性:随随着着样样本本容容量量的的增增大大,估估计计量量的的值越来越接近被估计的总体参数值越来越接
7、近被估计的总体参数AB较较较较 的样本容量的样本容量的样本容量的样本容量较较较较 的样本容量的样本容量的样本容量的样本容量P P()第12页,本讲稿共42页一致性:一致性:随随随随着着着着样样样样本本本本容容容容量量量量增增增增大大大大,估估估估计计计计量量量量会会会会越越越越来来来来越越越越接接接接近近近近被被被被估估估估计计计计的的的的参数。参数。参数。参数。即对任意的即对任意的 ,有,有则称则称 是参数是参数的一致估计量。的一致估计量。一一一一致致致致估估估估计计计计量量量量是是是是大大大大样样样样本本本本所所所所呈呈呈呈现现现现的的的的性性性性质质质质。若若若若某某某某个个个个估估估估
8、计计计计量量量量是是是是待待待待估估估估参参参参数数数数的的的的一一一一致致致致估估估估计计计计量量量量,意意意意味味味味着着着着样样样样本本本本容容容容量量量量很很很很大大大大时时时时,估估估估计量和待估参数接近的可能性几乎等于计量和待估参数接近的可能性几乎等于计量和待估参数接近的可能性几乎等于计量和待估参数接近的可能性几乎等于100%100%100%100%。NEXT第13页,本讲稿共42页4.2 4.2 总体均值的区间估计总体均值的区间估计一一.区间估计的基本原理区间估计的基本原理二二.正态总体或大样本的估计正态总体或大样本的估计三三.正态总体小样本的估计正态总体小样本的估计第14页,本
9、讲稿共42页4.2.1 4.2.1 区间估计的基本原理区间估计的基本原理第15页,本讲稿共42页区间估计的图示区间估计的图示 P124 X95%95%的样本的样本的样本的样本 -1.96-1.96 x x +1.96+1.96 x x99%99%的样本的样本的样本的样本 -2.582.58 x x +2.58+2.58x x90%90%的样本的样本的样本的样本 -1.65-1.65 x x +1.65+1.65 x x第16页,本讲稿共42页区间估计的图示区间估计的图示X100110-21201308070-390-1 0123原始数值标准差34.13%34.13%第17页,本讲稿共42页1.
10、1.将构造置信区间的步骤重复很多次,置信将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例区间包含总体参数真值的次数所占的比例称为置信水平称为置信水平.2.2.表示为表示为 1-a3.3.a是总体参数是总体参数未在未在区间内的比例区间内的比例 常用的置信水平值有常用的置信水平值有 99%,95%,90%99%,95%,90%n相应的相应的 为为0.010.01,0.050.05,0.100.10置信水平置信水平 第18页,本讲稿共42页1.1.由样本统计量所构造的总体参数的估计区由样本统计量所构造的总体参数的估计区间称为置信区间间称为置信区间2.2.统计学家在某种程度上确
11、信这个区间会包统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信含真正的总体参数,所以给它取名为置信区间区间 置信区间置信区间 (confidence interval)(confidence interval)样本统计量样本统计量样本统计量样本统计量 (点估计点估计点估计点估计)置信区间置信区间置信区间置信区间置信下限置信下限置信下限置信下限置信上限置信上限置信上限置信上限第19页,本讲稿共42页置信区间与置信水平置信区间与置信水平 均值的抽样分布均值的抽样分布均值的抽样分布均值的抽样分布(1-a1-a )%)%)%)%区间包含了区间包含了区间包含了区间包含了 a a%
12、的区间未包含的区间未包含的区间未包含的区间未包含 1-1-/2 2 /2 21.1.用一个具体的样本所用一个具体的样本所用一个具体的样本所用一个具体的样本所构造的区间是一个特构造的区间是一个特构造的区间是一个特构造的区间是一个特定的区间,我们无法定的区间,我们无法定的区间,我们无法定的区间,我们无法知道这个样本所产生知道这个样本所产生知道这个样本所产生知道这个样本所产生的区间是否包含总体的区间是否包含总体的区间是否包含总体的区间是否包含总体参数的真值参数的真值参数的真值参数的真值2.2.我们只能是希望这个我们只能是希望这个我们只能是希望这个我们只能是希望这个区间是大量包含总体区间是大量包含总体
13、区间是大量包含总体区间是大量包含总体参数真值的区间中的参数真值的区间中的参数真值的区间中的参数真值的区间中的一个,但它也可能是一个,但它也可能是一个,但它也可能是一个,但它也可能是少数几个不包含参数少数几个不包含参数少数几个不包含参数少数几个不包含参数真值的区间中的一个真值的区间中的一个真值的区间中的一个真值的区间中的一个第20页,本讲稿共42页4.2.2 正态总体或大样本的正态总体或大样本的总体均值的区总体均值的区间估计间估计1.1.假定条件假定条件n总体服从正态分布总体服从正态分布,方差方差()已知已知n如果不是正态分布,可由正态分布来近似如果不是正态分布,可由正态分布来近似 (n n 3
14、0)30)2.2.总体均值总体均值 在在1-1-置信水平下的置信水平下的置信区间为置信区间为重复抽样重复抽样不重复抽样不重复抽样第21页,本讲稿共42页总体均值的区间总体均值的区间【例例例例】某某某某种种种种零零零零件件件件的的的的长长长长度度度度服服服服从从从从正正正正态态态态分分分分布布布布,从从从从某某某某天天天天生生生生产产产产一一一一批批批批零零零零件件件件中中中中按按按按重重重重复复复复抽抽抽抽样样样样方方方方法法法法随随随随机机机机抽抽抽抽取取取取9 9 9 9个个个个,测测测测得得得得其其其其平平平平均均均均长长长长度度度度为为为为21.4cm21.4cm21.4cm21.4c
15、m。已已已已知知知知总总总总体体体体标标标标准准准准差为差为差为差为 =0.15cm=0.15cm=0.15cm=0.15cm。试估计该批零件平均长度的置信区间,置信水平为。试估计该批零件平均长度的置信区间,置信水平为。试估计该批零件平均长度的置信区间,置信水平为。试估计该批零件平均长度的置信区间,置信水平为95%95%95%95%。解解解解:已已已已知知知知 N N(,0.150.152 2),n n=9,=9,1-1-=95%95%,z z /2/2=1.96=1.96 总总总总体体体体均均均均值值值值 在在在在1-1-置信水平下的置信区间为置信水平下的置信区间为置信水平下的置信区间为置信
16、水平下的置信区间为该批零件平均长度的置信区间在该批零件平均长度的置信区间在该批零件平均长度的置信区间在该批零件平均长度的置信区间在21.302cm21.498cm21.302cm21.498cm之间之间之间之间 第22页,本讲稿共42页总体均值的区间估计【例例】在在在在某某某某天天天天生生生生产产产产的的的的500500500500袋袋袋袋食食食食品品品品中中中中,按按按按不不不不重重重重复复复复抽抽抽抽样样样样方方方方法法法法随随随随机机机机抽抽抽抽取取取取25252525袋袋袋袋进进进进行行行行检检检检查查查查,测测测测得得得得平平平平均均均均每每每每袋袋袋袋的的的的重重重重量量量量为为为
17、为996g996g996g996g。已已已已知知知知该该该该种种种种袋袋袋袋装装装装食食食食品品品品的的的的重重重重量量量量服服服服从从从从正正正正态态态态分分分分布布布布,且且且且标标标标准准准准差差差差为为为为20g20g20g20g。试试试试估估估估计计计计该该该该种种种种食食食食品品品品平平平平均均均均重重重重量量量量的的的的置置置置信信信信区区区区间间间间,置信水平为置信水平为置信水平为置信水平为95%95%95%95%。解解解解:已知已知 N N(,20202 2),n n=25,1-=25,1-=95%=95%,z z/2/2=1.96=1.96 总体均值总体均值 在在1-1-置
18、信水平下的置信区间为置信水平下的置信区间为该种食品平均重量的置信区间为该种食品平均重量的置信区间为该种食品平均重量的置信区间为该种食品平均重量的置信区间为988.35988.35g g g g1003.651003.65g g g g之间之间之间之间第23页,本讲稿共42页4.2.3 4.2.3 正态总体小样本正态总体小样本总体均总体均 值的值的区间估计区间估计1.假定条件假定条件n总体服从正态分布总体服从正态分布,且方差且方差()未知未知n小样本小样本 (n n 30)30)2.2.使用使用 t t 分布统计量分布统计量3.3.总体均值总体均值 在在1-1-1-1-置信水平下的置信水平下的置
19、信区间为置信区间为第24页,本讲稿共42页t t 分布分布 分分分分布布布布是是是是类类类类似似似似正正正正态态态态分分分分布布布布的的的的一一一一种种种种对对对对称称称称分分分分布布布布,它它它它通通通通常常常常要要要要比比比比正正正正态态态态分分分分布布布布平平平平坦坦坦坦和和和和分分分分散散散散。一一一一个个个个特特特特定定定定的的的的分分分分布布布布依依依依赖赖赖赖于于于于称称称称之之之之为为为为自自自自由由由由度度度度的的的的参数。随着自由度的增大,分布也逐渐趋于正态分布参数。随着自由度的增大,分布也逐渐趋于正态分布参数。随着自由度的增大,分布也逐渐趋于正态分布参数。随着自由度的增大
20、,分布也逐渐趋于正态分布 X X Xt t 分布与标准正态分布的比较分布与标准正态分布的比较t t 分布分布标准正态分布标准正态分布t t不同自由度的不同自由度的t t分布分布标准正态分布标准正态分布t t(dfdf=13)=13)t t(dfdf=5)=5)Z Z第25页,本讲稿共42页【例例例例】已已已已知知知知某某某某种种种种灯灯灯灯泡泡泡泡的的的的寿寿寿寿命命命命服服服服从从从从正正正正态态态态分分分分布布布布,现现现现从从从从一一一一批批批批灯灯灯灯泡泡泡泡中中中中随随随随机机机机抽抽抽抽取取取取16161616只只只只,测测测测得得得得其其其其使使使使用用用用寿寿寿寿命命命命(小小
21、小小时时时时)如如如如下下下下。建建建建立立立立该该该该批批批批灯泡平均使用寿命灯泡平均使用寿命灯泡平均使用寿命灯泡平均使用寿命95%95%95%95%的置信区间的置信区间的置信区间的置信区间16灯泡使用寿命的数据灯泡使用寿命的数据 1510152014801500145014801510152014801490153015101460146014701470第26页,本讲稿共42页解解解解:已已已已知知知知 N N(,2 2),n n=16,=16,1-1-=95%95%,t t /2/2=2.131=2.131。根根根根据样本数据计算得:据样本数据计算得:据样本数据计算得:据样本数据计算得
22、:,总体均值总体均值总体均值总体均值 在在在在1-1-置信水平下的置信区间为置信水平下的置信区间为置信水平下的置信区间为置信水平下的置信区间为该该该该 种种种种 灯灯灯灯 泡泡泡泡 平平平平 均均均均 使使使使 用用用用 寿寿寿寿 命命命命 的的的的 置置置置 信信信信 区区区区 间间间间 为为为为 1476.81476.8小小小小 时时时时 1503.21503.2小时小时小时小时第27页,本讲稿共42页4.3.4.3.总体比例的区间估计总体比例的区间估计一一.大样本重复抽样时的估计方法大样本重复抽样时的估计方法二二.大样本不重复抽样时的估计方法大样本不重复抽样时的估计方法第28页,本讲稿共
23、42页4.3.1 4.3.1 总体比例的区间估计总体比例的区间估计(重复抽样重复抽样)o1.假定条件假定条件n总体服从二项分布总体服从二项分布n可以由正态分布来近似可以由正态分布来近似2.使用正态分布统计量使用正态分布统计量3.3.3.3.3.3.总体比例总体比例总体比例总体比例总体比例总体比例 在在在在在在1-1-1-1-1-1-置信水平下置信水平下置信水平下置信水平下置信水平下置信水平下的置信区间为的置信区间为的置信区间为的置信区间为的置信区间为的置信区间为第29页,本讲稿共42页4.3.2 总体比例的区间估计总体比例的区间估计(不重复抽样不重复抽样)o1.1.假定条件假定条件n总体服从二
24、项分布总体服从二项分布n可以由正态分布来近似可以由正态分布来近似2.2.使用正态分布统计量使用正态分布统计量3.3.3.总体比例总体比例总体比例总体比例总体比例总体比例 在在在在在在1-1-1-1-1-1-置信水平下置信水平下置信水平下置信水平下置信水平下置信水平下的置信区间为的置信区间为的置信区间为的置信区间为的置信区间为的置信区间为第30页,本讲稿共42页总体比例的区间估计总体比例的区间估计【例例】某某某某城城城城市市市市想想想想要要要要估估估估计计计计下下下下岗岗岗岗职职职职工工工工中中中中女女女女性性性性所所所所占占占占的的的的比比比比例例例例,随随随随机机机机 抽抽抽抽 取取取取 了
25、了了了100100100100个个个个 下下下下岗岗岗岗职职职职工工工工,其其其其中中中中65656565人人人人为为为为女女女女性性性性职职职职工工工工。试试试试以以以以95%95%95%95%的的的的置置置置信信信信水水水水平平平平估估估估计计计计该该该该城城城城市市市市下下下下岗岗岗岗职职职职工工工工中中中中女女女女性性性性比比比比例例例例的的的的置置置置信区间信区间信区间信区间解:解:解:解:已知已知已知已知 n n n n=100=100=100=100,p p p p65%65%65%65%,z z z z /2/2/2/2=1.96=1.96=1.96=1.96该该该该城城城城市
26、市市市下下下下岗岗岗岗职职职职工工工工中中中中女女女女性性性性比比比比例例例例的的的的置置置置信信信信区区区区间为间为间为间为55.65%74.35%55.65%74.35%55.65%74.35%55.65%74.35%第31页,本讲稿共42页总体比例的区间估计总体比例的区间估计【例例】某某某某企企企企业业业业共共共共有有有有职职职职工工工工1000100010001000人人人人。企企企企业业业业准准准准备备备备实实实实行行行行一一一一项项项项改改改改革革革革,在在在在职职职职工工工工中中中中征征征征求求求求意意意意见见见见,采采采采取取取取不不不不重重重重复复复复抽抽抽抽样样样样方方方方
27、法法法法随随随随机机机机抽抽抽抽取取取取200200200200人人人人作作作作为为为为样样样样本本本本,调调调调查查查查结结结结果果果果显显显显示示示示,有有有有150150150150人人人人表表表表示示示示赞赞赞赞成成成成该该该该项项项项改改改改革革革革,50505050人人人人表表表表示示示示反反反反对对对对。试试试试以以以以95%95%95%95%的的的的概概概概率率率率确确确确定定定定赞赞赞赞成成成成改改改改革革革革的的的的人人人人数比例的置信区间数比例的置信区间数比例的置信区间数比例的置信区间解:解:解:解:已知已知 n n=100=100,p p75%75%,z z/2/2=1
28、.96=1.96该该企企业业职职工工中中赞赞成成改改革革的的人人数数比比例例的的置置信信区间为区间为69.63%80.37%69.63%80.37%之间之间 第32页,本讲稿共42页4.4.4.4.样本容量的确定样本容量的确定一一.估计总体均值时样本容量的确定估计总体均值时样本容量的确定二二.估计总体比例时样本容量的确定估计总体比例时样本容量的确定第33页,本讲稿共42页4.4.1 估计总体均值时样本容量的确定估计总体均值时样本容量的确定第34页,本讲稿共42页1.1.估计总体均值时样本容量估计总体均值时样本容量n n为为重复抽样重复抽样 不重复抽样不重复抽样2.2.样本容量样本容量n n与总
29、体方差成正比,与边际误差成反比,与可与总体方差成正比,与边际误差成反比,与可靠性系数成正比靠性系数成正比估计总体均值时样本容量的确定估计总体均值时样本容量的确定 其中:其中:其中:其中:其中:其中:第35页,本讲稿共42页估计总体均值时样本容量的确定估计总体均值时样本容量的确定【例例】拥拥拥拥有有有有工工工工商商商商管管管管理理理理学学学学士士士士学学学学位位位位的的的的大大大大学学学学毕毕毕毕业业业业生生生生年年年年薪薪薪薪的的的的标标标标准准准准差差差差大大大大约约约约为为为为2000200020002000元元,假假定定想想要要估估计计年年薪薪95%95%95%95%的的的的置置置置信信
30、信信区区区区间间间间,希希希希望望望望边边边边际际际际误误误误差差差差为为为为400400400400元元元元,应应应应抽抽抽抽取取取取多多多多大大大大的样本容量?的样本容量?的样本容量?的样本容量?第36页,本讲稿共42页估计总体均值时样本容量的确定估计总体均值时样本容量的确定 解解解解:已知已知已知已知 =2000=2000=2000=2000,E E E E=400,1-=400,1-=400,1-=400,1-=95%=95%=95%=95%,z z z z /2/2/2/2=1.96=1.96=1.96=1.96 1 1 1 12 2 2 2/2 2 2 22 2 2 2置信度为置信
31、度为置信度为置信度为90%90%90%90%的置信区间为的置信区间为的置信区间为的置信区间为即应抽取即应抽取即应抽取即应抽取97979797人作为样本人作为样本人作为样本人作为样本 第37页,本讲稿共42页1.1.根据比例区间估计公式可得样本容量根据比例区间估计公式可得样本容量n n为为1.重复抽样重复抽样2.不重复抽样不重复抽样4.4.2 估计总体比例时样本容量的确定估计总体比例时样本容量的确定 2.2.E E的取值一般小于0.13.3.未知时,可取最大值未知时,可取最大值0.5其中:其中:其中:第38页,本讲稿共42页估计总体比例时样本容量的确定估计总体比例时样本容量的确定【例例】根根据据
32、以以往往的的生生产产统统计计,某某种种产产品品的的合合格格率率约约为为90%90%,现现要要求求边边 际际 误误 差差 为为5%5%,在在求求95%95%的的置置信信区区间间时时,应应抽抽取取多多少少个个产产品品作作为为样样本?本?解解:已已已已 知知知知 =90%=90%,1-1-=95%=95%,Z Z /2/2=1.96=1.96,E E=5%=5%应抽取的样本容量应抽取的样本容量应抽取的样本容量应抽取的样本容量为为为为 应抽取应抽取应抽取应抽取139139139139个产品作为样本个产品作为样本个产品作为样本个产品作为样本第39页,本讲稿共42页习题:4、据某市场调查公司对某市据某市场
33、调查公司对某市8080名随机受访的购房名随机受访的购房者的调查,得到该市购房者中本地人的购房比者的调查,得到该市购房者中本地人的购房比例的区间估计,在置信水平例的区间估计,在置信水平=0.10=0.10下,其边际下,其边际误差误差E=0.08E=0.08。则:。则:(1 1)这)这8080名受访者样本中为本地购房者的比例名受访者样本中为本地购房者的比例p p是是多少?多少?(2 2)若置信水平)若置信水平=0.05=0.05,则要保持同样的精度进,则要保持同样的精度进行区间估计,需要调查多少名购房者?行区间估计,需要调查多少名购房者?解:解:第40页,本讲稿共42页一、填空题o1.某班学生的打字速度的95%的置信区间为44110字/分钟,从某班随机抽取10名学生测试其打字速度,则由10名学生组成的样本平均打字速度的期望是_,标准差是_。能否认为该样本的平均打字速度的抽样分布为正态分布_,理由是_。第41页,本讲稿共42页2.若从一总体中抽取一样本,样本容量为n,其95%的置信区间为(a,b),则其样本均值为_,若总体方差已知,则该总体方差为_。若总体方差未知,且样本量为15,则其样本均值为_,样本方差为_。若总体方差未知,且样本量为30,则其样本均值为_,样本方差为_。若增加样本容量置信区间会变第42页,本讲稿共42页
限制150内