区间估计资料优秀PPT.ppt
第五讲 区间估计 在在估估计计湖湖中中鱼鱼数数的的问问题题中中,若若我我们们依依据据一一个个实实际际样样本本,得得到到鱼鱼数数 N 的的极极大大似似然估计为然估计为1000条条.事事实实上上,N的的真真值值可可能能大大于于1000条条,也可能小于也可能小于1000 条条.若若我我们们能能给给出出一一个个区区间间,在在此此区区间间内内我我们们合合理理地地信信任任 N 的的真真值值位位于于其其中中.这这样样对对鱼鱼数数的的估估计计就就有把握多了有把握多了.11-91 习惯上把置信水平记作习惯上把置信水平记作 ,这里,这里 是一个是一个很小的正数很小的正数.也就是说,我们希望确定一个区间,使我们能以也就是说,我们希望确定一个区间,使我们能以比较高的牢靠程度信任它包含真参数值比较高的牢靠程度信任它包含真参数值.湖中鱼数的真值湖中鱼数的真值这里所说的这里所说的“牢靠程度牢靠程度”是用概率来度量的,称为是用概率来度量的,称为置信概率,置信度或置信水平置信概率,置信度或置信水平.21-911.1.置信区间与置信度置信区间与置信度定义定义 设总体设总体X含一待估参数含一待估参数对于样本对于样本找出找出使得:使得:称区间称区间为为的的置信区间置信区间为该区间的为该区间的置信度置信度 区间估计要求依据样本给出未知参数的范围,区间估计要求依据样本给出未知参数的范围,并保证真参数以指定的较或许率属于这个范围。并保证真参数以指定的较或许率属于这个范围。31-91通常通常,接受接受95%95%的置信度的置信度,有时也取有时也取99%99%或或90%.90%.即置信度为即置信度为这时重复这时重复抽样抽样100次次,则在得到的则在得到的100100个区间中包含个区间中包含真值真值 的有的有9595个左右个左右,例如:若真值的有真值的有5 5个左右个左右 。不包含不包含是一个随机区间;是一个随机区间;给出该区间给出该区间 含真值含真值 的的可靠度可靠度 。可能性。可能性。表示该区间不包含真值表示该区间不包含真值 的的区间区间 41-91几个常用统计量复习61-91区间估计的一般步骤71-912.2.正态总体均值的区间估计正态总体均值的区间估计(1)(1)已知方差,估计均值已知方差,估计均值设设为总体为总体 的一个样本的一个样本置信度置信度 下,来确定下,来确定设已知方差设已知方差 且且是是的的一个无偏点估计一个无偏点估计.的置信区间的置信区间 构造统计量构造统计量81-91对于给定的置信度对于给定的置信度 查正态分布表,找出查正态分布表,找出临界值临界值 使得:使得:由此可找出无穷多组由此可找出无穷多组 通常我们取对称通常我们取对称使:使:区间区间 由上由上 分位点的定义分位点的定义91-91推得,随机区间:推得,随机区间:查正态分布表查正态分布表找出找出得:得:101-91 须要指出的是,给定样本,给定置信水须要指出的是,给定样本,给定置信水平,置信区间也不是唯一的平,置信区间也不是唯一的.对同一个参数,我们可以构造很多置信区间对同一个参数,我们可以构造很多置信区间.我们总是希望置信区间尽可能短我们总是希望置信区间尽可能短.随意两个数随意两个数a a和和b b,只要它们的纵标包含,只要它们的纵标包含f(u)f(u)下下95%95%的面积,就确定一个的面积,就确定一个95%95%的置信区的置信区间间.置信区间短表示估计的精度高,111-91像像 N(0,1)分布概率密度分布概率密度图形是单峰且对称的状况。图形是单峰且对称的状况。当当n固定时以固定时以的区间长度为最短,的区间长度为最短,我们一般选择它。我们一般选择它。若以若以L为区间长度,则为区间长度,则可见可见L L随随 n n 的增大而削减(的增大而削减(给定时),给定时),121-91例1 已知幼儿身高听从正态分布,现从已知幼儿身高听从正态分布,现从5-65-6岁的幼岁的幼儿中随机地抽查了儿中随机地抽查了9 9人人,其高度分别为其高度分别为 115,120,131 115,120,131115,109,115,115,105,110cm;115,109,115,115,105,110cm;假设标准差假设标准差置信度为置信度为95%;95%;试求总体均值试求总体均值的置信区间的置信区间解解 已知已知由样本值算得:由样本值算得:查正态分布表得查正态分布表得得置信区间:得置信区间:131-91置信区间越短置信区间越短,估计精度越高估计精度越高留意:置信区间并不是唯一的。留意:置信区间并不是唯一的。同样给定同样给定 141-91构造统计量:构造统计量:对于给定的对于给定的分布表,得临界值分布表,得临界值查查使使我们取对称区间我们取对称区间使使即:即:未知方差,估计均值未知方差,估计均值可用样本方差:可用样本方差:(2)151-91由由分布表分布表查查分布表分布表找出找出其中,其中,是样本容量是样本容量是表中自由度;是表中自由度;推得,随机区间:推得,随机区间:得得161-91由中心极限定理知,当当 n 充分大时,充分大时,无论无论X听从什么听从什么分布,都近似有分布,都近似有当当n很大时,很大时,用样本方差用样本方差代替代替后对分布影响不大后对分布影响不大故故n很大时,如很大时,如n50则则的置信度为的置信度为1 1的置信区间为的置信区间为171-91均值的区间估计总结均值的区间估计总结(1)(1)方差已知方差已知方差未知方差未知(2)181-913.方差的区间估计设设为总体为总体的一个样本的一个样本构造统计量:构造统计量:(1)191-91201-91(2)数学期望未知.设设为总体为总体的一个样本的一个样本是是的一个点估计的一个点估计构造统计量:构造统计量:因此使概率对称的区间:因此使概率对称的区间:由于由于分布无对称性,分布无对称性,即:即:211-91由由分布表的构造分布表的构造置信区间置信区间:即即221-91两个正态总体参数的区间估计分别是这两个样本的均值分别是这两个样本的均值,且且 X 与与 Y 独立独立,X1,X2,是取自是取自X 的样本的样本,Y 的样本的样本,分别是这两个样本的样本方差分别是这两个样本的样本方差,则有则有Y1,Y2,是取自是取自和和 231-91和和 已知,已知,的置信区间的置信区间 独立独立 1.两个正态均值差两个正态均值差 的置信区间的置信区间241-91251-91未知,未知,的置信区间的置信区间 261-91271-91281-91291-91301-91二、两个总体方差比二、两个总体方差比 的置信区间的置信区间 (仅讨论(仅讨论 未知的情况)未知的情况)311-91321-91331-91 上述置信区间中置信限都是双侧的,但上述置信区间中置信限都是双侧的,但对于有些实际问题,人们关切的只是参数在对于有些实际问题,人们关切的只是参数在一个方向的界限一个方向的界限.例如对于设备、元件的运用寿命来说,平均例如对于设备、元件的运用寿命来说,平均寿命过长没什么问题,过短就有问题了寿命过长没什么问题,过短就有问题了.这时,可将置信上限取这时,可将置信上限取为为+,而只着眼于置信下,而只着眼于置信下限,这样求得的置信区间叫限,这样求得的置信区间叫单侧置信区间单侧置信区间.三、单侧置信区间341-91于是引入单侧置信区间和置信限的定义:于是引入单侧置信区间和置信限的定义:满足满足设设 是是 一个待估参数,给定一个待估参数,给定 若由样本若由样本X1,X2,Xn确定的统计量确定的统计量则称区间则称区间 是是 的置信水平为的置信水平为 的的单侧置信区间单侧置信区间.称为单侧置信下限称为单侧置信下限.351-91又若统计量又若统计量 满足满足则称区间则称区间 是是 的置信水平为的置信水平为 的的单侧置信区间单侧置信区间.称为单侧置信上限称为单侧置信上限.361-91设灯泡寿命服从正态分布设灯泡寿命服从正态分布.求灯泡寿命均求灯泡寿命均值值 的置信水平为的置信水平为0.95的单侧置信下限的单侧置信下限.例例4 从一批灯泡中随机抽取从一批灯泡中随机抽取5只作寿命试只作寿命试验,测得寿命验,测得寿命X(单位:小时)如下:(单位:小时)如下:1050,1100,1120,1250,1280由于方差由于方差 未知,未知,解:解:的点估计取为样本均值的点估计取为样本均值 选取统计量为371-91 对给定的置信水平对给定的置信水平 ,确定分位数,确定分位数使使即即于是得到于是得到 的置信水平为的置信水平为 的单侧置的单侧置信区间为信区间为 381-91 将样本值代入得将样本值代入得的置信水平为的置信水平为0.95的单侧置信下限是的单侧置信下限是1065小时小时的置信水平为的置信水平为 的单侧置信下限为的单侧置信下限为即即391-91例例5 5 为估计制造某种产品所须要的单件平均工时为估计制造某种产品所须要的单件平均工时(单位:小时),现制造(单位:小时),现制造5 5件,记录每件所需工时如下件,记录每件所需工时如下10.5 11.0 11.2 12.5 12.810.5 11.0 11.2 12.5 12.8假设制造单位产品所需工时假设制造单位产品所需工时试求平均工时的置信水平为试求平均工时的置信水平为0.950.95的单侧置信上限的单侧置信上限.解解 由于由于,其中其中未知未知,因此因此401-91对于给定的对于给定的,由由分布的上分布的上 分位点的定义分位点的定义,存在存在,使得使得而而,所以所以,411-91即即 故故的单侧置信区间为的单侧置信区间为单侧置信上限为单侧置信上限为421-91,经计算得经计算得,由由,得得从而可得单侧置信上限从而可得单侧置信上限因此因此,加工这种产品的平均工时不超过加工这种产品的平均工时不超过12.5512.55小时小时的牢靠程度是的牢靠程度是95%.95%.431-91单正态总体的区间估计被估参数条件统计量(枢轴变量)置信区间 已知 2 未知2 441-91被估参数条件统计量(枢轴变量)置信区间 2已知 2未知451-91被估参数条件统计量(枢轴变量)已知12与22 未知12和22未知1和2双正态总体的区间估计置信区间461-91单正态总体的单侧区间估计被估参数条件单侧置信上限单侧置信下限 已知 2 未知2 471-91被估参数条件单侧置信上限单侧置信下限 2已知 2未知481-91被估参数条件单侧置信上限已知12与22 未知12和22未知1和2双正态总体的单侧区间估计单侧置信下限491-91非正态总体参数的区间估计 对于非正态总体,(除具有可加性外)精确对于非正态总体,(除具有可加性外)精确的抽样分布很难求出,进行参数的区间估计比较的抽样分布很难求出,进行参数的区间估计比较困难,在大样本条件下,可以求出某些统计量的困难,在大样本条件下,可以求出某些统计量的近似分布,本质归于正态近似分布,本质归于正态501-91例题例题p72511-91