《概率统计正态总体的区间估计.ppt》由会员分享,可在线阅读,更多相关《概率统计正态总体的区间估计.ppt(35页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、现在学习的是第1页,共35页 引言引言 前面,我们讨论了参数点估计前面,我们讨论了参数点估计.它是用样它是用样本算得的一个值去估计未知参数本算得的一个值去估计未知参数.但是,点但是,点估计值仅仅是未知参数的一个近似值,它估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误差范围,使用没有反映出这个近似值的误差范围,使用起来把握不大起来把握不大.区间估计正好弥补了点估区间估计正好弥补了点估计的这个缺陷计的这个缺陷.现在学习的是第2页,共35页 譬如,在估计湖中鱼数的问题中,若我们譬如,在估计湖中鱼数的问题中,若我们根据一个实际样本,得到鱼数根据一个实际样本,得到鱼数N的极大似然的极大似然
2、估计为估计为1000条条.若我们能给出一个区间,在此区间内我们合若我们能给出一个区间,在此区间内我们合理地相信理地相信 N 的真值位于其中的真值位于其中.这样对鱼数的这样对鱼数的估计就有把握多了估计就有把握多了.实际上,实际上,N的真值可能大于的真值可能大于1000条,条,也可能小于也可能小于1000条条.现在学习的是第3页,共35页也就是说,我们希望确定一个区间,使我们能也就是说,我们希望确定一个区间,使我们能以比较高的以比较高的可靠程度可靠程度相信它包含真参数值相信它包含真参数值.湖中鱼数的真值湖中鱼数的真值 这里所说的这里所说的“可靠程度可靠程度”是用概率来度量的,称是用概率来度量的,称
3、为置信概率,置信度或置信水平为置信概率,置信度或置信水平.习惯上把置信水平记作习惯上把置信水平记作,这里,这里 是一个是一个很小的正数很小的正数.现在学习的是第4页,共35页置信水平的大小是根据实际需要选定的置信水平的大小是根据实际需要选定的.例如,通常可取置信水平例如,通常可取置信水平 =0.95或或0.9等等.根据一个实际样本,由给定的置信水平,我根据一个实际样本,由给定的置信水平,我小的区间小的区间 ,使,使们求出一个尽可能们求出一个尽可能置信水平为置信水平为 的的置信区间,其中置信区间,其中 为两个统计量为两个统计量.称区间称区间 为为 的的现在学习的是第5页,共35页 寻找置信区间的
4、方法寻找置信区间的方法,一般是从确定一般是从确定误差误差限限入手入手.使得使得称称 为为 与与 之间的误差限之间的误差限.我我们们选选取取未未知知参参数数的的某某个个估估计计量量 ,根根据置信水平据置信水平 ,可以找到一个正数,可以找到一个正数 ,只要知道只要知道 的概率分布,确定误差限并不难的概率分布,确定误差限并不难.现在学习的是第6页,共35页 下面我们就来正式给出置信区间的定义下面我们就来正式给出置信区间的定义,并通过并通过例子说明求置信区间的方法例子说明求置信区间的方法.由不等式由不等式可以解出可以解出 :这个不等式就是我们所求的置信区间这个不等式就是我们所求的置信区间.现在学习的是
5、第7页,共35页前面已经给出了概率分布的上侧分位数(分位点)前面已经给出了概率分布的上侧分位数(分位点)的定义,为便于应用,这里我们再简要复习一下的定义,为便于应用,这里我们再简要复习一下.在求置信区间时,要查表求分位数在求置信区间时,要查表求分位数.设设0 1,对随机变量对随机变量X,称满足,称满足的点的点 为为X的概率分布的上的概率分布的上 分位数分位数.现在学习的是第8页,共35页例如例如:标准正态分布的标准正态分布的上上 分位数分位数现在学习的是第9页,共35页例如例如:分布的上分布的上 分位数分位数自由度为自由度为n的的现在学习的是第10页,共35页F分布的上分布的上 分分位数位数自
6、由度为自由度为n1,n2的的现在学习的是第11页,共35页 书书末末附附有有 分分布布、t 分分布布、F分分布布的的上上侧侧分分位位数数表表,供供使使用用.需需要要注注意意的的事事项项在在教教材上有说明材上有说明.至于如何由标准正态分布函数表查表求得分至于如何由标准正态分布函数表查表求得分位数,若你对分布函数定义熟悉的话,这个问位数,若你对分布函数定义熟悉的话,这个问题不难解决题不难解决.现在回到置信区间题目上来现在回到置信区间题目上来.现在学习的是第12页,共35页 一、一、置信区间定义:置信区间定义:满足满足设设 是是 一个待估参数,给定一个待估参数,给定若由样本若由样本X1,X2,Xn确
7、定的两个统计量确定的两个统计量则称区间则称区间 是是 的的置信水平置信水平(置信度、(置信度、置信概率)为置信概率)为 的置信区间的置信区间.分别称为置信下限和置信上限分别称为置信下限和置信上限.现在学习的是第13页,共35页 一旦有了样本,就把一旦有了样本,就把 估计在区间估计在区间内内.这里有两个要求这里有两个要求:可见,可见,对参数对参数 作区间估计,就是要设法找出作区间估计,就是要设法找出两个只依赖于样本的界限两个只依赖于样本的界限(构造统计量构造统计量)(X1,Xn)(X1,Xn)现在学习的是第14页,共35页2.估计的精度要尽可能的高估计的精度要尽可能的高.如要求区间如要求区间长度
8、长度 尽可能短,或能体现该要求的其尽可能短,或能体现该要求的其它准则它准则.1.要求要求 以很大的可能被包含在区间以很大的可能被包含在区间内,就是说,概率内,就是说,概率 要尽可能大要尽可能大.即要求估计尽量可靠即要求估计尽量可靠.可靠度与精度是一对矛盾,可靠度与精度是一对矛盾,一般是在保证可靠度的条件下一般是在保证可靠度的条件下尽可能提高精度尽可能提高精度.现在学习的是第15页,共35页N(0,1)选选 的点估计为的点估计为求参数求参数 的置信度为的置信度为 的置信区间的置信区间.(1)设)设X1,Xn是取自是取自 的样本,的样本,二、置信区间的求法二、置信区间的求法 寻找未知参数的寻找未知
9、参数的一个良好估计一个良好估计.解:解:寻找一个待估参数和寻找一个待估参数和估计量的函数估计量的函数,要求,要求其分布为已知其分布为已知.有了分布,就可以求出有了分布,就可以求出U取值于任意区间的概率取值于任意区间的概率.现在学习的是第16页,共35页对给定的置信水平对给定的置信水平查正态分布表得查正态分布表得对于给定的置信水平对于给定的置信水平(大概率大概率),根据根据U的分布,的分布,确定一个区间确定一个区间,使得使得U取值于该区间的概率为取值于该区间的概率为置信水平置信水平.使使为什么为什么这样取这样取?现在学习的是第17页,共35页对给定的置信水平对给定的置信水平查正态分布表得查正态分
10、布表得使使从中解得从中解得现在学习的是第18页,共35页也可简记为也可简记为于是所求于是所求 的的 置信区间为置信区间为现在学习的是第19页,共35页 从解题的过程,我们归纳出求置信区间的一从解题的过程,我们归纳出求置信区间的一般步骤如下般步骤如下:1.明确问题明确问题,是求什么参数的置信区间是求什么参数的置信区间?置信水平置信水平 是多少是多少?2.寻找参数寻找参数 的一个良好的点估计的一个良好的点估计T(X1,X2,Xn)3.寻找一个待估参数寻找一个待估参数 和估计量和估计量T的函数的函数 S(T,),且其分布为已知且其分布为已知.现在学习的是第20页,共35页4.对于给定的置信水平对于给
11、定的置信水平 ,根据,根据S(T,)的分布,确定常数的分布,确定常数a,b,使得,使得 P(a S(T,)b)=5.对对“aS(T,)b”作等价变形作等价变形,得到如下得到如下形式形式:则则 就是就是 的的100()的置信区间的置信区间.现在学习的是第21页,共35页 这里,我们主要讨论总体分布为这里,我们主要讨论总体分布为正态正态的情形的情形.若样本容量很大,即使总体分布未知,应用若样本容量很大,即使总体分布未知,应用中心极限定理,可得总体的近似分布,于是中心极限定理,可得总体的近似分布,于是也可以近似求得参数的区间估计也可以近似求得参数的区间估计.现在学习的是第22页,共35页 某工厂生产
12、的零件长度某工厂生产的零件长度X X被认为服从被认为服从N(N(,0.04),0.04),现从该产品中随机抽取现从该产品中随机抽取6 6个个,其长度的测量其长度的测量值如下值如下(单位毫米单位毫米):):14.6,15.l,14.9,14.8,15.2,15.1.14.6,15.l,14.9,14.8,15.2,15.1.求求:该零件长度的置信系数为该零件长度的置信系数为0.950.95的区间估计的区间估计.n=6,n=6,=0.05,Z=0.05,Z/2/2=Z=Z0.0250.025=1.96=1.96 2 2=0.2=0.22 2.解解:例例1 1现在学习的是第23页,共35页(2)已知
13、已知因方差未知,取因方差未知,取 对给定的置信度对给定的置信度 ,确定分位数确定分位数使使即即先求均值先求均值 的区间估计的区间估计:1、现在学习的是第24页,共35页均值均值 的置信水平为的置信水平为 的区间估计的区间估计.即为即为从中解得从中解得现在学习的是第25页,共35页由于由于从中解得从中解得2 求方差求方差 的置信水平为的置信水平为 的区间估计的区间估计.对给定的置信度对给定的置信度 ,确定分位数确定分位数 使使现在学习的是第26页,共35页于是于是 即为所求即为所求.现在学习的是第27页,共35页 为了估计一件物体的重量为了估计一件物体的重量,将其称了将其称了1O1O次次,得得到
14、的重量到的重量(单位:千克单位:千克)为为:10.l,10,9.8,10.5,9.7,l0.l,9.9,10.l,10,9.8,10.5,9.7,l0.l,9.9,10.2,1O.3,9.910.2,1O.3,9.9 设所称出的物体重量设所称出的物体重量X X服从服从N(N(,2 2).).求求:该物体重量该物体重量 的置信系数为的置信系数为0.950.95的置信区间的置信区间解解:例例2 2 n=10,n=10,=0.05,=0.05,t t10-110-1(/2)=t/2)=t9 9(0.025)=2.2622(0.025)=2.2622现在学习的是第28页,共35页 求求:2 2的置信系
15、数为的置信系数为0.950.95的置信区间的置信区间.解解:例例3(续例续例2)2)n=10,n=10,=0.05,S=0.05,S2 2=0.0583,=0.0583,查附表得查附表得:现在学习的是第29页,共35页三、单侧置信区间三、单侧置信区间 上述置信区间中置信限都是双侧的,但对于上述置信区间中置信限都是双侧的,但对于有些实际问题,人们关心的只是参数在一个方有些实际问题,人们关心的只是参数在一个方向的界限向的界限.例如对于设备、元件的使用寿命来说,平均寿命例如对于设备、元件的使用寿命来说,平均寿命过长没什么问题,过短就有问题了过长没什么问题,过短就有问题了.这时,可将置信上限取为这时,
16、可将置信上限取为+,而只着眼于置信下限,这,而只着眼于置信下限,这样求得的置信区间叫单侧置信样求得的置信区间叫单侧置信区间区间.现在学习的是第30页,共35页于是引入单侧置信区间和置信限的定义:于是引入单侧置信区间和置信限的定义:满足满足设设 是是 一个待估参数,给定一个待估参数,给定 若由样本若由样本X1,X2,Xn确定的统计量确定的统计量则称区间则称区间 是是 的置信水平为的置信水平为 的的单侧置信区间单侧置信区间.称为单侧置信下限称为单侧置信下限.现在学习的是第31页,共35页又若统计量又若统计量 满足满足则称区间则称区间 是是 的置信水平为的置信水平为 的的单侧置信区间单侧置信区间.称
17、为单侧置信上限称为单侧置信上限.现在学习的是第32页,共35页设灯泡寿命服从正态分布设灯泡寿命服从正态分布.求灯泡寿命均求灯泡寿命均值值 的置信水平为的置信水平为0.95的单侧置信下限的单侧置信下限.例例4 从一批灯泡中随机抽取从一批灯泡中随机抽取5只作寿命试只作寿命试验,测得寿命验,测得寿命X(单位:小时)如下:(单位:小时)如下:1050,1100,1120,1250,1280由于方差由于方差 未知,取枢轴量未知,取枢轴量解:解:的点估计取为样本均值的点估计取为样本均值 现在学习的是第33页,共35页 对给定的置信水平对给定的置信水平 ,确定分位数,确定分位数使使即即于是得到于是得到 的置信水平为的置信水平为 的单侧置的单侧置信区间为信区间为 现在学习的是第34页,共35页 将样本值代入得将样本值代入得的置信水平为的置信水平为0.95的单侧置信下限是的单侧置信下限是1065小时小时的置信水平为的置信水平为 的单侧置信下限为的单侧置信下限为即即现在学习的是第35页,共35页
限制150内