应用数理统计参数估计区间估计.ppt
1,为了估计总体X 的未知参数 ,前面已经介绍了矩估计 法和极大似然估计法由于总体X的未知参数 的估计量 是随机变量,无论这个估计量的性质多么好,它只能是未知 参数的近似值,而不是 的真值并且样本不同,所得到的 估计值也不同那么 的真值在什么范围内呢?是否能通 过样本,寻求一个区间,并且给出此区间包含参数 真值的 可信程度这就是总体未知参数的区间估计问题,24 区间估计,2,定义1 设总体X的分布函数F(x;)含有一个未知参数,对于给定值 (0<<1),若由样本X1, X2, ,Xn确定的两个统计量 和 满足,则称随机区间 是 的置信度为 的置信区间,和 分别称为置信度为 的双侧置信区间的置信下 限与置信上限, 称为置信水平(置信度),2.4.1 区间估计的一般步骤,这种估计 的方法叫做区间估计.,评价一置信区间 好坏的两个标准:,1)精度: 越小越好;,2)置信度: 越大越好.,3,)当是连续型随机变量时,对于给定的,我们总是按要求:,求出置信区间,注,)当是离散型随机变量时,对于给定的 ,常常找不到区间使得 恰好为此时我们去找使得尽可能地接近,4,区间估计的一般步骤:,1.给出“好”的点估计(按前面的标准),并知道它的分布(只依赖待估的未知参数); 2.求一个区间(参数的一个邻域) 或 ,使得对于给定的置信水平, 且一般要求区间长尽可能小。 将不等式变形得到等价的形式 其中g ( x )为可逆的已知函数, 的分布已知且与无关。,5,对于给定的(0<<1),令,设总体XN(,2),X1, X2, ,Xn是总体X的样本,求,2 的置信水平为(1)的置信区间.,2.4.2 单个正态总体的情况, 均值 的置信区间,(a) 2为已知时,因为,求得 的置信度水平为(1)的置信区间: (2为已知),或,6,(b) 2为未知时,因为S 2是 2的点估计量,所以用S替换 ,求得 的置信水平为(1)的置信区间: ( 2未知),7,1) 例如当=0.05 时,即1-=0.95,查表得,于是得到 的置信水平为0.95 的置信区间:,即,即(4.71,5.69)这时已不是随机区间,说明 的真值含在,(4.71,5.69)的可信程度为95%.,2)若样本值为 ,则得到一个置信区间,3)置信水平为(1)的置信区间不唯一.如上例=0.05,可证,又若 =1,n=16,置信区间长度越短表示估计的精度越高.,8,例1 有一大批月饼,现从中随机地取16袋,称得重量(以克计)如下:506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496 ,设袋装月饼的重量近似地服从正态分布,试求总体均值的置信度为0.95的置信区间。,解: 2未知, 1-=0.95, /2=0.025,n-1=15,由公式(2)得均值的置信度为0.95的置信区间为,即(500.4, 507.1),这就是说估计袋装月饼重量的均值在500.4与507.1之间,这个估计的可信程度为95%。若以此区间内任一值作为 的近似值,其误差不大于 (克),这个误差估计的可信程度为95%。,由已知的数据算得,9, 2的无偏估计量为S*2 ,,(只介绍 未知的情况),当1- 给定后,因为,即,得到方差 2 的一个置信度为1- 的置信区间:,(2)方差 2 的置信区间,标准差 的一个置信度为1- 的置信区间,10,例2 有一大批糖果,现从中随机地取16袋,称得重量(以克计) 如下:506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496 ,设袋装糖果的重量近似地服从正态分布, 试求总体标准差 的置信度为0.95的置信区间。,11,2.4.3 两个正态总体参数的区间估计,例2.27 有A、B,两种牌号的灯泡各一批, A、B种,灯泡的寿命是独立的且分别服从,.希望通过抽样试验并进行区间估计,,考察:,()两种灯泡的寿命是否有明显差异; ()两种灯泡的质量稳定性是否有明显差异.,在实际中常遇到下面的问题:已知产品的某一质量指标服从正态分布,但由于原料、设备条件、操作人员不同,或工艺过程的改变等因素,引起总体均值、总体方差有所改变,我们需要知道这些变化有多大,这就需要考虑两个正态总体均值差或方差比的估计问题。,12,1两个总体均值差,的置信区间,(a),和,已知,求,的置信区间,相互独立,13,(b) ,但 为未知.,从而可得 的一个置信度为 的置信区间为,由定理1.15, 时,,14,例2.28,在例2.27中,随机选取A种灯泡5只,B种灯泡7只,做灯泡寿命实验,算得两种牌号的平均寿命分别为1000和980小时,样本方差分别为784和1024小时2.取置信度0.99,希望进行区间估计.,考察:,()两种灯泡的寿命是否有明显差异; ()两种灯泡的质量稳定性是否有明显差异.,15,仅讨论总体均值1 ,2 为未知的情况。,(2) 两个总体方差比 的置信区间,由于,于是得 的一个置信度为 的置信区间为,16,例 研究由机器A和机器B生产的钢管的内径,随机抽取机器A生产的管子18只,测得样本方差 ;抽取机器生产的管子13只,测得样本方差 。设两样本相互独立,且设由机器A、机器B生产的管子的内径分别服从正态分布 ,这里 均未知。试求方差比 的置信度为0.90的置信区间。,即(0.45, 2.79),由于 的置信区间包含1,在实际中我们就认为 两者没有显著差别。,解 现在,17,*单侧置信区间,定义 设总体 的分布函数为 ,其中 是未知参数, 为总体 的样本,给定 ,如果存在统计量 满足: ,则称随机区间 是 的置信水平为 的单侧置信区间, 称为单侧置信下限, 称为置信水平或置信度。,如果存在统计量 ,满足 则称随机区间 是 的置信水平为 的单侧置信区间, 称为单侧置信上限。,18,例 从某批灯泡中随机地取5只作寿命试验测得其寿命(单位:h)如下: 1050 1100 1120 1250 1280 设灯泡的寿命服从正态分布,试求均值的置信度为0.95的单侧置信区间(1 , +) ,解 设灯泡寿命为 ,由于 由 = 0.95查表得 ,使得 , 即 ,,19,20,记 ,置信水平为 ,则, 例2.29 大样本场合下非正态总体均值的区间估计,由中心极限定理知,只要 n 充分大,近似地有:,当 已知时, 的置信区间为,当 未知时, 的置信区间为,2.4.4 非正态总体参数的区间估计,21,X1, X2, ,Xn ( n 50)是X的大样本,求p 的置信度为(1) 的置信区间.,2.4.4 非正态总体参数的区间估计, 例2.30 设总体Xb(1, p), p为未知参数, X的分布律为,由中心极限定理,知,已知 (0-1)分布的均值和方差分别为,于是有,近似,N(0,1),22,记,而不等式,等价于,此处,于是得 p 的近似的置信度为(1) 置信区间为:,23,解 一级品率 p是(0-1)分布的参数,此处 按(5.7)、( 5.8)式来求p 的置信区间,其中,例2.31 设自一大批产品的100个样品中,得一级品60个,求这批产品的一级品率p 的置信度为0.95的置信区间。,而,故得 p 的置信度为0.95的近似置信区间为(0.50, 0.69).,24,置信水平为 的置信区间为,设总体 服从参数为 的指数分布,又有,例2.32 指数分布参数的置信区间,为来自总体的样本,据作业1.8得参数的,总体均值 的置信水平为 的置信区间为,25,区间估计的基本思想: 用两个统计量决定一个区间 ,作为参数 的取值范围的估计,要求(1)具有一定的精度; (2)可信程度。 在样本容量一定时,两者显然不能同时达到最理想的状态。一般作法,先固定可信程度在一定的水平之下,求得精度尽可能高的估计区间(区间尽可能小)。,26,2.2, 2.6(ii v), 2.10 2.12 2.13 2.22 2.24 2.25,作业:,