区间估计.ppt
《区间估计.ppt》由会员分享,可在线阅读,更多相关《区间估计.ppt(91页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、区间估计区间估计 区间估计的概念 定义 设 是总体的一个参数,其参数空间为,x1,x2,xn是来自该总体的样本,对给定的一个(0 1),若有两个统计量 和 ,若对任意的 ,有 则称 为 的置信度为 1-1-的置信区间,分别称为置信下限和置信上限例 设x1 1,x2 2 ,x1010是来自N(,2 2)的样本,则 的置信水平为1-的置信区间为 其中,,s 分别为样本均值和样本标准差。这里用它来说明置信区间的含义。若取=0.10,则t0.950.95(9)=1.8331,上式化为 现假定=15,2 2=4,则我们可以用随机模拟方法由N(15,4)产生一个容量为10的样本,如下即是这样一个样本:14
2、.85 13.01 13.50 14.93 16.97 13.80 17.9533 13.37 16.29 12.38 由该样本可以算得 从而得到 的一个区间估计为 该区间包含 的真值-15。现重复这样的方法 100次,可以得到100个样本,也就得到100个区 间,我们将这100个区间画在图6.5.1上。由图由图6.5.16.5.1可可以看出,以看出,这这100100个个区间中区间中有有9191个个包含参包含参数真值数真值1515,另,另外外9 9个不个不包含参包含参数真值。数真值。图6.5.1 的置信水平为0.90的置信区间 取取=0.50=0.50,我们也我们也可以给出可以给出100100
3、个这样个这样的区间,的区间,见图见图6.5.26.5.2。可以看出,可以看出,这这100100个区个区间中有间中有5050个包含参个包含参数真值数真值1515,另外,另外5050个不包含个不包含参数真值。参数真值。图6.5.2 的置信水平为0.50的置信区间 定义 沿用定义1的记号,如对给定的(0 1),对任意的,有 称 为 的1-同等置信区间。同等置信区间是把给定的置信水平1-用足了。常在总体为连续分布场合下可以实现。定义定义 若对给定的(0 1)和任意的,有 ,则称 为 的置信水平为1-的(单侧)置信下限。假如等号对一切成立,则称 为 的1-同等置信下限。若对给定的(0 1)和任意的,有
4、,则称 为 的置信水平为1-的(单侧)置信上限。若等号对一切成立,则称 为1-同等置信上限。单侧置信限是置信区间的特殊情形。因此,寻求置信区间的方法可以用来寻找单侧置信限。枢轴量法 构造未知参数构造未知参数 的置信区间的最常用的方法是的置信区间的最常用的方法是枢轴枢轴量法,量法,其步骤可以概括为如下三步:其步骤可以概括为如下三步:1.1.设法构造一个样本和设法构造一个样本和 的函数的函数 G G=G G(x x1 1,x,x2 2 ,x xn n,)使得使得G G的分布不依赖于未知参数。一般称具的分布不依赖于未知参数。一般称具有这种性质的有这种性质的G G为枢轴量。为枢轴量。2.2.适当地选择
5、两个常数适当地选择两个常数c,dc,d,使对给定的使对给定的 (0(0 1)1)有有P P(c c G G d d)=1)=1-3.3.假如能将假如能将c cG G d d 进行不等式等价变形化为进行不等式等价变形化为 则则 ,是是 的的1-1-同等置信区间。同等置信区间。关于置信区间的构造有两点说明:满足置信度要求的c与d通常不唯一。若有可能,应选平均长度 达到最短的c与d,这在G的分布为对称分布场合通常容易实现。实际中,选平均长度 尽可能短的c与d,这往往很难实现,因此,常这样选择 c与d,使得两个尾部概率各为/2,即P(Gd)=/2,这样的置信区间称为等尾置信区间。这是在G的分布为偏态分
6、布场合常采用的方法。例 设x1 1,x2 2 ,xn n是来自均匀总体U(0,)的一个样本,试对给定的(0 1)给出 的1-同等置信区间。解:(1)取x(n)作为枢轴量,其密度函数为p(y;)=nyn,0y 1;(2)x(n)/的分布函数为F(y)=yn,0y 1,故P(cx(n)/d)=d n-cn,因此我们可以适当地选择c和d满足d n-cn=1-(3)利用不等式变形可容易地给出 的1-同等置信区间为x(n n)/d,x(n n)/c,该区间的平均长度为 。不难看出,在0cd1及dn-cn=1-的条件下,当d=1,c=时,取得最小值,这说明 是 的置信水平1-为最短置信区间。单个正态总体参
7、数的置信区间 一、一、一、一、已知时已知时已知时已知时 的置信区间的置信区间的置信区间的置信区间 在这种情况下,枢轴量可选为在这种情况下,枢轴量可选为 ,c c和和d d应满足应满足P P(c c G G d d)=)=(d d)-(c c)=)=1 1-,经过不等经过不等式变形可得式变形可得 该区间长度为该区间长度为 。当。当d d=-c c=u u1 1-/2/2时,时,d d-c c达到最小,由此给出了的同等置信区间为达到最小,由此给出了的同等置信区间为 ,。(6.5.86.5.8)这是一个以这是一个以 为中心,半径为为中心,半径为 的对称的对称区间,常将之表示为区间,常将之表示为 。例
8、 用天平秤某物体的重量9次,得平均值为 (克),已知天平秤量结果为正态分布,其标准差为0.1克。试求该物体重量的0.95置信区间。解:此处1-=0.95,=0.05,查表知u0.9750.975=1.96,于是该物体重量 的0.95置信区间为 ,从而该物体重量的0.95置信区间为 15.3347,15.4653。例 设总体为正态分布N(,1),为得到 的置信水平为0.95的置信区间长度不超过1.2,样本容量应为多大?解:由题设条件知 的0.95置信区间为 其区间长度为 ,它仅依赖于样本容量n而与样本具体取值无关。现要求 ,立即有n(2/1.2)2 2u2 21 1-/2/2.现1-=0.95,
9、故u1 1-/2/2=1.96,从而n(5/3)2 2 1.962 2=10.6711。即样本容量至少为11时才能使得 的置信水平为0.95的置信区间长度不超过1.2。二、2未知时 的置信区间 这时可用t 统计量,因为 ,因此 t 可以用来作为枢轴量。完全类似于上一小节,可得到 的1-置信区间为 此处 是 2的无偏估计。例 假设轮胎的寿命服从正态分布。为估计某种轮胎的平均寿命,现随机地抽12只轮胎试用,测得它们的寿命(单位:万公里)如下:4.68 4.85 4.32 4.85 4.61 5.025.20 4.60 4.58 4.72 4.38 4.70 此处正态总体标准差未知,可使用t分布求均
10、值的置信区间。经计算有 =4.7092,s2 2=0.0615。取=0.05,查表知t0.9750.975(11)=2.2010,于是平均寿命的0.95置信区间为(单位:万公里)在实际问题中,由于轮胎的寿命越长越好,因此可以只求平均寿命的置信下限,也即构造单边的置信下限。由于 由不等式变形可知 的1-置信下限为 将t0.950.95(11)=1.7959代入计算可得平均寿命 的0.95置信下限为4.5806(万公里)。三、2的置信区间 取枢轴量 ,由于 2 2分布是偏态分布,寻找平均长度最短区间很难实现,一般都用等尾置信区间:采用 2 2的两个分位数 2 2 /2/2(n-1)和2 21-1-
11、/2/2(n-1),在 2 2分布两侧各截面积为/2的部分,使得 由此给出 2 2的1-置信区间为 例例 某厂生产的零件重量服从正态分布某厂生产的零件重量服从正态分布N N(,2 2),现从该厂生产的零件中抽现从该厂生产的零件中抽取取9 9个,测得其重量个,测得其重量为(单位:克)为(单位:克)45.3 45.4 45.1 45.3 45.5 45.7 45.4 45.3 45.3 45.4 45.1 45.3 45.5 45.7 45.4 45.3 45.645.6 试求总体标准差试求总体标准差 的的0.950.95置信区间。置信区间。解:解:由数据可算得由数据可算得 s s2 2=0.03
12、25=0.0325,(n n-1)1)s s2 2=8=8 0325=0.26.0325=0.26.查表知查表知 2 2 0.0250.025(8)(8)=2.1797=2.1797,2 20.9750.975(8)(8)=17.5345=17.5345,代入可得代入可得 2 2的的0.950.95置信区间为置信区间为 从而从而 的的0.950.95置信区间为置信区间为:0.12180.1218,0.34540.3454。在样本容量充分大时,可以用渐近分布来构造近似的置信区间。一个典型的例子是关于比例p 的置信区间。6 大样本置信区间 设x1,xn是来自b(1,p)的样本,有 对给定,通过变形
13、,可得到置信区间为 其中记=u21-/2,实用中通常略去/n项,于是可将置信区间近似为例6.对某事件A作120次观察,A发生36次。试给出事件A发生概率p 的0.95置信区间。解:此处n=120,=36/120=0.3 而u0.9750.975=1.96,于是p的0.95(双侧)置信下限和上限分别为 故所求的置信区间为 0.218,0.382例6.某传媒公司欲调查电视台某综艺节目收视率p,为使得 p 的1-置信区间长度不超过d0 0,问应调查多少用户?解:这是关于二点分布比例p的置信区间问题,由(6.5.11)知,1-的置信区间长度为 这是一个随机变量,但由于 ,所以对任意的观测值有 。这也就
14、是说p的1-的置信区间长度不会超过 。现要求p的的置信区间长度不超过d0,只需要 即可,从而 (6.5.12)这是一类常见的寻求样本量的问题。比如,若取d0 0=0.04,=0.05,则 。这表明,要使综艺节目收视率p的0.95置信区间的长度不超过0.04,则需要对2401个用户作调查。两个正态总体下的置信区间 设x1 1 ,xmm是来自N(1 1,1 12 2)的样本,y1 1 ,yn n是来自N(2 2,2 22 2)的样本,且两个样本相互独立。与 分别是它们的样本均值,和 分别是它们的样本方差。下面讨论两个均值差和两个方差比的置信区间。一、1-2的置信区间1、12和 22已知时的两样本u
15、区间 2、12=22=2未知时的两样本t区间 3、22/12=已知时的两样本t区间 4、当m和n都很大时的近似置信区间 5、一般情况下的近似置信区间 其中 例 为比较两个小麦品种的产量,选择18块条件相似的试验田,采用相同的耕作方法作试验,结果播种甲品种的8块试验田的亩产量和播种乙品种的10块试验田的亩产量(单位:千克/亩)分别为:甲品种 628 583 510 554 612 523 530 615 乙品种 535 433 398 470 567 480 498 560 503 426 假定亩产量均服从正态分布,试求这两个品种平均亩产量差的置信区间.(=0.05)。解:以x1 1 ,x8 8
16、记甲品种的亩产量,y1 1,y1010记乙品种的亩产量,由样本数据可计算得到 =569.3750,sx x2 2=2140.5536,m=8 =487.0000,sy y2 2=3256.2222,n=10 下面分两种情况讨论。(1)若已知两个品种亩产量的标准差相同,则可采用两样本t区间。此处 故1 1 -2 2的0.95置信区间为(2)若两个品种亩产量的方差不等,则可采用近 似 t 区间。此处 s0 02 2=2110.5536/8+3256.2222/10=589.4414,s0 0=24.2784 于是1 1-2 2的0.95近似置信区间为 31.3685,133.3815二、12/22
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 区间 估计
限制150内