《概率论与数理统计教程-朱庆峰》第6章参数估计.ppt
6.6 区间估计一、区间估计基本概念一、区间估计基本概念二、正态总体均值与方差的区间估计二、正态总体均值与方差的区间估计三、小结三、小结 引言引言 前面,我们讨论了参数点估计前面,我们讨论了参数点估计.它它是用样本算得的一个值去估计未知参数是用样本算得的一个值去估计未知参数.但是,点估计值仅仅是未知参数的一个但是,点估计值仅仅是未知参数的一个近似值,它没有反映出这个近似值的误近似值,它没有反映出这个近似值的误差范围,使用起来把握不大差范围,使用起来把握不大.区间估计区间估计正好弥补了点估计的这个缺陷正好弥补了点估计的这个缺陷.我们希望我们希望一、区间估计基本概念1.置信区间的定义置信区间的定义2.单侧单侧置信上(下)限的定义置信上(下)限的定义关于定义的说明关于定义的说明例如例如 一旦有了样本,就把一旦有了样本,就把 估计在区间估计在区间内内.这里有两个要求这里有两个要求:由定义可见,由定义可见,对参数对参数 作区间估计,就是要设法找出作区间估计,就是要设法找出两个只依赖于样本的界限两个只依赖于样本的界限(构造统计量构造统计量)2.估计的精度要尽可能的高估计的精度要尽可能的高.如要求区间如要求区间长度长度 尽可能短,或能体现该要求的其尽可能短,或能体现该要求的其它准则它准则.1.要求要求 以很大的可能被包含在区间以很大的可能被包含在区间内,就是说,概率内,就是说,概率 要尽可能大要尽可能大.即要求估计尽量可靠即要求估计尽量可靠.可靠度与精度是一对矛盾,可靠度与精度是一对矛盾,一般是在保证可靠度的条件下一般是在保证可靠度的条件下尽可能提高精度尽可能提高精度.3.求置信区间的一般步骤求置信区间的一般步骤(共共3步步)二、正态总体均值与方差的区间估计1.I 单个总体单个总体的情况的情况推导过程如下推导过程如下:这样的置信区间常写成这样的置信区间常写成其置信区间的长度为其置信区间的长度为 包糖机某日开工包了包糖机某日开工包了1212包糖包糖,称得重量称得重量(单单位位:克克)分别为分别为506,500,495,488,504,486,505,506,500,495,488,504,486,505,513,521,520,512,485.513,521,520,512,485.假设重量服从正态分布假设重量服从正态分布,解解例例1查表得查表得例 设总体为正态分布N(,1),为得到 的置信水平为0.95的置信区间长度不超过1.2,样本容量应为多大?推导过程如下推导过程如下:解解 有一大批糖果有一大批糖果,现从中随机地取现从中随机地取16袋袋,称得称得重量重量(克克)如下如下:设袋装糖果的重量服从正态分布设袋装糖果的重量服从正态分布,试求总体均值试求总体均值例例2就是说估计袋装糖果重量的均值在就是说估计袋装糖果重量的均值在500.4克与克与507.1克之间克之间,这个估计的可信程度为这个估计的可信程度为95%.这个误差的可信度为这个误差的可信度为95%.例 假设轮胎的寿命服从正态分布。为估计某种轮胎的平均寿命,现随机地抽12只轮胎试用,测得它们的寿命(单位:万公里)如下:4.68 4.85 4.32 4.85 4.61 5.025.20 4.60 4.58 4.72 4.38 4.70 此处正态总体标准差未知,可使用t分布求均值的置信区间。经计算有 =4.7092,s2=0.0615。取=0.05,查表知t0.975(11)=2.2010,于是平均寿命的0.95置信区间为(单位:万公里)在实际问题中,由于轮胎的寿命越长越好,因此可以只求平均寿命的置信下限,也即构造单边的置信下限。由于 由不等式变形可知 的1-置信下限为 将t0.95(11)=1.7959代入计算可得平均寿命 的0.95置信下限为4.5806(万公里)。推导过程如下推导过程如下:根据根据2进一步可得进一步可得:注意注意:在密度函数不对称时在密度函数不对称时,习惯上仍取对称的分位点来习惯上仍取对称的分位点来确定置信区间确定置信区间(如图如图).(续例续例2)求例求例2 2中总体标准差中总体标准差 的置信度为的置信度为0.950.95的置信区间的置信区间.解解代入公式得标准差的置信区间代入公式得标准差的置信区间例例5 在样本容量充分大时,可以用渐近分布来构造近似的置信区间。一个典型的例子是关于比例p 的置信区间。3.大样本置信区间 设x1,xn是来自b(1,p)的样本,有 对给定,通过变形,可得到置信区间为 其中记=u21-/2,实用中通常略去/n项,于是可将置信区间近似为例 对某事件A作120次观察,A发生36次。试给出事件A发生概率p 的0.95置信区间。解:此处n=120,=36/120=0.3 而u0.975=1.96,于是p的0.95(双侧)置信下限和上限分别为 故所求的置信区间为 0.218,0.382II 两个正态总体下的置信区间 设x1,xm是来自N(1,12)的样本,y1,yn是来自N(2,22)的样本,且两个样本相互独立。与 分别是它们的样本均值,和 分别是它们的样本方差。下面讨论两个均值差和两个方差比的置信区间。一、一、1-2的置信区间的置信区间1、12和 22已知时的两样本u区间 2、12=22=2未知时的两样本t区间 3、22/12=c已知时的两样本t区间 4、当m和n都很大时的近似置信区间 5、一般情况下的近似置信区间 其中 例 为比较两个小麦品种的产量,选择18块条件相似的试验田,采用相同的耕作方法作试验,结果播种甲品种的8块试验田的亩产量和播种乙品种的10块试验田的亩产量(单位:千克/亩)分别为:甲品种 628 583 510 554 612 523 530 615 乙品种 535 433 398 470 567 480 498 560 503 426 假定亩产量均服从正态分布,试求这两个品种平均亩产量差的置信区间.(=0.05)。解:以x1,x8记甲品种的亩产量,y1,y10记乙品种的亩产量,由样本数据可计算得到 =569.3750,sx2=2140.5536,m=8 =487.0000,sy2=3256.2222,n=10 下面分两种情况讨论。(1)若已知两个品种亩产量的标准差相同,则可采用两样本t区间。此处 故1-2的0.95置信区间为(2)若两个品种亩产量的方差不等,则可采用近 似 t 区间。此处 s02=2140.5536/8+3256.2222/10=593.1914,s0=24.3555 于是1-2的0.95近似置信区间为 31.74,134.02二、12/22的置信区间 由于(m-1)sx2/12 2(m-1),(n-1)sy2/22 2(n-1),且sx2与sy2相互独立,故可仿照F变量构造如下枢 轴量 ,对给定的1-,由 经不等式变形即给出 12/22的如下的置信区间例 某车间有两台自动机床加工一类套筒,假设套筒直径服从正态分布。现在从两个班次的产品中分别检查了5个和6个套筒,得其直径数据如下(单位:厘米):甲班:5.06 5.08 5.03 5.00 5.07 乙班:4.98 5.03 4.97 4.99 5.02 4.95 试求两班加工套筒直径的方差比 甲2/乙2的0.95置信区间。解:由数据算得sx2=0.00107,sx2=0.00092,故置信区间0.1574,10.8899 三、小结 点估计不能反映估计的精度点估计不能反映估计的精度,故而本故而本节引入了区间估计节引入了区间估计.求置信区间的一般步骤求置信区间的一般步骤(分三步分三步).正态总体均值与方差的区间估计正态总体均值与方差的区间估计但n充分大时近似置信区间