数理统计第三章课件吕晓玲.ppt
数理统计数理统计 第第3章章 区间估计区间估计置信区间置信区间正态总体参数的置信区间正态总体参数的置信区间大样本置信区间大样本置信区间数理统计数理统计 统计推断的过程统计推断的过程总体总体总体总体总体均值、总体均值、总体均值、总体均值、比例、方差比例、方差比例、方差比例、方差样样样样本本本本样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量例如:样本均例如:样本均例如:样本均例如:样本均例如:样本均例如:样本均值、比例、方值、比例、方值、比例、方值、比例、方值、比例、方值、比例、方差差差差差差数理统计数理统计 0 0 0 0 引言引言引言引言 前面,我们讨论了参数点估计前面,我们讨论了参数点估计.它是用样本算它是用样本算得的一个值去估计未知参数得的一个值去估计未知参数.但是,点估计值仅仅但是,点估计值仅仅是未知参数的一个近似值,它无法给出这个近似值是未知参数的一个近似值,它无法给出这个近似值的精度(也可用均方误差来刻画),使用起来把握的精度(也可用均方误差来刻画),使用起来把握不大(间接)不大(间接).区间估计正好弥补了点估计的这个区间估计正好弥补了点估计的这个缺陷(可直接给出误差限)缺陷(可直接给出误差限).数理统计数理统计 譬如,在估计湖中鱼数的问题中,若我们譬如,在估计湖中鱼数的问题中,若我们根据一个实际样本,得到鱼数根据一个实际样本,得到鱼数 N 的极大似然估的极大似然估计为计为1000条条.若我们能给出一个区间,在此区间内我们若我们能给出一个区间,在此区间内我们合理地相信合理地相信 N 的真值位于其中的真值位于其中.这样对鱼数的这样对鱼数的估计就有把握多了估计就有把握多了.实际上,实际上,N的真值可能大于的真值可能大于1000条,也可条,也可能小于能小于1000条条.数理统计数理统计 也就是说,我们希望确定一个区间,使我们能也就是说,我们希望确定一个区间,使我们能以比较高的以比较高的可靠程度可靠程度相信它包含真参数值相信它包含真参数值.湖中鱼数的真值湖中鱼数的真值 这里所说的这里所说的“可靠程度可靠程度”是用概率来度量的是用概率来度量的,称为称为置信度置信度或或置信水平置信水平.习惯上把置信水平记作习惯上把置信水平记作,这里,这里 是一个是一个 很小的正数,其大小是根据实际需要选定的很小的正数,其大小是根据实际需要选定的.数理统计数理统计 1、区间估计、区间估计数理统计数理统计 数理统计数理统计 数理统计数理统计 2、回顾分位数、回顾分位数数理统计数理统计 数理统计数理统计 数理统计数理统计 数理统计数理统计 3 3、置信区间置信区间数理统计数理统计 注注1:数理统计数理统计 数理统计数理统计 这里有两个要求这里有两个要求:注注2:对参数对参数 作区间估计,就是要设法找出两个作区间估计,就是要设法找出两个只依赖于样本的界限只依赖于样本的界限(构造统计量构造统计量).数理统计数理统计 可靠度与精度是一对矛盾,一般是可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高在保证可靠度的条件下尽可能提高精度精度.1.要求要求 以很大的可能被包含在区间以很大的可能被包含在区间内,就是说,概率内,就是说,概率 要尽可能大要尽可能大.即要求估计尽量可靠即要求估计尽量可靠.2.估计的精度要尽可能的高估计的精度要尽可能的高.如要求区间长度如要求区间长度 尽可能短,或能体现该要求的其它准则尽可能短,或能体现该要求的其它准则.数理统计数理统计 4、同等置信区间、同等置信区间数理统计数理统计 N(0,1)选选 的点估计为的点估计为 ,求参数求参数 的置信度为的置信度为 的置信区间的置信区间.例例1 设设X1,Xn是取自是取自 的样本,的样本,明确问题明确问题,是求什么是求什么参数的置信区间参数的置信区间?置信水平是多少?置信水平是多少?寻找未知参寻找未知参数的一个良数的一个良好估计好估计.解解 寻找一个待估参数和寻找一个待估参数和统计量的函数统计量的函数,要求,要求其分布为已知其分布为已知.有了分布,就可以求出有了分布,就可以求出U取值于任意区间的概率取值于任意区间的概率.5、置信区间的求法、置信区间的求法数理统计数理统计 从中解得从中解得对给定的置信水平对给定的置信水平查正态分布表得查正态分布表得使使数理统计数理统计 也可简记为也可简记为于是所求于是所求 的的 置信区间为置信区间为数理统计数理统计 从例从例1解题的过程,我们归纳出求置信区间解题的过程,我们归纳出求置信区间的一般步骤如下的一般步骤如下:1)明确问题)明确问题,是求什么参数的置信区间是求什么参数的置信区间?置信水平置信水平 是多少是多少?2)寻找参数寻找参数 的一个良好的点估计的一个良好的点估计T(X1,X2,Xn)3)寻找一个待估参数)寻找一个待估参数 和估计量和估计量 T 的函数的函数 U(T,),且其分布为已知且其分布为已知.数理统计数理统计 4)对于给定的置信水平)对于给定的置信水平 ,根据,根据U(T,)的分布,确定常数的分布,确定常数a,b,使得,使得 P(a U(T,)b)=5)对)对“aS(T,)b”作等价变形作等价变形,得到如下形得到如下形式式:即即于是于是 就是就是 的的100()的置信区间的置信区间.数理统计数理统计 需要指出的是需要指出的是,给定样本,给定置信水平,给定样本,给定置信水平,置信区间也置信区间也不是唯一不是唯一的的.对同一个参数,我们可以构造许多置信区间对同一个参数,我们可以构造许多置信区间.例如,设例如,设 X1,Xn 是取自是取自 的样本的样本,求参数求参数 的置信水平为的置信水平为 的置的置 N(0,1)信区间信区间.由标准正态分布表,对任意由标准正态分布表,对任意a、b,我们可以求得我们可以求得 P(aUb).数理统计数理统计 N(0,1)例如,由例如,由P(-1.96U1.96)=0.95我们得到我们得到均值均值 的置信水平为的置信水平为的的置信区间为置信区间为数理统计数理统计 由由 P(-1.75U2.33)=0.95这个区间比前面一个要长一些这个区间比前面一个要长一些.置信区间为置信区间为我们得到我们得到均值均值 的置信水平为的置信水平为的的数理统计数理统计 我们总是希望置信区间尽可能短我们总是希望置信区间尽可能短.类似地,我们可得到若干个不同的置信区间类似地,我们可得到若干个不同的置信区间.任意两个数任意两个数a和和b,只要它们的纵标包含,只要它们的纵标包含f(u)下下95%的面积,就确定一个的面积,就确定一个95%的置信区间的置信区间.数理统计数理统计 在概率密度为单峰且对称的情形,当在概率密度为单峰且对称的情形,当a=-b时求得的时求得的置信区间的长度为最短置信区间的长度为最短.a=-b数理统计数理统计 即使在概率密度不对称的情形,如即使在概率密度不对称的情形,如 分布分布,F分布分布,习惯上仍取对称的分位点来计算未知参数,习惯上仍取对称的分位点来计算未知参数的置信区间的置信区间.我们可以得到未知参数的的任何我们可以得到未知参数的的任何置信水平小置信水平小于于 1 的的置信区间,并且置信区间,并且置信水平越高,相应的置信水平越高,相应的置置信区间信区间平均长度平均长度越长越长.数理统计数理统计 上述置信区间中置信限都是双侧的,但对于上述置信区间中置信限都是双侧的,但对于有些实际问题,人们关心的只是参数在一个方向有些实际问题,人们关心的只是参数在一个方向的界限的界限.例如对于设备、元件的使用寿命来说,平均寿命例如对于设备、元件的使用寿命来说,平均寿命过长没什么问题,过短就有问题了过长没什么问题,过短就有问题了.这时这时,可将置信上限取为可将置信上限取为+,而,而只着眼于置信下限只着眼于置信下限,这样求得的,这样求得的置信区间叫置信区间叫单侧置信区间单侧置信区间.6、置信限(、置信限(单侧置信区间单侧置信区间)数理统计数理统计 数理统计数理统计 设灯泡寿命服从正态分布设灯泡寿命服从正态分布.求灯泡寿命均值求灯泡寿命均值 的的置信水平为置信水平为0.95的单侧置信下限的单侧置信下限.例例2 从一批灯泡中随机抽取从一批灯泡中随机抽取5只作寿命试只作寿命试验,测得寿命验,测得寿命X(单位:小时)如下:(单位:小时)如下:1050,1100,1120,1250,1280方差方差 未知未知解解 的点估计取为样本均值的点估计取为样本均值 ,数理统计数理统计 对给定的置信水平对给定的置信水平 ,确定分位点,确定分位点使使即即于是得到于是得到 的置信水平为的置信水平为 的单侧置信区间的单侧置信区间为为 数理统计数理统计 将样本值代入得将样本值代入得的置信水平为的置信水平为0.95的单侧置信下限是的单侧置信下限是1065小时小时的置信水平为的置信水平为 的的单侧置信下限单侧置信下限为为即即数理统计数理统计 课堂练习课堂练习 随机地取炮弹随机地取炮弹 10 发做试验,得炮口速度的发做试验,得炮口速度的标准差标准差 ,炮口速度服从正态分布炮口速度服从正态分布.求这求这种炮弹的炮口速度的标准差种炮弹的炮口速度的标准差 的置信水平为的置信水平为0.95 的置信区间的置信区间.数理统计数理统计 由由解解 随机地取炮弹随机地取炮弹 10 发做试验,得炮口速度的发做试验,得炮口速度的标准差标准差 ,炮口速度服从正态分布炮口速度服从正态分布.求这求这种炮弹的炮口速度的标准差种炮弹的炮口速度的标准差 的置信水平为的置信水平为0.95 的置信区间的置信区间.数理统计数理统计 于是得到于是得到 的置信水平为的置信水平为 的置信区间的置信区间为为这里这里可得到可得到 的置信水平为的置信水平为 的置信区间的置信区间为为数理统计数理统计 7、枢轴量、枢轴量数理统计数理统计 上述三步中,关键是第一步,构造枢轴量上述三步中,关键是第一步,构造枢轴量G,G的分布不能含有的分布不能含有未知参数,譬如标准正态分布未知参数,譬如标准正态分布N(0,1)、t分布等不含未知参数。分布等不含未知参数。数理统计数理统计 数理统计数理统计 例例3:数理统计数理统计 数理统计数理统计 数理统计数理统计 数理统计数理统计 例例4:数理统计数理统计 数理统计数理统计