《参数的点估计与区间估计.ppt》由会员分享,可在线阅读,更多相关《参数的点估计与区间估计.ppt(44页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第 七 章,参 数 估 计,进行统计推断的一般步骤为:,总体,样本,统计量,作出推断,统计推断的 基本问题,参数估计问题,假设检验问题,参数的点估计,参数的区间估计,参数假设检验,非参数假设检验,参数估计问题: 就是要利用样本, 对总体 分布中包含的未知参数或未知参数的某些函数 作出估计.,如:,估计产品的废品率;,估计湖中鱼的数量;,估计降雨量等等.,参数估计又分点估计与区间估计.,设总体 X 的分布中含未知参数,1 参数的点估计,( X1 , X2 , , Xn ) 是一样本,要构造一统计量,作为,的估计,( 叫做 的点估计量);,对应样本值( x1 , x2 , , xn ),叫做 的点
2、估计值.,可作为,的估计值,,构造点估计 的常用方法,矩估计法(moment method of estimation),极大似然估计法(method of maximum likelihood),矩估计法的基本思想是用样本矩估计总体矩 .,一、 矩估计法,理论依据是大数定律.,矩估计法:,用样本的 l 阶原点矩,作为总体的 l 阶原点矩,的估计,(若未知参数有 k 个, 则一般取 l = 1, , k ),由矩估计法求得的估计量叫矩估计量, 相应的 估计值叫矩估计值.,去求出未知参数的估计量.,解:,解得,总体矩用相应的样本矩代替, 得矩估计量:,解:,解得,总体矩用相应的样本矩代替, 得
3、a 与 b 的矩估计量:,解:,解得,总体矩用相应的样本矩代替, 得矩估计量:,其基本思想是概率最大的事件最可能发生 .,是在总体类型已知的条件下使用的一种参数 估计方法 .,二、 极大似然估计法,例如:,某位同学与一位猎人一起外出打猎 .一只野兔 从前方窜过 . 只听一声枪响,野兔应声倒下 .,是谁打中的呢?,你很自然地想到: 只发一枪便打中, 猎人命中的 概率一般大于这位同学命中的概率. 这一枪应该 是猎人射中的 .,极大似然估计原理:,设总体 X 为连续型, 其概率密度为,( 是待估参数),( X1 , X2 , , Xn )为一样本, 相应 的样本值为( x1 , x2 , , xn
4、) :,则 Xi 落在 xi , xi + d xi )中的概率约为,( X1 , X2 , , Xn ) 落在( x1 , x2 , xn )旁边的概率 近似为,其取值随,而变;,既然在一次抽样中就得到了样本值(x1 , x2 , , xn) , 因而我们有理由认为:,样本 ( X1 , X2 , , Xn ) 在 ( x1 , x2 , , xn ) 旁边取值的概率比较大;,根据“概率最大的事件最可能发生”,我们可取使,概率,达到最大的参数,作为,的估计;,即求 使,记,叫做样本的似然函数,则求 使,如此求出的,作为,的估计,叫 的极大似然估计.,求 时,通常对 求导,令其为 0, 来获取
5、结果.,若总体 X 为离散型, 则,中的,以 代.,若总体 X 为连续型, 概率密度为,设 ( X1 , X2 , , Xn ) 为总体 X 的一样本, ( x1 , x2 , , xn )为样本值:,引入似然函数,求 使 最大.,综述之, 的极大似然估计 的求法如下:,解:,X 的概率密度,似然函数,两边取对数得,续解:,分别对,求导并令其为 0 得,例: 设总体 X P(), 求 的极大似然估计.,解:,X 的分布律为,设( X1 , X2 , , Xn )为一样本, 样本值为( x1 , x2 , xn ),似然函数,两边取对数得,续解:,有时用求导方法无法最终确定未知参数的 极大似然估
6、计, 此时用极大似然原则来求 .,解:,X 的概率密度,似然函数,利用求导方法无法确定未知参数的极大似然估计,由 L (a, b) 的表达式知:,若 b a 取最小, 则 L (a, b) 达到最大,故得,问题讨论: 如何估计湖中的鱼数?,第二次捕出的有记号的鱼数 X 是随机变量, X的分布为:,为估计湖中的鱼数N, 第一次捕上r条鱼, 做上记号后放回. 隔一段时间后, 再捕出 S 条鱼, 结果发现这 S 条鱼中有 k 条 标有记号. 根据这个信息, 如何估计湖中的鱼数呢?,我们可用极大似然法估计湖中的鱼数.,把上式右端看作 N 的函数,记作 L(N; k) .,应取使 L(N; k) 达到最
7、大的N, 作为 N 的极大似然估计.,但用对 N 求导的方法相当困难, 我们考虑比值:,经过简单的计算知, 这个比值大于或小于1,这就是说, 当 N 增大时, 序列 L(N; k) 先是上升而后下降; 当N 为小于 的最大整数时, 达到最大值 .,故 N 的极大似然估计为,请看演示 捕鱼问题,求估计量的方法很多, 用不同的方法求出 的估计量会不一样. 我们希望用较好的估计量 去估计未知参数. 因而有必要讨论: 如何评价 一个估计量的好坏?,3 估计量的评选标准,常用的几条标准是:,无偏性,有效性,一致性,估计量是随机变量, 其取值随样本值的不同 而不同. 我们希望估计量的取值在被估参数附近 摆
8、动, 即它的期望值等于被估参数. 由此引入了 无偏性这个标准 .,同样是无偏估计量, 有的取值较集中, 有的 取值较分散. 自然是: 取值越集中的越好. 由此 引入了有效性这个标准 .,估计量与样本容量有关, 我们希望: 随着样 本容量的无限增大, 估计量与被估计量任意接近 的可能性越来越大. 由此引入了一致性这个标准.,无偏性:,若 ,则称,有效性:,若 及 都是 的无偏估计,且 ,则称,较 有效.,一致性:,设总体 X 的均值为,因,方差为,( X1, X2, , Xn ) 是它的一个样本,表明:,样本均值 是总体均值 的无偏估计.,样本方差 是总体方差 的无偏估计.,它们也是 一致估计,
9、注:,不是 的无偏估计,解:,X1 , X2 , X3 独立与 X 同分布, 故,同理得,所以 d1 , d2 都是,的无偏估计.,续解:,同理得,所以 d1 比 d2 有效, d1 更好.,参数点估计是用一个确定的值去估计未知参数, 得到的是未知参数的近似值.,但在很多实际问题中, 我们不但需要求出未知 参数的近似值, 还需知道近似值的精确程度;,数学上的处理方法是: 确定一个范围(区间), 使我们 能以比较高的可靠程度相信它包含参数真值.,这就是参数的区间估计.,4 & 5 参数的区间估计,一、置信区间,设总体 X 的分布中含未知参数,若有统计量,使对给定的,有,则称,是,的置信度(置信水
10、平, 置信概率)为,的双侧置信区间.,注:,对连续型总体 X , 一般按,求置信区间.,而对离散型总体 X , 应求,使,至少为,且尽可能地接近,由于我们主要讨论正态总体, 属连续型, 故取等号处理.,二、置信区间的求法,解:,求一区间,使,由于样本均值 是 的无偏估计,而,根据 U 的分布,我们可确定一个区间, 即上面的,使得U 在该区间取值的概率为,从图中可看出, 这样的区间,不是唯一的.,常以双侧等概率方式处理,即对,查表得,使,解出式,中的不等式, 得,的置信度为,的双侧等概率置信区间为,简记为,设总体,三、单正态总体均值与方差的置信区间,( X1 , X2 , Xn ) 为一样本,(
11、) 已知时, 均值 的置信度为 的置信区间,此时取,对给定的,查表得,使,的置信度为,的置信区间是,例: 测两点间距离 5 次, 测得距离值(单位: 米)为 108.5, 109.0, 110.0, 110.5, 112.0, 若测量值服从方差为 2.5 的正态分布, 求距离真值的置信度 为0.95的置信区间.,解:,设距离测量值为 X,已知,需求,的置信度为 0.95 的置信区间.,而此时,的置信度为,的置信区间是,由样本值算得:,对,查表得,求得,故距离真值的置信度为 0.95 的置信区间是 (108.61, 111.39).,() 未知时, 均值 的置信度为 的置信区间,设总体,( X1
12、 , X2 , Xn ) 为一样本,此时取,对给定的,查表得,使,的置信度为,的置信区间是,及自由度 n1,解:,设轴承直径为 X,未知,需求,的置信度为 0.95 的置信区间.,而此时,的置信度为,的置信区间是,由样本值算得:,对,n1=6 查表得,求得,故轴承直径的置信度为 0.95 的置信区间是 (111.75, 113.85).,例: 在一批由某车床加工的轴承中随抽几只, 测得直径(mm) 为 112.0, 113.4, 111.2, 114.5, 112.0, 112.9, 113.6, 若直径 服从正态分布, 求该批轴承直径均值的置信区间,设总体,( X1 , X2 , Xn )
13、为一样本,2 方差 的置信度为 的置信区间,未知,此时取,对给定的,及自由度 n1,查表得,及,使,的置信度为,的置信区间是,标准差,的置信区间是,解:,设轴承直径为 X,未知,需求,的置信度为 0.95 的置信区间.,由样本值算得:,对,n1=6 查表得,例: 在一批由某车床加工的轴承中随抽几只, 测得直径(mm) 为 112.0, 113.4, 111.2, 114.5, 112.0, 112.9, 113.6, 若直径 服从正态分布, 求该批轴承直径方差的置信区间,求得,故轴承方差的置信度为 0.95 的置信区间是 (0.535, 6.257).,小结如下:,对正态总体,(1) 已知时,
14、 均值 的置信度为 的置信区间,是,(2) 未知时, 均值 的置信度为 的置信区间,是,(3) 未知时, 方差 的置信度为 的置信区间,是,前面提到过: 对给定样本、给定的置信度, 置信区间 不是唯一的. 对同一个参数, 我们可以构造出许多置信区间.,我们总是希望置信区间尽可能短.,在概率密度为单峰且对称的情形, 以双侧等概率方法 求得的置信区间的长度为最短.,即使在概率密度不对称的情形, 习惯上仍以双侧等概率 方法来计算未知参数的置信区间.,我们可以得到未知参数的的任何置信度小于 1 的置信 区间, 并且置信度越高, 相应的置信区间平均长度越长.,也就是说, 要想得到的区间估计可靠度高, 区
15、间长度就长, 估计的精度就差. 这是一对矛盾.,实用中应在保证足够可靠的前提下, 尽量使得区间的 长度短一些 .,请看置信区间的演示,四、单侧置信区间,上述置信区间中置信限都是双侧的,但对于有些实际问 题,人们关心的只是参数在一个方向的界限.,例如对于设备、元件的使用寿命来说,平均寿命过长没 什么问题,过短就有问题了.,这时,可将置信上限取为+, 而只着眼于置信下限,这样求得的置信区间叫单侧置信区间.,而对化学药品等物品中的杂质含量来说,平均含量不能过长.,这时,可将置信下限取为 , 而只着眼于置信上限.,定义:,设 是 一个待估参数,若有统计量 满足,则称 是 的置信度为 的单侧置信区间,称为单侧置信下限.,若有统计量 满足,则称 是 的置信度为 的单侧置信区间,称为单侧置信上限.,以下介绍如何求正态总体均值的置信下限:,设总体,( X1 , X2 , Xn ) 为一样本,,未知,求,的置信度为,的置信下限,即求一,使,此时取,则前一概率式等价与,的置信度为,的置信下限是,
限制150内