管理统计学第5参数估计.ppt
《管理统计学第5参数估计.ppt》由会员分享,可在线阅读,更多相关《管理统计学第5参数估计.ppt(148页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、管理统计学第5参数估计 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望3.1 参数估计概述参数估计概述 参数估计是统计推断的基本方法之一。我们把刻划总体X的某些特征的常数称为参数,最常用的参数是总体X的数学期望和方差。假如总体XN(),则X的分布是由参数和2确定的,其中,=E(X),2=D(X)。在实际问题中,总体X的参数是未知的,例如纱厂细纱机上的断头次数XP(),如果求每只纱绽在某一时间间隔内断头的次数为K的概率,就需要先确定参数,才能求出所求的概率。又如,灯
2、泡厂生产的灯泡,由经验知其寿命XN(),但是由于生产过程中各种随机因素的影响,生产出来的灯泡的寿命是不一致的,为了保证灯泡的质量,必须进行抽样检查,根据样本所提供的信息,对总体X的分布做出估计,也即对参数,2做出估计。这类问题称为参数估计问题。参数估计问题,就是要从样本出发构造一些统计量作为总体某些参数的估计量,当取得一个样本值时,就以相应的统计量的值作为总体参数的估计值。例如,常以统计量 作为总体数学期望的估计量。当要估计某批灯泡的平均寿命时,就从该批灯泡中随机地抽取若干个,分别测出其寿命,以这些测量数据的平均值作为该批灯泡的平均寿命的估计值。设总体X的分布函数的类型已知,但是其中有一个或多
3、个参数未知,设X1,X2,X3,Xn为总体X的容量为n的样本。参数估计就是讨论如何由样本X1,X2,X3,Xn提供的信息对未知参数作出估计,以及讨论如何建立一些准则对所作出的估计进行评价。一般是建立适当的统计量 (X1,X2,X3,Xn),当样本观察值为x1,x2,x3,xn时,如果以 (x1,x2,x3,xn)作为总体分布中未知参数的估计值,这样的估计方法叫做点估计,如果总体分布函数中有t个未知参数,则要建立t个估计量作为t个未知参数的估计量。参数估计的形式分为两类:点估计和区间估计。由估计量的观察值作为未知参数的估计值,这种作法称为点估计或定值估计。而有时并不要求对参数作定值估计,只要求估
4、计出未知参数的一个所在范围,并指出参数被包含在该范围的概率,这种方法称为区间估计,进行参数估计并不一定要预先知道总体的分布类型。有时,虽然未知总体的分布类型,但仍可对总体的某些数字特征作出估计。3.2 参数的点估计 点估计方法很多,本节介绍最常见的矩估计法和极大似然法。一、矩估计法 由大数定律可知,样本分布函数依概率收敛于总体分布函数,样本均值依概率收敛于总体均值,我们自然会想到,是否能用有关的样本矩来估计总体分布的相应矩呢?统计实践表明,这个方法是可取的,这种用样本矩来估计总体分布参数的方法称为矩估计法,通常,用样本 均值来估计总体的均值,用样本方差S2来估计总体的方差。【例3.1】试用矩估
5、计法对总体 XN()的参数,2作出估计。解:因E(X)=,D(X)=2设X1,X2,Xn为X的一个样本,其 样本均值为,样本方差为S2。令E(X)=,D(X)=S2,即得的估计量为 ,。【例5.2】设X1,X2,Xn是取自总 体X的样本,已知X的概率密度为:试用矩估计法估计总体参数 。解:由于 样本均值为 ,令E(X)=,得:,从而总体 参数的矩估计为 ,其 中 。【例5.3】X1,X2,Xn为总体XB(N,P)的样本,其中N,P为未知参数,试用矩估计法估计参数N及P。解:E(X)=NP D(X)=NP(1-P)样本均值与方差分别为 ,S2。令E(X)=D(X)=S2即解得N、P的矩估计量为,
6、其 中 ,。二、极大似然估计法先考察两个简单的例子。【例3.4】某同学与一位男猎人一起外出打猎,只见一只野鸡在前方窜过,只听一声枪响,野鸡被他们两人中某一位一枪命中,试推测这一发命中的子弹是谁打的,答案是简单的,既然只发一枪且命中,而男猎人的命中的概率一般大于这位同学命中的概率,因此可以认为这一枪是男猎人射中的。【例3.5】假定在一个箱子里放着黑、白两种球共4只,且知道这两种球的数目之比为13,但不知道究竟哪一种颜色的球多。设黑球所占的比例为P,由上述假定推知P仅可能取1/4和3/4这两个值,现在采用有放回抽样的方法,从箱子中随机地抽取三个球,观察到球的颜色为黑、白、黑,你会对箱子中的黑球数作
7、出什么推断呢?即你认为P的值是1/4,还是3/4?直观上觉得P=3/4(即箱子中黑球数为3)更可信,因为当P=1/4时抽到这样一个具体样本的概率为1/41/4 3/43/4 1/4=3/641/4=3/64,当P=3/4时,抽到这样一个具体样本的概率为3/43/4 1/41/4 3/4=9/643/4=9/64,由于9/643/649/643/64,因此在观察到上述样本中的三个球的颜色之后,觉得P=3/4更可信,即你倾向于认为箱子中放有三个黑球,这里体现了极大似然法的基本思想。现在我们来阐明极大似然法的基本原理。设总体X的概率密度为 ,它只含一个未知参数(若X是离散型 ,表示概率 ),X1,X
8、2,X3,Xn是取自X的样本,x1,x2,x3,xn为样本观察值。X1,X2,X3,,Xn的联合密度等于 ,显然,对于样本的 一组观察值x1,x2,x3,xn,它是 的函数,记作 并称为似然函数 当 已知时,似然函数描述了样本取得样本观察值x1,x2,x3,xn的可能性。同样,当一组样本观察值取定时(即抽样完成时),要问它最大可能取自什么样的总体(即总体的参数 应等于什么时的可能性最大),也要从似然函数 的极大化中求出相应的 值来,这个值就是 的一个估计值。于是,我们可以给出极大似然估计的定义。定义3.1设总体的概率密度为 ,其中 是未知参数,x1,x2,xn为X的一组样本观察值。若能求得观察
9、值的某个函数 ,使得似然函数取极大值,即 ,则称 为 的一个极大似然估计值,其相应的统计量 ,称为参数 的极大似然估计量。由定义3.1可知,求总体参数 的极大似然估计值 的问题,就是求似然函数 L()的极大值问题。在L()可微时,要使L()取极大值 必须满足(3.1)从上式可解得 的极大似然估计值。由于lnL()与L()有相同的极值点,而且,求lnL()的极值点更为容易,所以常用下式(3.2)来代替(3.1)式。方程(3.1)或(3.2)都称为似然方程。当似然函数包含多个参数时,即:若L关于各参数的偏导数存在,则 j的极大似然估计 一般可由方程组:或 解得。上面方程组称 为似然方程组。注意上面
10、的讨论中,我们没有提到似函数 取极大值的充分条件,对于具体的函数可作验证。【例3.6】设总体X服从参数为 的泊松分布,求参数 的极大似然估计量。解设X1,X2,X3,Xn是来自X的样本,则 令 的极大似然估计量为 。其中为样本均值。【例3.7】设总体XN,其中 及 是未知参数,如果取得样本观测值为x1,x2,,xn,求参数 及 的极大似然估计值。解:似然函数为:对 及 求偏导数,并让它们等于零,得:解此方程组,即得 及 的极大似然估计值为:【例3.8】设总体X服从均匀分布 ,求参数 与 的极大似然估计量解设X1,X2,Xn是X的样本,则 从而有显然由此方程组解不出1与2,现利用定义求1与2的极
11、大似然估计量,因为:又,即 的极大似然估计量分别为 。三、估计量的优良标准在对总体参数做出估计时并非所有的估计量都是优良的,从而产生了评价估计量是否优良的标准。对于点估计量来说,一个好的估计量有如下三个标准:1无偏性 如果样本统计量的期望值等于该统计量所估计的总体参数,则这个估计量叫做无偏估计量。这是一个好的估计量的一个重要条件。用样本平均数作为总体平均数的点估计量,就符合这一要求。无偏性也就是没有系统的偏差,它是从平均意义讲的,即如果这种估计方法重复进行,则从估计量所获得的平均数等于总体参数。显然,如果说一个估计量是无偏的,并不是保证用于单独一次估计中没有随机性误差,只是没有系统性的偏差而已
12、。若以代表被估计的总体参数,代表的无偏估计量,则用数学式表示为:我们知道,总体参数中最重要的一个参数是总体平均数 ,样本平均数 是它的一个无偏估计量,即 。另外,样本方差也是总体方差的无偏估计量。2一致性 当样本容量n增大时,如果估计量越来越 接近总体参数的真值时,就称这个估计量为一致估计量。估计量的一致性是从极限意义上讲的,它适用于大样本的情况。如果一个估计量是一致估计量,那么,采用大样本就更加可靠。当然,在样本容量n增大时,估计量的一致性会增强,但调查所需的人力、物力也相应增加。3有效性 有效性的概念是指估计量的离散程度。如果两个估计量都是无偏的,其中方差较小的(对给定的样本容量而言)就可
13、认为相对来说是更有效的。严格地说,如果 和 是 的两个无偏估计量,它们的相对有效性按下述比率决定:其中,是较小的方差。以上这三个标准并不是孤立的,而应该联系起来看。如果一个估计量满足这三个标准,这个估计量就是一个好的估计量。数理统计已证明,用样本平均数来估计总体平均数和用样本比率来估计总体比率时,它们是无偏的,一致的和有效的。3.3 参数的区间估计参数的区间估计一、区间估计的概念 对未知参数来说,我们除了关心它的点估计外,往往还希望估计出它的一个范围,以及这个范围覆盖参数真值的可靠程度,这种范围通常用区间的形式给出,这种区间就叫参数的置信区间。定义3.2设总体分布含有一个未知参数,若由样本确定
14、的两个统计量(X1,X2,X3,Xn)与(X1,X2,X3,Xn),对于给定数值 ,满足(3.3)则称随机区间 为的一个 双侧置信区间,称为双侧置信下(上)限,1-称为置信水平或置信度。(3.3)式表示置信区间 包含未知参数 真值的概率是1-,若反复抽样多次(每次样本容量相等),每组样本观察值确定一个区间 ,每个这样的区间或者包含 的真值,或者不包含 的真值,按贝努利定理,在所有这些区间中,包含 真值的约占 ,不包含真值的仅占 左右。当 和 时,称为置信区间观察值,也称为置信区间。在有些问题中,我们关心的是未知参数至少有多大(如设备元件使用的寿命),或不超过多大(如产品的次品率),因此下面给出
15、单侧置信区间的概念。定义3.4在定义3.3中,如果将(3.3)式改成 则称 或 为单侧置信区间,和 分别称为单侧置信下限与单侧置信上限。评价一个置信区间的好与坏有两个标准,一是精度,即 越小精度越高,也就越好。另一个是置信度,即 越大越好。我们当然希望 尽可能地小,同时希望 尽可能地大,但是当样本容量n固定时,精度与置信度不可能同时提高。因为当精度提高时即 变小时,()覆盖真值 的可能性也变小,从而降低了置信度,相反,当置信度增大时,必然也增大,从而降低了精度,在实际问题中,一般是根据实际问题的需要,先选定置信度为1-,然后再通过增加样本容量n提高精度。二、区间估计的步骤(1)构造一个随机变量
16、g()(含待估计的未知参数,分布已知);(2)给定置信水平 ,使 ;(3)从不等式中解出 即 得的 置信区间 ;(4)将xi代替 中的xi,即得观察区间。3.4单正态总值均值与方差的区间估计 假设总体XN(),构造 与 的置信区间有重要的实用意义,而且有关结果是完满的。一、均值的置信区间 从总体X中取样本(X1,X2,Xn),设样本值为(x1,x2,x3,,xn)由于随机变量很明显,统计量Z的分布函数不依赖于未知参数。设已给定对的区间估计置信度为1-令为Z的双侧 点)解不等式(关于):得 从而所求的100(1-)%置信区间为 将样本平均值 取其观察值 ,则 100(1-)%的置信区间为【例3.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 管理 统计学 参数估计
限制150内