参数估计(修改)(精品).ppt
参数估计参数估计第七章第七章 参数估计参数估计参数的点估计参数的点估计 估计量的评选标准估计量的评选标准正态总体参数的区间估计正态总体参数的区间估计一。一。参数的点估计参数的点估计一、参数估计的概念一、参数估计的概念估计量;估计值估计量;估计值由于由于现用它来估计未知参数现用它来估计未知参数,故称这种估计为故称这种估计为点点估计估计。是实数域上的一个点是实数域上的一个点,点估计的经典方法是:点估计的经典方法是:(1)矩估计法矩估计法 (2)极大似然估计法极大似然估计法二、矩估计法二、矩估计法(简称简称“矩法矩法”)英国统计学家皮尔逊英国统计学家皮尔逊(K.pearson)提出提出1、矩法的基本思想:、矩法的基本思想:以样本矩作为相应的总体同阶矩的估计;以样本矩作为相应的总体同阶矩的估计;以样本矩的函数作为相应的总体矩的同一函以样本矩的函数作为相应的总体矩的同一函数的估计。数的估计。均值均值方差方差标准差标准差总体总体 E(X)D(X)样本样本样本值样本值K阶原点矩阶原点矩K阶中心矩阶中心矩总体总体样本样本样本样本值值2、矩法的步骤:、矩法的步骤:设总体设总体X的分布为的分布为F(x;1,2,k),k个参数个参数1,2,k待估计,待估计,(X1,X2,Xn)是一个样是一个样本本。(1)计算总体分布的计算总体分布的i阶原点矩阶原点矩E(Xi)=i(1,2,k),i=1,2,k,(计算计算到到k阶矩为止,阶矩为止,k个参数个参数);(2)列方程列方程从中解出方程组的解,记为从中解出方程组的解,记为分别为参数分别为参数1,2,k的矩估计。的矩估计。则则例例.1 设总体设总体X的均值为的均值为,方差为方差为2,均未知。,均未知。(X1,X2,Xn)是总体的一个样本,求是总体的一个样本,求和和2的矩估计。的矩估计。解解解得矩法估计量为解得矩法估计量为注:注:例例.2 设总体设总体XP(),求,求的矩估计。的矩估计。解解例例3 设设(X1,X2,Xn)来自来自X的一个样本,且的一个样本,且求求a,b的矩估计。的矩估计。解解 XU(a,b)解得矩估计为解得矩估计为2阶中心矩阶中心矩矩法估计的优点:计算简单;矩法估计的优点:计算简单;矩法估计的缺点矩法估计的缺点:(1)矩法估计有时会得到不合矩法估计有时会得到不合理的解;理的解;(2)求矩法估计时,不同的做法会得到不同的解;求矩法估计时,不同的做法会得到不同的解;(通常规定,在求矩法估计时,要尽量使用低阶通常规定,在求矩法估计时,要尽量使用低阶矩矩)如例如例7.2中,不是用中,不是用1阶矩,而是用阶矩,而是用2阶矩阶矩(3)总体分布的矩不一定存在,所以矩法估计总体分布的矩不一定存在,所以矩法估计不一定有解。如不一定有解。如三、极大似然估计法三、极大似然估计法(R.A.Fisher费歇费歇)1、极大似然估计法的基本思想、极大似然估计法的基本思想 由样本的具体取值,选择参数由样本的具体取值,选择参数的估计量的估计量使得取该样本值发生的可能性最大。使得取该样本值发生的可能性最大。2、似然函数与极大似然估计似然函数与极大似然估计设设则称则称为该总体为该总体X的似然函数的似然函数。3、求极大似然估计的步骤、求极大似然估计的步骤设总体设总体X的分布中,有的分布中,有m个未知参数个未知参数1,2,m,它,它们的取值范围们的取值范围。(1)写出似然函数写出似然函数L的表达式的表达式如果如果X是离散型随机变量,分布律为是离散型随机变量,分布律为P(X=x),则则如果如果X是连续型随机变量,密度函数为是连续型随机变量,密度函数为f(x),则则(2)在在 内求出使得似然函数内求出使得似然函数L达到最大的参数的估计值达到最大的参数的估计值它们就是未知参数它们就是未知参数1,2,m的极大似然估计。的极大似然估计。一般地,先将似然函数取对数一般地,先将似然函数取对数lnL,然后令然后令lnL关关于于1,2,m的偏导数为的偏导数为0,得方程组,得方程组从中解出从中解出例例4 (X1,X2,Xn)是来自总体是来自总体XP()的样本,的样本,0未知,未知,求求的极大似然估计量。的极大似然估计量。解解 总体总体X的分布律为的分布律为x=0,1,2,,n设设(x1,x2,xn)为样本为样本(X1,X2,Xn)的一个观察值,的一个观察值,似然函数似然函数对数似然函数对数似然函数所以所以是是的极大似然估计值,的极大似然估计值,的极大似然估计量为的极大似然估计量为例例5 设设(X1,X2,Xn)是来自正态总体是来自正态总体XN(,2)的一个的一个样本,样本,,2未知,求未知,求,2的极大似然估计。的极大似然估计。解解 设设(x1,x2,xn)为样本为样本(X1,X2,Xn)的一个观察值,的一个观察值,则似然函数为则似然函数为解得解得所以所以,2的极大似然估计量分别为的极大似然估计量分别为思考:当思考:当已知时,已知时,四。四。估计量的评选标准估计量的评选标准一、无偏性一、无偏性估计量估计量的观察或试验的结果,估计值可能较真实的参数值偏大的观察或试验的结果,估计值可能较真实的参数值偏大或偏小,而一个好的估计量不应总是偏大或偏小,在多或偏小,而一个好的估计量不应总是偏大或偏小,在多次试验中所得的估计量的平均值应与真实参数吻合,这次试验中所得的估计量的平均值应与真实参数吻合,这就是无偏性所要求的。就是无偏性所要求的。是一个随机变量,对一次具体是一个随机变量,对一次具体定义定义是是 的一个估计量,如果的一个估计量,如果 有有则称则称是是 的一个无偏估计。的一个无偏估计。如果如果不是无偏的,就称该估计是有偏的。不是无偏的,就称该估计是有偏的。称称为为的偏差。的偏差。例例6 设总体设总体X的的k阶矩存在,则不论阶矩存在,则不论X的分布如何,样本的分布如何,样本k阶原点矩阶原点矩是总体是总体k阶矩的无偏估计。阶矩的无偏估计。证明证明设设X的的k阶矩阶矩 k=E(Xk),k1(X1,X2,Xn)是来自正态总体是来自正态总体X的一个样本,则的一个样本,则所以所以Ak是是k的无偏估计的无偏估计.例例7.设设XN(,2),其中其中,2未知,问未知,问,2的极大似然的极大似然估计是否为估计是否为,2的无偏估计?若不是,请修正使它成的无偏估计?若不是,请修正使它成为无偏估计。为无偏估计。解解 设设(X1,X2,Xn)是取自总体是取自总体X的一个样本,由例的一个样本,由例6.6知知是是的无偏估计的无偏估计不是不是2的无偏估计,而的无偏估计,而为为2的无偏估计。的无偏估计。二、有效性二、有效性对于参数对于参数 的无偏估计量,其取值应在真值附近波动,的无偏估计量,其取值应在真值附近波动,我们希望它与真值之间的偏差越小越好。我们希望它与真值之间的偏差越小越好。定义定义 设设均为未知参数均为未知参数 的无偏估计量,若的无偏估计量,若则称则称比比有效。有效。在在 的所有无偏估计量中,若的所有无偏估计量中,若估计量,则称估计量,则称是具有最小方差的无偏是具有最小方差的无偏显然也是最有效的无偏估计量,简称有效估计量。显然也是最有效的无偏估计量,简称有效估计量。为一致最小方差无偏估计量。为一致最小方差无偏估计量。例例8 设总体设总体XU1,,1,未知,未知,(X1,X2,Xn)是总体是总体X的一个样本,的一个样本,(1)求求 的矩估计和极大似然估计;的矩估计和极大似然估计;(2)上述两个估计是否为无偏估计量,若不是,请修正为无上述两个估计是否为无偏估计量,若不是,请修正为无偏估计量;偏估计量;(3)问在问在(2)中的两个无偏估计量哪一个更有效?中的两个无偏估计量哪一个更有效?解解 X的密度函数的密度函数(1)的矩估计为的矩估计为设设(x1,x2,xn)为样本观察值,则似然函数为样本观察值,则似然函数i=1,2,n令令xn*=max(x1,x2,xn),则,则xn*即即 的极大似然估计为的极大似然估计为(2)是是 的无偏估计。的无偏估计。为求为求先求先求Xn*的密度函数的密度函数显然,它不是显然,它不是 的无偏估计,修正如下:的无偏估计,修正如下:令令则则是是 的无偏估计。的无偏估计。(3)当当n1时,对任意时,对任意 1,因此因此比比更有效。更有效。三、一致性(相合性)三、一致性(相合性)在参数估计中,很容易想到,如果样本容量越大,在参数估计中,很容易想到,如果样本容量越大,样本所含的总体分布的信息越多。样本所含的总体分布的信息越多。n越大,越能精确估越大,越能精确估计总体的未知参数。随着计总体的未知参数。随着n的无限增大,一个好的估计的无限增大,一个好的估计量与被估参数的真值之间任意接近的可能性会越来越量与被估参数的真值之间任意接近的可能性会越来越大,这就是所谓的相合性或一致性。大,这就是所谓的相合性或一致性。定义定义 设设 为未知参数为未知参数 的估计量,若对任意给定的正数的估计量,若对任意给定的正数0,都有都有即即以概率收敛于参数以概率收敛于参数 ,则称则称为参数为参数 的一致估计或相合估计量。的一致估计或相合估计量。五。五。区间估计区间估计 上一节中,我们讨论了参数的点估计,只要给定上一节中,我们讨论了参数的点估计,只要给定样本观察值,就能算出参数的估计值。但用点估计的样本观察值,就能算出参数的估计值。但用点估计的方法得到的估计值不一定是参数的真值,即使与真值方法得到的估计值不一定是参数的真值,即使与真值相等也无法肯定这种相等(因为总体参数本身是未知相等也无法肯定这种相等(因为总体参数本身是未知的),也就是说,由点估计得到的参数估计值没有给的),也就是说,由点估计得到的参数估计值没有给出它与真值之间的可靠程度,在实际应用中往往还需出它与真值之间的可靠程度,在实际应用中往往还需要知道参数的估计值落在其真值附近的一个范围。为要知道参数的估计值落在其真值附近的一个范围。为此我们要求由样本构造一个以较大的概率包含真实参此我们要求由样本构造一个以较大的概率包含真实参数的一个范围或区间,这种带有概率的区间称为置信数的一个范围或区间,这种带有概率的区间称为置信区间,通过构造一个置信区间对未知参数进行估计的区间,通过构造一个置信区间对未知参数进行估计的方法称为区间估计。方法称为区间估计。定义定义 设总体设总体X的分布函数族为的分布函数族为F(x;),,对于对于给定的给定的(01),如果有两个统计量如果有两个统计量使得使得对一切对一切成立,则称随机区间成立,则称随机区间是是的置信度为的置信度为1-的双侧置信区间的双侧置信区间双侧置信下限;双侧置信下限;双侧置信下限;双侧置信下限;1-置信度。置信度。由定义可知,置信区间是以统计量为端点的随机区间,对于给定由定义可知,置信区间是以统计量为端点的随机区间,对于给定的样本观察值的样本观察值(x1,x2,xn),由统计量,由统计量构成的置信区间构成的置信区间可能包含真值可能包含真值,也可能不包含真值,也可能不包含真值,但在多次观察或试验中,但在多次观察或试验中,每一个样本皆得到一个置信区间,在这些区间中包含真值每一个样本皆得到一个置信区间,在这些区间中包含真值的区的区间占间占100(1-)%,不包含不包含的仅占的仅占100%。例例9 设设(X1,X2,Xn)是取自总体是取自总体XN(,2)的一个样本,其中的一个样本,其中2已知,已知,未知。试求出未知。试求出的置信度为的置信度为1-的置信区间。的置信区间。解解 由于样本均值由于样本均值是总体均值是总体均值的极大似然估计,且的极大似然估计,且故统计量故统计量由标准正态分布上由标准正态分布上p分位点的定义可知分位点的定义可知即即落在区间落在区间内的概率为内的概率为1-。此区间称为此区间称为的置信度为的置信度为1-的置信区间。的置信区间。u/2 O u1-/2 x(x)/2/21-从此例我们发现随机变量从此例我们发现随机变量Z在区间的构造中起着关键的在区间的构造中起着关键的作用,它具有下述特点:作用,它具有下述特点:(1)Z是待估参数是待估参数和统计量和统计量(2)不含其它未知参数;不含其它未知参数;(3)服从与未知参数无关的已知分布。服从与未知参数无关的已知分布。求置信区间的一般步骤求置信区间的一般步骤的函数;的函数;一、正态总体一、正态总体N(,2)的均值的均值的置信区间的置信区间1、方差、方差2已知已知由例由例7.14可知可知则置信度为则置信度为1-的的的置信区间为的置信区间为2、方差、方差2未知未知由于由于方差方差2未知,不能使用未知,不能使用作为统计量作为统计量用用2的无偏估计量的无偏估计量代替代替2则则的置信度为的置信度为1-的置信区间为的置信区间为求正态总体参数置信区间的解题步骤:求正态总体参数置信区间的解题步骤:(1)根据实际问题构造样本的函数,根据实际问题构造样本的函数,要求仅含待估要求仅含待估参数且分布已知参数且分布已知;(2)令该令该函数落在由分位点确定函数落在由分位点确定的区间里的概率为的区间里的概率为给定的置信度给定的置信度1,要求要求区间按几何对称或概率区间按几何对称或概率对称对称;(3)解不等式得随机的置信解不等式得随机的置信区间;区间;(4)由观测值及由观测值及 值查表计算得所求值查表计算得所求置信置信区间。区间。例例10 已知某批灯泡的寿命已知某批灯泡的寿命X(单位单位:小时小时)N(,2),现从这批灯现从这批灯泡中抽取泡中抽取10个,测得寿命分别为个,测得寿命分别为1050,1100,1080,1120,1200,1250,1040,1130,1300,1200若若=0.05,求求的置信区间的置信区间(1)2=8,(2)未知。未知。解解(1)由于由于2=8,由样本观察值计算得,由样本观察值计算得n=10,=0.05查查标准正态分布表标准正态分布表得得的置信度为的置信度为0.95的置信区间为的置信区间为1145.25,1148.75。(2)由于由于2未知,由样本观察值计算得未知,由样本观察值计算得S=87.0568,n=10,=0.05,查查t分布表得分布表得的置信度为的置信度为0.95的置信区间为的置信区间为1084.72,1209.28。1、均值、均值已知已知此时此时2的极大似然估计为的极大似然估计为且且由由2分布分位点的概念可知分布分位点的概念可知二、正态总体二、正态总体N(,2)的方差的方差2的置信区间的置信区间则则2的置信度为的置信度为1-的置信区间为的置信区间为(2)均值均值未知未知此时取此时取可得可得2的置信度为的置信度为1-的置信区间为的置信区间为例例11 为测定某家具中的甲醛含量,取得为测定某家具中的甲醛含量,取得4个独立的测量值的样个独立的测量值的样本,并算得样本均值为本,并算得样本均值为8.34%,样本标准差为,样本标准差为0.03%,设被测总,设被测总体近似服从正态分布,体近似服从正态分布,=0.05,求,求,2的置信区间。的置信区间。解解 由题意:由题意:2未知,未知,n=4,S=0.03%,查查t分布表得分布表得的置信度为的置信度为0.95的置信区间为的置信区间为8.2923%,8.3877%。对于对于2,由于,由于未知,未知,查查2分布表分布表则则2的置信度为的置信度为0.95的置信区间为的置信区间为0.0002910-4,0.012510-4