第5章 参数估计与假设检验.pdf
《第5章 参数估计与假设检验.pdf》由会员分享,可在线阅读,更多相关《第5章 参数估计与假设检验.pdf(189页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第 5 章章参数估计参数估计与假设检验与假设检验(5.1 5.5)统计推断统计推断是统计学的重要内容。它大致可以分为是统计学的重要内容。它大致可以分为两类两类:估估计问题与假设检验问题计问题与假设检验问题。且每类问题又可以分为参数估计与假且每类问题又可以分为参数估计与假设检验和非参数估计与假设检验。本章将介绍设检验和非参数估计与假设检验。本章将介绍参数估计与参数参数估计与参数假设检验假设检验的基本知识。的基本知识。一方面一方面,在一些实际问题中,研究对象的总体分布,在一些实际问题中,研究对象的总体分布类型类型往往往可以从理论或实际经验中得到,而未知的只是分布中的往可以从理论或实际经验中得到,
2、而未知的只是分布中的参数参数。例如例如,由中心极限定理和实际经验知道:表示,由中心极限定理和实际经验知道:表示人体身高人体身高的随机的随机变量变量 X 近似地服从正态分布近似地服从正态分布 N(,2),其中参数其中参数 ,2未知;未知;表示表示纺织厂细纱机上的断头次数纺织厂细纱机上的断头次数的随机变量的随机变量 Y 近似地服从参数近似地服从参数为为 的泊松分布的泊松分布 P(),其中参数其中参数 未知;未知;另一方面另一方面,在有些情况下,人们所关心的并不是总体的分,在有些情况下,人们所关心的并不是总体的分布,而是总体的某些数字特征(一般可以表为总体参数的函数,布,而是总体的某些数字特征(一般
3、可以表为总体参数的函数,如:若总体如:若总体 X e(),则则 EX=1/)。)。这些问题都要求人们通过对所抽取的简单随机样本进行这些问题都要求人们通过对所抽取的简单随机样本进行科科学的分析学的分析,从而,从而推断出推断出总体的未知参数或数字特征来。这类问总体的未知参数或数字特征来。这类问题统称为题统称为参数估计问题参数估计问题。参数估计问题又分为参数估计问题又分为点估计与区间估计点估计与区间估计两类。两类。直观地讲直观地讲,点估计是要用样本的某一点估计是要用样本的某一函数值函数值做为待估参数的估计值;区间做为待估参数的估计值;区间估计则是要将待估参数确定在某一估计则是要将待估参数确定在某一范
4、围范围之内。之内。5.1 点估计概述点估计概述一、什么叫点估计一、什么叫点估计(P.149)设(设(X1,X2,Xn)是来自总体是来自总体 X 的的样本样本,(,(x1,x2,xn)是相应的是相应的样本值样本值。是总体分布的是总体分布的待估参数待估参数,表示表示 的取值范围,称为的取值范围,称为参数空间参数空间。注注:尽管参数尽管参数 是未知的,但是它的参数空间是未知的,但是它的参数空间 却是却是事先事先知道知道的。如正态总体的。如正态总体 X N(,2)的参数的参数 R,(0,+).为估计参数为估计参数 ,需要,需要先先构造构造一个统计量一个统计量 h(X1,X2,Xn),然后然后再利用再利
5、用该统计量的该统计量的实现值实现值 h(x1,x2,xn)来来估计参数估计参数 的真值的真值,作为,作为 的的近似值近似值,即,即 h(x1,x2,xn)。称称统计量统计量 h(X1,X2,Xn)为参数为参数 的的估计量估计量,记作,记作;该统计量的;该统计量的实现值实现值 h(x1,x2,xn)为参数为参数 的的估计值估计值,记作,记作。在不会引起误会的场合,估计量在不会引起误会的场合,估计量与估计值统称为与估计值统称为点估计点估计,简称为简称为估计估计,并简记为,并简记为。且有。且有 。由于由于 的估计值的估计值是是数轴数轴上的一个上的一个点点,用,用作为作为 的的真值的真值的近似值近似值
6、,就相当于,就相当于用一个点来估计用一个点来估计 ,故得名,故得名“点估点估计计”。),(21nxxx),(21nXXX),(21nxxx如果总体分布中有如果总体分布中有多个多个待估参数待估参数 1,2,r,(1,2,r),则一般需要构造则一般需要构造不同的不同的统计量统计量,i=1,2,r,分别分别估计各个估计各个 i,且称且称为为第第 i 个参数个参数 i的估计量的估计量,其相应的估计,其相应的估计值值为为第第 i 个参数个参数 i的估计值的估计值,i=1,2,r.如果待估参数是总体未知参数如果待估参数是总体未知参数 的的实值函数实值函数 g()(如:如:总体总体 X e()时,待估参数时
7、,待估参数 EX=1/就是总体未知参数就是总体未知参数 的的实值函数,此时有实值函数,此时有 g()=1/),则称用来估计实值函数则称用来估计实值函数g()的统计量的统计量为该实值函数为该实值函数 g()的的估计量估计量,统计量,统计量的相应的实现值为该实值函数的相应的实现值为该实值函数 g()的的估计值估计值。且有且有 g()。),(21niXXX),(21niXXX),(21nixxx)(g)(g例例 5.1(P.150 例例 5.1)设某种型号的电子元件的寿命设某种型号的电子元件的寿命 X(以小时计)以小时计),(,(x 0)。)。为未知参数,为未知参数,0。现得样本值为。现得样本值为1
8、68,130,169,143,174,198,108,212,252,试估计未知参数试估计未知参数 。解解未知参数未知参数 的一个估计量,就是利用样本构造的一个的一个估计量,就是利用样本构造的一个函数。函数。方法一方法一 总体总体 X 服从参数为服从参数为的指数分布:的指数分布:X e(),EX=(),),即未知参数即未知参数 就是总体就是总体 X 的数学期望(均值)的数学期望(均值)。xexf1);(1101);(dxexdxxxfEXx因此一个自然的想法就是,用样本均值因此一个自然的想法就是,用样本均值来估来估计未知参数计未知参数 (即总体的均值),得到未知参数(即总体的均值),得到未知参
9、数 的一个的一个估计估计量量为为,其中,其中。对于给定的样本值,计算出未知参数对于给定的样本值,计算出未知参数 的一个的一个估计值估计值为为。即即 172.7。方法二方法二未知参数未知参数 的估计量也可以取为的估计量也可以取为,则相应的估计,则相应的估计值为值为。即。即 168。niiXnX11X1niiXnX117.172)252130168(9191911iixx12X16812 x方法三方法三记记 X(1)=min X1,X2,X9,X(9)=max X1,X2,X9。将未知参数将未知参数 的估计量取为的估计量取为,则,则相应的估计值为相应的估计值为。即即 180.由此可见,同一个未知参
10、数,其由此可见,同一个未知参数,其估计量可以是多个估计量可以是多个。对于。对于一个未知参数,一个未知参数,原则上原则上可以可以随意随意地去构造其估计量。因此,需地去构造其估计量。因此,需要制定出衡量各种估计量好坏的要制定出衡量各种估计量好坏的标准标准,对估计量进行评价。,对估计量进行评价。注注:由于作为估计量的统计量,是样本的函数,因而它是:由于作为估计量的统计量,是样本的函数,因而它是一个一个随机变量随机变量,具有不确定性具有不确定性。因此,在评价估计量时,不能。因此,在评价估计量时,不能仅凭一次仅凭一次估计的效果来衡量估计量的好坏,即不能用估计量的估计的效果来衡量估计量的好坏,即不能用估计
11、量的一次实现值(估计值)来衡量其好坏。要对估计量进行一次实现值(估计值)来衡量其好坏。要对估计量进行综合评综合评价价。最常用的评价估计量好坏的。最常用的评价估计量好坏的标准标准有:无偏性、有效性和相有:无偏性、有效性和相合性。合性。)(21)9()1(3XX180)252108(21)(21)9()1(3xx二、评价估计量的标准二、评价估计量的标准1、无偏性、无偏性待估参数待估参数 的一个好的估计量的一个好的估计量在多次使用中,其估计在多次使用中,其估计值应该在待估参数值应该在待估参数 的的真值的两侧对称分布真值的两侧对称分布,即,即的的平均值平均值应该与应该与 的真值基本一致,即的真值基本一
12、致,即。如果估计量的实现值如果估计量的实现值较多地偏向较多地偏向待估参数的真值的待估参数的真值的左左(右)边,则说明估计值通常要(右)边,则说明估计值通常要小小(大)(大)于于参数的真值,用这参数的真值,用这样的估计量去估计参数,通常会样的估计量去估计参数,通常会低估低估(高估)参数的真值。(高估)参数的真值。据此得到了评价估计量的据此得到了评价估计量的“无偏性无偏性”标准。标准。定义定义 5.1(P.150)设设为参数为参数 的的估计量,若估计量,若,则称,则称是是 的的无偏估计量无偏估计量,否则称,否则称是是 的的有偏估计量有偏估计量。若若,则称,则称是是 的的渐进无偏估计量渐进无偏估计量
13、。EE),(21nXXXlimEn例例 5.2(P.150 例例 5.2*)设(设(X1,X2,Xn)是取是取自总体自总体 X 的容量为的容量为 n 的样本。试验证样本方差的样本。试验证样本方差是总体方差是总体方差 2的无偏估计量,而统计量的无偏估计量,而统计量(未修正未修正的样本方差)是总体方差的样本方差)是总体方差 2的有的有偏估计量偏估计量。证证 总体方差总体方差 DX=2存在,存在,总体均值也存在,记为总体均值也存在,记为 ,即,即 EX=。又又(X1,X2,Xn)是取自总体是取自总体 X 的一个样本,的一个样本,EXi=EX=,DXi=DX=2,i=1,2,n。且且 X1,X2,Xn
14、相互独立。相互独立。212)(11XXnSnii212)(1XXnBnii于是,于是,样本均值样本均值满足满足:(即样本均值(即样本均值 X 是总体均值是总体均值 的无偏估计:的无偏估计:E X=EX=););(即即)。)。而而样本方差样本方差,故故 niiXnX11EXEXnEXnXnEXEniniinii11111)1(2121211111)1(nDXnDXnDXnXnDXDniniinii独立211nDXnXD)(11)(11212212XnXnXXnSniinii而而样本方样本方,故故 样本方差样本方差是总体方差是总体方差 2的的无偏无偏估估计量。计量。2222221221221221
15、22)1(1)(1)(1)(11111)(11)(11nnnnnXEXDnnEXDXnXEnnEXnXnEEXnXnXnEESniiiniiniinii)(11)(11212212XnXnXXnSniinii212)(11XXnSnii又又 统计量统计量是总体方差是总体方差 2的的有偏有偏估估计量(但它是总体方差计量(但它是总体方差 2的的渐进无偏渐进无偏估计量)。用统计量估计量)。用统计量 B2估计总体方差估计总体方差 2时,平均说来会低估时,平均说来会低估 2。可见,样本方差可见,样本方差 S2比未修正的样本方差比未修正的样本方差 B2具有具有更良好更良好的的统计性质。统计性质。212)(
16、1XXnBnii时)nnnESnnSnnEXXnnnEXXnEEBniinii()(11)1()(111)(122222221212例例 5.3设设 X1,X2,Xn(n 2)为来自总体为来自总体N(0,2)的简单随机样本,其样本均值为的简单随机样本,其样本均值为 X,记记 Yi=XiX,i=1,2,n。经计算经计算,得,得 EYi=0,i=1,2,n。若若 c(Y1+Yn)2是是 2的无偏估计量的无偏估计量,求常数求常数 c。解解。21nnDYi211),(nYYCovn2222221112112121)2(2211)(),(2)()()()(ncnnnnnncEYEYYYCovDYDYcY
17、YEYYDcYYcEYYcEnnnnnnn)2(2nnc注:注:当估计量当估计量是待估参数是待估参数 的无偏估计量时,其函的无偏估计量时,其函数数不一定不一定仍是仍是 g()的无偏估计量(的无偏估计量(取决于取决于函数函数 g()是否为线性函数)。即是否为线性函数)。即 当当时,时,不一定成立不一定成立。例如例如,设(,设(X1,X2,Xn)是来自总体是来自总体 X 的一组样的一组样本,且本,且 E X=,DX=2(0),),则样本均值则样本均值 X 是总体是总体均值均值 的无偏估计量,但函数的无偏估计量,但函数 X2却不是却不是 2的无偏估计量。的无偏估计量。事实上,事实上,。即。即 X2不
18、是不是 2的无偏估计量。的无偏估计量。又又:可构造:可构造 2的无偏估计量:的无偏估计量:,其中其中,一个待估参数一个待估参数 有时可以有有时可以有若干个若干个无偏估计量。无偏估计量。)(gE222221)(nXEXDXE)()(?)(gEgEgnSX222niiXnX11212)(11XXnSnii例如例如,在例,在例 5.1 中,总体中,总体 X e(),EX=,DX=2.未知参数未知参数 (0)的估计量)的估计量,其中,其中,以及以及都是参数都是参数 的无偏估计量。的无偏估计量。但是,但是,。从而有从而有。这说明,用这说明,用去估计未知参数去估计未知参数 时,估计值在时,估计值在 的的真
19、值周围真值周围较集中地较集中地对称分布对称分布,摆动的幅度比较小;而用,摆动的幅度比较小;而用去估计未知参数去估计未知参数 时,估计值在时,估计值在 的真值周围的真值周围较分散地较分散地对称分对称分布布,摆动的幅度比较大。这也就是说,摆动的幅度比较大。这也就是说,估计未知参数估计未知参数 时,时,一般比一般比更接近更接近 的真值的真值。因此,一个好的估计量不仅应该是无偏估计量,而且应该因此,一个好的估计量不仅应该是无偏估计量,而且应该有有尽可能小的方差尽可能小的方差。由此得到评价估计两好坏的第二个标准。由此得到评价估计两好坏的第二个标准有效性有效性。1X1niiXnX1112X2111nDXn
20、XDD212DXDXD21DDX112X122、有效性、有效性定义定义 5.2(P.152)设设与与是参数是参数 的的两个无偏估计两个无偏估计量量,若,若,则称估计量,则称估计量较较有效有效。在参数。在参数 的所的所有无偏估计量中,若有无偏估计量中,若的方差最小,则称估计量的方差最小,则称估计量是参数是参数 的的最有效(最优、最佳)的估计量最有效(最优、最佳)的估计量。注:注:只有当估计量只有当估计量与与都是都是参数参数 的无偏估计量的无偏估计量时,才讨论时,才讨论与与的有效性;的有效性;并非所有未知参数都具有最有效的估计量。并非所有未知参数都具有最有效的估计量。例例 5.4设设与与是参数是参
21、数 的两个相互独立的无偏估计的两个相互独立的无偏估计量,且量,且,求常数,求常数 k1和和 k2,使使也是参也是参数数 的无偏估计量,并使它在所有这种形式的估计量中最有效的无偏估计量,并使它在所有这种形式的估计量中最有效.1221DD12211221212DD2211kk解解,且,且与与相互独立,相互独立,依题意,欲求常数依题意,欲求常数 k1和和 k2,使使k1+k2=1,且且 使使 2k12+k22达到最小值达到最小值。即确定常数即确定常数 k1的值,使的值,使2k12+k22=2k12+(1 k1)2=3k12 2k1+1 达到最小值。达到最小值。令令 f(k1)=3k12 2k1+1,
22、由由 f (k1)=6k1 2=0,得其得其唯一的驻点唯一的驻点。f (k1)=6 0,是极小值点,也是最小值点是极小值点,也是最小值点.于是,所求的于是,所求的。21EE12212DD2222122212122112122112211)2()()()(DkkDkDkkkDkkEkEkkkE311k311k32311,3121kk例例 5.5设总体设总体 X 的期望的期望 和方差和方差 2都存在,都存在,(X1,X2)是容量为是容量为 2 的样本,说明统计量的样本,说明统计量哪个是总体期望哪个是总体期望 的最有效的估计量。的最有效的估计量。解解依题意依题意 EX1=EX2=EX=,DX1=DX
23、2=DX=2,且且 X1,X2相互独立。相互独立。,1和和 2是总体期望是总体期望 的无偏估计量。的无偏估计量。在总体期望在总体期望 的的无偏估计量无偏估计量 1和和 2中中,2是是 1、2、3中对总体期望中对总体期望 的最有效的最有效的估计量。的估计量。2122112121,4341XXXX2132131XX 2122112121,4341EXEXEEXEXE652131213EXEXE22212221185214141,85169161DXDXDDXDXD233613D注注:尽管:尽管 3的方差的方差最小,最小,但由于但由于 3不是总体期望不是总体期望 的无偏估计量,因此的无偏估计量,因此
24、 3也不是总体也不是总体期望期望 的最有效的估计量。的最有效的估计量。3、相合性(一致性)、相合性(一致性)无偏性和有效性都是无偏性和有效性都是小样本准则小样本准则,即性质成立与否与样本,即性质成立与否与样本容量容量 n 无关无关。如果某种准则只要求当样本容量如果某种准则只要求当样本容量 n 时,估计量具有某时,估计量具有某种优良性质(如渐进无偏性),则称这种准则为种优良性质(如渐进无偏性),则称这种准则为大样本准则大样本准则。相合性(一致性)是重要的大样本准则之一,它反映了估相合性(一致性)是重要的大样本准则之一,它反映了估计量的一种大样本性质。计量的一种大样本性质。222132136134
25、191DXDXD定义定义 5.3(P.153)设设为未知参数为未知参数 的估计量,若的估计量,若依概率收敛依概率收敛于于 ,即对任意,即对任意 0,有,有或或,则称,则称为为 的的(弱)相合估计量(弱)相合估计量。此时也称估计量。此时也称估计量具有具有相合性(一致性)相合性(一致性).定义定义 5.3 表明,表明,“相合性相合性”就是当样本容量就是当样本容量 n 无限增大无限增大时时,估计量估计量与未知参数与未知参数 的真值任意接近的概率趋于的真值任意接近的概率趋于 1。),(21nXXX1)(limPn0)(limPn例例 5.6根据伯努利大数定律(根据伯努利大数定律(P.115 定理定理
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第5章 参数估计与假设检验 参数估计 假设检验
限制150内