ch7.参数估计.doc
《ch7.参数估计.doc》由会员分享,可在线阅读,更多相关《ch7.参数估计.doc(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流ch7.参数估计.精品文档.第七章 参数估计Chapter Seven Parameter Estimation内容提要本章主要讲述点估计(矩法估计,极大似然估计);估计量的评价准则(无偏性,最小方差性和有效性,其它几个准则);区间估计(区间估计的一般步骤,单个正态总体参数的区间估计,双正态总体参数的区间估计,非正态总体参数的区间估计)等内容重点分析1、 理解点估计的概念,掌握矩估计法(一阶、二阶)。了解极大似然估计法。2、 了解估计量的评选标准(无偏性、有效性、一致性)。3、 理解区间估计的概念,会求单个正态总体的均值与方差的置信区间,会求
2、两个正态总体的均值差与方差比的置信区间。难点分析1、 矩法估计,极大似然估计。2、 估计量的评价准则。3、 正态总体参数的区间估计。7.1 点估计(Point Estimation)一、 矩估计法(Square Estimation)如上所述,例7.4中我们所做的对该地区农户的平均收入水平和贫富悬殊程度做出推断这一工作,用数理统计的话说,实质上是对总体的未知参数期望值与方差值进行估计。我们当时是分别用样本均值和样本方差来反映这两个量的,那么这样做是否合理?直观来看这样做是合理的,从概率论的观点看也是合理的。事实上,若总体的期望存在,,是出自的样本,则由柯尔莫哥洛夫强大数定律,以概率为地成立而上
3、式左边极限号内正是样本均值,因此,我们常用作为的估计值。不仅如此,若的阶矩存在,则同样由柯尔莫哥洛夫强大数定律得出以概率为成立。于是,同样可用样本阶原点矩来近似,这种用样本原点矩去估计总体相应原点矩的方法,即是所谓的矩估计法。一般地,若总体的分布有个参数,则显然,总体的阶矩如果存在的话,必依赖这些参数,即按照用样本矩近似真实矩的原则,可得方程 (7.1)若上述关于的方程组有唯一的解则称是的矩估计量(Square Estimator)或矩估计。Example 7.1 按矩估计的定义,无论总体是什么分布,阶样本原点矩均是它们相应真实原点矩的矩估计量,只要真实矩存在。因当我们将视为未知参数时,显然是
4、方程组(7.1)的唯一解。Example 7.2 无论总体为什么分布,只要二阶矩存在,则样本方差为方差的矩估计量。Solution 设为一样本,我们有故记为第三步等号再一次用到习题5.4需要估计的参数也可以不是总体的数字特征。Example 7.3 设为上的均匀分布,为样本,求的矩估计。Solution令解上述关于的方程得Example 7.4 贝努利试验中,事件发生的频率是该事件发生概率的矩法估计。Solution 此处,实际上我们视总体为“唱票随机变量”,即服从两点分布:求参数的矩法估计。设为的一个样本,若其中有个等于1,则即为事件发生的频率,另一方面,显然故有应用中许多问题可归结为例7.
5、4,如废品率的估计问题等。特别对固定的,经验分布函数也可在某种意义下看成是的矩估计。因为我们在5.3.2节中讲过,是次试验中事件发生的频率,而已知是的概率。当然这一矩估计所涉及的总体已不是原来的总体,而是相应的“唱票随机变量”。并非所有建立了方程组(7.1)的矩估计问题都能得到的解析表达式。Example 7.5 设总体的密度函数为为此总体的样本。则可以算出其中为伽(Gamma)函数,按矩估计原理分别用取代,得到形如(7.1)的方程组,但无法得到简单的解析表达式,只能求的数值解。(见习题7.20)使用矩估计法的一个前提是总体存在适当阶的矩,阶数应不小于待估参数的个数(或者说参数空间的维数),但
6、这不总是可以做到的。Example 7.6 柯西(Cauchy)分布 设总体具有密度函数显然,它的各阶矩皆不存在,因此,不能用矩估计法来估计参数另外,尽管矩估计法简便易行,且只要充分大,估计的精确度也很高,但它只用到总体的数字特征的形式,而未用到总体的具体分布形式,损失了一部分很有用的信息,因此,在很多场合下显得粗糙和过于一般。二、 极大似然估计(Maximum Likelihood Estimation)参数的点估计方法中另一个常用方法就是极大似然估计,简记为(Maximum Likelihood Estimation)。从字面上来理解,就是通过对样本的考察,认为待估参数最象是取什么值即作为
7、对参数的估计,事实上,极大似然估计原理也大致如此。我们通过一个具体例子来说明这一估计的思想。Example 7.7 已知甲、乙两射手命中靶心的概率分别为0.9及0.4,今有一张靶纸上面的弹着点表明为10枪6中,已知这张靶纸肯定是甲、乙之一射手所射,问究竟是谁所射?从直观上看,甲的枪法属上乘,命中靶心率为0.9,看来这次射击成绩不至于这么差;而乙的枪法又似乎尚不足以打出这么好的成绩,但二者取一,还是更象乙所射。我们来计算一下可能性。为此,我们建立一个统计模型:设甲、乙射中与否分别服从参数为的两点分布,今有样本,其中有6个观察值为1,4个为0,由此估计总体的参数是0.9,还是0.4这里因为参数空间
8、只有两个点:=0.9,0.4,我们不妨分别计算一下参数为什么的可能性大。若是甲所射,即参数,则此事发生的概率为;若是乙所射,即参数,则此事发生的概率为,尽管是乙所射的可能也不大,但毕竟比是甲所射的概率大了10倍,因此,在参数空间只有两点的情况下,概率的最大值在处发生,故我们更情愿认为是乙所射,即用0.4作为的估计:.总之,极大似然估计的出发点是基于这样一个统计原理,在一次随机试验中,某一事件已经发生,比如已经得到某个具体的样本,则必然认为发生该事件的概率最大。从例7.7我们可以看出,极大似然估计的做法,关键有两步:第一步写出某样本出现概率的表达式,对于离散型总体,设它的分布列为则上述样本出现的
9、概率为对于固定的样本,是参数的函数,我们称之为似然函数(Likelihood Function)。第二步则是求(是参空间),使得达到最大,此即为所求的参数的极大似然估计。这里还需要着重强调几点:) 当总体是连续型随机变量时,谈所谓样本出现的概率是没有什么意义的,因为任何一个具体样本的出现都是零概率事件。这时我们就考虑样本在它任意小的邻域中出现的概率,这个概率越大,就等价于此样本处的概率密度越大。因此在连续型总体的情况下,我们用样本的密度函数作为似然函数。) 为了计算方便,我们常对似然函数取对数,并称为对数似然函数(Logarithm likelihood function)。易知,与在同一处达
10、到极大,因此,这样做不会改变极大点。c) 在例7.7中参数空间只有两点,我们可以用穷举法求出在哪一点上达到最大,但在大多数情形中,包含维欧氏空间的一个区域,因此,必须采用求极值的办法,即对对数似然函数关于求导,再令之为0,即得, (7.2)我们称(7.2)为似然方程(组)(Likelihood equation (group) 。解上述方程,即得到的,Example 7.8 设是的样本,求与的Solution 我们有解似然方程组,即得看来,对于正态分布总体来说,,的矩估计与是相同的。矩估计与相同的情形还有很多,如例7.4的问题中,容易验证,事件发生的频率也是其概率的我们有更进一步的例子。Exa
11、mple 7.9 设有个事件两两互斥,其概率之和为1.做次重复独立试验,则各事件发生的频率为各相应概率的事实上,设样本记录了每次试验中所发生的事件,以表示次试验中事件发生的次数,则此样本出现的概率(似然函数)为于是 得似然方程即将上述个等式相加,注意到及得到右边即为事件发生的频率,显然事件与其它事件地位是相同的,故类似可得到需注意到,并非每个问题都可通过解似然方程得到,如Example 7.10 同例7.3,求均匀分布中参数的先写出似然函数 (7.3)本例似然函数不连续,不能用似然方程求解的方法,只有回到极大似然估计的原始定义,由式(7.3),注意到最大值只能发生在 (7.4)时;而欲最大,只
12、有使最小,即使尽可能小,尽可能大,但在式(7.4)的约束下,只能取,和矩估计的情形一样,有时虽能给出似然方程,也可以证明它有解,但得不到解的解析表达式。Example 7.11 同例7.7,求柯西分布中的我们可得似然方程为这个方程只能求数值解。7.2 估计量的评价准则(Evaluation Rule of Estimator)对于同一参数,用不同方法来估计,结果是不一样的。如例7.3与例7.10就表明了对于均匀分布,参数的矩估计与极大似然估计是不一样的,甚至用同一方法也可能得到不同的统计量。Example 7.12 设总体服从参数为的泊松分布,即则易知,分别用样本均值和样本方差取代和,于是得到
13、的两个矩估计量既然估计的结果往往不是唯一的,那么究竟孰优孰劣?这里首先就有一个标准的问题。一、无偏性(Unbiased) Definition 7.1 设是的一个估计量,若对任意的,都有,则称是的无偏估计量(Unbiased estimator),如果则称是的渐近无偏估计量(Approximation unbiased estimator),其中称为是的偏差(affect)。无偏性反映了估计量的取值在真值周围摆动,显然,我们希望一个量具有无偏性。Example 7.13 是总体期望值的无偏估计,因为Example 7.14 不是总体方差的无偏估计,因为注意到故但 因此是渐近无偏估计。在的基础上
14、,我们适当加以修正可以得到一个的无偏估计,这个估计量也和样本方差一样是经常被采用的:由此例也可以看出,例7.12中关于的两个矩估计量中,是无偏的,;而是有偏的,.我们在第五章曾经说过,对估计量的优劣的评价,一般是站在概率论的基点上,在实际应用问题中,含有多次反复使用此方法效果如何的意思。对于无偏性,也同样是这样,即是在实际应用问题中若使用这一估计量算出多个估计值,则它们的平均值可以接近于被估参数的真值。这一点有时是有实际意义的,如某一厂商长期向某一销售商提供一种产品,在对产品的检验方法上,双方同意采用抽样以后对次品进行估计的办法。如果这种估计是无偏的,那么双方都理应能够接受。比如这一次估计次品
15、率偏高,厂商吃亏了,但下一次估计可能偏低,厂商的损失可以补回来,由于双方的交往是长期多次的,采用无偏估计,总的来说是互不吃亏。然而不幸的是,无偏性有时并无多大的实际意义。这里有两种情况,一种情况是在一类实际问题中没有多次抽样,比如前面的例子中,厂商和销售商没有长期合作关系,纯属一次性的商业行为,双方谁也吃亏不起,这就没有什么“平均”可言。另一种情况是被估计的量实际上是不能相互补偿的,因此“平均”没有实际意义,例如通过试验对某型号几批导弹的系统误差分别做出估计,既使这一估计是无偏的,但如果这一批导弹的系统误差实际估计偏左,下一批导弹则估计偏右,结果两批导弹在使用时都不能命中预定目标,这里不存在“
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ch7 参数估计
限制150内