第四章 极大似然估计和广义矩估计优秀PPT.ppt





《第四章 极大似然估计和广义矩估计优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第四章 极大似然估计和广义矩估计优秀PPT.ppt(78页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章第四章 极大似然估极大似然估计和广义矩估计计和广义矩估计第一页,本课件共有78页第一节 极大似然估计法第二节 似然比检验、沃尔德检验和拉 格朗日乘数检验第三节 广义矩(GMM)估计第二页,本课件共有78页 除普通最小二乘法(OLS)外,极大似然估计(MLE)和广义矩估计(GMM)也是计量经济学中重要的估计方法。极大似然估计法和广义矩估计法适用于大样本条件下参数的估计,它们在大样本条件下显示了优良的性质。本章主要介绍极大似然法和广义矩方法以及基于极大似然估计的似然比(LR)检验、沃尔德(W)检验和拉格朗日乘数(LM)检验。第三页,本课件共有78页第一节 极大似然估计法 极大似然估计法(Ma
2、ximum Likelihood method ML)的应用虽然没有普通最小二乘法广泛,但它是一个具有更强理论性质的点估计方法,它以极大似然原理为基础,通过概率密度函数或者分布律来估计总体参数。对于一些特殊类型的计量经济模型,如我们后面将介绍的Logit和Probit模型,最小二乘法不再适用,极大似然法成为首选的估计方法。第四页,本课件共有78页一、极大似然法的思路 极大似然估计的出发点是已知被观测现象的分布,但不知道其参数。极大似然法用得到观测值(样本)最高概率的那些参数的值来估计该分布的参数,从而提供一种用于估计刻画一个分布的一组参数的方法。第五页,本课件共有78页例例4.1 设有一枚不均
3、衡的硬币,我们关心的是在每次抛掷该硬币出现正面的概率p。抛掷该硬币N次,假设得到 N1 次正面,N N1 次反面。由于每次抛硬币都是相互独立的,根据二项分布,得到这样一个样本的概率为:上式中的表达式可看作是未知参数p的函数,被称为似然函数(Likelihood function)。对p的极大似然估计意味着我们选择使似然函数达到最大的p值,从而得到p的极大似然估计量。第六页,本课件共有78页 实际计算中,极大化似然函数的对数往往比较方便,这给出对数似然函数解之,得到p的极大似然估计量上式达到极大的一阶条件是第七页,本课件共有78页 二、极大似然原理 下面我们以一般化的数学语言来描述极大似然估计法
4、的基本原理和参数估计过程。极大似然法的思路是,设 是随机变量X的密度函数,其中 是该分布的未知参数,若有一随机样本 ,则 的极大似然估计值是具有产生该观测样本的最高概率的那个 值,或者换句话说,的极大似然估计值是使密度函数 达到最大的值。由于总体有离散型和连续型两种分布,离散型分布通过分布律来构造似然函数,而连续型分布通过概率密度函数来构造似然函数,因此二者有区别,下面分别讨论。第八页,本课件共有78页离散型随机变量极大似然原理离散型随机变量极大似然原理 若总体为离散型分布,容易求得从样本 取到观察值 的概率,亦即事件 发生的概率为:其中,是待估参数向量。这一概率随 的取值而变化,它是 的函数
5、,称为样本的似然函数。第九页,本课件共有78页极大似然估计法就是在 取值的可能范围内挑选使似然函数 ,达到最大的参数值 作为参数 的估计值,即求 ,使得一般通过微分的方法求得 ,即令 得到,有时候也可通过迭代法来求 ,具体的计算方法根据随机变量的分布来确定这样得到的 称为参数 的极大似然估计值,而相应的统计量通常记为 ,称为参数 的极大似然估计量极大似然估计量。第十页,本课件共有78页连续型随机变量极大似然原理若总体为连续型分布,其概率密度函数为密度函数的形式已知。其中,是待估参数向量。设 是来自总体的随机样本,则 的联合概率密度为 设 是相应于样本的一组样本值,则随机点()落在点()的邻域内
6、的概率可近似地表示为其值随 的取值而变化。第十一页,本课件共有78页 与离散型的情况一样,我们取 的估计值 使 取到极大值,但 不随 而变,故只需考虑函数 的极大值,这里 称为样本的似然函数。若 则 称为 的极大似然估计量,记为 。第十二页,本课件共有78页通常情况下,关于 可微,这时 可从方程 解得。因为 与 在同一点处取到极值,的 极大似然估计值 通常从方程 解得,式中 称为对数似然函数。为了后面内容表述方便起见,我们将对数似然函数的一阶导数向量表示为 称为score向量向量或梯度向量梯度向量,的极大似然估计通过求解 得到,因此 称为似然方似然方程程。第十三页,本课件共有78页三、极大似然
7、估计量的性质极大似然估计量(MLE)的优势在于它们的大样本性质(渐近性质)。为介绍这些渐近性质,我们用 表示参数向量 的极大似然估计量(MLE),表示参数向量的真值。如果极大似然函数被正确设定,可以证明,在弱正则条件下,极大似然估计量具有以下渐近性质:第十四页,本课件共有78页(1)一致性:)一致性:是 的一致估计量,即,(2)渐近有效性:渐近有效性:是渐近有效的且达到所有一致估计量的Cramr-Rao下界,即在所有一致渐近正态估计量(consistent asymptotically normal estimators)中具有最小方差。(3)渐近正态性:渐近正态性:即渐近地服从正态分布,其中
8、V是渐近协方差矩阵第十五页,本课件共有78页协方差矩阵V由对数似然函数的形状决定。为了说明这一点,我们引入信息矩阵信息矩阵(Information Matrix)的概念,信息矩阵定义为在适当的正则条件下,可以证明,极大似然估计量的渐近协方差矩阵等于信息矩阵的逆矩阵,即第十六页,本课件共有78页四、线性回归模型的极大似然估计 线性回归模型是计量经济学应用最为广泛的模型,因 此讨论线性模型的极大似然估计是非常必要的。下面我们在随机扰动项服从正态分布的假设下分别讨 论双变量线性回归模型和多元线性回归模型的极大似然估计。非线性模型的极大似然估计,将在第五章中介绍。第十七页,本课件共有78页双变量线性回
9、归模型的极大似然估计双变量线性回归模型:其中,为待估参数,为随机扰动项。对随机扰动项作出如下假设:即随机扰动项具有0均值、同方差、不相关和服从正态分布的性质。第十八页,本课件共有78页因此,的概率密度函数为:根据以上假设可知:由于独立同分布,因此,联合概率密度函数,即似然函数为:第十九页,本课件共有78页对数似然函数为:令:得:第二十页,本课件共有78页不难看出,前两式与用普通最小二乘法得出的正规方程相同,故我们有但最后一式表明,的极大似然估计量与最小二乘估计量不同,我们记得,最小二乘估计量 是一个无偏估计量。而 第二十一页,本课件共有78页这表明,是一个有偏估计量 不难看出,当样本容量趋向无
10、穷时,因而 是一个渐近无偏估计量。第二十二页,本课件共有78页多元线性回归模型的极大似然估计下面我们来讨论一般形式的线性回归模型的极大似然估计,并以矩阵形式表示:对随机扰动项作出如下假设:根据以上假设,我们有:因此,的概率密度函数为:第二十三页,本课件共有78页由于 独立同分布,因此,联合概率密度函数,即似然函数为:对数似然函数为:对于残差平方和有:这里最后一个等号成立是因为第二行中所有各项都是标量,且中间两项互为转置矩阵,因而相等。第二十四页,本课件共有78页 RSS对 微分,得到:这里用到了矩阵微分的以下两条规则:(1)(2),第二个等号成立的条件是A为对称矩阵。在(4.19)式中,a是
11、,A是 。第二十五页,本课件共有78页由(4.19)式的结果,使对数似然函数(4.17)达到极大的一阶条件为 解此二正规方程,得:第二十六页,本课件共有78页 因此,在随机扰动项满足标准假设条件的情况下,的极大似然估计量与普通最小二乘估计量相同,方差 的ML估计量与OLS估计量则不同。是无偏的,而 是有偏的,但在大样本下渐近无偏。第二十七页,本课件共有78页 将这些极大似然估计量代入(4.17),就得到 lnL 的极大值:为了得到 的无偏估计量的Cramr-Rao下界,需要先计算信息矩阵 第二十八页,本课件共有78页信息矩阵是按 分块对角的,这是扰动项为正态分布的回归模型的一个重要性质,意味着
12、Cramr-Rao下界为:值得注意的是,达到了Cramr-Rao下界。在正态性的假设下,是最小方差无偏估计量(MVU),这表明,在所有无偏估计量而不仅仅是线性无偏估计量中方差最小。通过对矩阵中各项二阶偏导数的计算,我们得到第二十九页,本课件共有78页 例4.2 以简单的消费函数为例,说明极大似然估计法的估计过程。根据经济理论,消费和收入与价格密切相关,因此建立以国内生产总值GDP和消费价格指数p 为解释变量,国内总消费TC为被解释变量的消费方程。数据区间为19882007年。消费方程设定为:其中 服从正态分布。第三十页,本课件共有78页普通最小二乘估计的结果为:极大似然估计的EViews结果为
13、:可见,对于线性方程,用极大似然估计得到的系数估计值与用最小二乘法估计得到的结果完全相同。第三十一页,本课件共有78页第二节 似然比检验、沃尔德检验和拉格朗日乘数检验 似然比检验(Likelihood Ratio Test,LR)瓦尔德检验(Wald Test,W)拉格朗日乘数检验(Lagrange Multiplier Test,LM)是三种基于极大似然法的大样本检验方法。第三十二页,本课件共有78页 我们在第二章中介绍的F检验适用于检验CLR模型的线性约束条件。如果施加于模型的约束是非线性的,模型存在参数非线性,或者扰动项的分布不是正态的,在这些情况下,F检验就不再适用,通常需要采用LR、
14、W和LM这三个检验方法中的一个来检验约束条件是否成立。这三个检验方法是渐近等价的,与这些检验相联系的统计量的小样本分布是未知的,但它们每一个都渐近地服从自由度为约束条件个数的 分布第三十三页,本课件共有78页一、三种检验的基本原理 这三个检验统计量基于三个不同的原理,我们用下图来解释之。第三十四页,本课件共有78页 图中,对数似然函数()由上面的那条曲线表示,它是要估计的参数 的函数。是使 达到极大的 值。假设要检验的约束条件是,这一条件在 这个值得到满足,从图上看,这个点是函数 与横轴 的交点。下面对这三个检验所依据的原理作出解释。第三十五页,本课件共有78页 1.LR检验检验 如果约束条件
15、为真,则在施加约束条件的情况下,的极大值 不应当显著小于 的无约束极大值 。因此,LR检验要检验的是(-)是否显著异于0。2.W检验检验 如果约束条件 为真,则 不应当显著异于0,其中 是 的无约束极大似然估计值。因此,W检验要检验的是 是否显著异于0。第三十六页,本课件共有78页 3.LM检验检验 对数似然函数 在A点达到极大,在这点 关于 的斜率为0。如果约束条件为真,则 在B点的斜率不应当显著异于0。LM检验要检验的是用约束估计值 计算的 的斜率是否显著异于0。第三十七页,本课件共有78页二、似然比(LR)检验 设 为待估计参数向量,原假设 规定施加于这些参数上的约束,为 的无约束极大似
16、然估计量,为约束极大似然估计量。如果 和 分别是用这两个估计值计算的似然函数值,则似然比(Likelihood Ratio)为:第三十八页,本课件共有78页 此函数的值位于0和1之间,因为两个似然都是正的,并且 不会大于 (约束最优不可能超过无约束最优)。如果 过于小,则有理由怀疑约束条件的正确性。LR检验的检验统计量是 ,该统计量在大样本情况下服从自由度为约束条件个数的 分布。第三十九页,本课件共有78页三、沃尔德(W)检验l在实践中似然比检验的短处是需要估计约束和无约束参数向量,也就是说,既要进行约束回归,又要进行无约束回归。在复杂模型中,其中的一个估计值可能很难计算。幸运的是,有两个可供
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四章 极大似然估计和广义矩估计优秀PPT 第四 极大 估计 广义 优秀 PPT

限制150内