第四章极大似然估计和广义矩估计精选PPT.ppt
《第四章极大似然估计和广义矩估计精选PPT.ppt》由会员分享,可在线阅读,更多相关《第四章极大似然估计和广义矩估计精选PPT.ppt(77页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章极大似然估计第四章极大似然估计和广义矩估计和广义矩估计第1页,此课件共77页哦第一节 极大似然估计法第二节 似然比检验、沃尔德检验和拉 格朗日乘数检验第三节 广义矩(GMM)估计第2页,此课件共77页哦 除普通最小二乘法(OLS)外,极大似然估计(MLE)和广义矩估计(GMM)也是计量经济学中重要的估计方法。极大似然估计法和广义矩估计法适用于大样本条件下参数的估计,它们在大样本条件下显示了优良的性质。本章主要介绍极大似然法和广义矩方法以及基于极大似然估计的似然比(LR)检验、沃尔德(W)检验和拉格朗日乘数(LM)检验。第3页,此课件共77页哦第一节 极大似然估计法 极大似然估计法(Max
2、imum Likelihood method ML)的应用虽然没有普通最小二乘法广泛,但它是一个具有更强理论性质的点估计方法,它以极大似然原理为基础,通过概率密度函数或者分布律来估计总体参数。对于一些特殊类型的计量经济模型,如我们后面将介绍的Logit和Probit模型,最小二乘法不再适用,极大似然法成为首选的估计方法。第4页,此课件共77页哦一、极大似然法的思路 极大似然估计的出发点是已知被观测现象的分布,但不知道其参数。极大似然法用得到观测值(样本)最高概率的那些参数的值来估计该分布的参数,从而提供一种用于估计刻画一个分布的一组参数的方法。例例4.1 设有一枚不均衡的硬币,我们关心的是在每
3、次抛掷该硬币出现正面的概率p。抛掷该硬币N次,假设得到 N1 次正面,N N1 次反面。由于每次抛硬币都是相互独立的,根据二项分布,得到这样一个样本的概率为:第5页,此课件共77页哦 上式中的表达式可看作是未知参数p的函数,被称为似然函数(Likelihood function)。对p的极大似然估计意味着我们选择使似然函数达到最大的p值,从而得到p的极大似然估计量。实际计算中,极大化似然函数的对数往往比较方便,这给出对数似然函数上式达到极大的一阶条件是解之,得到p的极大似然估计量第6页,此课件共77页哦 二、极大似然原理 下面我们以一般化的数学语言来描述极大似然估计法的基本原理和参数估计过程。
4、极大似然法的思路是,设 是随机变量X的密度函数,其中 是该分布的未知参数,若有一随机样本 ,则 的极大似然估计值是具有产生该观测样本的最高概率的那个 值,或者换句话说,的极大似然估计值是使密度函数 达到最大的值。由于总体有离散型和连续型两种分布,离散型分布通过分布律来构造似然函数,而连续型分布通过概率密度函数来构造似然函数,因此二者有区别,下面分别讨论。第7页,此课件共77页哦离散型随机变量极大似然原理离散型随机变量极大似然原理 若总体为离散型分布,容易求得从样本 取到观察值 的概率,亦即事件 发生的概率为:其中,是待估参数向量。这一概率随 的取值而变化,它是 的函数,称为样本的似然函数。第8
5、页,此课件共77页哦极大似然估计法就是在 取值的可能范围内挑选使似然函数 达到最大的参数值 作为参数 的估计值,即求 ,使得一般通过微分的方法求得 ,即令 得到,有时候也可通过迭代法来求 ,具体的计算方法根据随机变量的分布来确定。这样得到的 称为参数 的极大似然估计值,而相应的统计量通常记为 ,称为参数 的极大似然估计量极大似然估计量。第9页,此课件共77页哦连续型随机变量极大似然原理若总体为连续型分布,其概率密度函数为密度函数的形式已知。其中,是待估参数向量。设 是来自总体的随机样本,则 的联合概率密度为 设 是相应于样本的一组样本值,则随机点()落在点()的邻域内的概率可近似地表示为其值随
6、 的取值而变化。第10页,此课件共77页哦 与离散型的情况一样,我们取 的估计值 使 取到极大值,但 不随 而变,故只需考虑函数 的极大值,这里 称为样本的似然函数。若 则 称为 的极大似然估计量,记为 。第11页,此课件共77页哦通常情况下,关于 可微,这时 可从方程 解得。因为 与 在同一点处取到极值,的 极大似然估计值 通常从方程 解得,式中 称为对数似然函数。为了后面内容表述方便起见,我们将对数似然函数的一阶导数向量表示为 称为score向量向量或梯度向量梯度向量,的极大似然估计过求解 得到,因此 称为似然方程似然方程。第12页,此课件共77页哦三、极大似然估计量的性质极大似然估计量(
7、MLE)的优势在于它们的大样本性质(渐近性质)。为介绍这些渐近性质,我们用 表示参数向量 的极大似然估计量(MLE),表示参数向量的真值。如果极大似然函数被正确设定,可以证明,在弱正则条件下,极大似然估计量具有以下渐近性质:第13页,此课件共77页哦(1)一致性:)一致性:是 的一致估计量,即,(2)渐近有效性:渐近有效性:是渐近有效的且达到所有一致估计量的Cramr-Rao下界,即在所有一致渐近正态估计量(consistent asymptotically normal estimators)中具有最小方差。(3)渐近正态性:渐近正态性:即渐近地服从正态分布,其中V是渐近协方差矩阵第14页,
8、此课件共77页哦协方差矩阵V由对数似然函数的形状决定。为了说明这一点,我们引入信息矩阵信息矩阵(Information Matrix)的概念,信息矩阵定义为在适当的正则条件下,可以证明,极大似然估计量的渐近协方差矩阵等于信息矩阵的逆矩阵,即第15页,此课件共77页哦 四、线性回归模型的极大似然估计 线性回归模型是计量经济学应用最为广泛的模型,因 此讨论线性模型的极大似然估计是非常必要的。下面我们在随机扰动项服从正态分布的假设下分别讨 论双变量线性回归模型和多元线性回归模型的极大似 然估计。非线性模型的极大似然估计,将在第五章中 介绍。第16页,此课件共77页哦双变量线性回归模型的极大似然估计双
9、变量线性回归模型:其中,为待估参数,为随机扰动项。对随机扰动项作出如下假设:即随机扰动项具有0均值、同方差、不相关和服从正态分布的性质。第17页,此课件共77页哦根据以上假设可知:因此,的概率密度函数为:由于独立同分布,因此,联合概率密度函数,即似然函数为:第18页,此课件共77页哦 对数似然函数为:令:,得 第19页,此课件共77页哦不难看出,前两式与用普通最小二乘法得出的正规方程相同,故我们有但最后一式表明,的极大似然估计量与最小二乘估计量不同,我们记得,最小二乘估计量 是一个无偏估计量。而 第20页,此课件共77页哦这表明,是一个有偏估计量 不难看出,当样本容量趋向无穷时,因而 是一个渐
10、近无偏估计量。第21页,此课件共77页哦多元线性回归模型的极大似然估计下面我们来讨论一般形式的线性回归模型的极大似然估计,并以矩阵形式表示:对随机扰动项作出如下假设:根据以上假设,我们有:因此,的概率密度函数为:第22页,此课件共77页哦由于 独立同分布,因此,联合概率密度函数,即似然函数为:对数似然函数为:注意到(4.17)中右端第二项的分子就是残差平方和,我们有:第23页,此课件共77页哦 这里最后一个等号成立是因为第二行中所有各项都是标量,且中间两项互为转置矩阵,因而相等。RSS对 微分,得到:这里用到了矩阵微分的以下两条规则:(1)(2),第二个等号成立的条件是A为对称矩阵。在(4.1
11、9)式中,a是 ,A是 。第24页,此课件共77页哦由(4.19)式的结果,使对数似然函数(4.17)达到极大的一阶条件为 解此二正规方程,得:第25页,此课件共77页哦 因此,在随机扰动项满足标准假设条件的情况下,的极大似然估计量与普通最小二乘估计量相同,方差 的ML估计量与OLS估计量则不同。是无偏的,而 是有偏的,但在大样本下渐近无偏。第26页,此课件共77页哦 将这些极大似然估计量代入(4.17),就得到 lnL 的极大值:为了得到 的无偏估计量的Cramr-Rao下界,需要先计算信息矩阵 第27页,此课件共77页哦信息矩阵是按 分块对角的,这是扰动项为正态分布的回归模型的一个重要性质
12、,意味着Cramr-Rao下界为:值得注意的是,达到了Cramr-Rao下界。在正态性的假设下,是最小方差无偏估计量(MVU),这表明,在所有无偏估计量而不仅仅是线性无偏估计量中方差最小。通过对矩阵中各项二阶偏导数的计算,我们得到第28页,此课件共77页哦 例4.2 以简单的消费函数为例,说明极大似然估计法的估计过程。根据经济理论,消费和收入与价格密切相关,因此建立以国内生产总值gdp和消费价格指数p 为解释变量,国内总消费tc为被解释变量的消费方程。数据区间为19882007年。消费方程设定为:其中 服从正态分布。第29页,此课件共77页哦普通最小二乘估计的结果为:极大似然估计的EViews
13、结果为:可见,对于线性方程,用极大似然估计得到的系数估计值与用最小 二乘法估计得到的结果完全相同。第30页,此课件共77页哦第二节 似然比检验、沃尔德检验和拉格朗日乘数检验 似然比检验(Likelihood Ratio Test,LR)瓦尔德检验(Wald Test,W)拉格朗日乘数检验(Lagrange Multiplier Test,LM)是三种基于极大似然法的大样本检验方法。第31页,此课件共77页哦 我们在第二章中介绍的F检验适用于检验CLR模型的线性约束条件。如果施加于模型的约束是非线性的,模型存在参数非线性,或者扰动项的分布不是正态的,在这些情况下,F检验就不再适用,通常需要采用L
14、R、W和LM这三个检验方法中的一个来检验约束条件是否成立。这三个检验方法是渐近等价的,与这些检验相联系的统计量的小样本分布是未知的,但它们每一个都渐近地服从自由度为约束条件个数的 分布第32页,此课件共77页哦一、三种检验的基本原理 这三个检验统计量基于三个不同的原理,我们用下图来解释之。第33页,此课件共77页哦 图中,对数似然函数()由上面的那条曲线表示,它是要估计的参数 的函数。是使 达到极大的 值。假设要检验的约束条件是,这一条件在 这个值得到满足,从图上看,这个点是函数 与横轴 的交点。下面对这三个检验所依据的原理作出解释。第34页,此课件共77页哦 1.LR检验检验 如果约束条件为
15、真,则在施加约束条件的情况下,的极大值 不应当显著小于 的无约束极大值 。因此,LR检验要检验的是(-)是否显著异于0。2.W检验检验 如果约束条件 为真,则 不应当显著异于0,其中 是 的无约束极大似然估计值。因此,W检验要检验的是 是否显著异于0。第35页,此课件共77页哦 3.LM检验检验 对数似然函数 在A点达到极大,在这点 关于 的斜率为0。如果约束条件为真,则 在B点的斜率不应当显著异于0。LM检验要检验的是用约束估计值 计算的 的斜率是否显著异于0。第36页,此课件共77页哦二、似然比(LR)检验 设 为待估计参数向量,原假设 规定施加于这些参数上的约束,为 的无约束极大似然估计
16、量,为约束极大似然估计量。如果 和 分别是用这两个估计值计算的似然函数值,则似然比(Likelihood Ratio)为:第37页,此课件共77页哦 此函数的值位于0和1之间,因为两个似然都是正的,并且 不会大于 (约束最优不可能超过无约束最优)。如果 过于小,则有理由怀疑约束条件的正确性。LR检验的检验统计量是 ,该统计量在大样本情况下服从自由度为约束条件个数的 分布。第38页,此课件共77页哦三、沃尔德(W)检验l在实践中似然比检验的短处是需要估计约束和无约束参数向量,也就是说,既要进行约束回归,又要进行无约束回归。在复杂模型中,其中的一个估计值可能很难计算。幸运的是,有两个可供选择的方法
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 极大 估计 广义 精选 PPT
限制150内