多元线性回归模型分析ppt课件.pptx
《多元线性回归模型分析ppt课件.pptx》由会员分享,可在线阅读,更多相关《多元线性回归模型分析ppt课件.pptx(82页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章第三章 多元线性回归模型多元线性回归模型* 多元线性回归模型是我们课程的重点多元线性回归模型是我们课程的重点,原因,原因在于:在于: 多元线性回归模型应用非常普遍;多元线性回归模型应用非常普遍; 原理和方法是理解更复杂计量经济学模型的原理和方法是理解更复杂计量经济学模型的基础;基础; 内容较为丰富内容较为丰富。本章主要内容本章主要内容 多元线性回归模型的描述多元线性回归模型的描述 参数参数 的的OLSOLS估计估计 OLSOLS估计量的有限样本性质估计量的有限样本性质 参数估计量的方差参数估计量的方差- -协方差矩阵和随机误协方差矩阵和随机误差项方差差项方差 2 2的估计的估计 单方程模
2、型的统计检验单方程模型的统计检验 多元线性回归模型实例多元线性回归模型实例3.1 3.1 多元线性回归模型的描述多元线性回归模型的描述1 1、多元线性回归模型的形式、多元线性回归模型的形式 由于在实际经济问题中,一个变量往往受到多个原因由于在实际经济问题中,一个变量往往受到多个原因变量的影响;变量的影响; “从一般到简单从一般到简单”的建模思路。的建模思路。 所以,在线性回归模型中的解释变量有多个,至少开所以,在线性回归模型中的解释变量有多个,至少开始是这样。这样的模型被称为始是这样。这样的模型被称为多元线性回归模型多元线性回归模型。 多元线性回归模型参数估计的原理与一元线性回归模多元线性回归
3、模型参数估计的原理与一元线性回归模型相同,只是计算更为复杂。型相同,只是计算更为复杂。 以多元线性回归模型的一般形式以多元线性回归模型的一般形式K元线性回归元线性回归模型入手进行讲解,其模型结构如下:模型入手进行讲解,其模型结构如下:Y= x1 1 + x2 2 + xk k + (1) 其中,其中,Y是被解释变量(因变量、相依变量、内是被解释变量(因变量、相依变量、内生变量),生变量),x是解释变量(自变量、独立变量、外生是解释变量(自变量、独立变量、外生变量),变量), 是随机误差项,是随机误差项, i, i = 1, , k 是回归参是回归参数数。 线性回归模型的意义在于把线性回归模型的
4、意义在于把Y分成两部分:确定分成两部分:确定性部分和非确定性部分。性部分和非确定性部分。 在研究中,我们根本无法了解式(在研究中,我们根本无法了解式(1)所示的总体模型的特)所示的总体模型的特征,而只能通过样本特征来近似考察。征,而只能通过样本特征来近似考察。 设经过设经过n次试验,得到次试验,得到n个样本,如下所示:个样本,如下所示: y1 x11 x12 x1 k y2 x21 x22 x2 k yn x n1 x n2 x nk 在计量经济学分析中,通常会借助矩阵工具,在此亦将在计量经济学分析中,通常会借助矩阵工具,在此亦将多元线性模型表示成矩阵形式,以便于下一步的数学运算。多元线性模型
5、表示成矩阵形式,以便于下一步的数学运算。) 1n(n21) 1(21)n(nn1n22211111) 1n(n21kkkkjkjkjxxxxxxxxxyyy(2) 写成一般形式为:写成一般形式为: Y = X + (3) 针对式针对式(3),),在这里主要讲参数估计和统计推断,但在在这里主要讲参数估计和统计推断,但在此之前,我们要先回顾一下什么模型才是多元线性回归模型,此之前,我们要先回顾一下什么模型才是多元线性回归模型,即了解线性回归模型的即了解线性回归模型的6大假设,这一点十分重要。大假设,这一点十分重要。(1)线性性线性性。即要求模型关于参数是线性的,关于扰动项是可加的。 (2) 满秩。
6、满秩。说明解释变量之间是线性无关的,这一假设很重要,在后面会经常受到。(3)回归性。回归性。x与不相关。(4)x的的DGP是外生的。是外生的。x相对于y是外生的,是非随机的。(5)球形扰动。球形扰动。同方差性和非自相关性。(6)正态假设。正态假设。 2 2、多元回归方程及偏回归系数的含义、多元回归方程及偏回归系数的含义称为多元回归方程(函数)多元回归方程(函数)。 多元回归分析(多元回归分析(multiple regression analysis)中,中,诸诸 i称为称为偏回归系数偏回归系数(partial regression coefficients)。)。 在经典回归模型的诸假设下,对
7、(在经典回归模型的诸假设下,对(1)式两边求)式两边求条件期望得条件期望得 E(Y|X1,X2,Xk)= x1 1 + x2 2 + xk k 偏回归系数偏回归系数的含义如下: 1度量着在度量着在X2,X3,Xk保持不变的情况下,保持不变的情况下,X1每变化每变化1个单位时,个单位时,Y的均值的均值E(Y)的变化,或者说的变化,或者说 1给出给出X1的单位变的单位变化对化对Y均值的均值的“直接直接”或或“净净”(不含其他变量)影响。(不含其他变量)影响。 其他参数的含义与之相同。其他参数的含义与之相同。 需要说明的是,如果令需要说明的是,如果令x x1 111,则,则 1 1便是常数项便是常数
8、项。习惯上把常数项看成为一个虚变量的系数,在参数估习惯上把常数项看成为一个虚变量的系数,在参数估计过程中该虚变量的样本观测值始终取计过程中该虚变量的样本观测值始终取1 1。 常数项的作用在于中心化常数项的作用在于中心化误差。误差。3.23.2 参数参数 的的OLSOLS估计估计参数参数 的的OLSOLS估计估计 附录:极大似然估计和矩估计附录:极大似然估计和矩估计投影和投影矩阵投影和投影矩阵分块回归和偏回归分块回归和偏回归偏相关系数偏相关系数我们的模型是:我们的模型是: iKKi1iiiiXb.XbYYYe1残差为:残差为:一、参数一、参数 的的OLSOLS估计估计 普通最小二乘估计原理:使样
9、本残差平方和最小普通最小二乘估计原理:使样本残差平方和最小Y= x11 + x22 + xk k + 关键问题是选择关键问题是选择 的估计量的估计量b,使得残差平方和最小。使得残差平方和最小。要使残差平方和要使残差平方和22iKKi11iiXb.XbYeQ0., 01KbQbQ于是得到关于待估参数估计值的于是得到关于待估参数估计值的K个方程(即正规方程组):个方程(即正规方程组):为为最小最小,则应有:,则应有:按矩阵形式,上述方程组可表示为:按矩阵形式,上述方程组可表示为:iik2iKKi1ik1ii2iKi2Ki1i21ii1iKi1K2i11YXXb.XXb.YXXXb.XXbYXXXb
10、.Xb)(XXbXY即YXbXX)(YYeeene.21 上述结果,亦可从矩阵表示的模型上述结果,亦可从矩阵表示的模型 出发,完全用矩阵代数推导出来。出发,完全用矩阵代数推导出来。 uXYbXY 其中:其中:残差可用矩阵表示为:残差可用矩阵表示为:残差平方和残差平方和 )()(YYYY)()(bXYbXY)(bXYXbYbXXbbXYYXbYYnnieeeeeeeeeQ.21212注意到上式中所有项都是注意到上式中所有项都是标量标量,且,且 bXYYXb )(XbXbYXbYYQ20)(beeYXbXXYXXXb1)(与采用标量式推导所得结果相同。与采用标量式推导所得结果相同。因为因为x是满秩
11、的(假设是满秩的(假设2),所以(,所以(X X)-1存在。所以,得到存在。所以,得到 的估计为的估计为用向量展开或矩阵微分法(用向量展开或矩阵微分法(前导前导不变、后不变、后导转置导转置),我们可得到),我们可得到关于待估参数估计值的正规方程组:关于待估参数估计值的正规方程组:令令故故 注:这只是得到了求极值的必要条件。到目注:这只是得到了求极值的必要条件。到目前为止,仍不能确定这一极值是极大还是极前为止,仍不能确定这一极值是极大还是极小。接下来考察求极值充分条件。小。接下来考察求极值充分条件。 注意到上述条件只是极小化问题的必要条件,为了注意到上述条件只是极小化问题的必要条件,为了判断充分
12、性,我们需要求出目标函数的判断充分性,我们需要求出目标函数的Hessian矩阵矩阵 : 如果这个如果这个Hessian矩阵是正定的,则可以判断所得矩阵是正定的,则可以判断所得到的解是唯一的最小二乘解。到的解是唯一的最小二乘解。 显然,根据正定矩阵的定义或者正定矩阵的判断准显然,根据正定矩阵的定义或者正定矩阵的判断准则,可知当矩阵的满秩条件满足时,矩阵是正定的,因则,可知当矩阵的满秩条件满足时,矩阵是正定的,因此最小二乘解的充分性成立。从而,此最小二乘解的充分性成立。从而,OLS估计量为:估计量为:YXXXb1)( 样本回归线的数值性质样本回归线的数值性质 需要注意的是,上述命题成立的前提是线性
13、模型中包含常数需要注意的是,上述命题成立的前提是线性模型中包含常数项,也就是第一个解释变量是项,也就是第一个解释变量是“哑变量哑变量”形式。这样一个思考题形式。这样一个思考题目就是,当线性模型中不包含常数项时,结论是什么样的?目就是,当线性模型中不包含常数项时,结论是什么样的?(3)的证明方法1 因为ei=0,所以对 两边求和即可。eyy极极大似然估计大似然估计 Y Y的随机抽取的的随机抽取的n组样本观测值的联合概率组样本观测值的联合概率 )()(21)(212122222211022)2(1)2(1),(),(bbnxbxbxbbynneeyyyPbLnkikiiinXYXY 对数似然函数为
14、对数似然函数为 参数的极大似然估计参数的极大似然估计 结果与参数的普通最小二乘估计相同结果与参数的普通最小二乘估计相同 )()(21)2()( 2*bbnLnLLnLXYXYYXXX1)(b矩矩估计估计(Moment (Moment Method,MMMethod,MM) ) 矩估计是基于实际参数满足一些矩估计是基于实际参数满足一些矩条件矩条件而形成的一种参数估而形成的一种参数估计方法。计方法。 随机变量的均值和方差如何得到?随机变量的均值和方差如何得到? 例:例:总体:总体:E(Y-)=0 样本矩(用样本矩估计总体矩):样本矩(用样本矩估计总体矩): 满足相应的矩条满足相应的矩条件:件:T1
15、tt0)(YT1 同理,方差的估计量是样本的二阶中心矩。同理,方差的估计量是样本的二阶中心矩。 现在,考虑一元线性回归模型中的假设条件:现在,考虑一元线性回归模型中的假设条件:0)E(x0)(Ettt 其所对应的样本矩条件分别为:其所对应的样本矩条件分别为:T1tT1tt10tt0)xb-b-(yT1T1T1tT1tt10tttt0)xbby(xT1xT1 可见,与可见,与OLS估计量的正规方程组是相同的。估计量的正规方程组是相同的。 多元线性回归模型矩估计的矩条件通常是这样构造的:多元线性回归模型矩估计的矩条件通常是这样构造的: 对于多元线性回归模型对于多元线性回归模型 Y=X+ 两边分别左
16、乘两边分别左乘 ,即得到,即得到XXXXYX)XXE(Y)XE(上式称为总体回归方程的一组矩条件。现在,我们随机抽取样上式称为总体回归方程的一组矩条件。现在,我们随机抽取样本,用样本矩代替总体矩,得到:本,用样本矩代替总体矩,得到:XbXn1YXn1 解此正规方程组即得参数的估计量,这种估计方法称为矩解此正规方程组即得参数的估计量,这种估计方法称为矩估计。其参数估计结果与估计。其参数估计结果与OLSOLS一致。一致。 样本形式:用每个解释变量分别乘以模型的两边,并对所样本形式:用每个解释变量分别乘以模型的两边,并对所有样本点求和,即得到:有样本点求和,即得到: kiikikiikiiiikik
17、iiiiikikiiixxxxxyxxxxxy)xxx(y)()(22112221122211YX)XX(b 对每个方程的两边求期望,有:对每个方程的两边求期望,有: )()()()()()(22112221122211kiikikiikiiiikikiiiiikikiiixxxxExyExxxxExyE)xxxEyE 得到一组矩条件得到一组矩条件 求解这组矩条件,即得到参数估计量求解这组矩条件,即得到参数估计量 与与OLS、ML估计量等价估计量等价kikikiikiiikikiiiikikiiixxbxbxbxyxxbxbxbxy)xbxbx(by)()(22112221122211 矩方法
18、是工具变量方法矩方法是工具变量方法(Instrumental Variables,IV)和广义和广义矩估计方法矩估计方法(Generalized Moment Method, GMM)的基础的基础 在矩方法中关键是利用了在矩方法中关键是利用了 如果某个解释变量与随机项相关,只要能找到如果某个解释变量与随机项相关,只要能找到1个工具变量,个工具变量,仍然可以构成一组矩条件。这就是仍然可以构成一组矩条件。这就是IV。 如果存在如果存在k+1个变量与随机项不相关,可以构成一组方程个变量与随机项不相关,可以构成一组方程数数k+1的矩条件。这就是的矩条件。这就是GMM。kjxEjii, 2 , 1, 0
19、)( 广义矩估计中,矩条件的个数大于参数个数,会出广义矩估计中,矩条件的个数大于参数个数,会出现什么问题呢?现什么问题呢? 过度识别过度识别 则必须想办法调和出现在过度识别系统中相互冲突则必须想办法调和出现在过度识别系统中相互冲突的估计。那如何解决呢?的估计。那如何解决呢? 广义矩估计的思想是使得样本矩与总体矩的加权距广义矩估计的思想是使得样本矩与总体矩的加权距离(即马氏距离)最小。主要是考虑到不同的矩所离(即马氏距离)最小。主要是考虑到不同的矩所起的作用可能不同。起的作用可能不同。 注意:注意:GMM估计是一个大样本估计。在大样本的估计是一个大样本估计。在大样本的情况下,情况下,GMM估计量
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 线性 回归 模型 分析 ppt 课件
限制150内