线性回归模型 (2)讲稿.ppt
《线性回归模型 (2)讲稿.ppt》由会员分享,可在线阅读,更多相关《线性回归模型 (2)讲稿.ppt(124页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于线性回归模型关于线性回归模型(2)第一页,讲稿共一百二十四页哦第二章第二章 线性回归模型线性回归模型 线性模型的参数估计线性模型的参数估计 线性模型的检验线性模型的检验预预 测测 实证分析实证分析第二页,讲稿共一百二十四页哦第一节第一节 线性模型的参数估计线性模型的参数估计模型假定及最小二乘估计模型假定及最小二乘估计 估计量的性质及参数的估计估计量的性质及参数的估计 约束最小二乘法约束最小二乘法 第三页,讲稿共一百二十四页哦2.1.1 模型假定及最小二乘估计模型假定及最小二乘估计一、模型及模型的假定一、模型及模型的假定v线性模型的一般形式是线性模型的一般形式是 (2.1)其中,其中,为被解
2、释变量(因变量),为被解释变量(因变量),为解释变量(自变量),为解释变量(自变量),是随机误差项,是随机误差项,j=1,2,k 为模型参数。为模型参数。第四页,讲稿共一百二十四页哦v对经济问题的实际意义:对经济问题的实际意义:与与 存存在线性关系,在线性关系,是是 的重要解释的重要解释变量。由于模型是现实问题的一种简化,以及数变量。由于模型是现实问题的一种简化,以及数据收集和测量是产生据收集和测量是产生 ,因此,因此 代表众多影代表众多影响响 变化的微小因素,称为干扰项。计量经济变化的微小因素,称为干扰项。计量经济学中的多种估计、检验、预测等分析方法,是针学中的多种估计、检验、预测等分析方法
3、,是针对不同性质的扰动项引入的。对不同性质的扰动项引入的。第五页,讲稿共一百二十四页哦v这里应该注意到,由于这里应该注意到,由于 的影响使的影响使 变化偏离变化偏离了了 决定的决定的 维空间平面。维空间平面。用矩阵表示(用矩阵表示(2.1)式变形为)式变形为等价地,总体回归模型表示为等价地,总体回归模型表示为 ,(2.2)第六页,讲稿共一百二十四页哦v总体回归方程为总体回归方程为 (2.3)其中,其中,第七页,讲稿共一百二十四页哦 v这里的这里的 表示对于不同的表示对于不同的 (),被解释变量),被解释变量 的均值向量;的均值向量;X是由解释变量是由解释变量 的数据构成的矩阵,其中截距项可视为
4、解释变量的数据构成的矩阵,其中截距项可视为解释变量总是取值为总是取值为1。有时也称为数据矩阵或设计矩阵。有时也称为数据矩阵或设计矩阵。第八页,讲稿共一百二十四页哦v那么,样本回归模型为那么,样本回归模型为 (2.4)样本回归方程为样本回归方程为 (2.5)其中,其中,这里这里 表示表示Y的样本估计值向量;的样本估计值向量;表示回归表示回归 系数估计值向量;系数估计值向量;e表示残差向量。表示残差向量。第九页,讲稿共一百二十四页哦v这里需要说明的是,在构建线性回归模型时,要这里需要说明的是,在构建线性回归模型时,要以总体回归方程以总体回归方程(2.3)式描述的内容为理论基础,式描述的内容为理论基
5、础,利用样本通过统计推断建立样本回归方程利用样本通过统计推断建立样本回归方程(2.5)式,然后借助样本回归模型()式,然后借助样本回归模型(2.4)式,)式,解释总体回归模型(解释总体回归模型(2.2)式所描述的实际经济问式所描述的实际经济问题。然而题。然而,线性回归分析是有前提的,下面我们将线性回归分析是有前提的,下面我们将介绍经典线性回归模型必须满足的假定条件。介绍经典线性回归模型必须满足的假定条件。第十页,讲稿共一百二十四页哦 1、零均值假定、零均值假定v 假定随机干扰项假定随机干扰项 期望向量或均值向量为零,即期望向量或均值向量为零,即 (2.6)第十一页,讲稿共一百二十四页哦2、同方
6、差和无序列相关假定、同方差和无序列相关假定v假定假定随机干扰项假定假定随机干扰项 不存在序列相关且方差相不存在序列相关且方差相同,即同,即第十二页,讲稿共一百二十四页哦即即 (2.7)其中,其中,为为n 阶单位矩阵。阶单位矩阵。3、假定随机干扰项、假定随机干扰项 与解释变量相互独立,即与解释变量相互独立,即 (2.8)这里通常假定这里通常假定X中的元素中的元素 为非随为非随机变量。机变量。第十三页,讲稿共一百二十四页哦4、无多重共线性的假定、无多重共线性的假定v假设各解释变量之间不存在线性关系,或者说各假设各解释变量之间不存在线性关系,或者说各解释变量的观测值之间线性无关,在此条件下,解释变量
7、的观测值之间线性无关,在此条件下,数据矩阵数据矩阵X列满秩列满秩此时,方阵此时,方阵 满秩满秩 (2.9)从而,从而,可逆,可逆,存在。存在。第十四页,讲稿共一百二十四页哦5、正态性假定、正态性假定v 假定随机干扰项假定随机干扰项 服从正态分布,即服从正态分布,即 这里假定这里假定1和假定和假定2是对随机干扰项性质的要求,同时满足也是对随机干扰项性质的要求,同时满足也成为成为“球形干扰项球形干扰项”。假定。假定3 的主要意义是方便线性回归的讨论的主要意义是方便线性回归的讨论和证明,避免由于和证明,避免由于X与随机干扰项有强相关时回归分析的有效与随机干扰项有强相关时回归分析的有效性和价值受到影响
8、;假定性和价值受到影响;假定4是多元线性回归分析的特定要求,是多元线性回归分析的特定要求,对保证回归分析的有效性和可靠性也很只要;假定对保证回归分析的有效性和可靠性也很只要;假定5实际上要实际上要求干扰项确实是多种微小扰动因素的综合,也是回归系数估计求干扰项确实是多种微小扰动因素的综合,也是回归系数估计量分布性质和相关统计推断的基础,但这一假定不是线性回归量分布性质和相关统计推断的基础,但这一假定不是线性回归分析必须要求,因为本身不影响回归系数估计的性质。分析必须要求,因为本身不影响回归系数估计的性质。第十五页,讲稿共一百二十四页哦v在实际经济问题中,这些假定条件有时可能并不在实际经济问题中,
9、这些假定条件有时可能并不成立。如何识别这些假定条件是否满足,以及假成立。如何识别这些假定条件是否满足,以及假定条件不成立时如何进行参数估计和检验,我们定条件不成立时如何进行参数估计和检验,我们将在下一章讨论。将在下一章讨论。第十六页,讲稿共一百二十四页哦二、最小二乘估计二、最小二乘估计v总体回归模型总体回归模型(2.2)式式 中的参数矩阵中的参数矩阵 各个元素,各个元素,反映了解释变量反映了解释变量 对被解释变量对被解释变量Y的影响程度。由于的影响程度。由于 矩阵是总体参数矩阵,通过矩阵是总体参数矩阵,通过有限的样本无法得到有限的样本无法得到 矩阵。只能通过统计推断矩阵。只能通过统计推断的思想
10、,用有限的样本对的思想,用有限的样本对 矩阵进行估计,得出矩阵进行估计,得出参数估计值矩阵参数估计值矩阵 。第十七页,讲稿共一百二十四页哦v求参数估计值矩阵求参数估计值矩阵 的方法是最小二乘的方法是最小二乘(OLS)法,即求法,即求 使得残差平方和使得残差平方和 达到最小。达到最小。由样本回归模型由样本回归模型(2.4)式式和样本回归方程为(和样本回归方程为(2.5)式)式可以得到残差矩阵可以得到残差矩阵 (2.10)第十八页,讲稿共一百二十四页哦v那么,残差平方和为那么,残差平方和为 (2.11)根据矩阵代数理论,对(根据矩阵代数理论,对(2.11)式以)式以 求偏导,求偏导,并令其为零,可
11、以得到方程并令其为零,可以得到方程即即 (2.12)称其为正则方程。称其为正则方程。第十九页,讲稿共一百二十四页哦v因为因为(X X)是一个非退化矩阵,所以有是一个非退化矩阵,所以有 (2.13)这就是线性回归模型参数的最小二乘估计量。这就是线性回归模型参数的最小二乘估计量。v这里需要提及的是,根据微积分的极值理论,这里需要提及的是,根据微积分的极值理论,只是函数只是函数 的一个驻点,应该证明的一个驻点,应该证明 确实使确实使得得 达到最小。事实上,对于任何一个达到最小。事实上,对于任何一个 ,有有 (2.14)第二十页,讲稿共一百二十四页哦v由于由于 满足正则方程满足正则方程(2.12)式,
12、于是式,于是 ,那么(那么(2.14)式中的第三项为零。这样就证明了)式中的第三项为零。这样就证明了对于任何的对于任何的 ,有,有 (2.15)v又因为又因为 是一个正定阵,故(是一个正定阵,故(2.15)式中的)式中的第二项总是非负的,于是第二项总是非负的,于是且等号成立当且仅当且等号成立当且仅当第二十一页,讲稿共一百二十四页哦v下面我们考虑一个多元线性回归模型的特例下面我们考虑一个多元线性回归模型的特例一元线性回归模型一元线性回归模型v假设影响被解释变量假设影响被解释变量Y的因素只有一个,记为的因素只有一个,记为X。已知得到已知得到Y和和X的一组观测值(的一组观测值(,)()(),于是有)
13、,于是有 ()这时,正则方程(这时,正则方程(2.12)式变为)式变为第二十二页,讲稿共一百二十四页哦v当当 ()不全相等时)不全相等时,这里这里 。于是正则方程左边的系数。于是正则方程左边的系数行列行列 式式n 。经过初等计算可以得到。经过初等计算可以得到 和和 的最小二乘估计分别为的最小二乘估计分别为其中,其中,第二十三页,讲稿共一百二十四页哦2.1.2 估计量的性质及参数的估计估计量的性质及参数的估计一、估计量的性质一、估计量的性质v在线性模型的经典假设的前提下,线性回归模型在线性模型的经典假设的前提下,线性回归模型参数的最小二乘估计有优良的性质,是对最小二参数的最小二乘估计有优良的性质
14、,是对最小二乘估计量有效性和其价值的有力支持。线性回归乘估计量有效性和其价值的有力支持。线性回归模型参数的最小二乘估计量性质的具体内容由高模型参数的最小二乘估计量性质的具体内容由高斯斯马尔可夫定理来体现。马尔可夫定理来体现。v高斯高斯马尔可夫(马尔可夫(Gauss-Markov)定理:在)定理:在线性模型的经典假设下,线性模型的经典假设下,参数的最小二乘估计量参数的最小二乘估计量是线性无偏估计中方差最小的估计量(是线性无偏估计中方差最小的估计量(BLUE估估计量)。计量)。第二十四页,讲稿共一百二十四页哦v下面我们逐一证明。下面我们逐一证明。1、线性特性、线性特性由(由(2.13)式知)式知
15、(2.16)令令 ,那么,(,那么,(2.16)式为)式为 (2.17)第二十五页,讲稿共一百二十四页哦v各个参数的估计量为各个参数的估计量为 (2.18)这里(这里(2.18)中的)中的 是矩阵是矩阵 的的k行因素构成的行向量,由此证明了参数估计量行因素构成的行向量,由此证明了参数估计量 具有线性特性。它不仅是具有线性特性。它不仅是Y的线性组合,也是的线性组合,也是 的线性组合。线性特性是确定参数估计量的的线性组合。线性特性是确定参数估计量的分布性质和进行统计推断的重要基础。分布性质和进行统计推断的重要基础。第二十六页,讲稿共一百二十四页哦2、无偏性、无偏性v由(由(2.17)式知)式知 (
16、2.19)这里需要提及的是,这个性质从概率分布的角度这里需要提及的是,这个性质从概率分布的角度反映了最小二乘估计量与参数真实值之间的内在反映了最小二乘估计量与参数真实值之间的内在联系,利用无偏性通过最小二乘估计量的概率分联系,利用无偏性通过最小二乘估计量的概率分布可以推断参数情况和范围等。布可以推断参数情况和范围等。第二十七页,讲稿共一百二十四页哦3、最小方差性、最小方差性v最小二乘估计量的有效性,也称为最小二乘估计量的有效性,也称为“有效性有效性”。即在模型参数的所有线性无偏估计量中最小二乘即在模型参数的所有线性无偏估计量中最小二乘估计的方差最小。估计的方差最小。v由(由(2.17)式知,最
17、小二乘估计量的协方差矩阵)式知,最小二乘估计量的协方差矩阵为为 (2.20)第二十八页,讲稿共一百二十四页哦v该协方差矩阵对角线上的因素就是模型各个参数该协方差矩阵对角线上的因素就是模型各个参数估计量的方差,其他因素是不同参数估计量之间估计量的方差,其他因素是不同参数估计量之间的协方差。的协方差。v下面需要证明,任何其他线性无偏估计量下面需要证明,任何其他线性无偏估计量 的方的方差都大于差都大于 ,不妨假设,不妨假设 (2.21)第二十九页,讲稿共一百二十四页哦v由于由于 为为 的无偏估计量,即有的无偏估计量,即有 (2.22)这样只有这样只有 或或那么有那么有 (2.23)第三十页,讲稿共一
18、百二十四页哦v在(在(2.23)式中)式中从而从而 (2.24)第三十一页,讲稿共一百二十四页哦v根据矩阵代数的知识,任何矩阵与自身转置的乘根据矩阵代数的知识,任何矩阵与自身转置的乘积都是半正定矩阵,(积都是半正定矩阵,(2.24)式中的)式中的 为半为半正定矩阵,其对角线上的元素必然是非负的,因正定矩阵,其对角线上的元素必然是非负的,因此得知,任意其他线性无偏估计量的方差都大于此得知,任意其他线性无偏估计量的方差都大于最小二乘估计量的方差。最小二乘估计量的方差。v这里需要说明的是,对于无偏估计,方差愈小愈这里需要说明的是,对于无偏估计,方差愈小愈好,因此高斯好,因此高斯马尔可夫(马尔可夫(G
19、auss-Markov)定理表明:最小二乘估计量定理表明:最小二乘估计量 在在 的线性无偏的线性无偏估计量中是最优的,所以我们也称估计量中是最优的,所以我们也称 在在 的的“最佳线性无偏估计量最佳线性无偏估计量”(BLUE估计量)。这个估计量)。这个实事奠定了最小二乘估计在线性回归模型中的地实事奠定了最小二乘估计在线性回归模型中的地位。位。第三十二页,讲稿共一百二十四页哦二、参数二、参数 的估计的估计v在线性回归模型在线性回归模型(2.7)式中还有一个重要的参数式中还有一个重要的参数 ,它是模型干扰项的方差,因而有时简称为误差方它是模型干扰项的方差,因而有时简称为误差方差。差。反映了模型误差以
20、及观测误差的大小,在反映了模型误差以及观测误差的大小,在线性回归分析中起着重要的作用。现在我们讨论线性回归分析中起着重要的作用。现在我们讨论 的估计问题。的估计问题。由样本回归模型(由样本回归模型(2.4)式知)式知 (2.25)第三十三页,讲稿共一百二十四页哦v令令 ,即有,即有说明说明e是是 的线性变换。其中,的线性变换。其中,M称为最小二乘称为最小二乘基本等幂矩阵。基本等幂矩阵。M有如下的性质:有如下的性质:1、对称性。即、对称性。即 (2.26)实际上,实际上,这个性质表明这个性质表明M为为 对称矩阵。对称矩阵。第三十四页,讲稿共一百二十四页哦2、等幂性。即、等幂性。即 (2.27)实
21、际上,实际上,所以所以第三十五页,讲稿共一百二十四页哦3、M与与X互相独立。即互相独立。即 (2.28)实际上,实际上,利用最小二乘基本等幂矩阵利用最小二乘基本等幂矩阵M的性质,以及的性质,以及(2.25)式,可以得到残差平方和为式,可以得到残差平方和为第三十六页,讲稿共一百二十四页哦v由于由于 和和 都是标量,由矩阵代数的知识都是标量,由矩阵代数的知识知知,标量应与其迹相等,并由迹的轮换性定理知,即标量应与其迹相等,并由迹的轮换性定理知,即第三十七页,讲稿共一百二十四页哦v再由迹的轮换性知再由迹的轮换性知 (2.29)从而,从而,即即 定义定义 (2.30)则则 为为 的无偏估计量,即的无偏
22、估计量,即 。第三十八页,讲稿共一百二十四页哦2.1.3 约束最小二乘法约束最小二乘法v对于线性回归模型(对于线性回归模型(2.2)式,在对参数向量)式,在对参数向量 没有附加任何约束条件的情况下,我们以前求出没有附加任何约束条件的情况下,我们以前求出了最小二乘估计量,并讨论了它的基本性质。但了最小二乘估计量,并讨论了它的基本性质。但是,在解决经济活动的实际问题中,我们需要求是,在解决经济活动的实际问题中,我们需要求带一定线性约束的最小二乘估计量。带一定线性约束的最小二乘估计量。假设参数向量假设参数向量 的线性约束为的线性约束为 (2.31)是一个相容线性方程组,其中是一个相容线性方程组,其中
23、D为为 的已知的已知矩矩 阵,而且秩为阵,而且秩为p,b为为 已知向量。已知向量。第三十九页,讲稿共一百二十四页哦v我们用我们用Lagrange乘子法求模型(乘子法求模型(2.2)满足线)满足线性约束(性约束(2.31)式的最小二乘估计量。)式的最小二乘估计量。,则线性约束(则线性约束(2.31)式可以表示为)式可以表示为 ,(2.32)我们的问题是在(我们的问题是在(2.32)式的)式的p个条件下,求使个条件下,求使得得达到最小的达到最小的 。第四十页,讲稿共一百二十四页哦v应用应用Lagrange乘子法构造目标函数为乘子法构造目标函数为其中其中 为为Lagrange乘子。对函乘子。对函数数
24、 求对求对 的偏导数,整理并的偏导数,整理并令它们等于零,得到令它们等于零,得到 (2.33)然后解(然后解(2.33)式和线性约束()式和线性约束(2.31)式组成)式组成的联立方程组。的联立方程组。第四十一页,讲稿共一百二十四页哦v为方便表述,我们用为方便表述,我们用 和和 表示(表示(2.33)式)式和(和(2.31)式的解。用)式的解。用 左乘(左乘(2.33)式,)式,整理整理 后得到后得到 (2.34)代入(代入(2.31)式得到)式得到 即即 (2.35)这是一个关于这是一个关于 的线性方程组。的线性方程组。第四十二页,讲稿共一百二十四页哦v因为因为D的秩为的秩为p,于是,于是
25、是是 的可的可逆矩逆矩 阵,从而(阵,从而(2.35)式有唯一的解)式有唯一的解 将将 代入(代入(2.34)式得到)式得到 (2.36)第四十三页,讲稿共一百二十四页哦v这里我们需要提及的是,这里我们需要提及的是,确实是线性约束确实是线性约束 下的下的 的最小二乘估计量。即的最小二乘估计量。即 应该满足:应该满足:1、;2、对一切满足、对一切满足 的的 ,都有,都有根据(根据(2.36)式容易验证)式容易验证 。第四十四页,讲稿共一百二十四页哦v下面我们只验证第二个结论即可。下面我们只验证第二个结论即可。利用(利用(2.15)式得到)式得到 (2.37)其中其中 是无约束条件下的最小二是无约
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 线性回归模型 2讲稿 线性 回归 模型 讲稿
限制150内