经典单方程计量经济学模型-多元线性回归.ppt
《经典单方程计量经济学模型-多元线性回归.ppt》由会员分享,可在线阅读,更多相关《经典单方程计量经济学模型-多元线性回归.ppt(112页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、竭尽全力而不是尽力而为在美国西雅图一所著名的教堂里,一位德高望重的牧师同教会学校一个班的学生讲故事。猎人带着猎狗去打猎,猎人击中了兔子的后腿,受伤的兔子拼命地逃跑,猎狗在后穷追不舍。可是追了一阵子,猎狗没追上,只好悻悻地回来。猎人气急败坏地说:“你真没用,连一只受伤的兔子都追不到!”猎狗辩解道:“我已经尽力而为了呀!”逃脱的兔子回来跟大家说:“他是尽力而已,我是竭尽全力呀!他没有追上我最多挨一顿骂,而我若不竭尽全力的跑,可就没命了呀!”牧师讲完故事后,又向全班承诺:谁要能背出圣经.马太福音中第五章到第七章的全部内容,他就邀请谁去“太空针”高塔餐厅参加免费聚餐会。圣经.马太福音中第五章到第七章的
2、全部内容有几万字,而且不押韵,要背诵起全文难度极大。尽管参加免费的聚餐会是许多学生梦寐以求的事情,但几乎所有的人都望而却步了。几天后,班上一个11岁的男孩,胸有成竹从头到尾按要求背了下来,竟然没有出一点差错。牧师比别人更清楚,即使在成年的信徒中,能背诵这篇文章的人也是罕见的。牧师不禁好奇地问:“你为什么能背下这么有长有难的文字呢?”男孩不假思索地回答道:“我竭尽全力。”如今,那个男孩成了首富,他就是比尔.盖茨。第三章第三章 经典典单方程方程计量量经济学模型:学模型:多元多元线性回性回归模型模型Multiple Linear Regression Model引 子:中国汽车的保有量会达到中国汽车
3、的保有量会达到2 2亿辆吗亿辆吗?中国经济的快速发展,使居民收入不断增加,数以百万中国经济的快速发展,使居民收入不断增加,数以百万计的中国人开始得以实现拥有汽车的梦想,中国也成为世界计的中国人开始得以实现拥有汽车的梦想,中国也成为世界上成长最快的汽车市场。上成长最快的汽车市场。截至截至2015年底,全国机动车保有量达年底,全国机动车保有量达2.79亿辆,其中汽车亿辆,其中汽车1.72亿辆。工信部装备工业司副司长王富昌日前指出,预亿辆。工信部装备工业司副司长王富昌日前指出,预计到计到2020年中国汽车保有量将超过年中国汽车保有量将超过2亿辆。亿辆。是什么因素导致中国汽车数量的增长是什么因素导致中
4、国汽车数量的增长?影响中国汽车行业发展的因素并不是单一的,经济增长、影响中国汽车行业发展的因素并不是单一的,经济增长、消费趋势、市场行情、业界心态、能源价格、道路发展、内消费趋势、市场行情、业界心态、能源价格、道路发展、内外环境、相关政策等,都会使中国汽车行业面临机遇和挑战。外环境、相关政策等,都会使中国汽车行业面临机遇和挑战。分析中国汽车行业未来的趋势分析中国汽车行业未来的趋势,应具体分析这样一些问题:应具体分析这样一些问题:中国汽中国汽车市市场发展的状况如何?展的状况如何?(用(用销售量售量观测)影响中国汽影响中国汽车销量的主要因素是什么?量的主要因素是什么?(如收入、价格、(如收入、价格
5、、费用、道路状况、能源、政策用、道路状况、能源、政策环境等)境等)各种因素各种因素对汽汽车销量影响的性量影响的性质怎怎样?(正、(正、负)各种因素影响汽各种因素影响汽车销量的具体数量关系是什么?量的具体数量关系是什么?所得到的数量所得到的数量结论是否可靠?是否可靠?中国汽中国汽车行行业今后的今后的发展前景怎展前景怎样?应当如何制定汽当如何制定汽车的的产业政策?政策?很明显,只用一个解释变量已很难分析汽车产业的发展很明显,只用一个解释变量已很难分析汽车产业的发展,还需要寻求有更多个解释变量情况的回归分析方法。还需要寻求有更多个解释变量情况的回归分析方法。怎样分析多种因素的影响?怎样分析多种因素的
6、影响?第三章 多元线性回归模型 本章主要讨论本章主要讨论:如何将如何将简单线性回性回归的研究方法推广到多的研究方法推广到多元的情况元的情况 多元多元线性回性回归模型及古典假定模型及古典假定 多元多元线性回性回归参数的估参数的估计 多元多元线性回性回归方程的方程的拟合合优度度 多元多元线性回性回归的区的区间估估计和假和假设检验 多元多元线性回性回归模型的模型的预测 含有虚含有虚拟变量的多元量的多元线性回性回归模型模型3.1 多元线性回归模型多元线性回归模型 一、多元线性回归模型一、多元线性回归模型 二、多元线性回归模型的基本假定二、多元线性回归模型的基本假定 一、多元线性回归模型一、多元线性回归
7、模型 多元多元线性回性回归模型模型:表现在线性回归模型中的表现在线性回归模型中的解释变量有多个。一般表现形式:解释变量有多个。一般表现形式:i=1,2,n其中其中:k为解释变量的数目,为解释变量的数目,j j称为称为回回归参数参数(regression coefficient)。)。习习惯惯上上:把把常常数数项看看成成为为一一虚虚变量量的的系系数数,该该虚变量的样本观测值始终取虚变量的样本观测值始终取1。这样:。这样:模型中解模型中解释变量的数目量的数目为(k+1+1)也也被被称称为为总体体回回归函函数数的的随随机机表表达达形形式式。它它的的非随机表达式非随机表达式为为:方程表示:方程表示:各
8、各变量量X X值固定固定时Y Y的平均响的平均响应。j j也也被被称称为偏偏回回归系系数数,表表示示在在其其他他解解释变量量保保持持不不变的的情情况况下下,X Xj j每每变化化1 1个个单位位时,Y Y的的均均值E(Y)E(Y)的的变化化;或或者者说 j j给出出了了X Xj j的的单位位变化化对Y Y均均值的的“直直接接”或或“净”(不含其他(不含其他变量)影响。量)影响。指对各个回归系数而言是指对各个回归系数而言是“线性线性”的,对变量则的,对变量则可是线性的,也可是非线性的可是线性的,也可是非线性的例如:生产函数例如:生产函数取自然对数取自然对数多元线性回归的多元线性回归的“线性线性”
9、总体回归模型总体回归模型n个随机方程的个随机方程的矩阵表达式矩阵表达式为为 其中其中样本回本回归函数函数:用来估计总体回归函数:用来估计总体回归函数其其随机表示式随机表示式:e ei i称称为残差残差或或剩余剩余项(residuals)(residuals),可看成是,可看成是总体回体回归函数中随机函数中随机扰动项 i i的近似替代。的近似替代。样本回本回归函数函数的的矩矩阵表达表达:或或其中:其中:总体回归函数总体回归函数 或或样本回归函数样本回归函数 或或 其中:其中:都是有都是有 个元素的列向量个元素的列向量 是有是有 +1个元素的列向量个元素的列向量 是第一列为是第一列为1 1的的 阶
10、解释变阶解释变量数据矩阵量数据矩阵 (截距项可视为解释变量取值为截距项可视为解释变量取值为1)1)总结:总结:二、多元线性回归模型的基本假定二、多元线性回归模型的基本假定 假设假设1 1:回归模型是正确设定的。回归模型是正确设定的。假设假设2:解释变量在所抽取的样本中具有变异性,且各:解释变量在所抽取的样本中具有变异性,且各X X之间不存在严格线性相关性(无完全多重共线性)。之间不存在严格线性相关性(无完全多重共线性)。假设假设3,随机误差项具有条件零均值性,随机误差项具有条件零均值性 假设假设4,随机误差项具有条件同方差及不序列相关性,随机误差项具有条件同方差及不序列相关性 假设假设5,随机
11、项满足正态分布,随机项满足正态分布 上述假设的上述假设的矩阵符号表示矩阵符号表示式:式:假设假设2 2,n(k+1)+1)矩阵矩阵X的秩的秩为k+1+1,即,即X列列满秩。满秩。假设假设3,假设假设4:随机误差项具有条件同方差及不序列相关性。:随机误差项具有条件同方差及不序列相关性。其中,其中,I为一为一n阶单位矩阵。阶单位矩阵。假设假设5,向量,向量 有一多维正态分布,即有一多维正态分布,即 基本假定的推论:基本假定的推论:注:注:CLRM CLRM 和和 CNLRMCNLRM以上假设(正态性假设除外)也称为线性回归以上假设(正态性假设除外)也称为线性回归模型的模型的经典假设经典假设或或高斯
12、(高斯(Gauss)假设)假设,满足,满足该假设的线性回归模型,也称为该假设的线性回归模型,也称为经典线性回归经典线性回归模型模型(Classical Linear Regression Model,CLRM)。)。同时满足正态性假设的线性回归模型,称为同时满足正态性假设的线性回归模型,称为经经典正态线性回归模型典正态线性回归模型(Classical Normal Linear Regression Model,CNLRM)。)。3.2 多元线性回归模型的参数估计一、普通最小二乘估计一、普通最小二乘估计二、参数估计量的性质二、参数估计量的性质三、样本容量问题三、样本容量问题四、参数估计举例四、
13、参数估计举例说 明明估计对象:估计对象:模型结构参数模型结构参数随机项的分布参数(方差)随机项的分布参数(方差)估计方法:估计方法:3大类方法:大类方法:OLS、ML或者或者MM在经典模型中多应用在经典模型中多应用OLS在非经典模型中多应用在非经典模型中多应用ML或者或者MM一、普通最小二乘估计一、普通最小二乘估计对于随机抽取的对于随机抽取的n组观测值组观测值如果如果样本函数本函数的参数估计值已经得到,则有:的参数估计值已经得到,则有:i=1,2n根据根据最小二乘原理最小二乘原理,参数估计值应该是下列方程组的解,参数估计值应该是下列方程组的解 其中kjniXYijiLL,2,1,0,2,1),
14、(=于是得到关于待估参数估计值的于是得到关于待估参数估计值的正正规方程方程组:正正规方程方程组的的矩矩阵形式形式条件?条件?即:将上述过程用矩阵表示如下:将上述过程用矩阵表示如下:即求解方程组:即求解方程组:得到:于是:正正规方程方程组 的另一种写法的另一种写法对于对于正正规方程方程组 于是于是 或或(*)(*)或(或(*)是多元线性回归模型)是多元线性回归模型正正规方程方程组的另一的另一种写法种写法。(*)(*)样本回本回归函数的离差形式函数的离差形式i=1,2n其矩阵形式矩阵形式为 其中:在离差形式下,参数的最小二乘估计结果为在离差形式下,参数的最小二乘估计结果为 随机误差项随机误差项 的
15、方差的方差 的无偏估计的无偏估计 可以证明,随机误差项可以证明,随机误差项 的方差的无偏估计量为的方差的无偏估计量为 二二、参数估计量的性质 在满足基本假设的情况下,其结构参数在满足基本假设的情况下,其结构参数 的的普通普通最小二乘估最小二乘估计、最大或然估最大或然估计及及矩估矩估计仍具有:仍具有:线性性线性性、无偏性无偏性、有效性有效性。同时,随着样本容量增加,参数估计量具有:同时,随着样本容量增加,参数估计量具有:渐近无偏性、渐近有效性、一致性。渐近无偏性、渐近有效性、一致性。利用矩阵表达可以很方便地证明利用矩阵表达可以很方便地证明,注意证明过程中利用注意证明过程中利用的基本假设。的基本假
16、设。1、线性性性性 其中其中,C=(X,C=(XX)X)-1-1 X X 为一一仅与固定的与固定的X X有关的行向有关的行向量。量。2、无偏性、无偏性 这里利用了假设这里利用了假设:E(X)=0 3、有效性(最小方差性)、有效性(最小方差性)其中利用了其中利用了 和三、样本容量问题三、样本容量问题 所谓所谓“最小样本容量最小样本容量”,即从最小二乘原理,即从最小二乘原理和最大或然原理出发,欲得到参数估计量,不管和最大或然原理出发,欲得到参数估计量,不管其质量如何,所要求的样本容量的下限。其质量如何,所要求的样本容量的下限。最小样本容量最小样本容量 样本最小容量必本最小容量必须不少于模型中解不少
17、于模型中解释变量量的数目(包括常数的数目(包括常数项),即即 n k+1+1因为,因为,无多重共线性要求:秩无多重共线性要求:秩(X)=)=k+1+1 2 2、满足基本要求的样本容量、满足基本要求的样本容量 从统计检验的角度从统计检验的角度:n30 时,Z检验才能应用;n-k8时,t分布较为稳定 一般经验认为一般经验认为:当n30或者至少n3(k+1)时,才能说满足模型估计的基本要求。模型的良好性模型的良好性质只有在大只有在大样本下才能本下才能得到理得到理论上的上的证明。明。地区城地区城镇居民消居民消费模型模型被解释变量:地区城镇居民人均消费被解释变量:地区城镇居民人均消费Y解释变量:解释变量
18、:地区城镇居民人均工资性收入地区城镇居民人均工资性收入X1地区城镇居民人均其它地区城镇居民人均其它X2样本:样本:2013年,年,31个地区个地区 四、多元线性回归模型的参数估计实例四、多元线性回归模型的参数估计实例 数据数据地区现金消费支出Y工资性收入X1其他收入X2地区现金消费支出Y工资性收入X1其他收入X2 北 京26274.930273.015000.8 湖 北15749.515571.89608.7 天 津21711.923231.912423.7 湖 南15887.113951.410691.6 河 北13640.614588.49554.4 广 东24133.325286.511
19、217.5 山 西13166.216216.47797.2 广 西15417.615647.89381.0 内蒙古19249.118377.98600.1 海 南15593.015773.09146.8 辽 宁18029.715882.012022.9 重 庆17813.916654.710195.7 吉 林15932.314388.39155.9 四 川16343.514976.08917.9 黑龙江14161.712525.88623.4 贵 州13702.913627.67785.5 上 海28155.033235.415643.9 云 南15156.115140.79557.6 江 苏
20、20371.521890.013241.0 西 藏12231.919604.02956.7 浙 江23257.224453.016788.0 陕 西16679.716441.07667.8 安 徽16285.215535.39470.8 甘 肃14020.713329.76819.3 福 建20092.721443.411939.3 青 海13539.514015.68115.4 江 西13850.514767.58181.9 宁 夏15321.115363.98402.8 山 东17112.221562.19066.0 新 疆15206.215585.36802.6 河 南14822.014
21、704.28982.3变量量间关系关系变量量间关系关系OLSOLS估估计OLSOLS估估计结果果3.3 多元线性回归模型的统计检验多元线性回归模型的统计检验 一、拟合优度检验一、拟合优度检验 二、方程的显著性检验二、方程的显著性检验(F(F检验检验)三、变量的显著性检验(三、变量的显著性检验(t t检验)检验)四、参数的置信区间四、参数的置信区间 一、拟合优度检验一、拟合优度检验 1 1、可决系数与调整的可决系数、可决系数与调整的可决系数则 总离差平方和的分解总离差平方和的分解由于=0所以有:注意:注意:一个有趣的一个有趣的现象象-+=ikiikiiieYXeXee110L 可决系数可决系数该
22、统计量越接近于该统计量越接近于1,模型的拟合优度越高。,模型的拟合优度越高。问题:问题:在应用过程中发现,如果在模型中增加一个解在应用过程中发现,如果在模型中增加一个解释变量,释变量,R2往往增大。往往增大。这就给人一个错觉:这就给人一个错觉:要使得模型要使得模型拟合得好,只合得好,只要增加解要增加解释变量即可量即可。但是,现实情况往往是,由增加解释变量个数但是,现实情况往往是,由增加解释变量个数引起的引起的R2的增大与拟合好坏无关的增大与拟合好坏无关,R2需调整。需调整。调整可决系数的原因原因对于有k个解释变量的多元回归方程,可决系数的另一计算式如下:其中,分母总离差平方和其中,分母总离差平
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 经典 方程 计量 经济学 模型 多元 线性 回归
限制150内