第七线性回归模型的扩展.ppt
《第七线性回归模型的扩展.ppt》由会员分享,可在线阅读,更多相关《第七线性回归模型的扩展.ppt(62页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七线性回归模型的扩展现在学习的是第1 页,共62 页 前几章所讨论的,都是基于横截面数据的线性回归模型,涉及的变量均是数值变量。实际上,许多经济变量之间并不存在线性关系,建模中涉及的许多变量也不直接表现为数值,而是属于分类变量的范畴。为了扩大计量经济建模方法的适用范围,本章拟将横截面数据的线性回归建模方法扩展到对非线性关系的分析,并将计量经济模型的变量类型从数值变量扩展到分类变量。现在学习的是第2 页,共62 页2023/5/4 2 线性回归分析的前提是作为被解释变量的经济变量与作为解释变量的经济变量之间存在着线性关系。这里所说的线性是指解释变量线性并且参数线性。但是,在众多的经济现象中,分
2、析经济变量之间的关系,根据某种经济理论和对实际经济问题的分析,所建立的经济模型往往不符合上面的线性要求,即模型是非线性的,称为非线性模型(Non-linear Model)。非线性模型包括两种情况:(1)解释变量非线性,但是参数线性。(2)参数非线性。尤其参数非线性是对古典假定SLR.1和MLR.1的违背,对回归分析影响很大。本节针对第一种情况进行讨论,常用的变量非线性回归模型包括对数函数模型、双曲线模型和多项式模型。这类模型有一个共同特点,可以利用变量转换等处理方法将模型线性化,线性化后的模型即可采用OLS方法进行参数估计。这类非线性模型被称为内蕴线性模型,或广义线性模型。第一节 变量非线性
3、回归模型现在学习的是第3 页,共62 页2023/5/4 3一、对数函数模型(一)双对数函数模型 回归分析经常使用的对数模型是双对数函数模型(Double-log Model),考虑如下形式的需求收入模型(7.2)(7.2)中的参数是以线性形式出现在模型中的,虽然(7.1)中原变量x和y之间是非线性的,但因变量与自变量的对数形式是线性的,因而称双对数函数模型。对数函数模型的自变量和因变量中,至少有一种是原始变量的对数形式。具体分为以下两种类型:两边取对数,模型可变换为:(7.1)现在学习的是第4 页,共62 页2023/5/4 4 实际工作中,双对数模型应用非常广泛,其原因在于,如果忽略误差项
4、,(7.2)是一条直线(y和x都是对数形式),所以它的斜率(1)为一常数,是y相对于x的弹性系数:所以弹性为一常数。由于这个特殊的性质,双对数模型又称为不变(固定)弹性模型。对这类模型可作如下代换,令双对数模型可化为标准线性模型在古典假定满足的情况下,可以使用OLS对模型进行估计。现在学习的是第5 页,共62 页2023/5/4 5对于多个解释变量的情形,(7.2)式可以扩展为(7.3)称为偏弹性系数。它度量了在其他变量不变的条件下,被解释变量y对于解释变量 的弹性系数。如著名的柯布道格拉斯(CobbDouglas)生产函数模型,就是这类模型的一个典型,我们下面举例说明。例7-1 表7-1列出
5、了抽样调查得到的某市19个规模以上制造业企业的投入产出数据。试用回归分析法分析企业产出中各要素的贡献及其特点。现在学习的是第6 页,共62 页2023/5/4 6企业 产值Q(万元)职工数L(人)固定资产K(万元)大华 1291.87 874 2051.92麒麟 1347.05 895 2151.3双剑 1399.6 917 2250.21衡麓 1505.11 957 2370.26六合 1578.97 953 2488.97春风 1652.86 966 2606.61联华 1784.91 1033 2754.66太岳 1994.57 1098 2953.78东海 2123.23 1175 3
6、157.15荷佳 2269.77 1152 3376.42博世 2411.94 1154 3635.99科维 2608.81 1207 3918.47梅花 2774.98 1230 4223.82绿源 2965.3 1296 4550.49人和 3067.12 1334 4846.77花都 3290.3 1374 5205.33金鼎 3540.57 1592 5615.31谦祥 3749.77 1415 6098.25表71 某市19个规模以上制造业企业的投入产出数据现在学习的是第7 页,共62 页2023/5/4 7用EViews建立双对数模型,回归结果如下:样本回归方程为:Dependen
7、tVariable:LOG(Q)Method:LeastSquaresIncludedobservations:19afteradjustmentsVariable Coefficient Std.Error t-Statistic Prob.C-1.545211 0.590710-2.615855 0.0187LOG(L)0.339701 0.188987 1.797479 0.0912LOG(K)0.841910 0.095141 8.849122 0.0000R-squared 0.994499 Meandependentvar 7.651499AdjustedR-squared 0.9
8、93811 S.D.dependentvar 0.365836S.E.ofregression 0.028780 Akaikeinfocriterion-4.114328Sumsquaredresid 0.013253 Schwarzcriterion-3.965206Loglikelihood 42.08611 F-statistic 1446.223Durbin-Watsonstat 0.432115 Prob(F-statistic)0.000000现在学习的是第8 页,共62 页2023/5/4 8 对样本回归方程解释如下:斜率系数0.3397表示产出对劳动投入的弹性,即表明在资本投入
9、保持不变的条件下,劳动投入每增加一个百分点,平均产出将增加0.3397个百分点。同样地,在劳动投入保持不变的条件下,资本投入每增加一个百分点,产出将平均增加0.8419个百分点。两个弹性系数相加为规模报酬系数,其数值大于1,表明该市经济的特征很可能是规模报酬递增的(如果数值等于1,属于规模报酬不变;小于1,则属于规模报酬递减)。现在学习的是第9 页,共62 页2023/5/4 9 根据单边检验的结果,这两个系数各自均是统计显著的(这是用单边检验,即,因为我们预期劳动力和资本对产出影响都是正向的),模型的F值也是高度显著的(因为prob=0.0000),因此能够拒绝零假设:劳动力与资本对产出无影
10、响。R2值为0.995,表明劳动力和资本(对数)的变动解释了大约99.5%的产出(对数)的变动,说明了模型很好地拟合了样本数据。现在学习的是第10 页,共62 页2023/5/4 10(二)半对数函数模型线性模型与对数函数模型的混合就是半对数模型(Semi-log Models)。因变量是对数形式(对数线性模型):(7.4)解释变量是对数形式(线性对数模型):(7.5)这两个模型的参数是以线性形式出现的,虽然原变量之间是非线性的,但被解释(解释)变量的对数与解释(被解释)变量之间是线性关系,因此,半对数函数模型可以很容易地转换成线性模型,并使用OLS估计参数。现在学习的是第1 1 页,共62
11、页2023/5/4 11对于半对数模型(7.4),显然有 可见,表示x每变化一个相对单位(变动率)对应的y的平均绝对变动量,所以,半对数函数模型又称增长率模型。(7.4)常用于度量由解释变量相对变动率导致的被解释变量平均变动的绝对数量;(7.5)常用于度量由解释变量绝对量变化导致的被解释变量的平均相对变动率。两个模型中的斜率系数 又被称为半弹性(Semi-elasticity)系数。现在学习的是第12 页,共62 页2023/5/4 12二、双曲线模型形如的模型,称为双曲线模型(Double-curve Model)。该模型刻画了 y与x的反向变动关系,其显著特点是随着 x的无限增大(即 1/
12、x接近于零),y趋近于。令,原模型可化为线性形式即可用OLS的方法进行估计。菲利普斯曲线(Phillips Curve)就是这个模型在经济分析中应用的典型体现。菲利普斯曲线刻画了通货膨胀率与失业率的反向变动关系,如图7-1。现在学习的是第13 页,共62 页2023/5/4 13 失业率与通货膨胀率负向相关,同时通货膨胀率变化有一个渐近底限。当失业率x趋于无穷大时,通货膨胀率y将取渐近值。0失业率菲利普斯曲线现在学习的是第14 页,共62 页2023/5/4 14三、多项式函数模型 多项式回归模型(Polynomial Regression Model)在生产与成本函数分析中被广泛地使用。如果
13、用y表示成本,x表示产出,则可以建立以下多项式模型,体现微观经济分析中的二者关系:总成本(TC):边际成本(MC)和平均成本(AC)的 PRF为:(7.8)即总体回归函数(PRF)为:现在学习的是第15 页,共62 页2023/5/4 15产出x成本y产出x成本yMCTCAC 成本曲线 如果模型的解释变量为时间变量t,多项式函数模型又称为曲线回归模型,常常用于对非线性长期趋势的拟合。有时为了反映自变量之间的交互影响,也需要用到多项式回归模型。现在学习的是第16 页,共62 页2023/5/4 16 如以y、x、z分别表示单位面积上的粮食产量、施肥量和灌溉用水量。由于施肥量和灌溉用水量对粮食产量
14、的效应之间存在交互影响,所以,可以建立以下模型:施肥量x对粮食产量y的总边际影响是:是施肥量对粮食产量的直接效应(假定灌溉用水量不变),是施肥量对粮食产量的间接效应,随灌溉用水量的不同而变化,说明肥效的发挥取决于灌溉用水的多少。同样,灌溉用水z对粮食产量y的总边际影响也可以这样分解。显然,该模型比单纯的二元回归模型 更符合实际情况。现在学习的是第17 页,共62 页2023/5/4 17例7-2 表7-3给出了某市16个企业的产品产量(x)与单位产品成本(y)的抽样调查数据。试研究二者的依存关系。企业序号产品产量(吨)x单位产品成本(元/吨)y企业序号产品产量(吨)x单位产品成本(元/吨)y1
15、 430 3462 9 602 31082 410 3433 10 619 30683 432 3275 11 756 30514 501 3151 12 738 30075 552 3108 13 695 30686 565 3076 14 647 30347 588 3146 15 635 29818 665 3057 16 788 2962 企业产品产量与单位产品成本数据现在学习的是第18 页,共62 页2023/5/4 18 根据规模经济的原理,产品产量是单位产品成本变化的原因。为了明确二者的具体关系类型,使用EViews的Graph功能,绘制散点图如下:现在学习的是第19 页,共62
16、 页2023/5/4 19 显然,二者的关系不是线性关系。可供选择的模型有以下两种:双曲线模型:半对数模型:分别拟合两种模型,回归结果整理如下:模型 的估计值与t 检验值 的估计值与t 检验值R2AIC SCt 检验值 t 检验值双曲线半对数2489.77247.833.4413.18367183.6-646.28.70-7.510.840.8011.1411.3811.2311.48 双曲线模型和幂函数模型的系数均通过了显著性检验,但前者无论是R2还是AIC、SC均好于后者,所以,最终的模型应为双曲线模型:现在学习的是第20 页,共62 页2023/5/4 20 该回归结果说明,单位产品成本
17、随产量的上升而下降,当产品产量趋近于无穷大时,单位产品成本趋近于2489.7元/吨,这就是单位产品成本的理论最低值(实际上是可变成本部分)。四、Box-Cox变换 在考察被解释变量y和解释变量 的关系时,经常用的两种模型是线性模型和对数线性模型事实上,经济学家对被解释变量和解释变量之间的具体的函数关系并不是很清楚的。现在学习的是第21 页,共62 页2023/5/4 21 由博克斯和考克斯(Box,Cox,1964)引进的Box-Cox变换对于利用样本数据确定函数形式非常有益的。对一种关系中的所有变量进行某个变换就会得到一个由变换参数决定的函数族,线性和对数线性关系是这个函数族中的两个特例。函
18、数形式最终由估计的变换参数值确定。我们考虑变量z的下列Box-Cox变换:时,;时,;时,。现在学习的是第22 页,共62 页2023/5/4 22 对某个特殊的关系式的所有变量都进行Box-Cox变换可得到下列模型 时,这个模型就是双对数模型(7.13)。时,可得即它和线性模型(7.12)是等价的。对于其它的 的值,确定其它的函数形式。现在学习的是第23 页,共62 页2023/5/4 23 也可以进行更一般的变换,它就是每个变量的变换参数不一样。此时变换后得到的模型为可能有些变量以线性的形式出现(,有些变量以对数的形式出现(,有些变量以倒数的形式出现(,等等。这样得到的函数族更大些,但是它
19、也给我们估计参数带来困难。接下来,我们需要做的事情就是利用样本数据估计变换参数 或()以及,得到估计的函数形式。一般采用极大似然估计方法估计参数,在此不展开讨论。现在学习的是第24 页,共62 页2023/5/4 24五、小结 计量经济模型设定的重要方面是要使所设定的变量间函数形式能够体现变量间的基本关系。总体回归模型是对总体回归函数的描述,总体回归函数正是计量经济要去估计的目标。但其真实的函数形式事先并不知道。所谓模型函数形式的设定,是指根据对变量间相互关系的已有认识,把y的条件期望设定为解释变量x的某种函数。总体条件期望函数,可以设定为各种具体的函数形式。在计量经济学的实践中,通常把总体回
20、归函数的具体函数形式设定为初等函数,应当注意的是不同函数形式中参数的经济意义有较大差异。常用的函数形式见课本P217表7-5(课件略)。现在学习的是第25 页,共62 页2023/5/4 25 大多数模型中,边际和弹性系数为变量,其大小取决于具体样本点自变量或(和)因变量的取值。在实际应用时,一般用 代替具体的 计算,得到的是平均的边际效应或弹性系数。现在学习的是第26 页,共62 页2023/5/4 26第三节 虚拟变量虚拟变量含义虚拟解释变量的回归分类变量表现为多种状态现在学习的是第27 页,共62 页2023/5/4 27 迄今为止,本教材涉及的变量都是数值变量,诸如市场需求量、商品的价
21、格、收入、产量等;但我们在建模时还经常遇到另外一些“变量”,如职业、性别、地区、季节等等。例如,季节的变化会对某些商品的需求量产生影响;性别或者职业的不同,其收入水平可能会有很大的差异。再如,当研究某一经济问题时还可能有些起暂时作用的“变量”,诸如在某一时期出现了战争、天灾、人祸等。诸如此类的“变量”都是分类变量,或称为“非数值变量”、“定性变量”或“名义变量”。一、虚拟变量 现在学习的是第28 页,共62 页2023/5/4 28 在计量经济建模过程中,有时候分类变量是不可缺少的。但由于在一般情况它们并不表现为具体的数值,为了将分类变量引入计量经济模型中,需要率先将其数量化,即转化为所谓的“
22、虚拟变量”(Dummy Variable),又被称为二元变量或二进制变量(Binary Variable),一般用D来表示。分类变量数量化的方法是,当分类变量起作用时,赋值“D1”;不起作用时,赋值“D0”。通过定义虚拟变量,就可以将分类变量等同于数值变量,引入回归模型之中。现在学习的是第29 页,共62 页2023/5/4 29 计量经济模型中,虚拟变量可以发挥多方面的作用:比如,作为属性因素的代表,如性别、所有制等;可以作为某些非精确计量的数量因素的代表,如受教育程度、管理者素质等;作为某些偶然因素或政策因素的代表,如战争、灾害、改革前后等;实现分段回归,研究斜率、截距的变动,或比较两个回
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七 线性 回归 模型 扩展
限制150内