应用统计学 第六章 回归分析2.ppt
《应用统计学 第六章 回归分析2.ppt》由会员分享,可在线阅读,更多相关《应用统计学 第六章 回归分析2.ppt(72页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、四、多元线性回归模型的延伸n在实际经济活动中,经济变量的关系是复杂的,直接表现为线性关系的情况并不多见。n如著名的C-D生产函数表现为幂函数曲线形式、宏观经济学中的菲利普斯曲线(Pillips cuves)表现为双曲线形式等。n但是,大部分非线性关系又可以通过一些简单的数学处理,使之化为数学上的线性关系,从而可以运用线性回归模型的理论方法。1 1、倒数模型、多项式模型与变量的直接置换法、倒数模型、多项式模型与变量的直接置换法 例如,例如,描述税收与税率关系的拉弗曲线拉弗曲线:抛物线 s=a+b r+c r2 c0 s:税收;r:税率设X1=r,X2=r2,则原方程变换为 s=a+b X1+c
2、X2 c01010 xy120 xy1平均固定成本与产出水平平均固定成本与产出水平平均固定成本与产出水平平均固定成本与产出水平菲利普斯曲线菲利普斯曲线菲利普斯曲线菲利普斯曲线恩格尔曲线恩格尔曲线恩格尔曲线恩格尔曲线倒数模型的线性化:令倒数模型的线性化:令 原方程变为原方程变为:y=1+2zi+i2、幂函数模型、指数函数模型与对数变换法、幂函数模型、指数函数模型与对数变换法 例如例如,Cobb-Dauglas生产函数:幂函数 Q=AKLQ:产出量,K:投入的资本;L:投入的劳动 方程两边取对数:ln Q=ln A+ln K+ln L对数线性模型测度弹性n n对数线性模型的特点:斜率系数对数线性模
3、型的特点:斜率系数 测度了测度了Q Q对对L L的弹性:的弹性:ln Qi=ln A+ln Ki+ln Li+i例 美国咖啡需求:1970-1980n美国咖啡消费(y)与平均真实零售价格(x)数据如表,(x=名义价格/食品与饮料的消费者价格指数,1967年=100),求咖啡消费函数。n输入数据n建立模型:lny=+lnx+in参数估计:n与线形模型比较线性模型对数线性模型R2=0.663 1=-0.480R2=0.745 1=-0.253哪个模型更好(参数估计的精度、拟合程度)?回归参数的意义?不可比不可比R2的可比性问题n根据判定系数来比较两个模型的时候,一定要注意样本容量n和因变量都必须相
4、同,而解释变量则可取任何形式。n对咖啡需求的两个模型:nyi=+xi+inlnyi=+lnxi+InR2项是不可直接相比的,因为它们是不同尺度的。要比较必须进行处理。不同尺度R2的比较方法n以咖啡需求为例nyi=+xi+i (1)nlnyi=+lnxi+i (2)n方法一:对模型(1)得到的 取对数,然后求其与方程(2)的lnyi之间的R2,此R2与(2)的判定系数有可比性。n(1)转换后的R2=0.677线性模型的R2n两种方法比较结果相同:对数线性模型的拟合程度高于线性模型。半对数模型-测度增长率n假如要求GDP的增长率,有如下公式:nyt=y0(1+r)t 指数函数n其中,yt:时间t的
5、实际GDP;y0:实际GDP的初始值;r:y的复合增长率。n两边取对数:lnyt=lny0+tln(1+r)n令1=lny0,2=ln(1+r),并增加干扰项n方程变为:lnyt=1+2t+i半对数模型n模型特点:2 2:测度了测度了GDPGDP的恒定相对增长率。的恒定相对增长率。例:n用例5数据,求1956-1970年美国个人可支配收入的增长率。X2:个人可支配收入,x3:时间变量n模型:lnx2i=1+2x3i+in求解过程n结果:2=0.04228,说明56-70年间,美国个人可支配收入每年增长4.23%比较线性趋势模型:x2i=b2+b23x3i+ib23=17.13,说明个人可支配收
6、入每年平均增长17亿美元。3、复杂函数模型与级数展开法、复杂函数模型与级数展开法 方程两边取对数后,得到:(1+2=1)Q:产出量,K:资本投入,L:劳动投入 :替代参数,1、2:分配参数例如例如,常替代弹性CES生产函数 将式中ln(1K-+2L-)在=0处展开台劳级数,取关于的线性项,即得到一个线性近似式。如取0阶、1阶、2阶项,可得 五、含虚拟变量的回归n一些影响经济变量的因素是无法定量度量。为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们“量化”。n虚拟变量(定类尺度变量、范畴变量):n用来表示某一“性质”或属性出现或不出现,通常取值0或1,因而也称两值变量或两分变量。
7、n如:x表示性别,0=男性,1=女性n或x=0表示政策实施前,x=1表示政策实施后。n同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型或者方差分析(analysis-of variance:ANOVA)模型。被赋予0值的类别是基底(基准),1是基底类的截距。1、虚拟变量的性质n例:教授薪金与性别、教龄的关系nYi=1+2Di+Xi+I (1)n其中:Yi=教授的薪金,Xi=教龄,Di=性别教龄X年薪Y0女教授男教授12男教授平均薪金和女教授平均薪金水平相差2,但平均年薪对教龄的变化率是一样的2:级差截距系数薪金与性别:估计结果男教授平均薪金水平比女教授显著高$3.334K(男:21.3,女
8、:17.969)2、含有虚拟变量的回归问题n虚拟变量的设计n对多分定性变量,按照虚拟变量的个数比变量分类数少一的规则设虚拟变量。n例如受教育程度分为:低于中学、中学和大学三类,则应设两个虚拟变量:Yi=1+2D2i+3D3i+Xi+i“低于中学”类为基底为什么不能设三个虚拟变量?为什么不能设三个虚拟变量?为什么不能设三个虚拟变量?为什么不能设三个虚拟变量?2、含有虚拟变量的回归问题n美国制造业的利润-销售额行为季节调整例D2=1,第2季度;D3=1,第3季度;D4=1,第4季度 =0,其他季度;=0,其他季度;=0,其他季度剔除季节影响,销售额增加1美元,利润可望增加4美分3、比较两个回归n比
9、较英国在第二次大战后重建时期和重建后时期的总储蓄-收入关系是否发生变化。数据如表。D=1,重建时期 =0,重建后时期级差截距:区分两个时期的截距级差斜率系数:区分两个时期的斜率级差截距和级差斜率系数都是统计上显著的,表示两个时期的回归是相异的级差截距和级差斜率系数都是统计上显著的,表示两个时期的回归是相异的D=1D=0虚拟变量模型与方差分析n新食品定价和广告策略研究例协变量调整前协变量调整后六、六、模型设定偏误问题模型设定偏误问题 n模型设定偏误的类型模型设定偏误的类型 n模型设定偏误的后果模型设定偏误的后果n模型设定偏误的模型设定偏误的检验检验1、模型设定偏误的类型、模型设定偏误的类型 n模
10、型设定偏误主要有两大类:(1)关于解释变量选取的偏误,主要包括漏选相关变量和多选无关变量,(2)关于模型函数形式选取的偏误。a.相关变量的遗漏(相关变量的遗漏(omitting relevant variables)n例如,如果“正确”的模型为:而我们将模型设定为:即设定模型时漏掉了一个相关的解释变量。这类错误称为遗漏相关变量遗漏相关变量。b.无关变量的误选无关变量的误选 (including irrevelant variables)n例如例如,如果 Y=0+1X1+2X2+仍为“真”,但我们将模型设定为:Y=0+1X1+2X2+3X3+即设定模型时,多选了一个无关解释变量。c.错误的函数形
11、式错误的函数形式(wrong functional form)n例如,如果“真实”的回归函数为:但却将模型设定为:2 2、模型设定偏误的后果、模型设定偏误的后果 n当模型设定出现偏误时,模型估计结果也会与“实际”有偏差。这种偏差的性质及程度与模型设定偏误的类型密切相关。1)遗漏相关变量偏误遗漏相关变量偏误 采用遗漏相关变量的模型进行估计而带来的偏误称为遗漏相关变量偏误(omitting relevant variable bias)。设正确的模型为:Y=0+1X1+2X2+却对 Y=0+1X1+v进行回归,得:将正确模型 Y=0+1X1+2X2+的离差形式:代入得:(1)如如果果漏漏掉掉的的X
12、2与与X1相相关关,则则上上式式中中的的第第二二项项在在小小样样本本下下求求期期望望与与大大样样本本下下求求概概率率极极限限都都不不会会为为零零,从从而而使使得得OLSOLS估估计计量量在在小小样样本本下下有有偏,在大样本下非一致偏,在大样本下非一致。(2)如果如果X2与与X1不相关,则不相关,则 1 1的估计满足无偏性的估计满足无偏性与一致性;但这时与一致性;但这时 0 0的估计却是有偏的。的估计却是有偏的。何时1被高估?由由 Y=0+1X1+v 得得:由由 Y=0+1X1+2X2+得得:如果如果X2与与X1相关,显然有相关,显然有如果如果X2与与X1不相关,也有不相关,也有Why?2)包含
13、无关变量偏误包含无关变量偏误 采用包含无关解释变量的模型进行估计带来的偏误,称为包含无关变量偏误(including irrelevant variable bias)。设设 Y=0+1X1+v (*)为正确模型,但却估计了为正确模型,但却估计了 Y=0+1X1+2X2+(*)如果如果 2=0,则则(*)(*)与与(*)(*)相同,因此,可将相同,因此,可将(*)式视为以式视为以 2=0为约束的为约束的(*)式的特殊形式。式的特殊形式。由于所有的经典假设都满足,因此对由于所有的经典假设都满足,因此对 Y=0+1X1+2X2+(*)式进行式进行OLSOLS估计,可得到估计,可得到无偏无偏且且一致
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用统计学 第六章 回归分析2 应用 统计学 第六 回归 分析
限制150内