《自相关和面板数据.pptx》由会员分享,可在线阅读,更多相关《自相关和面板数据.pptx(82页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多元线性回归模型的基本经典假定多元线性回归模型的基本经典假定 假设1 随机误差项具有零均值。假设2 对于解释变量的所有观测值,随机误差项有相同的方差。(如果违反,则出现异方差)第1页/共82页假设3 3 随机误差项彼此之间不相关 (如果违反,则出现自相关)假设4 所有的解释变量Xi与随机误差项彼此之间不相关。(遗漏变量中经常出现,会出现参数估计有偏)第2页/共82页假设5 解释变量Xi之间不存在精确的线形关系,即解释变量的样本观测值矩阵X是满秩矩阵,应满足关系式:rank(X)=k+1n (如果违反,则出现多重共线性)第3页/共82页假设6 6 随机误差项服从正态分布,Y也服从正态分布。在大样
2、本下,这一假设可以放松为i.i.d.假设7 不太可能出现大异常值。第4页/共82页u的方差协方差矩阵经典假设异方差自相关第5页/共82页异方差经常出现在截面数据中,因为在截面数据中经常会出现 的情况。解决方法:异方差稳健的标准差。FGLS(可行性广义最小二乘法)自相关经常出现在时间序列数据中,因为在时间序列数据中,经常会出现的 的情况。面板数据可以看作是截面数据和时间序列的集合,所以既有可能出现异方差,又有可能出现自相关。第6页/共82页截面数据的残差图第7页/共82页时间序列数据的残差图第8页/共82页第9页/共82页由于经济活动通常具有某种连续性或持久性,自相关现象在时间序列中很常见。比如
3、,相邻两年的GDP 增长率、通货膨胀率。又比如,某个意外事件或新政策的效应需要逐步地随时间推移而释放出来;滞后的调整过程,比如,最优资本存量需要通过若干年的投资才能逐渐达到。第10页/共82页 再比如大多数经济时间数据都有一个明显的特点:惯性,表现在时间序列不同时间的前后关联上。由于消费习惯的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关)。例如,绝对收入假设下居民总消费函数模型:Ct=0+1Yt+t t=1,2,n第11页/共82页或者写成:其中称为相关系数第12页/共82页自相关的数学形式第13页/共82页第14页/共82页自相关的检验图形法残差与X的散点图自相关图(auto
4、-correlation cofficient)偏自相关图(partial auto-correlation cofficient)第15页/共82页例题:利用B2_lutkepohl.dta数据集建立消费和收入之间的一元线性回归模型。并检验是否存在自回归,是一阶还是高阶。use B2_lutkepohl.dta,cleartsset yearreg consum incomepredict e1,resscatter e1 income,yline(0)ac e1pac e1第16页/共82页第17页/共82页第18页/共82页 杜宾和沃特森他们成功地导出了临界值的下限dL和上限dU,且这些
5、上下限只与样本的容量n和解释变量的个数k有关,而与解释变量X的取值无关。D.W.统计量:第19页/共82页 D.W检验步骤:(1)计算DW值(2)给定,由n和k的大小查DW分布表,得临界值dL和dU(3)比较、判断第20页/共82页 若 0D.W.dL 存在正自相关 dLD.W.dU 不能确定 dU D.W.4dU 无自相关 4dU D.W.4 dL 不能确定 4dL D.W.2时不能直接应用这种“前后”比较方法。为了分析该面板数据集中的所有观测值,我们使用固定效应回归方法。第59页/共82页固定效应模型对于特定的个体i而言,ai 表示那些不随时间改变的影响因素,如个人的消费习惯、国家的社会制
6、度、地区的特征、性别等,一般称其为“个体效应”(individual effects)。如果把“个体效应”当作不随时间改变的固定性因素,相应的模型称为“固定效应”模型。第60页/共82页固定效应模型第61页/共82页第62页/共82页对于固定效应模型,可采用虚拟变量法。基本思想:固定效应模型实质上就是在传统的线性回归模型中加入 N-1 个虚拟变量,使得每个截面都有自己的截距项。由于固定效应模型假设存在着“个体效应”,每个个体都有其单独的截距项。这就相当于在原方程中引入n1个虚拟变量(如果省略常数项,则引入n个虚拟变量)来代表不同的个体,获得每个个体的截据项。第63页/共82页第64页/共82页
7、例如:共有7个州,方程可以写成:7个州的回归线斜率相同,但截距不同。第1个州的截距是:第2个州的截距是:第3个州的截距是:第65页/共82页固定效应模型的估计算法“个休中心化”OLS算法或者组内离差估计法假设原方程为:(式1)给定第i 个个体,将(式1)两边对时间取平均可得,(式2)第66页/共82页(式1)(式2),得:可以用OLS方法一致地估计,称为“固定效应估计量”(Fixed Effects Estimator),记为由于 主要使用了每个个体的组内离差信息,故也称为“组内估计量”(within estimator)。第67页/共82页固定效应模型的优势和劣势面板固定效应模型的优势是:即
8、使个体特征ui与解释变量Xit相关,只要使用组内估计量,就可以得到一致估计,即即使存在不随时间改变的遗漏变量,也可得到无偏一致的估计。面板固定效应模型的劣势是:模型无法估计不随时间而变的变量之影响,这需要用我们后面要讲到的随机效应模型。第68页/共82页在交通事故死亡人数中的应用由于(10.8)式中的“差分”回归只用了1982年和1988年的数据(具体讲就是这两年的差额),而(10.15)式中的固定效应回归用到了所有7年的数据,因此这两个回归是不同的。由于利用了更多的数据,因此(10.15)式中的标准误差小于(10.8)式中的标准误差。第69页/共82页固定效应模型的stata实现 use g
9、runfeld,clear xtset company year xtdes xtline invest固定效应模型:xtreg invest mvalue kstock,fe第70页/共82页回归结果解读1。三个R2哪个重要?2。固定效应为什么有两个F检验?3。corr(u_i,Xb)的含义。4。sigma_u、sigma_e、rho的含义。第71页/共82页1。因为固定效应模型是组内估计量(离差),因此,只有within是一个真正意义上的R2,其他两个是组间相关系数的平方。2。右侧的F统计量表示除常数项外其他解释变量的联合显著性。最后一个F检验,原假设所有U_i=0,即不存在个体效应,此时
10、证明pooled ols 更有效。首先注意:结果中的u_i不表示残差,而是表示个体效应。第72页/共82页3。corr(u_i,Xb)个体效应与解释变量的相关系数,相关系数为0或者接近于0,可以使用随机效应模型;相关系数不为0,需要使用固定效应模型。4。sigma_u:表示个体效应的标准差sigma_e:表示干扰项的标准差rho:rho=sigma_u2/(sigma_u2+sigma_e2)个体效应的波动占整个波动的比例。第73页/共82页 显示每个个体截距的方法:tab company,gen(dum)drop dum1 reg invest mvalue kstock dum*与上述方法
11、比较一下:xi:reg invest mvalue kstock pany 结果完全一样。第74页/共82页几个常见问题1。既然固定效应每个个体都有单独的截距项,如何获得每个个体的截距项?xi:reg invest mvalue kstock pany 即LSDV方法或者添加虚拟变量法。第75页/共82页2。面板数据格式不符合要求的处理。例如如下表格格式该如何处理?处理方法:扁平数据变长条数据的命令:reshape use invest2,clear edit reshape long invest kstock,i(company)j(year)第76页/共82页companycompany
12、invest2002invest2002invest2003invest2003invest2004invest2004kstock2002kstock2002kstock2003kstock2003kstock2004kstock20041 118.918.919.119.119.619.619.619.616.816.816.716.72 217.417.418.418.418.818.818.118.117.417.417173 3191919.619.620.120.120.220.2171717.117.14 4202020.420.420.320.320.420.417.517.5
13、17.317.35 518.118.118.318.318.418.418.518.516.416.416.116.16 619.719.7202019.919.917.217.216.316.316.316.3第77页/共82页时间固定效应回归其中St是只随时间改变,不随个体改变的变量,如汽车的性能。第78页/共82页只有时间效应第79页/共82页个体和时间固定效应(双向固定效应模型)固定效应模型:Yit=ai+XitB+it双向固定效应模型:Yit=ai+ft+XitB+it实际上添加了t-1个时间虚拟变量。主要反应随着时间变化的一些特征。tab year,gen(yr)edit drop yr1 xtreg invest mvalue kstock yr*,fe 大部分时间虚拟变量显著,说明随着时间的变动,invest有不断变动的趋势。第80页/共82页检验:可以使用似然比检验。原假设:时间虚拟变量不显著。xtreg invest mvalue kstock,fe est store fe1 xtreg invest mvalue kstock yr*,fe est store fe2 lrtest fe1 fe2 整体来看时间虚拟变量不够显著。第81页/共82页感谢您的观看!第82页/共82页
限制150内