2022年计量经济学课件第三章多元线性回归模型 .pdf
《2022年计量经济学课件第三章多元线性回归模型 .pdf》由会员分享,可在线阅读,更多相关《2022年计量经济学课件第三章多元线性回归模型 .pdf(20页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、学而不思则惘,思而不学则殆第三章多元线性回归模型第一节多元线性回归模型及基本假定问题: 只有一个解释变量的线性回归模型能否满足分析经济问题的需要?简单线性回归模型的主要缺陷是:把被解释变量Y 看成是解释变量X 的函数是前提是,在其它条件不变的情况下,并且,所有其它影响Y的因素都应与X 不相关,但这在实际情况中很难满足。怎样在一元线性回归的基础上引入多元变量的回归?看教科书第7273 页关于汽车销售量的影响因素的讨论。一、多元线性回归模型的意义1、建立多元线性回归模型的意义,即一元线性回归模型的缺陷,多个主要影响因素的缺失对模型的不利影响。在一元线性回归模型中,如果总体回归函数的设定是正确的,那
2、么,根据样本数据得到的样本回归模型就应该有较好的拟合效果,这时,可决系数就应该较大。相反,如果在模型设定时忽略了影响被解释变量的某些重要因素,拟合效果可能就会较差,此时可决系数会偏低,并且由于忽略了一些重要变量而对误差项的影响会加大,这时误差项会表现出一些违背假定的情况。2、从一个解释变量到多个解释变量的演变。一个生产函数的例子,一个商品需求函数的例子,(教材第74 页) 。二、多元线性回归模型及其矩阵表示1、一般线性回归模型的数学表达式。设12233iiikk iiYXXXui=1 ,2,3, n 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第
3、1 页,共 20 页学而不思则惘,思而不学则殆在模型表达式里,1仍是 截距项 ,它反映的是当所有解释变量取值为零时,被解释变量Y 的取值;j(j=2 , 3, k)为斜率系数,它的经济含义 :在其它变量不变的情况下,第j 个解释变量每变动一个单位,Y平均增加(或减少)j个单位,这就是所谓的运用边际分析法对多元变量意义下回归参数的解释。因此,称j为偏回归系数,它反映了第j 个解释变量对Y 的边际影响程度。4、2、总体回归函数,即12233(|)iiikkiE Y XXXX3、样本回归函数,即12233?iikk iYXXX4、将 n 个样本观测值代入上述表达式,可得到从形式上看,像似方程组的形式
4、。并在此基础上,转化成矩阵表达的形式,即12233231122133111212223322212233122331, 2,?iiikkiiiiikikkkknnnkknniiikkiiiiiiiYXXXuYXXXinYXXXuYXXXuYXXXuYXXXYYeYYe样本观测数据:,1112131122222322323112132223223111?1?11?kknnnnknknnnYXXXYXXXYXXXYXBUYXBeYYYYeYXXXXYXXYuuu又1112223?kknknkXeXeeXe精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第
5、2 页,共 20 页学而不思则惘,思而不学则殆三、模型的基本假定在一元线性回归模型的基础上,可将在第二章中提出的基本假定平行地推到多元回归模型中去,但对多个解释变量之间还需做出新的假定。下面给出多元线性回归模型的基本假定(用矩阵表示)。1、 零均值假定。2、 同方差和无自相关假定。3、随机扰动项与解释变量不相关假定。),2,1;0)E(0)E,E(),E(E(U),(U12121niuuuuuuuuuinnn221112122212112212211212212()();1,2,(,)()0; ,1,2,()()()iiijijnnnnnnnnVar uE uinCov u uE u uij
6、i jnuuu uu uuu uuu uE UUEuuuEuu uu uuEuE uuE u uE u uEu2222221200()00I()()00nnnnE u uE u uE u uEu11ov(,)()()()()()()()0;1, 2,()00.()0;1,2,iiiiiiiiiikiikiiiCXuEXEXuEuEXEXuEXuEXEuEXuinEX UuEuXuXEuEXuXEuEuin即精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 3 页,共 20 页学而不思则惘,思而不学则殆4、无多重共线性假定。解释变量之间要求无多重共线性
7、的意义。即对 于 解 释 变 量iX 之 间 , 如 果 不 存 在 不 全 为 零 的 数23,k, 使 得22330kkXXX成立。5、 正态性假定。iu 独立同分布,且iu N(0, 2 ) 第二节多元线性回归模型的估计一、参数的最小二乘估计1、构造残差平方和。设,(1,2,3, ;1,2,3, )jiiXYjk in 为一组样本观测值,按残差的定义,有12222?(),1,2,iiiiiikkieYYYXXXin进一步得到残差平方和2212222?()iiiikkiQeYXXX2、最小二乘准则。求k?,?,?21,使得函数Q 有最小值。按照极值原理,求上述函数关于参数的偏导数,得kje
8、Qjij, 2, 1, 0?)(?2这样得如下正规方程组存 在 。即所 以 , 行 列 式也 应 是 满 秩 的 :关 系 。 此 时 矩 阵之 间 不 存 在 线 性 相 关不 为 零 , 表 明 解 释 变 量阶 子 行 列 式至 少 有如 果 该 假 定 成 立 ,-1X)X(,0XXX)rank(XXXX)X(kkkrank精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 4 页,共 20 页学而不思则惘,思而不学则殆1222212222212222?()0?()0?()0iiikk iiiikk iiiiikk ik iYXXXYXXXXY
9、XXXX注意方括号里的表示,即2000iiiikiee Xe X用矩阵表示为0X e由回归模型的样本估计形式eBXY?对上式两端同时乘以X,得?X YX X BX e因为0X e,所以得到如下表示BXXYX?根据无多重共线性假定,这时有1)(XX存在,从而解出B?,得YXXXB)(?1即 参 数 估 计 的 矩 阵 表 达 式 。B?中 各 分 量 就 是 参 数 的 估 计 值 , 即12? ?kB。这样,我们便得到样本回归模型12222?kkYXXX3、偏回归系数。对模型12222?kkYXXX中的参数估计值的解释。j?(j=2 ,3, k)表明的是jX (j=2 , 3, k)对?Y的边
10、际精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 5 页,共 20 页学而不思则惘,思而不学则殆影响。多元线性回归模型的标准化形式。由于出现在模型中各个变量的单位不尽一致,这时会对变量的边际解释带来干扰,因此,需要对变量进行标准化处理。对变量进行标准化变换可得到模型的标准化形式,用标准化形式能够真实地反映每一个解释变量对应变量的直接(边际)影响。标准化变换过程如下例如, 基于下表的数据,用EViews 软件计算得线性回归模型如下,其中 Y 表示家庭书刊消费水平,X 表示家庭收入, T 表示户主受教育年限。Y X T 450 1027.2 8 507
11、.7 1045.2 9 613.9 1225.8 12 563.4 1312.2 9 501.5 1316.4 7 781.5 1442.4 15 541.8 1641 9 611.1 1768.8 10 1222.1 1981.2 18 793.2 1998.6 14 660.8 2196 10 792.7 2105.4 12 580.8 2147.4 8 612.7 2154 10 890.8 2231.4 14 1121 2611.8 18 1094.2 3143.4 16 1253 3624.6 20 1223323,1,2,iiikikiiiiikYXXXuYXXXin设变量得取值为
12、:,*2233,1, 2.,1, 2;2,3.,1,2.1,2,jiijijiijyxiiiuiiikkiiYYXXyinxinjkssuuuinsyxxxuin令精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 6 页,共 20 页学而不思则惘,思而不学则殆2?50.01640.086552.3703( 1.0112)(2.9442)(10.0670)0.9512146.2974.2.6057YXTRFDW下表为各变量描述统计的一些数字特征:Y X T Mean 755.1222 1942.933 12.16667 Median 637.3500
13、1989.900 11.00000 Maximum 1253.000 3624.600 20.00000 Minimum 450.0000 1027.200 7.000000 Std. Dev. 258.7206 698.8325 3.944467 Skewness 0.784266 0.768374 0.552971 Kurtosis 2.261701 3.209892 2.075582 Jarque-Bera 2.254034 1.804238 1.558242 Probability 0.323998 0.405709 0.458809 Observations 18 18 18 下表为
14、变量经过标准化后的回归估计结果:Dependent Variable: YY Method: Least Squares Date: 10/21/01 Time: 20:38 Sample: 1 18 Included observations: 18 Variable Coefficient Std. Error t-Statistic Prob. XX 0.233511 0.079312 2.944186 0.0101 TT 0.798440 0.079312 10.06702 0.0000 R-squared 0.951235 Mean dependent var 8.59E-08 De
15、pendent Variable: Y Method: Least Squares Sample: 1 18 Included observations: 18 Variable Coefficient Std. Error t-Statistic Prob. C -50.01638 49.46026 -1.011244 0.3279 X 0.086450 0.029363 2.944186 0.0101 T 52.37031 5.202167 10.06702 0.0000 R-squared 0.951235 Mean dependent var 755.1222 Adjusted R-s
16、quared 0.944732 S.D. dependent var 258.7206 S.E. of regression 60.82273 Akaike info criterion 11.20482 Sum squared resid 55491.07 Schwarz criterion 11.35321 Log likelihood -97.84334 F-statistic 146.2974 Durbin-Watson stat 2.605783 Prob(F-statistic) 0.000000 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - -
17、- -第 7 页,共 20 页学而不思则惘,思而不学则殆Adjusted R-squared 0.944732 S.D. dependent var 1.000000 S.E. of regression 0.235090 Akaike info criterion 0.093319 Sum squared resid 0.829012 Schwarz criterion 0.241714 Log likelihood 2.160133 F-statistic 146.2974 Durbin-Watson stat 2.605783 Prob(F-statistic) 0.000000 *?0
18、.23350.7984YXT可以看出,户主受教育时间的长短对家庭书刊消费水平的直接(边际)影响最大,其次才是家庭的收入,这一实证结论与现实情况一致。例如 , 分析房屋售价(PRICE) 与住房面积(SQFT) 、 卧房间数 (BEDRMS) 、洗澡间数 (BATHS)之间得关系。数据由下表给出TABLE Data for Single Family Houses回归估计结果如下:精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 8 页,共 20 页学而不思则惘,思而不学则殆书写格式为:epric ?= 60.817 + 0.0866SQFT - 24
19、.577BEDRMS+31.006BATHSt= (0.823) (2.948) (-1.465) (1.026) se=(73.922) (0.029) (16.733) (30.226) Prob=(0.4298) (0.0146) (0.1736) (0.3292) R2=0.652 ,2R=0.548 ,F=6.248变量经标准化后的估计结果:PRICE1 = 0.69229973SQFT1 - 0.29910841BEDRMS1 + 0.24958698BATHS1二、参数最小二乘估计的最优性质关于在多元线性回归模型中参数估计的最优性质,可根据一元线性回归模型的情况平行得到,这里不再
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年计量经济学课件第三章多元线性回归模型 2022 计量 经济学 课件 第三 多元 线性 回归 模型
限制150内