多元线性回归模型高等教育统计学_高等教育-统计学.pdf
《多元线性回归模型高等教育统计学_高等教育-统计学.pdf》由会员分享,可在线阅读,更多相关《多元线性回归模型高等教育统计学_高等教育-统计学.pdf(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章多元线性回归模型 在一元线性回归模型中,解释变量只有一个。但在实际问题中,影响因变量 的变量可能不止一个,比如根据经济学理论,人们对某种商品的需求不仅受该商 品市场价格的影响,而且受其它商品价格以及人们可支配收入水平的制约;影响 劳动力劳动供给意愿(用劳动参与率度量)的因素不仅包括经济形势(用失业率 度量),而且包括劳动实际工资;根据凯恩斯的流动性偏好理论,影响人们货币 需求的因素不仅包括人们的收入水平,而且包括利率水平等。当解释变量的个数 由一个扩展到两个或两个以上时,一元线性回归模型就扩展为多元线性回归模 型。本章在理论分析中以二元线性回归模型为例进行。一、预备知识(一)相关概念 对
2、于一个三变量总体,若由基础理论,变量 x1,x2和变量 y 之间存在因果关 系,或xX2的变异可用来解释 y 的变异。为检验变量Xi,X2和变量 y 之间因果关 系是否存在、度量变量Xi,X2对变量 y 影响的强弱与显著性、以及利用解释变量 Xi,X2去预测因变量 y,引入多元回归分析这一工具。将给定Xii,X2i条件下y的均值 E(yi|Xii,X2i)=一0 Xii -2X2i(4.1)定义为总体回归函数(Population Regression Function,PRF)。定义 yi-E(yi|Xii,X2i)为误差项(error term),记为,即*=yi-E(yi|刈,x?i),
3、这样yi=EW|旳卞剂,或 y=01刈:2X2ii(4.2)(4.2)式称为总体回归模型或者随机总体回归函数。其中,X1,X2称为解释 变量(explanatory variable)或自变量(independent variable);y 称为被 解释变量(explained variable)或因变量(dependent variable);误差项二解 释了因变量的变动中不能完全被自变量所解释的部分。在总体回归模型(4.2)中参数r12是未知的,叫是不可观察的,统计 计量分析的目标之一就是估计模型的未知参数。给定一组随机样本(yi,X1i,X2i),i=1,2,n,对(4.1)式进行估计,
4、若 E(yi|x1i,x2i),0,1,2 的估 A A A A 计量分别记为yioi2,则定义(4.3)式为样本回归函数 A A A A yi 八0 1 Xii:2X2i(i=1,2/,n)(4.3)AAA 注意,样本回归函数随着样本的不同而不同,也就是说。,匚匕是随机变量,它们的随机性是由于yi的随机性(同一组(Xii,X2i)可能对应不同的yj、Xi,X2各个比如根据经济学理论人们对某种商品的需求不仅受该商品市场价格的影响而且受其它商品价格以及人们可支配收入水平的制约影响劳动力劳动供给意愿用劳动参与率度量的因素不仅包括经济形势用失业率度量而且包括劳动实际工量的个数由一个扩展到两个或两个以
5、上时一元线性回归模型就扩展为多元线性回归模型本章在理论分析中以二元线性回归模型为例进一预备知识一相关概念对于一个三变量总体若由基础理论变量和变量之间存在因果关系或的变异可去预测因变量引入多元回归分析这一工具将给定条件下的均值一定义为总体回归函数定义为误差项记为即刈这样旳卞剂八注意样本回归函数随着样本的不同而不同也就是说匚匕是随机变量它们的随机性是由于的随机性同一组可能对自的变异、以及x1,x2之间的相关性共同引起的。定义yy为残差项(residual A A term),记为 e,即 e=yi-yi,这样 yi=yi+e,或 A A yi 1 人 y(i=1,2,n)(4.4)(4.4)式称为
6、样本回归模型或者随机样本回归函数。样本回归模型中残差项e可 视为总体回归模型中误差项 叫的估计量。(二)多元线性回归模型的矩阵表示 多元线性回归模型的参数估计比一元线性回归模型要复杂得多,为了便于计 算和分析,便于将结果由三变量总体推广到一般的多变量总体,引入矩阵这一工 具简化计算和分析。设(yi,Xii,X2i),i=12,n是取自总体的一组随机样本。在该组样本下,总体 回归模型(4.2)式可以写成方程组的形式 yi=-0 -1X11 -2X21 川-1 y2=一 0 一 1X12 -2X22 川-2 yn=必仆2X2n 利用矩阵运算,可表示为 则在该组样本下,总体回归模型的矩阵表示为(4.
7、6)e/l e2 e=_en 则样本回归模型的矩阵表示为 y 二 X:e(三)模型假定 yj y2 1 Jn Y1 1 xn 目2 _ 1 X12 a a a(4.5)(4.7)An 一 J Xm X11 X21 X2n R,X21 X22 X2n 2 个比如根据经济学理论人们对某种商品的需求不仅受该商品市场价格的影响而且受其它商品价格以及人们可支配收入水平的制约影响劳动力劳动供给意愿用劳动参与率度量的因素不仅包括经济形势用失业率度量而且包括劳动实际工量的个数由一个扩展到两个或两个以上时一元线性回归模型就扩展为多元线性回归模型本章在理论分析中以二元线性回归模型为例进一预备知识一相关概念对于一个
8、三变量总体若由基础理论变量和变量之间存在因果关系或的变异可去预测因变量引入多元回归分析这一工具将给定条件下的均值一定义为总体回归函数定义为误差项记为即刈这样旳卞剂八注意样本回归函数随着样本的不同而不同也就是说匚匕是随机变量它们的随机性是由于的随机性同一组可能对假定 1 回归模型是参数线性的,并且是设定正确的 假定 2 随机误差项与解释变量不相关。即 cov(Xji,叫)=0,j=1,2。如果解释变量是非随机的,则该假设自动满足。假定 3 零均值假定。即 E(叫)=0,i=1,2,n 假定 4 同方差假定。即 var(叫)2,i=1,2,n 假定 5 无自相关假定。即两个误差项之间不相关 cov
9、(曲)=0 i=j,i=1,2 厂,n,j=1,2,n 假定 6 解释变量X1与X2之间不存在完全共线性,即两个解释变量之间无确切的 的线性关系。假定 7 正态性假定。即 2 叫N(0,匚),i=1,2,n(四)参数估计与估计量的分布 系数向量:的 OLS 估计为 A 一(XTX)XTy(4.8)其中,XT为 X 的转置矩阵。在随机误差项服从正态分布的假定下,系数向量的 估计量也服从正态分布,即 A 1 N(1,;2(XTX)(4.9)记C=(XTX)J的第 j个主对角元素为Cjj,贝U A j N(j;2Cjj)(4.10)有了系数估计量的分布,就可以对总体参数做假设检验。与双变量总体相同,
10、A 总体误差 7 是不可观察的,因而其方差二2是未知的。若用二2的无偏估计量二2代 替二2,则 OLS 估计量服从自由度为 n-3的 t 分布,而不是正态分布,即 A t(n-3)(4.11)se(:j)2 其中,se(:j)=2 Cjj,匚2:。n-3(五)预测原理 回归分析的目的之一是利用回归模型预测因变量。假设三变量总体的回归模 型为(4.2),即 个比如根据经济学理论人们对某种商品的需求不仅受该商品市场价格的影响而且受其它商品价格以及人们可支配收入水平的制约影响劳动力劳动供给意愿用劳动参与率度量的因素不仅包括经济形势用失业率度量而且包括劳动实际工量的个数由一个扩展到两个或两个以上时一元
11、线性回归模型就扩展为多元线性回归模型本章在理论分析中以二元线性回归模型为例进一预备知识一相关概念对于一个三变量总体若由基础理论变量和变量之间存在因果关系或的变异可去预测因变量引入多元回归分析这一工具将给定条件下的均值一定义为总体回归函数定义为误差项记为即刈这样旳卞剂八注意样本回归函数随着样本的不同而不同也就是说匚匕是随机变量它们的随机性是由于的随机性同一组可能对月=o:lXi:2X2-i(4.2)在一组随机样本(y,Xi,X2),i=1,2,n下,利用 OLS 求得样本回归函数为(4.3)A NN A y J:oXi2 X2(i=1,2,n)(4.3)给定样本外一点 Xf=(1,Xif,X2f
12、)T,贝U因变量yf的点预测为 y f=o 1 X1 2 X2 f A 点预测yf的标准误为 A A 1 T T 1 se(yf)=;1 Xf(X X)Xf 因变量yf 的置信度为 1-:的区间预测为 A A A A yf-tg(n-3)se(yf),y2(n-3)se(yf)(4.14)二、案例 案例 1 Woody 餐馆的选址分析 Woody 餐馆是一家价位适中、24 小时营业的家庭连锁店,公司邀请你决策下 一家连锁店的选址问题。你决定建立一个回归模型来解释每一家连锁餐馆的毛销 售额 Y(the gross sales volume),通过文献的阅读,你认为以下变量对毛销 售额的影响较大,
13、N=竞争变量:餐馆位置半径 2 里以内市场直接竞争者的数量;P=人口:餐馆位置半径 3 里以内人口的数量;匸收入:餐馆位置半径 3 里以内家庭平均收入。并且通过调研,你获得了 33 家 Woody 餐馆连锁店的数据。案例 2经济形势和实际工资对人们工作意愿的影响 在第三章,我们根据劳动经济学理论,分析了经济形势对人们工作意愿的影 响存在两种效应:受挫工人效应和增加工人效应;并且利用 1980-2002 年的数据 实证了受挫工人效应占主导地位。但根据劳动经济学理论,影响人们工作意愿的因素,除了经济形势以外,还 有实际的工资水平。从理论上说,实际工资增加对劳动供给具有两种效应:替代 效应与收入效应
14、。替代效应趋于使劳动供给增加,而收入效应则趋于使劳动供给 降低,两种效应的相对影响取决于家庭的偏好(参考文献 4,p49)。本案例考察实际工资对人们工作意愿是否有影响,以及在有影响的情况下,那种效应占优。数据见表 3.1。三、实验目的 案例 1 Woody 餐馆的选址分析 (4.12)(4.13)个比如根据经济学理论人们对某种商品的需求不仅受该商品市场价格的影响而且受其它商品价格以及人们可支配收入水平的制约影响劳动力劳动供给意愿用劳动参与率度量的因素不仅包括经济形势用失业率度量而且包括劳动实际工量的个数由一个扩展到两个或两个以上时一元线性回归模型就扩展为多元线性回归模型本章在理论分析中以二元线
15、性回归模型为例进一预备知识一相关概念对于一个三变量总体若由基础理论变量和变量之间存在因果关系或的变异可去预测因变量引入多元回归分析这一工具将给定条件下的均值一定义为总体回归函数定义为误差项记为即刈这样旳卞剂八注意样本回归函数随着样本的不同而不同也就是说匚匕是随机变量它们的随机性是由于的随机性同一组可能对1、绘制丫对 N P、I的散点图,并在散点图中附加回归线。2、建立丫对 N、P、I的线性回归模型,并定性分析解释变量 N、P、I对丫的影 响。3、利用样本数据及 OLS 法对回归模型进行估计,并报告回归结果。4、观察回归系数的显著性和方程的显著性,并解释回归系数的含义。案例 2经济形势和实际工资
16、对人们工作意愿的影响 1、绘制 clfpr 对 ahe82 的散点图,并附回归线,观察城市劳动参与率与实际工 资之间的线性关系。2、建立 clfpr 对 ahe82 的一元线性回归模型,利用 1980-2002 年的数据估计模 型,并观察回归系数的显著性和方程的显著性。3、同时考虑经济形势与实际工资对人们工作意愿的影响,建立二元线性回归模 型,利用 1980-2002 年的数据估计模型,观察回归系数的显著性和方程的显著性,并解释回归系数的经济含义。4、对上面(2)与(3)中估计结果的差别进行解释。5、模型的选择问题,在以下三个模型之间,哪个模型更好呢?clfprt=:0 cunrt t(I)c
17、lfprt 二:0 ahe82t t(n)clfprt=:0 ahe82t:2cu nr-t(川)四、实验原理 五、实验步骤 案例 1 Woody 餐馆的选址分析 图 4-1 Y对 N P、I的散点图 180,000 1 160,000-140,000 */*/丫 d*120,000-*.卜 100,000 二 80,000-y 180,000 160,000 140,000 120,000 100,000 80,000 0 2 4 6 8 10 N 180,000 160,000-140,000 Y 120,000-100,000-80,000 0 100,000 200,000 300,0
18、00 P 10,000 20,000 30,000 40,000 个比如根据经济学理论人们对某种商品的需求不仅受该商品市场价格的影响而且受其它商品价格以及人们可支配收入水平的制约影响劳动力劳动供给意愿用劳动参与率度量的因素不仅包括经济形势用失业率度量而且包括劳动实际工量的个数由一个扩展到两个或两个以上时一元线性回归模型就扩展为多元线性回归模型本章在理论分析中以二元线性回归模型为例进一预备知识一相关概念对于一个三变量总体若由基础理论变量和变量之间存在因果关系或的变异可去预测因变量引入多元回归分析这一工具将给定条件下的均值一定义为总体回归函数定义为误差项记为即刈这样旳卞剂八注意样本回归函数随着样本
19、的不同而不同也就是说匚匕是随机变量它们的随机性是由于的随机性同一组可能对1、打开 Eviews 工作文件 Woody.wfl,按住 Ctrl 键,点击工作文件目录中的序 列丫、N、P、I图标,点击鼠标右键,点击 Open/as Group,出现包含序列丫、N、P、I的组对象窗口。点击组对象窗口工具栏的 View 按钮,选择 Graph,在 Specifi 选项中选择个比如根据经济学理论人们对某种商品的需求不仅受该商品市场价格的影响而且受其它商品价格以及人们可支配收入水平的制约影响劳动力劳动供给意愿用劳动参与率度量的因素不仅包括经济形势用失业率度量而且包括劳动实际工量的个数由一个扩展到两个或两个
20、以上时一元线性回归模型就扩展为多元线性回归模型本章在理论分析中以二元线性回归模型为例进一预备知识一相关概念对于一个三变量总体若由基础理论变量和变量之间存在因果关系或的变异可去预测因变量引入多元回归分析这一工具将给定条件下的均值一定义为总体回归函数定义为误差项记为即刈这样旳卞剂八注意样本回归函数随着样本的不同而不同也就是说匚匕是随机变量它们的随机性是由于的随机性同一组可能对Scatter,在 Fit lines 中选择 Regression Line,在 Multiple 中选择 Multiple graphs-First vs.All,设定完毕后点击 确定按钮,则出现丫对 N P、I的三张散
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 线性 回归 模型 高等教育 统计学
限制150内