(精品)第七章_虚拟变量.ppt
《(精品)第七章_虚拟变量.ppt》由会员分享,可在线阅读,更多相关《(精品)第七章_虚拟变量.ppt(72页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章虚拟变量Dummy variables1本章将主要考虑虚拟的自变量的情况,即解释变量出现虚拟变量。在现实中,模型中可能会出现一些定性的变量作为解释变量。通常将虚拟变量取值0或1,所以虚拟变量又称为二分变量,用虚拟变量来表示某一性质或属性出现或不出现。2例如:收入决定模型中,除了可以量化的工作年限和受教育年限这两个变量以外,我们还包括了性别这一定性的变量,用0表示女性,1表示男性。模型可以写成:y=+1 x+2 D +其中,D为虚拟变量D0,表示女性,D1表示男性模型中加入虚拟变量后,更加贴近经济的真实情况,也更加灵活,收入决定模型我们不仅要考察一般人口的状况,也关注不同性别的收入决定模型
2、的差异,从而更有利于政策的制定和调整。3一般情况下,一个定性变量所需要的虚拟变量的个数取决于该定性的变量的类别,如果有n个类别,所引进的虚拟变量的个数时m-1,比总体类别的数量少1。例如性别变量,分为两类男性或女性,需要一个虚拟变量就可以了;如果地区发展问题,考虑地区差异,假设把全国分为东部,中部和西部,就需要2个虚拟变量,令 1 东部 D1=0 其他4 1 中部D2=0 其他全集分为三类,所以需要两个虚拟变量。5第一节 临时虚拟为了更好地对模型进行估算,经常要在模型中排除一些又突发时间产生的异常值(outlier),及其对模型的影响,例如战争、地震、内乱、罢工等。例如:y=+1 x+2 D
3、+其中,D为临时虚拟变量D1,异常时期D0,平时6例题下表是日本19851995年水稻产量Y和耕种面积的数据X:年份 产量(10万吨)Y 耕种面积(万公顷)X1985 116 2321986 116 2281987 106 2121988 99 2091989 103 2081990 105 2061991 96 2031992 105 2091993 78 2131994 120 2201995 107 2117 (1)估计模型y=+x+(2)受1993年冻害的影响,水稻收成指数为战后最低,出现了歉收。因此设D1为1993年,D0为其他年份,估计下列模型y=+1 x+2 D +8根据数据计算
4、结果如下:X=2351 Y=1151 XY=246601X2=503313 Y2=121757 n=11Y=-48.224+0.71521X (73.4)0.3432)R2=0.32559引入临时虚拟变量后,即1993年为异常年份,计算结果如下:X=2351 Y=1151 XY=246601X2=503313 Y2=121757 n=11D=1 XD=213 YD=78Y=-40.292+0.69033X-28.748D (30.90)(0.1444)(4.389)经过校正的R2=0.867510如果直接去掉1993年的数据,回归的结果为Y=-40.292+0.69033X (30.898)(
5、0.1450)R2=0.7408 经过校正的R2 =0.708411第二节 季度虚拟 季度虚拟是通过回归模型中的常数项的变化(斜率不变)来掌握季度和月度等季节变化对模型的不同影响。例如,根据研究人们发现:利用季度数据,消费对收入回归时,在夏季和冬季(第二和第四季度)发半年奖和年终奖时,收入异乎寻常地高,为了消除这种季节变化的影响,引入季度虚拟变量D1、D2、D3。估计下列多元回归模型:y=+1 x+2 D1 +3D2 4D3 12 1 第一季度D1 0 其他 1 第二季度D2 0 其他 1 第三季度D3 0 其他13 季度数据需要3个虚拟变量,月度数据用11个虚拟变量。实际估计时,会根据t检验
6、结果去掉不显著的季度或月度虚拟变量,然后用剩下的虚拟变量再重新估计就可以了。14例题下面时日本饮食消费总额(食品、饮料等)Y与国内家庭最终消费支出X的变化数据,首先估计下面的模型:y=+x+(宏观恩格尔函数)引入季度虚拟变量,估计模型y=+1 x+2 D1 +3D2 4D3 15 1 第一季度D1 0 其他 1 第二季度D2 0 其他 1 第三季度D3 0 其他16年、季度 饮食消费 Y 国内最终消费支出X1990年13月 10.0 53.5 46月 11.0 54.4 79月 12.2 56.4 1012月 13.3 60.61991年13月 10.2 54.7 46月 11.0 55.4
7、79月 12.3 57.6 1012月 13.2 62.41992年 13月 10.5 56.5 46月 11.1 56.4 79月 12.3 58.3 1012月 13.4 62.61993年13月 10.4 56.7 46月 11.2 56.8 79月 12.2 58.9 1012月 13.4 63.71994年13月 10.4 58.217X=983.10 Y=198.10 XY=11505.46X2=56993.83 Y2=2331.77Y=-8.5246+0.34891XR2=0.7398518季度虚拟变量数据表年、季度 D1 D2 D31990年13月 1 0 0 46月 0 1
8、0 79月 0 0 1 1012月 0 0 01991年13月 1 0 0 46月 0 1 0 79月 0 0 1 1012月 0 0 01992年 13月 1 0 0 46月 0 1 0 79月 0 0 1 1012月 0 0 01993年13月 1 0 0 46月 0 1 0 79月 0 0 1 1012月 0 0 01994年13月 1 0 019估计结果如下:Y=9.0681+0.068301X-2.05875D1-1.8009D2-0.76594D3所有t值都在1的水平显著经过校正的R2 0.99390将第一季度D11,D20,D30代入上述模型,得到第一季度的子模型Y=9.0681
9、-2.5875+0.068301X=6.4806+0.068301X20将第二季度D10,D21,D30代入上述模型,得到第二季度的子模型Y=9.0681-1.8009+0.068301X 7.2672+0.068301X将第三季度D10,D20,D31代入上述模型,得到第三季度的子模型Y=9.0681-0.76594+0.068301X 8.3022+0.068301X将第四季度D10,D20,D30代入上述模型,得到第四季度的子模型Y=9.0681+0.068301X 21第三节运用虚拟变量改变回归直线的截距加入虚拟变量后,回归模型中解释变量前面的系数(斜率)没有变化,只有截距发生改变,事
10、实上,临时虚拟和季度(月度)虚拟中都是是截距发生了改变。看下面的例子:22例子1,在收入决定模型中,除了假设教龄以外,性别和肤色也是影响大学教授收入的重要因素,模型为:y=+1 x+2 D1 +3D2 y为收入x为教龄23 1 男性D1=0 女性 1 白色D2=0 有色人种24黑人女教授的平均工资:Ey=+1 x黑人男教授的平均工资:Ey=2+1 x白人女教授的平均工资:Ey=3+1 x白人男教授的平均工资:Ey=2 3+1 x估计上述包括性别和肤色虚拟变量的模型,如果它们的t值显著,表明这两个因素的确影响了收入25例子2,假设我们具有消费C和收入Y的数据,同时有一些定性的变量:S:性别,A:
11、年龄(50)E:教育(高中以下,高中以上,但大学以下;大学及以上)26所估计的模型为:C=+Y+1D1+2D 2+3D 3+4D 4+5D5+1 男性D1=0 女性27 1 如果年龄小于25D2=0 其他 1 年龄在25到50之间D3=0 其他 1 教育在高中以下D4=0 其他28 1 学历在高中以上但大学以下D5=0 其他这是一个典型的截距发生改变的例子。例如:(1)男性,年龄在25岁以下,大学毕业C=(+1+2)+Y+相当于 D1=1,D2=1,D3=0,D4=0,D5=0(2)女性,年龄在50以上,大学学历C=+Y+相当于 D1=0,D2=0,D3=0,D4=0,D5=029例子3,兰普
12、森研究一些定性变量对电影票价的影响,他估计了下列模型 Y=4.13+5.77D1+8.21D2-7.68D3 -1.13D4+27.09D5+31.46logX1+0.81X2其中Y成人晚间入场票(美分)1 郊区D1电影院位置 0 城中心30 1 建成后或大修后10年内D2电影院年龄 0 其他 1 露天D3电影院类型 0 室内 1 有 D4停车场 0 无31 1 首映D5上映政策 0 其他X1平均每场放映的空位率X2平均影片片租,以分摊到每张电影票上的美分价计算 32解释模型。计算下列子模型:(1)城中心,电影院年龄在10年以上,无停车场,室内,非首映(即虚拟变量取值全部为0)Y4.13+31
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 精品 第七 虚拟 变量
限制150内