本科经济计量学第10章第.ppt
《本科经济计量学第10章第.ppt》由会员分享,可在线阅读,更多相关《本科经济计量学第10章第.ppt(50页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第10章章 虚拟变量回归模型虚拟变量回归模型第10章210.1 虚拟变量的性质虚拟变量的性质10.2 ANCOVA ANCOVA模型:模型:包含一个定量变量包含一个定量变量、一个两分定性、一个两分定性变量的回归模型变量的回归模型10.3 包含一个定量变量、一个多分定性变量的回归包含一个定量变量、一个多分定性变量的回归10.4 包含一个定量变量、多个定性变量的回归包含一个定量变量、多个定性变量的回归10.5 比较两个回归比较两个回归10.6 虚拟变量在季节分析中的应用虚拟变量在季节分析中的应用10.7 应变量也是虚拟变量的情形应变量也是虚拟变量的情形:线性概率模型:线性概率模型10.8 总结总
2、结第10章3 前面我们考虑的回归模型中的解释变量都是前面我们考虑的回归模型中的解释变量都是定量变量定量变量,本章将介绍在模型中如何引入,本章将介绍在模型中如何引入定性变定性变量量并使模型更加丰富和完善。并使模型更加丰富和完善。这类定性变量称为这类定性变量称为虚拟变量虚拟变量。第10章410.1 虚拟变量的性质虚拟变量的性质虚拟变量(虚拟变量(dummy variable):一种通常表明了具:一种通常表明了具备或不具备某种性质的备或不具备某种性质的定性变量定性变量。通常将这类变。通常将这类变量取值为量取值为0,1。用符号。用符号D表示。表示。方差分析模型(方差分析模型(ANOVA):):解释变量
3、仅是虚拟变量的模型。解释变量仅是虚拟变量的模型。协方差模型(协方差模型(ANCOVA):):回归模型中的解释变量有些是定量的,有些是回归模型中的解释变量有些是定量的,有些是定性的。定性的。第10章5我们来看我们来看ANOVA模型的一个例子:模型的一个例子:Yi=B1+B2Di+ui (10-1)其中,其中,Y=每年食品支出每年食品支出 此时的解释变量仅是一个虚拟变量。假定随机扰此时的解释变量仅是一个虚拟变量。假定随机扰动项满足古典线性回归模型的基本假定,根据模型动项满足古典线性回归模型的基本假定,根据模型(10-1)得到:)得到:男性食品支出的期望为:男性食品支出的期望为:女性食品支出的期望为
4、:女性食品支出的期望为:用用OLS法很容易检验零法很容易检验零假设:男女平均食品支出假设:男女平均食品支出无显著性差异无显著性差异(即即B2=0),并可根据并可根据t检验值判定检验值判定b2是是否统计显著。否统计显著。第10章6表表10-1 男、女食品支出与税后收入和年龄数据男、女食品支出与税后收入和年龄数据首先对数据进行整理,得到表首先对数据进行整理,得到表10-2。例例10.1 男、女个体消费者每年的食品支出男、女个体消费者每年的食品支出表表10-1给出了给出了20002001年男、女每年食品支出(美元)年男、女每年食品支出(美元)和税后收入(美元)的数据。和税后收入(美元)的数据。年龄年
5、龄女性食品支出女性食品支出女性税后收入女性税后收入男性食品支出男性食品支出男性税后收入男性税后收入256565221722171495214952253325332043720437第10章7表表10-2 10-2 食品支出与税后收入、性别和年龄的关系食品支出与税后收入、性别和年龄的关系观察值观察值性别性别食品支出食品支出税后收入税后收入1 11 11983198311557115572 21 12987298729387293873 31 12993299331463314634 41 13156315629554295545 51 12706270625137251376 61 12217
6、221714952149527 70 02230223011589115898 80 03757375733328333289 90 038213821361513615110100 032913291354483544811110 034293429329883298812120 0253325332043720437然后利用这些数据建立虚拟变量模型:然后利用这些数据建立虚拟变量模型:(Y是食品支出,女性取为是食品支出,女性取为1):):Yi=B1+B2Di+ui用用OLS回归结果如下:回归结果如下:第10章8Dependent Variable:YMethod:Least SquaresS
7、ample:1 12Included observations:12VariableCoefficientStd.Errort-StatisticProb.C3176.833233.044613.631870.0000d1-503.1667329.5749-1.5267140.1578R-squared0.189026 Mean dependent var2925.25Adjusted R-squared0.107929 S.D.dependent var604.387S.E.of regression570.8404 Akaike info criterion15.6831Sum squar
8、ed resid3258588.Schwarz criterion15.7639Log likelihood-92.09865 F-statistic2.33086Durbin-Watson stat1.582001 Prob(F-statistic)0.15782Eviews输出输出结果如下:结果如下:利用利用EViews软件操作讲解。软件操作讲解。第10章9 从回归结果可以看出,估计的男性的平均食品从回归结果可以看出,估计的男性的平均食品支出为支出为3176.83美元,女性的平均食品支出为美元,女性的平均食品支出为2673.66美元。美元。回归结果也表明,回归结果也表明,b2是统计不显著的
9、,也即男是统计不显著的,也即男性与女性在食品支出上的差异不显著。性与女性在食品支出上的差异不显著。前面已经说过,这类解释变量仅是虚拟变量的前面已经说过,这类解释变量仅是虚拟变量的模型被称为方差分析模型(模型被称为方差分析模型(ANOVA)。实际上,这类)。实际上,这类模型的确可以用于判断两组(或多组)均值是否有模型的确可以用于判断两组(或多组)均值是否有显著不同。显著不同。本例中,男女平均食品支出无显著性差异。本例中,男女平均食品支出无显著性差异。第10章10虚拟变量的一些性质:虚拟变量的一些性质:(1)为了区别男、女两类的不同,我们仅引入了一)为了区别男、女两类的不同,我们仅引入了一个虚拟变
10、量。一个虚拟变量足可以区分两个不同个虚拟变量。一个虚拟变量足可以区分两个不同的种类。的种类。若模型包含截距项,若模型包含截距项,如果模型(如果模型(10-1)写为:)写为:其中,其中,Y表示食品支出。表示食品支出。由于由于D1i与与D2i存在完全共线性,所以无法估存在完全共线性,所以无法估计模型(计模型(10-6)。)。(10-6)第10章11 假定有一个样本,该样本包括三个男性,两假定有一个样本,该样本包括三个男性,两个女性。其数据矩阵如下:个女性。其数据矩阵如下:cD1D2男男Y1110男男Y2110女女Y3101男男Y4110女女Y5101 数据矩阵右边的第一列代表了共同的截距数据矩阵右
11、边的第一列代表了共同的截距B1。容易验证:容易验证:D1=(1-D2)或)或D2=(1-D1)也即也即D1 和和D2完全共线性。陷入虚拟变量陷阱。完全共线性。陷入虚拟变量陷阱。第10章12 一般的规则是:如果一个定性的变量有一般的规则是:如果一个定性的变量有m类,类,则要引入则要引入(m-1)个虚拟变量。否则就会陷入个虚拟变量。否则就会陷入虚拟变虚拟变量陷阱量陷阱(dummy variable trap),就会出现完全多重共就会出现完全多重共线性。线性。(2)虚拟变量的赋值是任意的。)虚拟变量的赋值是任意的。(3)赋值为)赋值为0的一类常称为基准类(的一类常称为基准类(base)、对比)、对比
12、类(类(benchmark)、控制类()、控制类(control)、或遗)、或遗漏类(漏类(omitted category)。基准类的选择也是根)。基准类的选择也是根据研究的目的而定的。据研究的目的而定的。(4)虚拟变量)虚拟变量D的系数称为的系数称为差别截距差别截距系数,表明取系数,表明取值为值为1的类的截距值与基准类截距值的差距。的类的截距值与基准类截距值的差距。第10章13例例10.2 工会化程度与工作权利法工会化程度与工作权利法为了研究工作权利法的效果(该法禁止了各种工为了研究工作权利法的效果(该法禁止了各种工会保护措施。因此预期通过工作权利法的州比未会保护措施。因此预期通过工作权利
13、法的州比未通过的州工会化程度低),通过的州工会化程度低),BrennanBrennan等人建立了工等人建立了工会会员(属于工会的工人占所有工人的百分比)会会员(属于工会的工人占所有工人的百分比)对工作权利法的函数模型。对工作权利法的函数模型。数据见数据见表表10-310-3(新教材(新教材P216P216)。)。函数模型如下函数模型如下:PVT PVTi i=B=B1 1+B+B2 2RWLRWLi i+U+Ui i其中其中PVTPVT代表工会化程度,代表工会化程度,RWLRWL是虚拟变量,通过是虚拟变量,通过工作权利法的州赋值为工作权利法的州赋值为1 1,未通过的赋值为,未通过的赋值为0 0
14、。第10章14回归结果如下回归结果如下(见(见Eviews文件文件)Dependent Variable:PVTVariableCoefficientStd.Errort-StatisticProb.C19.806671.16269117.035200.0000RWL-9.3916671.838376-5.1086760.0000R-squared0.352214 Mean dependent var16.05000Adjusted R-squared0.338719 S.D.dependent var7.831263S.E.of regression6.368320 Akaike info
15、criterion6.579727Sum squared resid1946.664 Schwarz criterion6.656207Log likelihood-162.4932 F-statistic26.09857Durbin-Watson stat0.847527 Prob(F-statistic)0.000006 回归结果表明,通过工人工作权利法的州中,工会化程度回归结果表明,通过工人工作权利法的州中,工会化程度平均为平均为10.415,未实施工人权利法的州中,工会化程度平均,未实施工人权利法的州中,工会化程度平均为为19.8。因为虚拟变量的系数显著不为零。所以通过工作权。因为虚拟
16、变量的系数显著不为零。所以通过工作权利法的州与未通过的州的工会化程度有显著差异。利法的州与未通过的州的工会化程度有显著差异。第10章1510.2 ANCOVA模型:包含一个定量变量、一模型:包含一个定量变量、一个两分定性变量的回归模型个两分定性变量的回归模型一个一个ANCOVA模型:模型:Yi=B1+B2Di+B3Xi+ui (10-8)其中,其中,Y食品支出食品支出X税后收入税后收入D 上面模型包含了一个定量变量上面模型包含了一个定量变量X和一个定性和一个定性变量变量D(性别性别)。第10章16对模型的解释如下:对模型的解释如下:Yi=B1+B2Di+B3Xi+ui 假定假定E(ui)=0,
17、则则男性平均食品支出为:男性平均食品支出为:E(Yi|Xi,Di0)=B1+B3Xi女性平均食品支出为:女性平均食品支出为:E(Yi|Xi,Di1)=(B1+B2)+B3Xi 是两条同斜率不同截矩的平行直线。是两条同斜率不同截矩的平行直线。第10章17Dependent Variable:YMethod:Least SquaresSample:1 12Included observations:12VariableCoefficientStd.Errort-StatisticProb.C1506.244188.00968.0115290.0000 X0.0589820.0061179.6417
18、450.0000d1-228.9868107.0582-2.1388990.0611R-squared0.928418 Mean dependent var2925.250Adjusted R-squared0.912511 S.D.dependent var604.3869S.E.of regression178.7693 Akaike info criterion13.42239Sum squared resid287626.1 Schwarz criterion13.54361Log likelihood-77.53432 F-statistic58.36471Durbin-Watson
19、 stat1.925985 Prob(F-statistic)0.000007Eviews输出结果如下:输出结果如下:比较该结果与前例结果比较该结果与前例结果。第10章18男性平均食品支出为:男性平均食品支出为:女性平均食品支出为:女性平均食品支出为:(10-10)税后收入税后收入XY食食品品支支出出男性平均食品支出男性平均食品支出女性平均食品支出女性平均食品支出第10章1910.3 包含一个定量变量、一个多分定性变量的回归包含一个定量变量、一个多分定性变量的回归 考虑考虑表表10-4(新教材(新教材P219)提供的数据。该表给出)提供的数据。该表给出了了1951年美国年美国50个州的公立学校
20、和哥伦比亚公立学校教个州的公立学校和哥伦比亚公立学校教师的平均薪水和每个学生的公共教育支出的数据。师的平均薪水和每个学生的公共教育支出的数据。现在想知道教师薪水是否有地区差异。地区分为三现在想知道教师薪水是否有地区差异。地区分为三类:东北和中北部(类:东北和中北部(21个)、南部(个)、南部(17个)、西部(个)、西部(13个)。定义虚拟变量如下:个)。定义虚拟变量如下:不考虑学生支出,我们可以考察如下模型:不考虑学生支出,我们可以考察如下模型:Yi=B1+B2D2i+B3D3i+ui (10-12)第10章20如果考虑学生支出,我们可以考察如下模型:如果考虑学生支出,我们可以考察如下模型:Y
21、i=B1+B2D2i+B3D3i+B4Xi+u西部地区的公立学教师平均年薪水:西部地区的公立学教师平均年薪水:E(Yi|D2=0,D3=0,Xi)=B1+B4Xi东北和中北部地区的公立学教师平均年薪水:东北和中北部地区的公立学教师平均年薪水:E(Yi|D2=1,D3=0,Xi)=(B1+B2)+B4Xi 南部地区的公立学教师平均年薪水:南部地区的公立学教师平均年薪水:E(Yi|D2=0,D3=1,Xi)=(B1+B3)+B4Xi回归直线是三条同斜率不同截矩的平行直线。回归直线是三条同斜率不同截矩的平行直线。第10章21Dependent Variable:YMethod:Least Squar
22、esSample:1 51Included observations:51VariableCoefficientStd.Errort-StatisticProb.C26158.621128.52323.179520.0000 d2-1734.4731435.953-1.2078900.2330d3-3264.6151499.155-2.1776370.0344R-squared0.090083 Mean dependent var24356.22Adjusted R-squared0.052170 S.D.dependent var4179.426S.E.of regression4068.9
23、47 Akaike info criterion19.51718Sum squared resid7.95E+08 Schwarz criterion19.63082Log likelihood-494.6880 F-statistic2.376027Durbin-Watson stat1.162044 Prob(F-statistic)0.103764Eviews输出结果输出结果如下如下(未加入每个学生的公共教育支出未加入每个学生的公共教育支出)第10章22加入每个学生的公共教育支出变量,模型的回归结果如下:加入每个学生的公共教育支出变量,模型的回归结果如下:se=(1395.06)(801
24、.17)(861.12)(0.3176)t=(9.51158)(-2.0888)(-1.3287)(10.3539)p值值=(0.0000)(0.0422)(0.1904)(0.0000)R2=0.7227 回归结果表明,在其它条件不变时,每个学生的公共回归结果表明,在其它条件不变时,每个学生的公共教育支出每增加教育支出每增加1美元,公立学校教师平均薪水将增加美元,公立学校教师平均薪水将增加3.29美元。美元。在在5的显著性水平下,两个虚拟变量统计显著性是不的显著性水平下,两个虚拟变量统计显著性是不一样的。一样的。第10章2310.4 10.4 包含一个定量变量和多个定性变量的回归包含一个定量
25、变量和多个定性变量的回归 虚拟变量的技术可以推广到解释变量中有不虚拟变量的技术可以推广到解释变量中有不止一个定性变量的情形。止一个定性变量的情形。例如考虑平均小时工资一例,影响因素有:例如考虑平均小时工资一例,影响因素有:受教育年限、性别和肤色。为了简便,假定肤色受教育年限、性别和肤色。为了简便,假定肤色有两种:白种和非白种。有两种:白种和非白种。模型设为:模型设为:Yi=B1+B2D2i+B3D3i+B4Xi+ui (10-18)式中,式中,Y小时工资小时工资X受教育年限受教育年限 D2i D3i第10章24假定假定E(ui)=0,则:则:Yi=B1+B2D2i+B3D3i+B4Xi+ui(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 本科 经济 计量学 10
限制150内