第九章 含虚拟变量的回归模型16866.docx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第九章 含虚拟变量的回归模型16866.docx》由会员分享,可在线阅读,更多相关《第九章 含虚拟变量的回归模型16866.docx(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第九章 含虚拟变量的回归模型目前为止,在已已学习的线性性回归模型中中,解释变量量X都是定量变变量。但有时时候,解释变变量是定性变变量。9.1 虚拟变变量的性质通常在回归分析析中,应变量量不仅受一些些定量变量的的影响,还受受一些定性变变量的影响(性别、种族族、肤色、宗宗教、民族、罢罢工、政团关关系、婚姻状状况)。如:美国黑人的收入入比相应的白白人的收入低低。女学生的S.AA.T.的数数学平均分数数比相应的男男生低。定性变量通常表表明了具备或或不具备某种种性质,比如如,男性或女女性,黑人或或白人,佛教徒或非佛教徒,本国公民或非非本国公民。把定性因素“定定量化”的一个方法法是建立人工工变量,并赋赋值
2、0和1,0表示变量不不具备某种属属性,1表示变量具具备某种属性性,该变量称称为虚拟变量量(dummmy varriablee),用符号号D表示。虚拟变量一样可可用于回归分分析,一个回回归模型的解解释变量可以以仅仅是虚拟拟变量,称为为方差分析模模型( ANNOVA )。Yi = B11 + B2Di + ui ( 9 - 1 )其中Y = 初初职年薪Di =1,大学毕业业=0,非大学毕毕业假定随机扰动项项满足古典线线性回归模型型的基本假定定,根据模型型( 9 - 1 )得得到:非大学毕业生的的初职年薪的的期望为:E(YiDii=0) = B1 + B2( 00 ) = B1 ( 99 - 2 )
3、大学毕业生的初初职年薪的期期望为:E(YiDii=1) = B1+B22( 1 ) = B1+B22 ( 99 - 3 )可以看出:截距B1表示非非大学毕业生生的平均初职职年薪,“斜率”系数BB2表明大学毕业业生的平均初初职年薪与非非大学生的差差距是多少;(B1+B2)表示大学毕毕业生的平均均初职年薪。零假设:大学教教育没有任何何益处(即B2=0),可根据t检验值判定定b2是否是统统计显著的。例9.1 大学学毕业生和非非大学毕业生生的初职年薪薪模型( 9-11 ) OLLS回归结果果如下:Yi = 188.00 + 3.288Di ( 9 - 4 )se = (00.31) (00.44) t
4、 = (577.74 ) (7.4444) p值= ( 00.000 ) (00.000)r2=0.87737估计的非大学毕毕业生的平均均初职年薪为为180000美元(=b11),大学毕业生的平平均初职年薪薪为212880美元(b1+b2)。根据括号中的tt值,很容易易验证b2是统计显显著的,表明明非大学毕业业生和大学毕毕业生的初职职年薪有差距距。图9-1描绘了了回归结果,回回归函数是一一个分段函数数。在社会学、心理理学、教育学学领域,ANNOVA模型型用得很广泛泛,而经济学学中很少。在在许多经济研研究中,回归归模型中的解解释变量有些些是定量的,有有些是定性的的,称为协方方差模型( ANCOV
5、VA )。9.2 包含一一个定量变量量,一个定性性变量的回归归模型Yi=B1 + B2Di + B3Xi + ui ( 9 - 66 )其中 Yi 公司职员员的年薪Xi 工龄龄Di =1,女职员=0,男职员模型( 9 - 6 )包包含了一个定定量的变量XX(工龄)和一个定性性变量(性别)。假定E(ui) = 0,则则,男职员平均年薪薪:E (YiXXi,Di= 00) = B1 + B3Xi ( 99 - 7 )女职员平均年薪薪:E (YiXXi,Di= 11) = (B1 + B2) + B3Xi ( 9 - 8 )图9 - 2描描绘了这两种种不同的情况况。(假定B1 0 )模型( 9 -
6、6 )表表明男、女职员的平均年年薪对工龄的函数具具有相同的斜斜率(B3),但截距不不同。即男职员的平均年年薪水平与女女职员不同(多了B2),但男男、女职员平均年薪薪对工龄的变化率率相同。零假设:回归方方程( 9 - 7 )和( 9 - 8 )有有相同的截距距(也即没有性性别歧视)。再根据t检验结果判判定b2的统计显显著性。考虑:能否引入入关于性别的的两个虚拟变变量?模型( 9 - 6 )可可写为:Yi=B1 + B2Xi + B3D1ii + B4D2i + ui ( 9 - 9 )D1i =1, 男职员=0, 女职员员D2i =1, 女职员=0, 男职员员无法估计模型( 9 - 9 ),因因
7、为D1i与D2i存在完完全共线性(即完全的线线性关系)。很容易验验证: D1= ( 1-D2)或D2= 11D1,也即D1,D2完全共线线性。避免完全共线性性问题的一般般规则是:如果一个个定性的变量量有m类,则要引引进(m-11 )个虚拟拟变量。如果果不遵循这个个规则,就会会陷入虚拟变变量陷阱(ddummy variaable ttrap),也也即完全多重重共线性情形形。虚拟变量的赋值值是任意的。例子中令D= 1,代表女职员,D= 0,代表男职员;赋值可根据习惯而定。赋值为0的一类类常称为基准准类,对比类;(共同的)截距B1是基准类类的截距。同同样,对于基基准类的选择择也是根据研研究目的而定定
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第九章 含虚拟变量的回归模型16866 第九 虚拟 变量 回归 模型 16866
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内