2022年虚拟变量 .pdf





《2022年虚拟变量 .pdf》由会员分享,可在线阅读,更多相关《2022年虚拟变量 .pdf(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章虚拟变量第一节虚拟变量的引入一、什么是虚拟变量前面几章介绍的解释变量都是可以直接度量的,称为定量变量。如收入、支出、价格、资金等等。但在现实经济生活中,影响应变量变动的因素,除了这些可以直接获得实际观测数据的定量变量外,还包括一些无法定量的解释变量的影响,如性别、民族、国籍、职业、文化程度、政府经济政策变动等因素,他们只表示某种特征的存在与不存在,所以称为属性变量或定性变量。属性变量:不能精确计量的说明某种属性或状态的定性变量。在计量经济模型中,应当包含属性变量对应变量的影响作用。那怎么才能把定性变量包括在模型中呢?属性变量通常是非数值变量,直接纳入回归方程中进行回归,显然是很困难的。为
2、此,人们采取了一种构造人工变量的方法,将这些定性变量进行量化,使其能与定量变量一样在回归模型中得以应用。由于定性变量通常是表明某种特征或属性是否存在,如性别变量中以男性为分析基础的话,那就只有男性、非男性;政策变动变量中以政策不变为基准,则有政策不变,和政策变动;至于有两种以上的状态的话,比如学历分高中,本科,本科以上等等,我们又怎么办呢?把疑问留到后面去解决。既然定性变量只有存在或不存在两种状态,所以量化的一般方法是取值为 0 或 1。称为虚拟变量。虚拟变量:人工构造的取值为0或 1 的作为属性变量代表的变量。一般常用D 表示。D=0,表示某种属性或状态不存在D=1,表示某种属性或状态存在比
3、如前面说的性别变量,以男性为基准,则当样本为男性时,虚拟变量取0,当样本为女性时,则虚拟变量取1。当虚拟变量作为解释变量引入计量经济模型时,对其回归系数的估计和统计检验方法都与定量解释变量相同。二、虚拟变量的作用1、作为属性因素的代表,如,性别、种族等2、作为某些非精确计量的数量因素的代表,如:受教育程度、年龄段等;3、作为某些偶然因素或政策因素的代表,如战争、911等。4、时间序列分析中作为季节(月份)的代表(比如对某些明显有淡季、旺季之分的产品)5、分段回归,研究斜率、截距的变动;6、比较两个回归模型;7、虚拟应变量概率模型,应变量本身是定性变量(比如你研究某产品的购买率,应变量本身就是买
4、或不买)三、虚拟变量的设置规则1、虚拟变量D 取值为 0,还是取值为1,要根据研究的目的决定。D 取值为 0 的类型,是基础类型,是比较的基准。不如前面说的性别变量,如果你研究是以男性为研究基准,则样本为男性,D 取值为 0,2、避免落入“虚拟变量陷阱”。当一个定性变量含有m 个相互排斥的类型时,应向模型引入m1 个虚拟变量。比如“性别”含男性和女性两个类别,所以当性别作为解释变量时,应向模型引入一个虚拟变量。取值方式是:D=1(男性)、D=0(女性)或D=0(男性)、D=1(女性)而当“学历”含有四个类别时,即大学、中学、小学、无学历。当“学历”作为解释变量时,应向模型引入三个虚拟变量。一种
5、取值方式是:1(大学)1(中学)1(小学)D1=0(非大学)D2=0(非中学)D3=0(非小学)所谓的“虚拟变量陷阱”就是当一个定性变量含有m 个类别时,模型引入m 个虚拟变量,造成了虚拟变量之间产生完全多重共线性,无法估计回归参数。在 m-1 个虚拟变量中,虚拟变量可以同时取值为0,但不能全部取值为1。3、当定性变量含有m 个类别时,不能把虚拟变量的值设为D=0(第一类)D=1(二类)D=2(三类)等等。名师资料总结-精品资料欢迎下载-名师精心整理-第 1 页,共 5 页 -1、回归模型中可以只有虚拟变量作解释变量,也可以用定量变量和虚拟变量一起作解释变量。另外,虚拟变量还可以作被解释变量。
6、第二节虚拟解释变量的回归虚拟变量的引入,可以影响模型的截距,也可以影响斜率,还可以同时影响截距和斜率。因此,加入虚拟解释变量的途径有两种基本类型:一是加法类型,二是乘法类型。不同的引入途径对计量经济模型有不同的影响。一、加法类型:改变模型的截距所谓的加法类型引入虚拟变量,就是虚拟变量与其他解释变量在设定模型中是相加关系。在所设定的计量经济模型中,根据所研究问题中定量变量的影响作用,按照虚拟变量的设置规则,直接在所设定的计量经济模型中加入适当的虚拟解释变量。比如:Y=a0+a1D1+a2D2+X+u 就是以加法形式引入的虚拟变量。加法形式引入虚拟解释变量,其作用是改变了设定模型的截距水平。定性因
7、素所包含的属性类别m 的多少,决定了引入虚拟解释变量个数的多少,同时也决定了所设模型的不同性质。下面分三种主要情形对加法形式引入虚拟变量的情形进行讨论。1、解释变量包含一个分为两种属性类型的定性变量的回归如 Y=a0+a1D+X+u D=0(基础类型)D=1(其他类型)则基础类型:E(Y)=a0+X 比较类型:E(Y)=(a0+a1)+X a1 就是截距的差异系数。对a1 的显著性检验,就是判别两条回归线的截距项是否存在显著性差异,或者说,检验定性因素对截距是否有显著影响。注意:u 应服从基本假定;这里一个定性变量有两种类型,只使用了一个虚拟变量。比如:我们分析是否读大学对年工资的影响。见资料
8、。另P219 2、解释变量中包含一个两种属性以上的定性解释变量的回归Y=a0+a1D1+a2D2+X+u 例如研究收入、学历(中学以下、中学、中学以上)对书报费支出的影响。D1=1(中学)=0(其他)D2=1(中学以上)=0(其他)则基础类型:(中学以下)E(Y|D1=0、D2=0)=a0+X 比较类型(中学)E(Y|D1=1,D2=0)=(a0+a1)+X(中学以上)E(Y|D1=0,D2=1)=(a0+a2)+X 这表明,三种不同的属性类型,其对应变量的影响都是不同的,原因在于三者的起点水平即截距不同。同样,a2、a3 表示的是截距差异系数,对他们的显著性检验,说明了不同的属性是否对戒惧6
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年虚拟变量 2022 虚拟 变量

限制150内