8第八章虚拟变量回归new1773.pptx
《8第八章虚拟变量回归new1773.pptx》由会员分享,可在线阅读,更多相关《8第八章虚拟变量回归new1773.pptx(42页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第八章虚拟变量回归计量经济学1在对在校学生的消费行为进行的调查中,发现在校生的消费行为呈现多元化的结构。人际交往消费、手机类消费、衣着类消费、化妆品类消费、电脑类消费、旅游类消费占有较大的比例;而食品类消费、学习用品类消费不突显。显然,男女生在消费上存在差异。为了了解男、女生的消费支出结构差异,应当如何建立模型?面临的问题:如何把男女生这样的非数量变量引入方程?引子:男女大学生消费真有差异吗?2 问题的一般性描述在实际建模中,一些定性变量具有不可忽视的重要影响。例如,研究某个企业的销售水平,产业属性(制造业、零售业)、所有制(私营、非私营)、地理位置(东、中、西部)、管理者的素质、不同的收入水
2、平等是值得考虑的重要影响因素,但这些因素共同的特征是定性描述的。如何对非定量因素进行回归分析?采用“虚拟变量”对定性变量进行量化一种思路。3第八章 虚拟变量回归 本章主要讨论:虚拟变量及其作用 虚拟变量设定 虚拟解释变量的回归 虚拟被解释变量的回归(选讲,不包括)4一、定义 反映品质指标变化、数值只取0和1的人工变量,用符号D来表示。如:城镇居民农村居民销售旺季销售淡季政策紧缩政策宽松本科以上学历本科以下学历变量的划分应遵循穷举与互斥原则。第一节 虚拟变量及其作用5二、作用可以描述和测量定性因素的影响。能够正确反映经济变量之间的相互关系,提高模型的精度。便于处理异常数据。即将异常数据作为一个特
3、殊的定性因素异常时期正常时期6一、虚拟变量的引入方式(1)加法方式 Yi=a+bxi+Di+i 等价为:当Di=0时:Yi=a+bxi+i 当Di=1时:Yi=(a+)+bxi+iD=0D=1aa+以加法方式引入,反映定性因素对截距的影响 第二节 虚拟变量的设定(2)乘法方式 Yi=a+bxi+XDi+i其中:XDi=Xi*Di,上式等价于:当Di=0时:Yi=a+bxi+i 当Di=1时:Yi=a+(b+)xi+iD=0D=1a 以乘法方式引入,可反映定性因素对斜率的影响,系数描述了定性因素的影响程度。8(3)一般方式 同时用加法与乘法方式引入虚拟变量,然后再利用t检验判断、是否显著的不等于
4、零,进而确定虚拟变量的具体引入方式。【例】现有1998年我国城镇居民人均收入与彩电每百户拥有量的统计资料。9观察相关图从相关图可以看出,前3个样本点与后5个样本点存在较大差异,因此,可设置虚拟变量反映“收入层次”:中高收入家庭低收入家庭10将我国城镇居民的彩电需求函数设成:Yi=a+bxi+Di+XDi+i DATA D1(由于D是EViews软件的保留字,所以将虚拟变量取名为D1;另外,此时也可以用SMPL和GENR命令直接生成D1变量)GENR XD=X*D1 生成变量XDLS D1 XD 估计需求函数 结果如下图所示:11我国城镇居民彩电需求函数的估计结果为:对应的t统计量值R2的值调整
5、的R2值SE的值 结果表明不同收入家庭对彩电的消费需求,在截距和斜率上都存在着明显差异。12低收入家庭:此例说明了三个问题:如何设置和在模型中引入虚拟变量;如何测量定性因素(即收入层次)的影响;如何区分不同类型的模型(即需求函数)。中高收入家庭:13二、虚拟变量的设置原则 一个因素多个类型 对于有m个不同属性的定性因素,应该设置m-1个虚拟变量来反映该因素的影响。例如,设公司职员的年薪与工龄和学历有关。学历分成三种:大专以下、本科、研究生。为反映“学历”的影响,应该设置两个虚拟变量:本科其他研究生其他 Yi=a+bxi+i 大专以下(D1=D2=0)Yi=(a+1)+bxi+i 本科(D1=1
6、,D2=0)Yi=(a+2)+bxi+i 研究生(D1=0,D2=1)而将年薪模型取成(假设以加法方式引入):Yi=a+bxi+1D1i+2D2i+i 其等价于:三类年薪函数的差异情况如下图所示:大专以下本科研究生工龄年薪2-11D设置虚拟变量D或增设D3行吗?研究生其他(2)多个因素各两种类型 如果有m个定性因素,且每个因素各有两个不同的属性类型,则引入 m 个虚拟变量。例如,研究居民住房消费函数时,考虑到城乡的差异以及不同收入层次的影响,将消费函数取成:yi=a+bxi+1D1i+2D2i+i 其中y,x分别是居民住房消费支出和可支配收入,虚拟变量设为:这样可以反映各类居民家庭的住房消费情
7、况:农村居民城镇居民高收入家庭低收入家庭 城市低收入家庭(D1=0,D2=0)城市高收入家庭(D1=0,D2=1)农村低收入家庭(D1=1,D2=0)农村高收入家庭(D1=1,D2=1)思考:若是多因素、多个属性水平的问题,如何设置?一、调整季节波动 例如,用季度数据分析某公司利润y与销售收入x之间的相互关系时,为研究四个季度的季节性影响,引入三个虚拟变量(设第1季度为基础类型):利润函数可取为:Yi=a+bxi+1D1i+2D2i+3D3i+i第i+1季度 i=1,2,3其他季度第三节 虚拟变量的特殊应用二、检验模型结构的稳定性 设根据两个样本估计的回归模型分别为:样本1:Yi=a1+b1x
8、i+i 样本2:Yi=a2+b2xi+i估计模型:Yi=a1+b1xi+(a2-a1)Di+(b2-b1)XDi+i其中,XDi=xi*Di。样本2样本1 设置虚拟变量:20利用t检验判断D、XD系数的显著性,得到四种检验结果:(1)a2=a1,b2=b1,两个回归模型没有显著差异。(2)a2a1,b2=b1,两个回归模型之间的差异仅仅表现在截距上。(3)a2=a1,b2b1,两个回归模型的截距相同,但斜率存在显著差异。(4)a2a1,b2b1,表明两个回归模型完全不同。第(1)种情况下模型结构是稳定的,其余情况都表明模型结构不稳定。重合回归平行回归汇合回归相异回归21三、分段回归 设虚拟变量
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 虚拟 变量 回归 new1773
限制150内