虚拟变量哑变量回归.ppt
《虚拟变量哑变量回归.ppt》由会员分享,可在线阅读,更多相关《虚拟变量哑变量回归.ppt(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、虚拟变量的应用多元线性回归Contents虚拟变量的建立虚拟变量的建立1虚拟变量回归系数的意义虚拟变量回归系数的意义2虚拟变量回归分析的检验虚拟变量回归分析的检验3SPSS实例操作实例操作4一、虚拟变量的建立一、虚拟变量的建立虚拟变量虚拟变量(Dummy Variable):取值为0和1的变量,当案例属于一个虚拟 变量所代表的类别时,这个虚拟变量就赋值为1,否则变赋值为0Di =1,是女性 =0,不是女性例1:例2:大学生年级变量具有四个类别,如何构造?其中,D1=1,是大一,否则为0;D2=1,是大二,否则为0;D3=1,是大三,否则为0;D4=1,是大三,否则为0。“虚拟变量陷阱”虚拟变量
2、的建立虚拟变量的建立D1+D2+D3+D4=1,说明D1,D2,D3,D4存在线性相关,造成多重共线性解决办法:原则:当一个分类量具有k个类别时,则仅引入k-1个虚拟变量。当所有k-1个自变量都取0的时候,那这个案例就属于第k类,我们称这类为参照类,参照类不仅解决了共线性的问题,而且在分析回归结果时也有非常重要的意义二、虚拟变量回归系数的意义二、虚拟变量回归系数的意义因变量为大学生的月支出,自变量有家庭月收入,年级,性别建立回归方程:(0)其中,DG2=1,是大二,否则为0;DG3=1,是大三,否则为0;DG4=1,是大三,否则为0。DS=1,是女生,否则为0虚拟变量回归系数的意义虚拟变量回归
3、系数的意义(1)参照类:大一男生(所有虚拟变量均取0)变式1:大二男生(DG2=1,虚拟变量均取0)(2)变式2:大一女生(DS=1,虚拟变量均取0)(3)参照类中,b0为直线的截距,b1为直线斜率,即 INCOME 的回归系数由式(1)到式(2),截距项增加了b2,因此b2就是大二男生比大一男生月支出高的部分;由式(1)到式(3),截距项增加了b4,因此b4就是大一女生比大一男生月支出高的部分。差别截距:所有表示各类别虚拟变量的回归系数(bj)表示的是该类与参照类的均值之差。(对于序次变量还可计算相邻分类的边际效应,任意两类的边际效应)虚拟变量回归系数的意义虚拟变量回归系数的意义1.只考虑年
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 虚拟 变量 回归
限制150内