数据统计与分析教程章含虚拟变量的回归模型学习教案.pptx
《数据统计与分析教程章含虚拟变量的回归模型学习教案.pptx》由会员分享,可在线阅读,更多相关《数据统计与分析教程章含虚拟变量的回归模型学习教案.pptx(22页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据数据(shj)统计与分析教程章含虚拟变量统计与分析教程章含虚拟变量的回归模型的回归模型第一页,共22页。一、虚拟变量的定义1.定性(dng xng)变量与定量变量定量变量:回归模型定量变量:回归模型(mxng)中有些变量是可以被度量的,如居民消费、国内生产总值、出口总额等,这些变量被称为中有些变量是可以被度量的,如居民消费、国内生产总值、出口总额等,这些变量被称为“定量变量定量变量”。定性变量:在经济现象的分析中还存在一些不能被度量的变量,如性别、种族、婚姻状况、文化程度等,这些变量被称为定性变量:在经济现象的分析中还存在一些不能被度量的变量,如性别、种族、婚姻状况、文化程度等,这些变量被
2、称为“定性变量定性变量”。第1页/共22页第二页,共22页。一、虚拟(xn)变量的定义2.虚拟(xn)变量定义:定义:定性变量描述的是变量具有的性质,要将这样的变量纳入回归模型中,需构造定性变量描述的是变量具有的性质,要将这样的变量纳入回归模型中,需构造(guzo)人工变量,从而将定性变量进行量化处理。人工变量,从而将定性变量进行量化处理。在计量经济学中,将取值为在计量经济学中,将取值为“0”和和“1”的人工变量称作虚拟变量(的人工变量称作虚拟变量(Dummy Variable),用字母),用字母D表示。当表示。当D取值为取值为0时,表示该变量不具备某种属性;当时,表示该变量不具备某种属性;当
3、D取值为取值为1时,表示该变量具有某种属性。时,表示该变量具有某种属性。第2页/共22页第三页,共22页。一、虚拟(xn)变量的定义2.虚拟(xn)变量虚拟变量陷阱:虚拟变量陷阱:所谓的所谓的“虚拟变量陷阱虚拟变量陷阱”是指自变量(解释变量)中包含了过多的虚拟变量,从而导致了模型出现多重共线性。当模型中既有整体截距又对每一组都设有一个是指自变量(解释变量)中包含了过多的虚拟变量,从而导致了模型出现多重共线性。当模型中既有整体截距又对每一组都设有一个(y)虚拟变量时,就产生了虚拟变量陷阱。虚拟变量时,就产生了虚拟变量陷阱。第3页/共22页第四页,共22页。一、虚拟变量(binling)的定义2.
4、虚拟变量(binling)引入虚拟变量的原则:引入虚拟变量的原则:一般情况一般情况(qngkung)下,如果定性变量有下,如果定性变量有m类,并且模型不含有截距项时,应引入类,并且模型不含有截距项时,应引入m个虚拟变量;如果模型含有截距项,应引入个虚拟变量;如果模型含有截距项,应引入m-1个虚拟变量。个虚拟变量。第4页/共22页第五页,共22页。二、含虚拟变量(binling)的模型1.仅含一个虚拟变量(binling)在回归模型中,解释变量可以仅是一个虚拟变量,这样在回归模型中,解释变量可以仅是一个虚拟变量,这样(zhyng)的回归模型被称为方差分析模型。的回归模型被称为方差分析模型。例如:
5、例如:yt=0+1Dt+t 假设被解释变量假设被解释变量yt为员工工资收入,为员工工资收入,Dt为虚拟解释变量,取值为为虚拟解释变量,取值为0或或1:1,雇员为女性,雇员为女性Dt=0,雇员为男性,雇员为男性第5页/共22页第六页,共22页。二、含虚拟变量(binling)的模型1.仅含一个虚拟变量(binling)如果该回归模型的随机误差项满足线性回归模型的五个基本如果该回归模型的随机误差项满足线性回归模型的五个基本(jbn)假定条件,则假定条件,则E(yt|Dt=1)=E(雇员工资收入(雇员工资收入|雇员为女性)雇员为女性)=0+1E(yt|Dt=0)=E(雇员工资收入(雇员工资收入|雇员
6、为男性)雇员为男性)=00+1表示女性雇员的平均工资收入,表示女性雇员的平均工资收入,0表示男性雇员的平均工资收入。表示男性雇员的平均工资收入。第6页/共22页第七页,共22页。二、含虚拟变量(binling)的模型1.仅含一个虚拟变量(binling)实验:实验:根据表根据表7-1中的数据显示,建立解释变量为虚拟变量的回归模型。表中列出了中的数据显示,建立解释变量为虚拟变量的回归模型。表中列出了24个不同性别个不同性别(xngbi)的企业员工的月工资收入情况,性别的企业员工的月工资收入情况,性别(xngbi)一列中一列中“1”表示女性员工,表示女性员工,“0”表示男性员工。通过建立含有虚拟变
7、量的回归模型,试图分析男女平均工资是否存有差距,如果有差距,那么差距是多少。表示男性员工。通过建立含有虚拟变量的回归模型,试图分析男女平均工资是否存有差距,如果有差距,那么差距是多少。第7页/共22页第八页,共22页。二、含虚拟变量的模型(mxng)1.仅含一个虚拟变量实验:实验:回归模型为回归模型为yt=0+1Dt+t (t=1,2,n)其中,其中,yt表示企业表示企业(qy)员工的工资收入情况,员工的工资收入情况,Dt=0表示男性员工,表示男性员工,Dt=1表示女性员工。表示女性员工。第8页/共22页第九页,共22页。二、含虚拟变量的模型(mxng)1.仅含一个虚拟变量实验:实验:第一步,
8、建立类型为第一步,建立类型为“Unstructured/Undated”(未限定结构(未限定结构/未限定日期)的工作文件,在未限定日期)的工作文件,在“Data range”(数据范围)中输入观测数据的样本范围,本例中所分析的数据为(数据范围)中输入观测数据的样本范围,本例中所分析的数据为24个样本,在个样本,在“Names”中为该工资文件命名中为该工资文件命名(mng mng),如,如“工资与性别关系工资与性别关系”。然后单击。然后单击“OK”按钮即可生成工作文件。按钮即可生成工作文件。第9页/共22页第十页,共22页。二、含虚拟变量(binling)的模型1.仅含一个虚拟变量(binlin
9、g)实验:实验:第二步,在该工作文件中建立两个序列对象,一个为第二步,在该工作文件中建立两个序列对象,一个为“wage”,一个为,一个为“sex”。第三步,在第三步,在“wage”序列对象中输入序列对象中输入 “工资工资(gngz)”的数据,在的数据,在“sex”序列对象中输入序列对象中输入 “性别性别”的数据。的数据。第10页/共22页第十一页,共22页。二、含虚拟(xn)变量的模型1.仅含一个虚拟(xn)变量实验:实验:第四步,在工作文件中选择主菜单栏中的第四步,在工作文件中选择主菜单栏中的“Object”|“New Object”|“Equation”选项,或者选项,或者(huzh)选择
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 统计 分析 教程 虚拟 变量 回归 模型 学习 教案
限制150内