虚拟变量回ppt课件资料讲解.ppt
《虚拟变量回ppt课件资料讲解.ppt》由会员分享,可在线阅读,更多相关《虚拟变量回ppt课件资料讲解.ppt(67页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、虚拟变量回ppt课件 问题的一般性描述问题的一般性描述在实际建模中,一些在实际建模中,一些定性变量定性变量具有不可忽视的重要具有不可忽视的重要影响。例如,研究某个企业的销售水平,产业属性影响。例如,研究某个企业的销售水平,产业属性(制造业、零售业)、所有制(私营、非私营)、(制造业、零售业)、所有制(私营、非私营)、地理位置(东、中、西部)、管理者的素质、不同地理位置(东、中、西部)、管理者的素质、不同的收入水平等是值得考虑的重要影响因素,但这些的收入水平等是值得考虑的重要影响因素,但这些因素共同的特征是因素共同的特征是定性描述定性描述的。的。如何对非定量因素进行回归分析?如何对非定量因素进行
2、回归分析?采用采用“虚拟变量虚拟变量”对定性变量进行量化一种思路。对定性变量进行量化一种思路。2第八章第八章 虚拟变量回归虚拟变量回归 本章主要讨论本章主要讨论:虚拟变量虚拟变量 虚拟解释变量的回归虚拟解释变量的回归 虚拟虚拟被解释变量被解释变量的回归的回归(选讲选讲,不包括不包括)3第一节第一节 虚拟变量虚拟变量 本节基本内容本节基本内容:基本概念基本概念 虚拟变量设置规则虚拟变量设置规则 4一、基本概念一、基本概念定量因素:可直接测度、数值性的因素。定量因素:可直接测度、数值性的因素。定性因素:属性因素,表征某种属性定性因素:属性因素,表征某种属性存在与否存在与否的的 非数值非数值性的因素
3、。性的因素。基本思想:基本思想:直接在回归模型中加入定性因素存在诸多的困难直接在回归模型中加入定性因素存在诸多的困难(那些困难?),是否可将这些定性因素进行量(那些困难?),是否可将这些定性因素进行量化,以达到定性因素能与定量因素有着相同作用化,以达到定性因素能与定量因素有着相同作用之目的。之目的。5计量经济学中,将计量经济学中,将取值为取值为0 0和和1 1的人工变量称为虚的人工变量称为虚拟变量。虚拟变量也称:哑元变量、定性变量等拟变量。虚拟变量也称:哑元变量、定性变量等等。通常用字母等。通常用字母D或或DUM加以表示(英文中虚拟加以表示(英文中虚拟或者哑元或者哑元Dummy的缩写)。的缩写
4、)。对定性变量的量化可采用虚拟变量的方式实现。对定性变量的量化可采用虚拟变量的方式实现。一般设置某一属性存在则一般设置某一属性存在则d=1d=1,属性不存在则,属性不存在则d=0d=0。这样就这样就 把不能精确计量的定性因素用把不能精确计量的定性因素用0-10-1数字来数字来定量描述了。定量描述了。虚拟变量的定义虚拟变量的定义6虚拟变量的设置规则涉及三个方面虚拟变量的设置规则涉及三个方面:1.“0”1.“0”和和“1”“1”选取原则选取原则 2.2.属性(状态、水平)因素与设置虚拟变量属性(状态、水平)因素与设置虚拟变量数量的关系数量的关系 3.3.虚拟变量在回归分析中的角色以及作用等虚拟变量
5、在回归分析中的角色以及作用等方面的问题方面的问题二、二、虚拟变量虚拟变量设置规则设置规则7 “0”“0”和和“1”“1”选取原则选取原则l虚拟变量取虚拟变量取“1”“1”或或“0”“0”的原则,应从分析问题的原则,应从分析问题的目的出发予以界定。的目的出发予以界定。l从理论上讲,虚拟变量取从理论上讲,虚拟变量取“0”“0”值通常代表比较值通常代表比较的基础类型的基础类型;而虚拟变量取;而虚拟变量取“1”“1”值通常代表被值通常代表被比较的类型比较的类型。“0”“0”代表基期(比较的基础,参照物);代表基期(比较的基础,参照物);“1”“1”代表报告期(被比较的效应)。代表报告期(被比较的效应)
6、。8例如,比较收入时考察性别的作用。当研究男性收入是否例如,比较收入时考察性别的作用。当研究男性收入是否高于女性时,是将女性作为比较的基础(参照物),故有高于女性时,是将女性作为比较的基础(参照物),故有男性为男性为“1”“1”,女性为,女性为“0”“0”。例例1 1问题问题:为何只选为何只选0 0、1 1,选,选2 2、3 3、4 4行吗?为什么?行吗?为什么?9定性因素的属性既可能为两种状态,也可能为多种定性因素的属性既可能为两种状态,也可能为多种状态。例如,性别(男、女两种)、季节(状态。例如,性别(男、女两种)、季节(4 4种状态种状态),地理位置(东、中、西部),行业归属,所有),地
7、理位置(东、中、西部),行业归属,所有制,收入的分组等。制,收入的分组等。属性的状态(水平)数与虚拟变量属性的状态(水平)数与虚拟变量数量的关系数量的关系101 1.若定性因素具有若定性因素具有 个个 相互排斥属性相互排斥属性(或或几个水平几个水平),当回归模型有截距项时,只能引入,当回归模型有截距项时,只能引入 个虚拟变量;个虚拟变量;2.2.当回归模型无截距项时,则可引入当回归模型无截距项时,则可引入 个虚拟变个虚拟变量;否则,就会陷入量;否则,就会陷入“虚拟变量陷阱虚拟变量陷阱”。(为什(为什么?)么?)虚拟变量数量的设置规则虚拟变量数量的设置规则11研究居民住房消费支出研究居民住房消费
8、支出 和居民可支配收入和居民可支配收入 之间的之间的数量关系。回归模型的设定为:数量关系。回归模型的设定为:现在要考虑城镇居民和农村居民之间的差异,如何办?现在要考虑城镇居民和农村居民之间的差异,如何办?为了对为了对“城镇居民城镇居民”、“农村居民农村居民”进行区分,分析进行区分,分析各自在住房消费支出各自在住房消费支出 上的差异,设上的差异,设 为城镇为城镇;为农村为农村,则模型为则模型为(模型有截距,模型有截距,“居民属性居民属性”定性变量只有两个相互排斥定性变量只有两个相互排斥的属性状态(的属性状态(),故只设定一个虚拟变量。),故只设定一个虚拟变量。)一个例子一个例子(虚拟变量陷阱虚拟
9、变量陷阱)12若对两个相互排斥的属性若对两个相互排斥的属性“居民属性居民属性”,仍然,仍然引入引入 个虚拟变量,则有个虚拟变量,则有则模型(则模型(1 1)为)为则对任一家庭都有:则对任一家庭都有:,即产生完全共线,陷入了即产生完全共线,陷入了“虚拟变量陷阱虚拟变量陷阱”。“虚拟变量陷阱虚拟变量陷阱”的实质是:的实质是:完全多重共线性完全多重共线性。13三、虚拟变量的作用n属性因素代表:性别,所有制n非精确计量的数量因素的代表:教育程度,管理者素质,企业规模。n偶然因素或政策因素代表:战争、灾害、改革等。n时间序列里的季节或月份的代表。n分段回归,研究截距斜率变化。14虚拟变量既可作为被解释变
10、量,也可作为解释虚拟变量既可作为被解释变量,也可作为解释变量,分别称其为虚拟被解释变量和虚拟解释变量。变量,分别称其为虚拟被解释变量和虚拟解释变量。虚拟被解释变量的研究是当前计量经济学研究的虚拟被解释变量的研究是当前计量经济学研究的前沿领域,如前沿领域,如MacFadden、Heckmen等人的微观计等人的微观计量经济学研究,大量涉及到虚拟被解释变量的分析。量经济学研究,大量涉及到虚拟被解释变量的分析。本课程本课程只是讨论虚拟解释变量只是讨论虚拟解释变量的问题的问题 虚拟变量在回归模型中的角色虚拟变量在回归模型中的角色15第二节第二节 虚拟解释变量的回归虚拟解释变量的回归 本节基本内容本节基本
11、内容:加法类型加法类型 乘法类型乘法类型 虚拟解释变量综合应用虚拟解释变量综合应用16在计量经济学中,通常引入虚拟变量的方式分为在计量经济学中,通常引入虚拟变量的方式分为加法方式和乘法方式两种:即加法方式和乘法方式两种:即实质实质:加法方式引入虚拟变量改变的是加法方式引入虚拟变量改变的是截距截距;乘法方式引入虚拟变量改变的是乘法方式引入虚拟变量改变的是斜率斜率。17 以加法方式引入虚以加法方式引入虚拟变拟变量量时时,主要考,主要考虑虑的的问问 题题是定性因素的属性和引入虚是定性因素的属性和引入虚拟变拟变量的个数。量的个数。分分为为四种情形四种情形讨论讨论:(1 1)解)解释变释变量只有一个定性
12、量只有一个定性变变量而无定量量而无定量变变量,量,而且定性而且定性变变量量为为两种相互排斥的属性;两种相互排斥的属性;(2 2)解解释释变变量量分分别别为为一一个个定定性性变变量量(两两种种属属性性)和一个定量解和一个定量解释变释变量;量;一、加法类型一、加法类型18(3 3)解)解释变释变量分量分别为别为一个定性一个定性变变量(两种以量(两种以上属性)和一个定量解上属性)和一个定量解释变释变量;量;(4 4)解)解释变释变量分量分别为别为两个定性两个定性变变量(各自分量(各自分别别是两种属性)和一个定量解是两种属性)和一个定量解释变释变量;量;19(1 1)一个两种属性定性解释变量而)一个两
13、种属性定性解释变量而无定量变量的情形无定量变量的情形农村20n这种类型实质是研究两类样本是否存在差别。通过判断系数是否显著。21(2)一个定性解释变量(两种属性)一个定性解释变量(两种属性)和一个定量解释变量的情形和一个定量解释变量的情形城市农村22共同的特征:共同的特征:由收入引起的平均消费变化由收入引起的平均消费变化是相同的,但是相同的,但截距发生改变截距发生改变。123(3 3)一个定性解释变量(两种以上)一个定性解释变量(两种以上属性)和一个定量解释变量的情形属性)和一个定量解释变量的情形24单个是否显著用t检验判断,各个参数都为零的联合假设检验由F检验完成。25n啤酒消费需求模型,为
14、了分析城乡差别和季节差异,引入两个虚拟变量(这时不会有虚拟变量陷阱,因为这两个没有非此即彼关系)。(4 4)两个定性解释变量(均为两种属)两个定性解释变量(均为两种属性)和一个定量解释变量的情形性)和一个定量解释变量的情形26夏季、农村居民冬季、农村居民27上述图形的前提条件是什么?上述图形的前提条件是什么?28 运用运用OLS得到回归结果,再用得到回归结果,再用t检验讨论因素检验讨论因素 是否对模型有影响。是否对模型有影响。加法方式引入虚拟变量的一般表达式加法方式引入虚拟变量的一般表达式:基本分析方法基本分析方法:条件期望。条件期望。29加法方式引入虚拟变量的主要作用为:加法方式引入虚拟变量
15、的主要作用为:1.1.在有定量解释变量的情形下,主要改变方程在有定量解释变量的情形下,主要改变方程 截距;截距;2.2.在没有定量解释变量的情形下,主要用于方在没有定量解释变量的情形下,主要用于方 差分析。差分析。30基本思想基本思想以乘法方式引入虚以乘法方式引入虚拟变拟变量量时时,是在所,是在所设设立的模型中,将立的模型中,将虚虚拟拟解解释变释变量与其它解量与其它解释变释变量的乘量的乘积积,作,作为为新的解新的解释变释变量出量出现现在在模型中,模型中,以达到其以达到其调调整整设设定模型斜率系数的目的。或者将模定模型斜率系数的目的。或者将模型斜率系数表示型斜率系数表示为为虚虚拟变拟变量的函数,
16、以达到相同的目的。量的函数,以达到相同的目的。乘法引入方式乘法引入方式:(1 1)截距不)截距不变变;(2 2)截距和斜率均)截距和斜率均发发生生变变化;化;分析手段:分析手段:仍然是条件期望。仍然是条件期望。二、乘法类型二、乘法类型31模型形式:模型形式:例:研究消费支出例:研究消费支出 受收入受收入 、年份状况、年份状况 的影响的影响(1 1)截距不变的情形)截距不变的情形32(2 2)截距和斜率均发生变化)截距和斜率均发生变化 例,同样研究消费支出例,同样研究消费支出 、收入收入 、年份状况、年份状况 间的影间的影 响关系。响关系。模型形式:模型形式:33不同截距、斜率的组合图形不同截距
17、、斜率的组合图形重合回归:截距斜率均相同重合回归:截距斜率均相同平行回归:截距不同斜率相同平行回归:截距不同斜率相同共点回归:截距相同斜率不同共点回归:截距相同斜率不同交叉(不同)回归:截距斜率均不同交叉(不同)回归:截距斜率均不同34三、虚拟解释变量综合应用三、虚拟解释变量综合应用所谓综合应用是指将引入虚拟解释变量的加法方所谓综合应用是指将引入虚拟解释变量的加法方式、乘法方式进行综合使用。式、乘法方式进行综合使用。基本分析方式仍然是条件期望分析。基本分析方式仍然是条件期望分析。本课主要讨论本课主要讨论(1 1)结构变化分析;)结构变化分析;(2 2)交互效应分析;)交互效应分析;(3 3)分
18、段回归分析)分段回归分析35(1 1)结构变化分析)结构变化分析 结构变化的实质是结构变化的实质是检验所设定的模型在样本期内检验所设定的模型在样本期内是否为同一模型是否为同一模型。显然,平行回归、共点回归、。显然,平行回归、共点回归、不同的回归三个模型均不是同一模型。不同的回归三个模型均不是同一模型。平行回归模型的假定是斜率保持不变(加法类型,平行回归模型的假定是斜率保持不变(加法类型,包括方差分析);包括方差分析);共点回归模型的假定是截距保持不变(乘法类型,共点回归模型的假定是截距保持不变(乘法类型,又被称为协方差分析);又被称为协方差分析);不同的回归的模型的假定是截距、斜率均为变动不同
19、的回归的模型的假定是截距、斜率均为变动的(加法、乘法类型的组合)。的(加法、乘法类型的组合)。36 例:比较改革开放前、后我国居民(平均)例:比较改革开放前、后我国居民(平均)“储储 蓄蓄收入收入”总量关系是否发生了变化?总量关系是否发生了变化?模型的设定形式为模型的设定形式为 :37显然,只要显然,只要 、不同时为零,上述模型就能刻画不同时为零,上述模型就能刻画改革开放前后我国居民储蓄收入模型结构是否发生改革开放前后我国居民储蓄收入模型结构是否发生变化。变化。回归方程:回归方程:38与单独对两端分别回归相比与单独对两端分别回归相比:1.用一个回归代替多个回归,简化分析用一个回归代替多个回归,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 虚拟 变量 ppt 课件 资料 讲解
限制150内