【教学课件】第8章虚拟变量模型.ppt
《【教学课件】第8章虚拟变量模型.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第8章虚拟变量模型.ppt(86页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第8 8章章 虚拟变量模型虚拟变量模型 一、虚拟变量的基本含义一、虚拟变量的基本含义 二、虚拟变量的设置原则二、虚拟变量的设置原则 三、虚拟变量作用三、虚拟变量作用 四、虚拟变量的引入四、虚拟变量的引入 五、虚拟变量的特殊应用五、虚拟变量的特殊应用 六、虚拟被解释变量模型六、虚拟被解释变量模型一、虚拟变量的基本含义一、虚拟变量的基本含义l许多经济变量是许多经济变量是可以定量度量可以定量度量的,其取值可用数的,其取值可用数值表示,值表示,如:如:商品需求量、价格、收入、产量等商品需求量、价格、收入、产量等l但也有一些影响经济变量的因素但也有一些影响经济变量的因素无法定量度量无法定量度量,如:如
2、:职业、性别对收入的影响,战争、自然灾害职业、性别对收入的影响,战争、自然灾害对对GDP的影响,季节对某些产品(如冷饮)销售的影响,季节对某些产品(如冷饮)销售的影响等等,反映这些的影响等等,反映这些定性因素定性因素的变量被称为的变量被称为品品质变量质变量,这些变量由于各种原因不能计量,这些变量由于各种原因不能计量。l为了在模型中能够反映这些因素的影响,并提高为了在模型中能够反映这些因素的影响,并提高模型的精度,需要将它们模型的精度,需要将它们“量化量化”.这这种种“量量化化”通通常常是是通通过过人人为为地地虚虚构构出出来来一一种种特特殊殊的的变变量量来来完完成成的的。即即根根据据这这些些因因
3、素素的的属属性性类类型型,构构造造只只取取“0”或或“1”的的人人工工变变量量,通通常常称称为为虚虚拟拟变量变量(dummy variables),),文献中习惯用文献中习惯用 表示表示。例如例如,反映性别这个属性的虚拟变量可取为,反映性别这个属性的虚拟变量可取为:一般地,在虚拟变量的设置中:用一般地,在虚拟变量的设置中:用1表示这种属表示这种属性或特征存在,用性或特征存在,用0表示这种属性或特征不存在。表示这种属性或特征不存在。或者说,设置虚拟变量时或者说,设置虚拟变量时,将将比较类型、肯定类型比较类型、肯定类型取值为取值为1;而将基础类型、否定类型取值为;而将基础类型、否定类型取值为0。再
4、如:虚拟变量模型概念:虚拟变量模型概念:把把 包包 含含 虚虚 拟拟 变变 量量 的的 模模 型型 称称 为为 虚虚 拟拟 变变 量量 模模 型型(Dummy Variable Model),若若仅仅有有解解释释变变量量中中包包含含虚虚拟拟变变量量,称称为为虚虚拟拟解解释释变变量量模模型型;若若被被解解释释变变量量是是虚虚拟拟变变量量,称称为为虚虚拟拟被被解解释释变变量量模模型型,或或称称为为离离散散选择模型。选择模型。一个以性别为虚拟变量考察企业职工薪金的模型:一个以性别为虚拟变量考察企业职工薪金的模型:其中:其中:Yi为企业职工的薪金,为企业职工的薪金,Xi为工龄,为工龄,Di=1,若是男
5、性,若是男性,Di=0,若是女性。,若是女性。l研究居民住房消费支出研究居民住房消费支出 和居民可支配收入和居民可支配收入 之间的之间的数量关系。回归模型的设定为:数量关系。回归模型的设定为:l现在要考虑城镇居民和农村居民之间的差异,如何办?现在要考虑城镇居民和农村居民之间的差异,如何办?l为了对为了对“城镇居民城镇居民”、“农村居民农村居民”进行区分,分析进行区分,分析各自在住房消费支出各自在住房消费支出 上的差异,设上的差异,设 为城镇为城镇;为农村为农村,则模型为则模型为l(模型有截距,模型有截距,“居民属性居民属性”定性变量只有两个相互排斥定性变量只有两个相互排斥的属性状态(的属性状态
6、(),故只设定一个虚拟变量。),故只设定一个虚拟变量。)虚拟变量陷阱虚拟变量陷阱 (一个例子一个例子)l若对两个相互排斥的属性若对两个相互排斥的属性“居民属性居民属性”,仍然,仍然引入引入 个虚拟变量,则有个虚拟变量,则有则模型(则模型(1 1)为)为l则对任一家庭都有:则对任一家庭都有:,即产生完全共线,陷入了即产生完全共线,陷入了“虚拟变量陷阱虚拟变量陷阱”。l“虚拟变量陷阱虚拟变量陷阱”的实质是:的实质是:完全多重共线性完全多重共线性。虚拟变量陷阱虚拟变量陷阱二、虚拟变量的设置原则二、虚拟变量的设置原则 虚拟变量的个数须按以下原则确定:虚拟变量的个数须按以下原则确定:每一定性变量所需的虚
7、拟变量个数要比该定性变每一定性变量所需的虚拟变量个数要比该定性变量的类别数少量的类别数少1,即如果定性变量有,即如果定性变量有m个类型,只在个类型,只在模型中引入模型中引入m-1个虚拟变量个虚拟变量。每个虚拟变量定义为:每个虚拟变量定义为:当第当第i种属性种属性类类型出型出现时现时,第,第i个虚个虚拟变拟变量取量取1,其它其它都取都取0时时,则则表示出表示出现现第第种属性种属性类类型型。虚拟变量皆取虚拟变量皆取0,而当所有,而当所有 例例:虚拟变量反映季节变动的影响虚拟变量反映季节变动的影响 已已知知冷冷饮饮的的销销售售量量Y除除受受k种种定定量量变变量量Xk的的影影响响外外,还还受受春春、夏
8、夏、秋秋、冬冬四四季季变变化化的的影影响响,要要考考察该四季的影响,只需引入三个虚拟变量即可:察该四季的影响,只需引入三个虚拟变量即可:则冷饮销售量的模型为:则冷饮销售量的模型为:在上述模型中,若再引入第四个虚拟变量在上述模型中,若再引入第四个虚拟变量则冷饮销售模型变量为:则冷饮销售模型变量为:其矩阵形式为:其矩阵形式为:如果只取六个观测值,其中春季与夏季取了如果只取六个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则式中的:两次,秋、冬各取到一次观测值,则式中的:显然,显然,(X,D)中的第中的第1列可表示成后列可表示成后4列的线性组合,列的线性组合,从而从而(X,D)不满秩,参数
9、无法唯一求出。不满秩,参数无法唯一求出。这就是所谓的这就是所谓的“虚拟变量陷虚拟变量陷阱阱”,应避免。1.可以检验和度量用文字所表示的定性因可以检验和度量用文字所表示的定性因素的影响素的影响例如,例如,为了反映甲、乙两种不同的工艺过程对产为了反映甲、乙两种不同的工艺过程对产量的影响,可以在生产函数中引入描述甲、乙两量的影响,可以在生产函数中引入描述甲、乙两种不同的工艺过程的虚拟变量:种不同的工艺过程的虚拟变量:通过对模型中通过对模型中 的显著性检验来确定甲、乙两的显著性检验来确定甲、乙两种不同的工艺过程是否对产量有显著影响。种不同的工艺过程是否对产量有显著影响。三、虚拟变量的作用三、虚拟变量的
10、作用2.2.可以测量变量在不同时期的影响可以测量变量在不同时期的影响l例例如如:研研究究我我国国国国民民生生产产总总值值Y随随时时间间X而而增增长长的的过过程程,需需要要考考虑虑反反常常年年份份这这一一特特殊殊因因素素的的影响。若定义影响。若定义 l则引入虚拟变量的模型为则引入虚拟变量的模型为l通通过过对对参参数数 进进行行 检检验验,可可以以检检验验反反常常年年份份对对社社会会总总产产值值有有无无显显著著影影响响,就就把把受受反反常常年年份份影响的时期从总过程中区分出来影响的时期从总过程中区分出来 3.3.可以用来处理异常数据的影响。可以用来处理异常数据的影响。l例如,变量例如,变量Y和和X
11、在长期中基本满足线性回归在长期中基本满足线性回归模型的各个假设,但在时刻有一个突发情况,模型的各个假设,但在时刻有一个突发情况,使得使得Y出现一个出现一个k单位的暂时性波动。如果用线单位的暂时性波动。如果用线性回归模型性回归模型 分析这两个变量的分析这两个变量的关系,其误差项的均值是关系,其误差项的均值是l解决的办法是引进一个针对性解决的办法是引进一个针对性 的虚拟变量,其定义为的虚拟变量,其定义为 l新的回归模型为:新的回归模型为:l解决了均值非解决了均值非0的问题的问题 其中其中 四、虚拟变量的引入方式四、虚拟变量的引入方式 在计量经济模型中引入虚拟解释变量,一般地有在计量经济模型中引入虚
12、拟解释变量,一般地有三种方式:三种方式:加法方式、乘法方式加法方式、乘法方式和和混合方式混合方式。1.1.加法方式:加法方式:所谓加法方式,即将虚拟变量直接作为一个解释所谓加法方式,即将虚拟变量直接作为一个解释变量引入模型,它同其他解释变量之间是相加的关变量引入模型,它同其他解释变量之间是相加的关系。当不同类型模型的斜率相同,系。当不同类型模型的斜率相同,截距截距不相同时,不相同时,可考虑以加法形式引入虚拟变量。可考虑以加法形式引入虚拟变量。以加法方式引入虚拟变量时,主要考虑的问题是以加法方式引入虚拟变量时,主要考虑的问题是定性因素的属性和引入虚拟变量的个数。定性因素的属性和引入虚拟变量的个数
13、。(1 1)解)解释变释变量只有一个定性量只有一个定性变变量而无定量量而无定量变变量,而量,而且定性且定性变变量量为为两种相互排斥的属性;两种相互排斥的属性;(2 2)解解释释变变量量分分别别为为一一个个定定性性变变量量(两两种种属属性性)和和一个定量解一个定量解释变释变量;量;(3 3)解解释释变变量量分分别别为为一一个个定定性性变变量量(两两种种以以上上属属性性)和一个定量解和一个定量解释变释变量;量;(4 4)解)解释变释变量分量分别为别为两个定性两个定性变变量(各自分量(各自分别别是两是两种属性)和一个定量解种属性)和一个定量解释变释变量;量;加法方式分为四种情形讨论:加法方式分为四种
14、情形讨论:(1 1)一个两种属性定性解释变量而无定量)一个两种属性定性解释变量而无定量变量的情形变量的情形农村(2)2)一个定性解释变量(两种属性)和一个一个定性解释变量(两种属性)和一个定量解释变量的情形定量解释变量的情形城市农村几何意义:几何意义:两个函数有相同的斜率,但有不同的截距两个函数有相同的斜率,但有不同的截距YX(3 3)一个定性解释变量(三种属性)和一)一个定性解释变量(三种属性)和一个定量解释变量的情形个定量解释变量的情形 在工资模型中如果我们考虑的是员工的受教在工资模型中如果我们考虑的是员工的受教育程度,比如可以将员工的分为:高中以下,育程度,比如可以将员工的分为:高中以下
15、,高中毕业和大学及其以上三种。如果虚拟变量高中毕业和大学及其以上三种。如果虚拟变量设为设为 高中以下高中以下 其他其他 高中毕业高中毕业 其他其他 大学及其以上大学及其以上 其他其他 则则 将会出现将会出现多重共线性多重共线性,因此需要去掉一个虚拟变量。,因此需要去掉一个虚拟变量。假设模型为:假设模型为:高中高中其他其他大学及其以上大学及其以上其他其他模型变为:模型变为:估计出的回归方程为:估计出的回归方程为:高中以下:高中以下:高中:高中:大学及其以上:大学及其以上:假定假定 3 3 2 2,其几何意义:其几何意义:(3 3)一个定性解释变量(四种属性)和一个)一个定性解释变量(四种属性)和
16、一个定量解释变量的情形定量解释变量的情形四个季节对某些商品的需求量分别为:四个季节对某些商品的需求量分别为:模模型型中中系系数数 、分分别别反反映映了了四四、一一、二二、三三、一一季季度度对对该该商商品品的的平平均均影影响响程程度度,根根据据这这些些系系数数的的统统计计检检验验就就可可以以判判断断季季度度因因素素对对该该商商品品的的需需求求量是否存在着显著影响。量是否存在着显著影响。(4 4)两个定性解释变量(均为两种属性)和一个定)两个定性解释变量(均为两种属性)和一个定量解释变量的情形量解释变量的情形 运用运用OLS得到回归结果,再用得到回归结果,再用t检验讨论因素检验讨论因素是否对模型有
17、影响。是否对模型有影响。男性、农村居民女性、农村居民各类型居民香烟消费量分别为:各类型居民香烟消费量分别为:几何意义几何意义 加法方式引入虚拟变量的一般表达式加法方式引入虚拟变量的一般表达式:基本分析方法基本分析方法:条件期望。条件期望。加法方式引入虚拟变量的主要作用为:加法方式引入虚拟变量的主要作用为:1.在有定量解释变量的情形下,主要改变方程在有定量解释变量的情形下,主要改变方程 截距;截距;2.在没有定量解释变量的情形下,主要用于在没有定量解释变量的情形下,主要用于方方 差分析。差分析。基本思想基本思想:以乘法方式引入虚以乘法方式引入虚拟变拟变量量时时,是在所,是在所设设立的模型立的模型
18、中,将中,将虚虚拟拟解解释变释变量与其它解量与其它解释变释变量量 的乘的乘积积,作,作为为新的解新的解释变释变量出量出现现在模型中,以达到其在模型中,以达到其调调整整设设模模型型斜率斜率系数的目的。或者将模型斜率系数表示系数的目的。或者将模型斜率系数表示为为虚虚拟变拟变量的函数,以达到相同的目的。量的函数,以达到相同的目的。乘法引入方式的特点乘法引入方式的特点:(1 1)截距不)截距不变变;(2 2)斜率)斜率发发生生变变化;化;2.2.乘法方式乘法方式例:研究文化用品消费支出例:研究文化用品消费支出Y Y受收入受收入X X、居民身份、居民身份D D的的影响,影响,模型形式:模型形式:截距不变
19、但斜率发生变化的情形:截距不变但斜率发生变化的情形:图8-5 农村和城市的文化用品消费O3.3.混合方式:截距和斜率均发生变化混合方式:截距和斜率均发生变化 例例:同样研究消费支出同样研究消费支出Y 、收入、收入X 、居民身份、居民身份D 间的影响关系。模型形式:间的影响关系。模型形式:几何意义:几何意义:在计量经济学中,通常引入虚拟变量的方式分为在计量经济学中,通常引入虚拟变量的方式分为加法方式加法方式和和乘法方式乘法方式以及以及混合方式混合方式三种:即三种:即实质实质:加法方式引入虚拟变量改变的是截距;加法方式引入虚拟变量改变的是截距;乘法方式引入虚拟变量改变的是斜率;乘法方式引入虚拟变量
20、改变的是斜率;混合方式引入虚拟变量既改变截距又改变斜率混合方式引入虚拟变量既改变截距又改变斜率 虚拟变量的引入小结:虚拟变量的引入小结:五、虚拟解释变量特殊应用五、虚拟解释变量特殊应用 所谓特殊应用是指将引入虚拟解释变量所谓特殊应用是指将引入虚拟解释变量的加法方式、乘法方式进行综合使用。的加法方式、乘法方式进行综合使用。基本分析方式:仍然是条件期望分析。基本分析方式:仍然是条件期望分析。本课主要讨论本课主要讨论(1 1)分段回归分析;)分段回归分析;(2 2)交互效应分析;)交互效应分析;(3 3)结构变化分析)结构变化分析 在在经经济济发发生生转转折折时时期期,可可通通过过建建立立临临界界指
21、指标标的的虚虚拟变量模型来反映数量因素的不同阶段。拟变量模型来反映数量因素的不同阶段。例例如如,进进口口消消费费品品数数量量Y主主要要取取决决于于国国民民收收入入X的的多多少少,中中国国在在改改革革开开放放前前后后,Y对对X的的回回归归关关系系明明显不同。显不同。这这时时,可可以以t*=1979年年为为转转折折期期,以以1979年年的的国国民收入民收入Xt*为临界值,设如下虚拟变量:为临界值,设如下虚拟变量:则进口消费品的回归模型可建立如下:则进口消费品的回归模型可建立如下:1.1.分段回归分析分段回归分析 用用OLSOLS法得到该模型的回归方程为:法得到该模型的回归方程为:几何意义:几何意义
22、:1979年之前,回归模型的斜率为年之前,回归模型的斜率为 ;1979年之前,回归模型的斜率为年之前,回归模型的斜率为 ;若统计检验表明,若统计检验表明,显著不为零,则我国居民的消显著不为零,则我国居民的消费行为在费行为在1979年前后发生了明显改变。年前后发生了明显改变。图8-7 时间分段前后的进口消费品数量XOY例例:是否发展油菜籽生产与是否发展养蜂生产的是否发展油菜籽生产与是否发展养蜂生产的差异对农副产品总收益的影响研究。差异对农副产品总收益的影响研究。模型设定为模型设定为:(1 1)式中)式中,以加法形式引入虚拟变量暗含何假设以加法形式引入虚拟变量暗含何假设?2.2.交互效应分析交互效
23、应分析上式以加法形式引入,暗含的假设为:菜籽生产和上式以加法形式引入,暗含的假设为:菜籽生产和养蜂生产是分别独立地影响农副品生产总收益。但养蜂生产是分别独立地影响农副品生产总收益。但是,在发展油菜籽生产时,同时也发展养蜂生产,是,在发展油菜籽生产时,同时也发展养蜂生产,所取得的农副产品生产总收益,可能会高于不发展所取得的农副产品生产总收益,可能会高于不发展养蜂生产的情况。即在是否发展油菜籽生产与养蜂养蜂生产的情况。即在是否发展油菜籽生产与养蜂生产的虚拟变量生产的虚拟变量 和和 间,很可能存在着一定间,很可能存在着一定的交互作用,且这种交互影响对被解释变量农副产的交互作用,且这种交互影响对被解释
24、变量农副产品生产收益会有影响。品生产收益会有影响。(1)为了反映为了反映交互效应交互效应,将(,将(1 1)变为:)变为:同时发展油菜籽和同时发展油菜籽和养蜂生产:养蜂生产:发展油菜籽生产:发展油菜籽生产:发展养蜂生产:发展养蜂生产:基础类型:基础类型:基本思想基本思想:在模型中引入相关的两个变量的乘积在模型中引入相关的两个变量的乘积如何检验交互效应是否存在?如何检验交互效应是否存在?3.3.结构稳定性分析结构稳定性分析l模型结构的稳定性是指两个不同时期模型结构的稳定性是指两个不同时期(或不同空间或不同空间)研究同一性质的问题时所建立的同一形式的回归模研究同一性质的问题时所建立的同一形式的回归
25、模型的参数之间有无显著差异,如果存在着差异,则型的参数之间有无显著差异,如果存在着差异,则认为模型结构不稳定。认为模型结构不稳定。l在现实经济生活中,往往由于某些重要因素的影响,在现实经济生活中,往往由于某些重要因素的影响,解释变量和被解释变量之间关系可能会发生解释变量和被解释变量之间关系可能会发生结构变结构变化;化;l如我国由于经济体制的变化,改革开放前后国民经如我国由于经济体制的变化,改革开放前后国民经济总量指标之间的关系都会发生变化;或者研究我济总量指标之间的关系都会发生变化;或者研究我国发达地区和不发达地区投资对经济增长的影响,国发达地区和不发达地区投资对经济增长的影响,也会因地区不同
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学课件 教学 课件 虚拟 变量 模型
限制150内