第六章 虚拟解释变量模型蓝色优秀课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第六章 虚拟解释变量模型蓝色优秀课件.ppt》由会员分享,可在线阅读,更多相关《第六章 虚拟解释变量模型蓝色优秀课件.ppt(103页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章第六章 虚拟解释变量虚拟解释变量模型蓝色模型蓝色第1页,本讲稿共103页第一节第一节 引引 言言 在经济计量分析中,在经济计量分析中,经常会碰到所经常会碰到所建模型的被解释变量不仅受诸如收入、建模型的被解释变量不仅受诸如收入、产量、价格、产量、价格、成本、需求、投资等数成本、需求、投资等数量变量的影响,而且也受到诸如战争、量变量的影响,而且也受到诸如战争、自然灾害、国际环境、季节变动以及自然灾害、国际环境、季节变动以及政府经济政策变动等质量变量的影响。政府经济政策变动等质量变量的影响。建立经济计量模型若不考虑这些质量建立经济计量模型若不考虑这些质量变量的影响作用,显然是不适宜的。变量的影
2、响作用,显然是不适宜的。2第2页,本讲稿共103页 所以,在建立经济计量模型时,即要所以,在建立经济计量模型时,即要考虑数量变量,也要考虑质量变量。但是,考虑数量变量,也要考虑质量变量。但是,质量变量和数量变量不同,数量变量可以质量变量和数量变量不同,数量变量可以在事前规定好的尺度上,用不同的数值表在事前规定好的尺度上,用不同的数值表现出来,质量变量却只能以属性、种类的现出来,质量变量却只能以属性、种类的不同具体形式表现出来。不同具体形式表现出来。3第3页,本讲稿共103页例例如如,性性别别可可表表现现为为男男或或女女;人人种种可可表表现现为为白白种种人人和和非非白白种种人人;宗宗教教信信仰仰
3、可可表表现现为为教教徒徒和和非非教教徒徒;政政府府的的经经济济政政策策可可表表现为改革开放前和改革开放后,如此等等。现为改革开放前和改革开放后,如此等等。4第4页,本讲稿共103页 显显然然,这这种种不不同同的的具具体体形形式式是是无无法法直直接接引引入入经经济济计计量量模模型型中中去去的的。但但由由于于这这类类变变量量通通常常表表现现为为品品质质、属属性性、种种类类的的出出现现或或者者未未出出现现,所所以以我我们们可可以以根根据据质质量量变变量量的的这这一一特征将其数量化。特征将其数量化。5第5页,本讲稿共103页 虚虚拟拟变变量量:给给定定某某一一质质量量变变量量某某属属性性的的出出现现为
4、为1,未未出出现现为为0,称称这这样样的的变量为虚拟变量。变量为虚拟变量。6第6页,本讲稿共103页 把哪种情况取把哪种情况取0,哪种情况取,哪种情况取 1 要视研究情况而定。要视研究情况而定。0和和1只是一个符只是一个符号而已,不代表他们有高低的意义。号而已,不代表他们有高低的意义。7第7页,本讲稿共103页 虚虚虚虚拟拟拟拟变变变变量量量量主主主主要要要要是是是是用用用用来来来来代代代代表表表表质质质质的的的的因因因因素素素素,但但但但是是是是有有有有些些些些情情情情况况况况下下下下也也也也可可可可以以以以用用用用来来来来代代代代表表表表数数数数量量量量因因因因素素素素。例例例例如如如如建
5、建建建立立立立储储储储蓄蓄蓄蓄函函函函数数数数时时时时,“收收收收入入入入”显显显显然然然然是是是是一一一一个个个个重重重重要要要要解解解解释释释释变变变变量量量量,虽虽虽虽然然然然是是是是“数数数数量量量量”因因因因素素素素,但但但但是是是是为为为为了了了了方便也可以用虚拟变量表示。方便也可以用虚拟变量表示。方便也可以用虚拟变量表示。方便也可以用虚拟变量表示。8第8页,本讲稿共103页 虚拟解释变量模型的设定因为质的因虚拟解释变量模型的设定因为质的因素的多少和这些因素特征的多少而引入的素的多少和这些因素特征的多少而引入的虚拟变量也会不同。虚拟变量也会不同。第二节第二节第二节第二节 虚拟解释变
6、量的设定虚拟解释变量的设定虚拟解释变量的设定虚拟解释变量的设定9第9页,本讲稿共103页 以一个最简单的虚拟变量模型为例,如以一个最简单的虚拟变量模型为例,如果只包含一个质的因素,而且这个因素仅果只包含一个质的因素,而且这个因素仅有两个特征,则回归模型中只需引入一个有两个特征,则回归模型中只需引入一个虚拟变量。如果是含有多个质的因素,虚拟变量。如果是含有多个质的因素,自然要引入多个虚拟变量。自然要引入多个虚拟变量。10第10页,本讲稿共103页 如果只有一个质的因素,且具有如果只有一个质的因素,且具有m个特征,那么如果是含有个特征,那么如果是含有截距项的,就要引入截距项的,就要引入m-1个虚拟
7、变量;不含有截距项的,个虚拟变量;不含有截距项的,应该应该引入引入m个虚拟变量,这就是虚拟变量的设定原则。个虚拟变量,这就是虚拟变量的设定原则。11第11页,本讲稿共103页一、截距变动模型和斜率变动模型 (一)包含一个虚拟变量的截距变动模型(一)包含一个虚拟变量的截距变动模型 假设只有一个定性因素影响被解释变量的变化,而且这个因素假设只有一个定性因素影响被解释变量的变化,而且这个因素仅有两种特征,这时候只需要引入一个虚拟变量。仅有两种特征,这时候只需要引入一个虚拟变量。12第12页,本讲稿共103页 【例例8.1】假设有一个包括正常年份和非假设有一个包括正常年份和非正常年份(亚洲金融危机或正
8、常年份(亚洲金融危机或SARS的影响)的影响)居民消费的样本,并打算用这些数据估计居民消费的样本,并打算用这些数据估计消费函数。由于在正常年份和非正常年份消费函数。由于在正常年份和非正常年份居民在消费水平上存在明显差异,所以一居民在消费水平上存在明显差异,所以一些外界的影响是一个重要的解释变量。些外界的影响是一个重要的解释变量。13第13页,本讲稿共103页 用一个虚拟变量来表示这个质的因素,消费函数为用一个虚拟变量来表示这个质的因素,消费函数为 式中,式中,Yi=第个居民的消费水平,第个居民的消费水平,Xi=第个居民的收入水平,第个居民的收入水平,D为为虚拟变量。我们用虚拟变量。我们用D=1
9、表示正常年份这一特征,用表示正常年份这一特征,用D=0来表示非来表示非正常年份正常年份(8.1)14第14页,本讲稿共103页 假设假设E(u i)=0,式(式(8.1)可以写成可以写成(8.3)(8.28.2)15第15页,本讲稿共103页 式(式(8.2)和和式(式(8.3)分别为正常年份分别为正常年份和非正常年份的居民消费水平。二者具和非正常年份的居民消费水平。二者具有相同的斜率,但是截距不同。有相同的斜率,但是截距不同。16第16页,本讲稿共103页 对对 1 1 作作t t 检验,若检验,若 1 显著地不为显著地不为0,我们就认为正常年份和,我们就认为正常年份和非正常年份居民在消费行
10、为上的差异是明显的。若非正常年份居民在消费行为上的差异是明显的。若 1 0,则正,则正常年份的居民消费水平高于非正常年份的居民消费水平。常年份的居民消费水平高于非正常年份的居民消费水平。利用最小二乘法对利用最小二乘法对式(式(8.1)进行估计,可得到进行估计,可得到(8.4)17第17页,本讲稿共103页 通过通过例例8.1,我们可以找出虚拟变量模型的,我们可以找出虚拟变量模型的一些特征。一些特征。用用用用“1”“1”“1”“1”来代表质的因素的哪个特征是可以任意设定的。我来代表质的因素的哪个特征是可以任意设定的。我来代表质的因素的哪个特征是可以任意设定的。我来代表质的因素的哪个特征是可以任意
11、设定的。我们一般认为,们一般认为,们一般认为,们一般认为,“1”“1”“1”“1”代表具有某些特征,但没有具体规定。在上例代表具有某些特征,但没有具体规定。在上例代表具有某些特征,但没有具体规定。在上例代表具有某些特征,但没有具体规定。在上例中,也可以指定中,也可以指定中,也可以指定中,也可以指定D=1D=1时为非正常年份,而时为非正常年份,而时为非正常年份,而时为非正常年份,而D=0D=0就必然为正常年份。就必然为正常年份。就必然为正常年份。就必然为正常年份。在这种情况下,正常年份和非正常年份的消费函数分别为在这种情况下,正常年份和非正常年份的消费函数分别为在这种情况下,正常年份和非正常年份
12、的消费函数分别为在这种情况下,正常年份和非正常年份的消费函数分别为18第18页,本讲稿共103页 如果我们绘制图形,得到的结果仍然是一样的。此时,如果我们绘制图形,得到的结果仍然是一样的。此时,1 1,非正常年份的线低于正常年份的线,代表非正常年份的,非正常年份的线低于正常年份的线,代表非正常年份的消费水平低于正常年份的消费水平。消费水平低于正常年份的消费水平。19第19页,本讲稿共103页 虚拟变量虚拟变量D=0所代表的特性或状态所代表的特性或状态通常称为基础类型。和其它特征或状通常称为基础类型。和其它特征或状态比较的意义上说,基础类型为对比态比较的意义上说,基础类型为对比的基础。的基础。2
13、0第20页,本讲稿共103页 模型中的系数模型中的系数0 为基础类型的截为基础类型的截距项,称为公共截距项;系数距项,称为公共截距项;系数1 称称为差别截距系数,指的是为差别截距系数,指的是 D 取取 1 时截时截距系数和基础类型的截距系数的差异。距系数和基础类型的截距系数的差异。21第21页,本讲稿共103页 如果一个回归模型有截距项,而且这个质的因素又有如果一个回归模型有截距项,而且这个质的因素又有两种特征,也就是将其分两类,则我们只需要引入一个虚拟两种特征,也就是将其分两类,则我们只需要引入一个虚拟变量。如我们的变量。如我们的例例8.1所示。如果一个回归方程有截距项,所示。如果一个回归方
14、程有截距项,只只有一个质的因素影响被解释变量,它有个有一个质的因素影响被解释变量,它有个m特征,我们就要特征,我们就要引入引入m-1个虚拟变量;个虚拟变量;22第22页,本讲稿共103页 如果回归方程没有截距项,那么这个质如果回归方程没有截距项,那么这个质的因素有多少个特征就要设多少个虚拟的因素有多少个特征就要设多少个虚拟变量,这就是虚拟变量的使用原则。变量,这就是虚拟变量的使用原则。23第23页,本讲稿共103页 虚拟变量陷阱:如果虚拟变量设定不虚拟变量陷阱:如果虚拟变量设定不当,会使最小二乘法无解,称这种情当,会使最小二乘法无解,称这种情况为虚拟变量陷阱。况为虚拟变量陷阱。24第24页,本
15、讲稿共103页 引入两个虚拟变量对有截距项和没有截距项的情况分别讨论。引入两个虚拟变量对有截距项和没有截距项的情况分别讨论。(1)对有截距项的情况,我们如果设两个虚拟变量,则回归模对有截距项的情况,我们如果设两个虚拟变量,则回归模型为型为(8.7)25第25页,本讲稿共103页式式(8.7)也可表示为也可表示为其中,其中,显然如下等式成立。,显然如下等式成立。(8.8)(8.9)26第26页,本讲稿共103页 式式(8.9)表明模型表明模型(8.8)即原模型即原模型(8.7)中有完中有完全的多重共线性,将导致最小二乘估计无解。全的多重共线性,将导致最小二乘估计无解。我们称该情景为掉入虚拟变量陷
16、阱。所以,我们称该情景为掉入虚拟变量陷阱。所以,在有截距项的情况下,如果一个质的因素有在有截距项的情况下,如果一个质的因素有多少个特征就引入多少个虚拟变量是行不通多少个特征就引入多少个虚拟变量是行不通的。的。27第27页,本讲稿共103页 (2)对没有截距的情况,我们如果设两个虚拟变量,对没有截距的情况,我们如果设两个虚拟变量,显然显然模型模型(8.10)中,解释变量中,解释变量D1,D2和和X之间无完全的多重共线性。之间无完全的多重共线性。可以使用普通最小二乘法估计可以使用普通最小二乘法估计式(式(8.10)的参数。的参数。(8.10)28第28页,本讲稿共103页 (二)斜率变动模型(二)
17、斜率变动模型 在实际问题中,斜率单独变动出现的情在实际问题中,斜率单独变动出现的情形一般比较少,它指的是改变了变动的速形一般比较少,它指的是改变了变动的速率也就是弹性。率也就是弹性。例如城镇居民家庭与农村例如城镇居民家庭与农村居民家庭的消费函数,居民家庭的消费函数,在边际消费倾向在边际消费倾向(斜率)上可能会有所不同,假设它们的(斜率)上可能会有所不同,假设它们的消费函数在截距项没有区别。消费函数在截距项没有区别。29第29页,本讲稿共103页那么回归模型可记为那么回归模型可记为(8.11)其中,其中,Yi=第个家庭的消费水平,第个家庭的消费水平,Xi=第个家庭的收入水平,第个家庭的收入水平,
18、30第30页,本讲稿共103页式(式(8.11)可以表示为)可以表示为(8.12)(8.13)31第31页,本讲稿共103页 (三)包含多个虚拟变量的截距变动模型(三)包含多个虚拟变量的截距变动模型 如果一个质的因素仅有两种特征,只需引入一个虚拟变量。如果一个质的因素仅有两种特征,只需引入一个虚拟变量。但是,很多质的因素往往不只具有两个特征,例如全世界的国家但是,很多质的因素往往不只具有两个特征,例如全世界的国家可以分为发达国家、发展中国家、不发达国家可以分为发达国家、发展中国家、不发达国家。32第32页,本讲稿共103页 我国少数民族在很多问题上有差我国少数民族在很多问题上有差异,所以当把民
19、族作为虚拟变量时,异,所以当把民族作为虚拟变量时,不能简单将其分为汉族和非汉族;季不能简单将其分为汉族和非汉族;季节因素是我们最常见的质的因素,它节因素是我们最常见的质的因素,它具有四个特征,按照前面的原则,我具有四个特征,按照前面的原则,我们要引入三个虚拟变量。们要引入三个虚拟变量。33第33页,本讲稿共103页 例如,我们用季度资料研究各种商品消例如,我们用季度资料研究各种商品消费额在季节上有没有什么区别?可以建立费额在季节上有没有什么区别?可以建立模型如下:模型如下:(8.14)其中,其中,其中,其中,YtYt=季度的消费,季度的消费,季度的消费,季度的消费,XtXt=季度的收入,对于四
20、个季度,我们引季度的收入,对于四个季度,我们引季度的收入,对于四个季度,我们引季度的收入,对于四个季度,我们引入了三个虚拟变量:入了三个虚拟变量:入了三个虚拟变量:入了三个虚拟变量:34第34页,本讲稿共103页这里,第四季度为基础类型,其截距项为这里,第四季度为基础类型,其截距项为0 。而其它三个季。而其它三个季度的截距项分别为度的截距项分别为 0+1,0+2 ,0+3 。1,2,3 代代表季节变动引起的消费差异。表季节变动引起的消费差异。35第35页,本讲稿共103页四个季度的回归模型分别为四个季度的回归模型分别为(8.15)(8.16)(8.17)(8.18)36第36页,本讲稿共103
21、页 (四)截距和斜率同时变动模型(四)截距和斜率同时变动模型(四)截距和斜率同时变动模型(四)截距和斜率同时变动模型 在多数情况下,质的因素不但对回在多数情况下,质的因素不但对回在多数情况下,质的因素不但对回在多数情况下,质的因素不但对回归模型的截距有影响,而且还会改变归模型的截距有影响,而且还会改变归模型的截距有影响,而且还会改变归模型的截距有影响,而且还会改变模型的斜率。模型的斜率。模型的斜率。模型的斜率。37第37页,本讲稿共103页 例如城镇居民和农村居民的消费例如城镇居民和农村居民的消费函数不但在斜率上有差异,在截距上函数不但在斜率上有差异,在截距上也是有可能不一致的,将两个问题同也
22、是有可能不一致的,将两个问题同时考虑进来,我们可以得到回归方程时考虑进来,我们可以得到回归方程 38第38页,本讲稿共103页(8.19)式中,式中,Yi=第个家庭的消费水平,第个家庭的消费水平,Xi=第个家庭的收入水平第个家庭的收入水平,39第39页,本讲稿共103页 1和和和和 3 分别表示城镇居民家庭和农村居民家庭分别表示城镇居民家庭和农村居民家庭的消费函数在截距和斜率上的差异。的消费函数在截距和斜率上的差异。式(式(8.19)可以表示为)可以表示为(8.208.20)(8.218.21)40第40页,本讲稿共103页 我们一般通过我们一般通过t t 检验来判定它们之间是否有差异。检验来
23、判定它们之间是否有差异。1.1.若若10 0,30 0,则为截距和斜率同时变动模型;,则为截距和斜率同时变动模型;2.2.若若 10,0,3=0=0,则为截距变动模型;,则为截距变动模型;3.3.若若 1=0=0,3=0,=0,则表示城镇居民家庭和农村居则表示城镇居民家庭和农村居 民家庭有着完全民家庭有着完全相同的消费模式;相同的消费模式;4.4.若若 1=0=0,30,0,则为斜率变动模型,这种情况在现实中出现得则为斜率变动模型,这种情况在现实中出现得不是很多。不是很多。41第41页,本讲稿共103页 下面,以我国的农村和城市的消费样本下面,以我国的农村和城市的消费样本为例,实际体会虚拟变量
24、模型从建模到检为例,实际体会虚拟变量模型从建模到检验再到估计参数最后下结论的全过程。验再到估计参数最后下结论的全过程。【例例8.2】已有数据资料为我国城镇居民家已有数据资料为我国城镇居民家庭庭1955年至年至1985年人均收入和人均储蓄。年人均收入和人均储蓄。根据经验,也就是先验信息,再通过某些根据经验,也就是先验信息,再通过某些检验,我们发现储蓄和收入有很强的相关检验,我们发现储蓄和收入有很强的相关关系而且收入的变化会引起储蓄的变化。关系而且收入的变化会引起储蓄的变化。42第42页,本讲稿共103页 假定它们之间为线性关系,我们可以建立储蓄模型如下假定它们之间为线性关系,我们可以建立储蓄模型
25、如下 式中,式中,St=人均储蓄,人均储蓄,Xt=人均收入,人均收入,t=年份(年份(t=1955=1955,19561956,19851985)。)。(8.22)43第43页,本讲稿共103页 把把19551955年作为基期并把该期的价格水平定为年作为基期并把该期的价格水平定为100,再分别扣,再分别扣除包含在和中的物价上涨因素。用最小二乘法估计除包含在和中的物价上涨因素。用最小二乘法估计式(式(8.22),),得到得到 R2=0.833=0.833,DW=0.398=0.398 (8.22)44第44页,本讲稿共103页 模型(模型(8.23)包含了这样一个假定,那包含了这样一个假定,那就
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第六章 虚拟解释变量模型蓝色优秀课件 第六 虚拟 解释 变量 模型 蓝色 优秀 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内