虚拟变量回归模型计量经济学.pptx
《虚拟变量回归模型计量经济学.pptx》由会员分享,可在线阅读,更多相关《虚拟变量回归模型计量经济学.pptx(303页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1、虚拟变量的性质与有明确尺度量化了的变量(GDP、产量、价格、成本、汇率等)不同,虚拟变量是一种定性性质的变量,如性别、种族、国籍等只涉及“是”与“非”两种状态的变量。虚拟变量的取值只取0或1。1表示某种性质出现,0表示某种性质不出现。第1页/共303页例:研究性别差异对工资的影响。可以建立如下模型:其中:为工资水平,为虚拟变量:第2页/共303页如果影响工资的其他因素保持不变,由上述模型很容易得到:女性的平均工资水平:男性的平均工资水平:斜率反映了男性与女性的平均工资差别。虚拟变量模型:第3页/共303页事例:Y表示工资收入,D1表示性别第4页/共303页Estimation Equati
2、on:=Y=C(1)+C(2)*D1第5页/共303页第6页/共303页则女性的平均工资为18单位、男性的平均工资为18+3.28=21.28单位,男性与女性的工资差别为3.28单位。第7页/共303页2、虚拟变量应用的扩展同时含有一般变量与虚拟变量的模型(1)对一个普通变量与一个两分虚拟变量的回归第8页/共303页把工资差异模型扩展,工资收入还取决于工作年限,则上述模型可以变为:其中:为工作年限,为一个普通变量。第9页/共303页女性的平均工资水平:男性的平均工资水平:第10页/共303页男性与女性的工资与工作年限之间有相同的斜率,但有不同的截距,两者之间的平均工资相差 单位。如果模型中 通
3、过显著性检验,则可以认为男性与女性之间存在工资差异。第11页/共303页注意:区分两种类别,只需要一个虚拟变量,如果引入两个虚拟变量,则会造成多重共线性。一般来说,如果一个定性变量有m个类别,则只需要引入m1个虚拟变量就可以了。第12页/共303页(2)对一个普通变量与一个多分虚拟变量的回归第13页/共303页如:研究一个企业员工教育程度对工资的影响。假设教育程度分为3类:中学及以下教育程度、大学教育程度、研究生及以上教育程度。则模型可以设立为:第14页/共303页则模型可以设立为:其中,为某人的工资水平,为工作年限。第15页/共303页 为虚拟变量:第16页/共303页中学及以下教育水平的员
4、工平均工资水平:大学教育水平的员工平均工资水平:研究生及以上教育水平的员工平均工资水平:第17页/共303页模型含义:通过 的显著性检验判断教育水平是否对工资差异有显著的影响。第18页/共303页(3)对一个普通变量与两个两分虚拟变量的回归第19页/共303页例:种族及性别差异对薪金的影响。假定薪金除了受工作年限、性别的影响之外,还受种族的影响。为某人的工资水平,为工作年限。第20页/共303页虚拟变量:n虚拟变量模型:第21页/共303页虚拟变量模型:白人男性的工资水平:白人女性的工资水平:第22页/共303页其他人种男性的平均工资:其他人种女性的平均工资:n虚拟变量模型:第23页/共303
5、页3、虚拟变量的实际应用第24页/共303页(1)虚拟变量可以用于研究制度变迁的影响如:研究2001年中国加入WTO事件对中国进出口贸易的影响,可以建立如下方程:其中 的构造如下:2001年前的值设为0,2001年以后的值设为1,即:第25页/共303页 衡量了中国加入WTO这一制度变化对中国进出口贸易的影响第26页/共303页虚拟变量也可以用来描绘一个外部冲击对被解释变量的影响,如研究1998东亚金融危机对中国进出口贸易的影响,则可以在一个普通模型中引入一个虚拟变量D1998,D1998 1,如果t1998 0,如果t其他年份则D1998度量了1998年当年中国进出口贸易的异常变动。第27页
6、/共303页(2)虚拟变量与普通变量相乘,可以分离普通变量的某些特征如使用截面数据研究不同产业的FDI对中国就业增进的影响,可以建立如下方程:上式中,FDI为当年27个行业的截面数据,虚拟变量的设置如下第28页/共303页则上述回归就可以把FDI分解为三个不同产业的FDI并分别估算了这些产业FDI对就业增进的影响。第29页/共303页(3)虚拟变量可以用来对一些结构变化方程进行估计,检验方程的稳定性如:检验1994年人民币汇率并轨事件对人民币汇率与中国出口贸易的关系是否产生了根本的影响人民币汇率与出口贸易的关系可以建立一个如下简单模型:如果1994年人民币汇率并轨事件对人民币汇率与中国出口贸易
7、的关系产生了根本的影响,则上述方程是不稳定的(1994年以前与1994年以后的关系不能用同一个方程来描述),如下:第30页/共303页第31页/共303页1994年以前它们之间的关系为1994年以后它们之间的关系为分为两个方程估计将导致自由度的下降第32页/共303页设置一个虚拟变量则汇率的影响方程可以重新设置为:如果 任意一个通过了显著型检验,则说明在1994年前后汇率方程发生了结构型的变化第33页/共303页回归后,1994年以前的方程为:1994年以后的方程为:第34页/共303页数字实例:英国19461963年的个人储蓄与个人收入的数据。检验重建时期(19461955)与重建后时期(1
8、9561963)英国的居民储蓄行为是否有结构性的变化。第35页/共303页即检验是否在重建时期(19461955)储蓄模型为:而重建后时期(19561963)储蓄模型为:第36页/共303页可以用虚拟变量建立一个模型:其中 为虚拟变量:第37页/共303页则重建时期的消费模型为:重建后时期的消费模型为:为截距差异,为斜率差异。n模型:第38页/共303页Estimation Equation:S=C(1)+C(2)*D1+C(3)*Y+C(4)*(D1*Y)第39页/共303页第40页/共303页第41页/共303页截距差异、斜率差异,在统计上都通过了1的显著性检验,表明两个时期的回归结构是相
9、异的。第42页/共303页相对于chow检验的优越性:(1)可以清楚的知道两个时期的差异究竟是截距差异、斜率差异,还是截距差异与斜率差异共存。(2)由于合并而增加了自由度,提高了参数估计的精度。第43页/共303页注意:如果虚拟变量回归涉及到异方差问题,可以用前面提过的方法进行异方差调整。第44页/共303页二、虚拟变量作为被解释变量的回归1、线性概率模型如研究家庭收入对住房拥有的影响,可以建立如下模型:其中X家庭收入 Y1,如果该家庭拥有住房 0,如果该家庭不拥有住房第45页/共303页上述模型等价于:线性概率模型存在的问题:1、残差非正态分布(为二项分布)2、残差异方差3、X越大(小),P
10、越大(小),不能确保第46页/共303页一个好的概率模型要求(1)随着X的增加,P也增加,但永远不会超出0-1区间(2)P与X之间应该为非线性关系,随着X增大,P趋向于1的速度应该越来越慢,随着X的缩小,P趋向于0的速度也应该越来越慢。第47页/共303页01p第48页/共303页2、Probit模型假定住房所有权回归中,第 个家庭对是否拥有住房的决定,依赖于一种不可观测的效用指数 ,而后者又按照某种方式取决于解释变量,比如说取决于收入:而且指数 的值越大,家庭拥有住房的概率就越高第49页/共303页拥有住房的决定如何与 发生关系呢?一个合理的假定就是对每一个家庭都有一个门槛值 ,当 时,该家
11、庭拥有住房,否则不拥有,有:第50页/共303页概率模型累积分布函数第51页/共303页3、Logit模型如果累积分布函数取逻辑斯蒂函数形式,则可以建立一Logit模型第52页/共303页Probit模型与Logit模型分布函数的比较01Probit分布函数Logit分布函数第53页/共303页第54页/共303页三种概率模型的比较:1、LPM具有常值的边际效应;而Probit与Logit模型边际效应减少2、Probit与Logit模型的解释变量的估计是使用累积分布函数来估计的,因此解释变量对被接受变量的边际效应不能按普通模型的字面含义解释3、一个经验的判断是:当解释变量的值不太大又不太小的时
12、候,Probit模型的系数值除以2.5,Logit模型的参数值除以4,可以大致把他们的值与LPM的系数值相比较,更精确的比较应该使用他们的分布函数并计算其中F(x)为累积分布函数,g(x)为密度函数第55页/共303页4、Probit/Tobit模型报告McFadden R-squared.第56页/共303页Tobit模型受限因变量模型应用:住房所有权研究,我们想知道什么样的人在买房。问题:如果一个消费者不买房子,那么我们就得不到此类消费者住房支出的数据。我们只有买了房的消费者的数据。类似:社会保险的购买,只有保险者的数据,缺乏未购买保险者的数据。第57页/共303页4、概率模型的Eview
13、s实现第58页/共303页第59页/共303页第60页/共303页第61页/共303页计数模型适用于被解释变量为大于0的整数离散型变量。在计数模型中,一般假定被解释变量的离散取值服从某种泊松分布(Poisson distribute),其分布函数为:其中,即随机变量y的均值与方差均为,若以表示影响的m个自变量,泊松回归模型就是描述服从泊松分布的目标变量y的均值与解释变量之间关系的回归模型,可以表示为:第62页/共303页 如果随机变量y的均值等于方差,那么泊松最大似然估计就是一致和有效的,但是,如果随机变量Y过度发散,方差大于均值,那么,一个可以替代的方法就是使用负二项回归模型(Negativ
14、e Binomial Regression)来代替泊松回归模型进行估计。负二项回归模型在条件均值中 引入了一个独立的随机效应,从而扩展了泊松回归模型,即:,则负二项回归模型的回归形式为:第63页/共303页计数模型的Eviews实现第64页/共303页第65页/共303页第66页/共303页虚拟变量的应用实例:论文:外商直接投资、产业结构与中国的出口竞争力第67页/共303页1、问题的提出相当多的研究文献认为,外商直接投资对东道国经济起着一种有利的促进作用。对东道国来说,特别是对作为发展中国家的东道国来说,他们之所以愿意吸引跨国公司到本国来投资,一个重要的目的就是想通过这些外商直接投资来提升本
15、国的工业及技术水平,促进本国的工业化进程。第68页/共303页第69页/共303页二、中国出口产品的竞争力及FDI关系检验1、数据来源及说明第70页/共303页2、中国出口产品的竞争力及FDI关系的一般性检验Grubel-Lloiyd指数:第71页/共303页令则t1到t2中国出口比较优势的相对变化可以表示为:第72页/共303页第73页/共303页第74页/共303页3、中国产品的出口竞争力与FDI关系的模型检验A、首先以1994年为基年,检验1994年中国产品的出口竞争力在某种程度是否构成1997年跨国公司对中国FDI的直接原因,检验模型为:第75页/共303页其次,检验FDI与中国产品的
16、出口竞争力之间是否与检验1具有相反的因果关系,即1997年FDI是否1999年中国出口竞争力的部分原因,检验模型为:第76页/共303页第三个检验以1999年中国分行业的出口竞争力指数为被解释变量,以1997年分行业FDI及1994年中国分行业的出口竞争力指数为解释变量进行回归。检验模型为:第77页/共303页第四,用代表不同产品类型及不同要素密集类型的虚拟变量分别乘以FD I,把FDI分解为在不同产业(产品)部门的投资,来检验FDI对这些不同产业(产品)部门出口竞争力的影响 第78页/共303页检验模型为:在上式中,为代表产品类型的虚拟变量,当等于1时表示产品类型为初级产品,等于0时表示产品
17、类型为工业制成品。同样定义,当等于1时表示产品类型为工业制成品,等于0时表示产品类型为初级产品。第79页/共303页然后,检验在不同要素密集类型产业的FDI对这些不同产业出口竞争力的影响,检验模型为:第80页/共303页第81页/共303页第82页/共303页三、结果分析及讨论(略)第83页/共303页计量经济学专题(2)非 平 稳 时 间 序 列、虚 假 回 归 与 A D F 检 验第84页/共303页1、非平稳的时间序列定义:当时间序列的均值与方差随时间变化而变化时,这种时间序列称为非平稳的时间序列。大多数的经济时间序列时非平稳的时间序列,如GDP、物价水平、出口总额等时间序列,它们的均
18、值与方差随时间的变化而变化。第85页/共303页非平稳的时间序列:19521993中国的不变价格的GDP与居民消费水平:第86页/共303页 随机游走过程:随机游走过程的方差为无穷大:则第87页/共303页平稳的时间序列举例:白噪声随机过程(均值为0,方差不随时间改变,随机变量之间非自相关)第88页/共303页非平稳的时间序列可以通过差分的方法变为平稳的时间序列。第89页/共303页2、非平稳时间序列的单整性单整性:对于时间序列(随机过程),如果必须经过d次差分才能变换成为一个平稳的时间序列,而当进行d-1次差分仍是一个非平稳的随机过程,则称此时间序列具有d阶单整性。第90页/共303页如:一
19、个时间序列经过一次差分之后变为平稳的随机过程,则称此过程为一阶的单整过程,记为 ,如果差分一次仍不平稳,第二次差分后才是一个平稳过程,则称此过程为二阶单整过程,用 表示。第91页/共303页注意平稳的随机过程不需要差分就已经是平稳的,因此平稳的时间序列的单整阶数为0,用 表示平稳的时间序列。单整过程指的是单整阶数大于0的过程,即非平稳的随机过程。第92页/共303页3、非平稳的时间序列与虚假回归问题当求两个相互独立非平稳时间序列的相关系数时,常常得到一个相关系数不为0的结论,当对几个相互独立的非平稳时间序列进行多元回归时,常常能得到一个具有统计显著性的回归函数,Granger-Newbold把
20、这种现象称为虚假回归。第93页/共303页虚假回归的后果:传统的参数检验不再有效,参数估计值也不再具有渐近无偏特征。用常规的办法对非平稳时间序列进行统计推断时存在严重的问题。第94页/共303页4、非平稳时间序列的单位根(ADF)检验(1)根据相关图的平稳性检验自相关函数自相关函数定义为:把 对k描点,所得出的图形叫相关图。第95页/共303页由于我们研究的仅仅是随机过程的一个样本,我们只能计算样本自相关函数,首先计算滞后k的样本协方差与样本方差:第96页/共303页定义:其中n为样本容量,为样本均值。第97页/共303页如果一个时间序列为平稳的随机过程,那么,它的自相关系数近似的遵循均值为0
21、,方差为的正态分布。第98页/共303页检验:伯克斯-皮尔斯Q检验。Q统计量:其中:n为样本容量,m为滞后长度。第99页/共303页Q统计量遵循自由度为m的 分布,检验标准为,当Q统计量大于临界的值时,拒绝全部为0的原假设,即拒绝时间序列平稳的原假设。(或P值小余临界的p值时,拒绝时间序列平稳的原假设)第100页/共303页例:19521993中国的不变价格的GDP相关图A、原始序列检验,非平稳第101页/共303页第102页/共303页第103页/共303页B、差分一次后的相关图,非平稳第104页/共303页C、差分两次后的相关图,平稳第105页/共303页(2)单位根检验(DF与ADF检验
22、)DF检验的思想检验原始序列是否存在如下关系:其中 为一白噪声误差项。如果 的系数为1,说明序列存在单位根,序列为非平稳的时间序列。第106页/共303页则检验的形式为:检验的假设为:第107页/共303页实际的检验方程为:相对应的检验假设为:第108页/共303页检验判断标准为:如果 ,则原假设不能拒绝,认为序列非平稳如果 ,则拒绝原假设,认为序列平稳第109页/共303页在实际检验中如不能拒绝原假设,说明序列 的单整阶数大于0,接着应该进一步检验序列 的单整阶数是否为1,即检验差分序列 的单整阶数是否为0。第110页/共303页DF检验的三种形式无截距项与趋势项:有截距项无趋势项:有截距项
23、与趋势项:第111页/共303页由于DF检验只适合一阶的自回归 过程,对于 过程,使用ADF检验:第112页/共303页实例:19521993中国的不变价格的GDP:ADF检验A、原始序列ADF检验第113页/共303页第114页/共303页检验结果 ,序列非平稳。第115页/共303页B、原始序列一阶差分ADF检验第116页/共303页B、原始序列二阶差分ADF检验第117页/共303页结论:检验结果 ,序列平稳,说明序列为一 过程。第118页/共303页计量经济学专题(3)非平稳时间序列回归与协整检验第119页/共303页1、协整的引入由于用非平稳的时间序列建立回归模型会带来虚假回归问题,
24、导致用非平稳的时间序列建立的回归模型的估计结果毫无意义,因此在用非平稳的时间序列回归前必须对回归的序列做进一步的检验。第120页/共303页2、协整检验的思想在实际中,大多数时间序列时是平稳的,然而某些非平稳的时间序列的线性组合却有可能是平稳的。第121页/共303页经济理论认为,某些经济时间序列存在长期的均衡关系。如:收入与支出、工资与价格、进口与出口、货币发行量与物价水平等。由于这些序列都是非平稳的时间序列,其方差与均值随时间的变化而变化,看起来这些非平稳的序列不会存在任何均衡的关系,但事实上若干个非平稳的时间序列的线性组合却有可能是平稳的序列,称具有这种性质的序列具有协整性,如果某些时间
25、序列存在协整关系,这认为这些经济变量之间存在长期的均衡关系。第122页/共303页协整关系的另一种理解:如果两个或两个以上的非平稳变量存在长期均衡的关系,则长期均衡关系得到的误差序列是平稳的。第123页/共303页3、协整的定义用 表示N1阶的时间序列向量 ,如果:(1)所含有的所有变量都是 阶的;(2)如果存在一个N1阶向量 ,使得 ,则称的各分量存在b阶协整关系。称协整向量,的各元素称协整参数。第124页/共303页例如:假定 均为一阶非平稳的时间序列,即:I(1),如果 具有如下关系:其中 I(0)第125页/共303页则 表示长期均衡关系,表示非均衡误差,两个非平稳的时间序列 的线性组
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 虚拟 变量 回归 模型 计量 经济学
限制150内