第七章计量经济学.pdf
《第七章计量经济学.pdf》由会员分享,可在线阅读,更多相关《第七章计量经济学.pdf(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章:多重共线性 第一部分:学习目的和要求 在经典多元线性回归模型中,其中一个重要假设就是各变量之间是线性无关的。但在现实中我们建立的多元线性回归模型的各变量之间都会存在一定程度上的线性相关即存在多重共线性。本章就是讨论存在多重共线性的情形,主要介绍了多重共线性的概念,多重共线性的理论后果,几种检测多重共线性的方法,以及对多重共线性进行补救的措施。通过本章的学习我们需要掌握以下几个问题:(1)多重共线性的概念,完全多重共线性和近似多重共线性的异同。(2)了解多重共线性产生的原因。(3)理解多重共线性的理论及实际后果,对统计量估计的后果、对参数显著性检验和预测的影响。(4)掌握并学会运用多重共
2、线性的几种监测方法,主要有样本决定系数检验法、相关系数检验法、辅回归模型检验法、容许度与方差膨胀因子检验法及特征值检验法。(5)掌握并学会运用多重共线性的补救措施:利用先验信息法、变换模型法、综合使用横截面数据和时间序列数据法、增加样本容量法、删除变量和设定偏误法。第二部分:练习题 一、术语解释 1、多重共线性 2、完全多重共线性与近似多重共线性 3、辅回归 4、容许度与方差膨胀因子 5、条件指数与病态指数 二、简答题 1、导致多重共线性的原因有哪些?2、多重共线性为什么会使得模型的预测功能失效?3、如何利用辅回归模型来检验多重共线性?4、判断以下说法正确、错误,还是不确定?并简要陈述你的理由
3、。(1)尽管存在完全的多重共线性,OLS 估计量还是最优线性无偏估计量(BLUE)。(2)在高度多重共线性的情况下,要评价一个或者多个偏回归系数的个别显著性是不可能的。(3)如果某一辅回归显示出较高的2iR值,则必然会存在高度的多重共线性。(4)变量之间的相关系数较高是存在多重共线性的充分必要条件。(5)如果回归的目的仅仅是为了预测,则变量之间存在多重共线性是无害的。(6)和 VIF 相比,容许度(TOL)是多重共线性的更好度量指标。5、考虑下面的一组数据:Y-10-8-6-4-2 0 2 4 6 8 10 2X 1 2 3 4 5 6 7 8 9 10 11 3X 1 3 5 7 9 11
4、13 15 17 19 21 如果我们用模型:12233iiiYXX 来对以上数据进行拟合回归。(1)我们能得到这 3 个估计量吗?并说明理由。(2)如果不能,那么我们能否估计得到这些参数的线性组合?可以的话,写出必要的计算过程。6、考虑以下模型:231234iiiiiYXXX 由于2X和3X是X的函数,那么它们之间存在多重共线性。这种说法对吗?为什么?7、在涉及时间序列数据的回归分析中,如果回归模型不仅含有解释变量的当前值,同时还含有它们的滞后值,我们把这类模型称为分布滞后模型(distributed-lag model)(见计量经济学251 页)。我们考虑以下模型:12313233ittt
5、ttYXXXX 其中 Y消费,X收入,t时间。该模型表示当期的消费是其现期的收入及其滞后三期的收入的线性函数。(1)在这一类模型中是否会存在多重共线性?为什么?(2)如果存在多重共线性的话,应该如何解决这个问题?8、设想在模型 12233iiiiYXX 中,2X和3X之间的相关系数23r为零。如果我们做如下的回归:1221iiiYX 1332iiiYX(1)会不会存在22且33?为什么?(2)1会等于1或1或两者的某个线性组合吗?(3)会不会有22var()var()且33var()var()?9、通过一些简单的计量软件(比如 EViews、SPSS),我们可以得到各变量之间的相关矩阵:232
6、3232311 1kkkkrrrrRrr。怎样可以从相关矩阵看出完全多重共线性、近似多重共线性或者不存在多重共线性?三、计算题 1、考虑消费函数 123itttCYW 1,2,tn 其中,C、Y、W 依次表示消费、收入与财富。下面是假想数据。C Y W 70 80 810 65 100 1009 90 120 1273 95 140 1425 110 160 1633 115 180 1876 120 200 2252 140 220 2201 155 240 2435 150 260 2686(1)作 C 对 Y 和 W 的普通最小二乘回归。(2)这一回归方程是否存在着多重共线性?你的判断依
7、据是什么?(3)分别作 C 对 Y 和 W 的回归,这些回归结果表明了什么?(4)作 W 对 Y 的回归。这一回归结果表明了什么?(5)如果存在严重的共线性,你是否会删除一个解释变量?为什么?2、下表给出了美国 1971-1986 年期间新客车出售的数据。年份 Y 2X 3X 4X 5X 6X 1971 10227 112.0 121.3 776.8 4.89 79367 1972 10872 111.0 125.3 839.6 4.55 82153 1973 11350 111.1 133.1 949.8 7.38 85064 1974 8775 117.5 147.7 1038.4 8.6
8、1 86794 1975 8539 127.6 161.2 1142.8 6.16 85846 1976 9994 135.7 170.5 1252.6 5.22 88752 1977 11046 142.9 181.5 1379.3 5.50 92017 1978 11164 153.8 195.3 1551.2 7.78 96048 1979 10559 166.0 217.7 1729.3 10.25 98824 1980 8979 179.3 247.0 1918.0 11.28 99303 1981 8535 190.2 272.3 2127.6 13.73 100397 1982
9、7980 197.6 286.6 2261.4 11.20 99526 1983 9179 202.6 297.4 2428.1 8.69 100834 1984 10394 208.5 307.6 2670.6 9.65 105005 1985 11039 215.2 318.5 2841.1 7.75 107150 1986 11450 224.4 323.4 3022.1 6.31 109597 Y新车出售量,未经季节调整数量;2X新车,消费者价格指数,1967 年=100,未经季节调整;3X消费者价格指数,1967 年=100,未经季节调整;4X个人可支配收入,10 亿美元,未经季节调
10、整;5X利率,百分数,金融公司票据直接使用;6X民间就业劳动人数(个人),未经季节调整。(1)如果你决定使用表中全部回归元作为解释变量,可能会遇到多重共线性吗?为什么?(2)如果你这样认为的话,你准备怎样解决这个问题?明确你的假设并说明全部计算。(3)制定适当的线性或者对数线性的模型,以估计美国对汽车的需求函数。第三部分:参考答案 一、术语解释 1、多重共线性:对于经典线性回归模型(CLRM)niuXXXYikikiii,2,1 22110 如果上式中某两个或多个解释变量之间出现了相关性,则称为存在多重共线性。依据解释变量之间共线性的程度不同,可以分为完全多重共线性和近似多重共线性。2、完全多
11、重共线性与近似多重共线性:所谓完全多重共线性,是指线性回归模型中的若干解释变量或全部解释变量之间具有严格的线性关系,也就是说,对于多元线性回归模型,若各解释变量kXXX,21的之间存在如下的关系式:02211kkXXX 式中k,21是不全为零的常数,则称这些解释变量之间存在完全多重共线性。当各解释变量kXXX,21的之间存在如下的近似的线性关系:02211kkXXX 则可以说上述解释变量之间存在近似多重共线性。还可以采用如下的方式,在近似线性关系式中,假设0i,则可将此近似线性关系表示为:ikkiiiiivXXXXX111111 其中,/illiv为随机误差项。3、辅回归:在变量之间存在多重共
12、线性的情况下,有一个解释变量能由其它解释变量近似的线性表示出来。为了找出哪个解释变量和其它变量有这种关系,我们可以将每个iX对其余变量进行回归,即 ikkiiiiivXXXXX111111 这种回归叫做辅回归,它是相对于 Y 对各个 X 的主回归而言的。4、容许度与方差膨胀因子:在含有 k 个变量的回归模型中,包括常数项和 k-1 个回归元,解释变量iX的偏回归系数的方差可以表示为:222221var()1iiiiiVIFRxx,我们定义方差膨胀因子211iiVIFR,2iR为第 i 个解释变量与其它解释变量辅回归模型的决定系数。容许度被定义为211iiiTOLRVIF。容许度与方差膨胀因子的
13、数值可以被用来检测多重共线性。5、条件指数与病态指数:条件指数与病态指数是在特征值检验法中用来检测多重共线性所构造出来的两个指标。条件指数(病态数)CN(condition number):CN=最大特征数/最小特征数 病态指数 CI(condition index):C IC N。二、简答题 1、答:经济数据中大量存在多重共线性这一现象,主要原因在于:经济领域很难象其它实验学科那样从控制性试验中获得数据;此外,可能有经济变量结构上的原因,也有数据收集与模型设定方面的原因,具体的,有以下几种:(1)所使用的数据收集方法。我们只能在一个有限的范围内得到观察值,无法进行重复试验。(2)模型或从中取
14、样的总体受到约束(经济变量的共同趋势)。(3)模型设定的偏误。(4)过度决定的模型。这种情况尤其容易发生在解释变量的个数大于观测值个数的情形。由于上述原因,实际应用中,解释变量之间总会存在一定程度的线性相关,因此,问题不是多重线性有无,而是多重共线性的严重程度。2、答:多元线性回归模型的一个重要应用是经济预测。对于模型 XY 如果给定样本以外的解释变量的观测值0X,就可以得到被解释变量的预测值 00XY 但是,这只是被解释变量的预测值的估计值而不是预测值。预测值仅以某一个置信水平位于以该估计值为中心的一个区间中。对于预测的置信区间,我们利用的是构造t统计量,得到在给定1的置信水平下0Y的置信区
15、间为 110102/000102/0XXXXtYYXXXXtY 显然,当解释变量之间存在多重共线性时,1XX非常大,故而0Y的置信区间也很大,因此,模型的预测功能失效。3、答:辅回归是相对于 Y 对各个 X 的主回归而言的。在变量之间存在多重共线性的情况下,有一个解释变量能由其它解释变量近似的线性表示出来。为了找出哪个解释变量和其它变量有这种关系,我们可以将每个iX对其余变量进行回归,即 ikkiiiiivXXXXX111111,并计算相应的决定系数,分别记为2iR。然后,我们在建立统计量:22(2)(1)(1)iiiRkFRnk 它服从自由度为 k-2 和 n-k+1 的 F 分布。其中 n
16、 为样本大小,k 为包括常数项在内的解释变量个数。如果计算出的iF超过了相应自由度的临界值,则认为这个iX和其余的解释变量存在共线性;如果iF未超过临界值,则认为这个iX和其余的解释变量不存在共线性。这种辅回归模型检验不仅可以检验是否存在多重共线性,而且还可以得到多重共线性的具体形式。4、答:(1)错。如果变量之间存在完全的线性关系时,我们甚至无法估计其系数或者标准误。(2)错。在高度多重共线性的情况下,仍然可以得到一个或者多个显著的 t 值。(3)错。OLS 估计量的方差有下式给出:2221var()1iiiRx 从此式可以看出,一个很高的2iR可被一个很低的2或者很高的2ix抵消掉。(4)
17、错。如果一个模型只有两个回归元,两两之间的高度相关系数便表示存在多重共线性。但是在变量之间存在多重共线性的前提下,可能是几个变量之间的关系。变量之间的相关系数较高是存在多重共线性的充分非必要条件。(5)不确定。如果观测到共线性在后来的样本数据中继续存在,或许无害。但如果不是这样,或者目的在于做出精确的估计的话,多重共线性便成为问题。如果仅仅要是预测的话,预测有效的前提条件是模型结构的稳定。(6)错。VIF 和 TOL 给出的信息含义是相同的。它们仅仅是同一种方法的两个不同的指标而已。5、答:(1)不能。通过对2X和3X的观察,我们可以知道它们存在以下的关系:3221iiXX,所以可知变量2X和
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七 计量 经济学
限制150内