计量经济学课件第五章 异方差性.doc
《计量经济学课件第五章 异方差性.doc》由会员分享,可在线阅读,更多相关《计量经济学课件第五章 异方差性.doc(80页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章 异方差性1引子:更为接近真实的结论是什么?根据四川省2000年21个地市州医疗机构数与人口数资料,分析医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。对模型估计的结果如下: Yi = -563.0548 + 5.3735 X i (291.5778) (0.644284)t = (-1.931062) (8.340265)R2 = 0.785456 R 2 = 0.774146F = 69.56003式中 Y 表示卫生医疗机构数(个), X 表示人口数量(万人)。2模型显示的结果和问题人口数量对应参数的标准误差较小; t统计量远大于临界值,可决系数和修正的可决系数结果较
2、好,F检验结果明显显著;表明该模型的估计效果不错,可以认为人口数量每增加1万人,平均说来医疗机构将增加5.3735人。然而,这里得出的结论可能是不可靠的,平均说来每增加1万人口可能并不需要增加这样多的医疗机构,所得结论并不符合真实情况。有什么充分的理由说明这一回归结果不可靠呢?更为接近真实的结论又是什么呢?3第五章 异 方 差 性本章讨论四个问题:异方差的实质和产生的原因异方差产生的后果异方差的检测方法异方差的补救4第一节 异方差性的概念本节基本内容:异方差性的实质异方差产生的原因5一、异方差性的实质同方差的含义同方差性:对所有的 i (i = 1,2,., n)有:Var(ui ) = 2(
3、5.1)因为方差是度量被解释变量 Y 的观测值围绕回归线E(Yi ) = b1 + b2 X 2i + b3 X 3i + . + bk X ki (5.2)的分散程度,因此同方差性指的是所有观测值的分散程度相同。6异方差性的含义设模型为Yi = b1 + b2 X 2i + b3 X 3i + . + bk X ki + uii = 1,2,., n如果对于模型中随机误差项 ui 有:Var(ui ) = s ,i = 1, 2,3,., n (5.3)则称具有异方差性。进一步,把异方差看成是由于某个解释变量的变化而引起的,则 2iVar(ui ) = s = s f ( X i ) 2i2
4、(5.4)7图形表示概率密度YX8二、产生异方差的原因(一)模型中省略了某些重要的解释变量假设正确的计量模型是:Yi = b1 + b2 X 2i + b3 X 3i + ui假如略去 X 3i ,而采用Yi = b1 + b2 X 2i + u*i(5.5)当被略去的 X 3i 与 X 2i 有呈同方向或反方向变化的趋势时,随 X 2i 的有规律变化会体现在(5.5) *式的 ui 中。9举例1nnnn用截面数据研究消费函数,根据绝对收入消费原理,设消费函数为:yt = b0 + b1x1 + ut其中:yt为家庭消费支出,xt为家庭可支配收入。在该模型中,物价水平Pt没有包括在解释变量中,
5、但它对消费支出是有影响的,该影响因素却被放在随机误差项中。如果物价水平是影响消费的重要部分,则很可能使随机误差的方差变动呈现异方差性。如果用xt / Pt表示不同家庭收入组的数据来研究消费函数,则不同收入组在消费支出上的差异是不同的。高收入组的消费支出差异应该很大,而低收入组的消费支出差异就很小。不同收入的家庭其消费支出有不同的差异变化。10举例2n用截面数据研究某一时点上不同地区的某类企业的生产函数,其模型为:u为随机误差项,它包含了除资本K和劳动力L以外的其他因素对产出Y的影响,比如不同企业在设计上、生产工艺上的区别,技术熟练程度或管理上的差别以与其他因素,这些因素在小企业之间差别不大,而
6、在大企业之间则相差很远,随机误差项随L、K增大而增大。由于不同的地区这些因素不同造成了对产出的影响出现差异,使得模型中的u具有异方差性,并且这种异方差性的表现是随资本和劳动力的增加而有规律变化的。11nn(二)模型的设定误差模型的设定主要包括变量的选择和模型数学形式的确定。模型中略去了重要解释变量常常导致异方差,实际就是模型设定问题。除此而外,模型的函数形式不正确,如把变量间本来为非线性的关系设定为线性,也可能导致异方差。(三)数据的测量误差样本数据的观测误差有可能随研究范围的扩大而增加,或随时间的推移逐步积累,也可能随着观测技术的提高而逐步减小。12举例nn例如,研究某人在一定时期内学习打字
7、时打字差错数Yt与练习打字时间Xt之间的关系。显然在打字练习中随时间的增加,打字差错数将减少,即随着Xt的增加Yt将减小。这时Var(ut)将随Xt的增加而减少,于是存在异方差性。利用平均数作为样本数据也容易出现异方差性。因为许多经济变量之间的关系都服从正态分布,例如不同收入组的人数随收入的增加是正态分布,即收入较高和较低的人是少数的,大部分人的收入居于较高和较低之间,在以不同收入组的人均数据作为样本时,由于每组中的人数不同,观测误差也不同,一般来说,人数多的收入组的人均数据较人数少的收入组的人均数据具有较高的准确性,即Var(ui)随收入Ii呈现先降后升的趋势,这也存在着异方差性。13(四)
8、截面数据中总体各单位的差异通常认为,截面数据较时间序列数据更容易产生异方差。这是因为同一时点不同对象的差异,一般说来会大于同一对象不同时间的差异。不过,在时间序列数据发生较大变化的情况下,也可能出现比截面数据更严重的异方差。14举例n运用截面数据研究消费和收入之间的关系。如果采取不同家庭收入组的数据,低收入组的家庭用于购买生活必需品的比例相对较大,消费的分散程度不大,组内各家庭消费的差异也较小。而高收入组的家庭有更多自由支配的收入,家庭消费有更广泛的选择范围,消费的分散程度较大,组内各家庭消费的差异也较大。15第二节 异方差性的后果本节基本内容:对参数估计统计特性的影响对参数显著性检验的影响对
9、预测的影响16一、对参数估计统计特性的影响(一)参数估计的无偏性仍然成立参数估计的无偏性仅依赖于基本假定中的零均值假定(即 E(ui ) = 0 )。所以异方差的存在对无偏性的成立没有影响。(二)参数估计的方差不再是最小的同方差假定是OLS估计方差最小的前提条件,所以随机误差项是异方差时,将不能再保证最小二乘估计的方差最小。17二、对参数显著性检验的影响由于异方差的影响,使得无法正确估计参数的标准误差,导致参数估计的 t 统计量的值不能正确确定,所以,如果仍用 t 统计量进行参数的显著性检验将失去意义。18三、对预测的影响尽管参数的OLS估计量仍然无偏,并且基于此的预测也是无偏的,但是由于参数
10、估计量不是有效的,从而对Y的预测也将不是有效的。19第三节 异方差性的检验常用检验方法:图示检验法Goldfeld-Quanadt检验White检验Park检验和Gleiser检验ARCH检验20一、图示检验法(一)相关图形分析方差描述的是随机变量取值的(与其均值的)离散程度。因为被解释变量 Y 与随机误差项 u 有相同的方差,所以利用分析 Y 与 X 的相关图形,可以初略地看到 Y 的离散程度与 X 之间是否有相关关系。如果随着 X 的增加, 的离散程度为逐渐增大(或Y减小)的变化趋势,则认为存在递增型(或递减型)的异方差。21图形举例1用1998年四川省各地市州农村居民家庭消费支出与家庭纯
11、收入的数据,绘制出消费支出对纯收入的散点图,其中用 XY1 表示农村家庭消费支出, 1 表示家庭纯收入。22图形举例2我国制造工业利润函数。已有1998年我国主要制造工业销售收入与销售利润的统计资料,可键入命令:Scat X Y有下图:2324(二)残差图形分析设一元线性回归模型为:Yi = 1 + 2 X i + ui运用OLS法估计,得样本回归模型为: Yi = 1 + 2 X i由上两式得残差:2i ei = Yi - Yi绘制出 e 对 X i的散点图如果 ui 不随 X i 而变化,则表明不存在异方差;如果 ui 随 X i 而变化,则表明存在异方差。25或直接观察残差分布图分析注意
12、观察之前需要先将数据关于解释变量排序,命令格式为:SORT XLS Y C X26二、Goldfeld-Quanadt检验作用:检验递增性(或递减性)异方差。基本思想:将样本分为两部分,然后分别对两个样本进行回归,并计算两个子样的残差平方和所构成的比,以此为统计量来判断是否存在异方差。y样本1C个数据样本2GQ检验原理图x27(一)检验的具体做法1.排序将解释变量的取值按从小到大排序。2.数据分组将排列在中间的约1/4的观察值删除掉,记为c,再将剩余的分为两个部分,每部分观察值的个数为 (n - c) / 2 。3.提出假设H0 : = , i =1,2,., n;2i2H1 : . 2122
13、2n284.构造F统计量分别对上述两个部分的观察值求回归模型,由此得到的两个部分的残差平方为 2 e1i和 2 e2i。 2 e1i 为前一部分样本回归产生的残差平方和, 2 e2i为后一部分样本回归产生的残差平方和。它们的自由度均为 (n - c) / 2 - k ,k 为参数的个数。29在原假设成立的条件下,因和 2为 (n - c) / 2 - k , 分布,可导出: 2 n-ce2i / - k 2 2 e1i 2 e2i自由度均 2 e2i F ( n - c - k, n - c - k ) *F= 2222 n-c e1i e1i / 2 - k (5.13)305.判断 给定显
14、著性水平 a ,查 F分布表得临界值 F n-c n-c (a ) 计算统计量 F * 。(2-k ,2-k )如果F F n -c* n-c(-k ,-k ) 22(a )则拒绝原假设,接受备择假设,即模型中的随机误差存在异方差。31(二)检验的特点要求大样本异方差的表现既可为递增型,也可为递减型检验结果与选择数据删除的个数 c 的大小有关只能判断异方差是否存在,在多个解释变量的情下,对哪一个变量引起异方差的判断存在局限。32三、White检验(一)基本思想:不需要关于异方差的任何先验信息,只需要在大样本的情况下,将OLS估计后的残差平方对常数、解释变量、解释变量的平方与其交叉乘积等所构成一
15、个辅助回归,利用辅助回归建立相应的检验统计量来判断异方差性。33(二)检验的特点要求变量的取值为大样本不仅能够检验异方差的存在性,同时在多变量的情况下,还能判断出是哪一个变量引起的异方差。34(三)检验的基本步骤:以一个二元线性回归模型为例,设模型为:Yt = 1 + 2 X 2t + 3 X 3t +ut并且,设异方差与 X 2t , X 3t 的一般关系为 = 1 +2 X 2t +3 X 3t +4 X +5 X +6 X 2t X 3t +vt2t22t23t其中 vt为随机误差项。351.求回归估计式并计算 2et 用OLS估计式(5.14),计算残差 et = Yt - Yt ,并
16、求残 2差的平方 et 。2.求辅助函数 22用残差平方 et 作为异方差 t 的估计,并建立 22X 2t , X 3t , X 2t , X 3t , X 2t X 3t 的辅助回归,即e = 1 +2 X 2t +3 X 3t +4 X +5 X +6 X 2t X 3t (5.15)2t22t23t363.计算利用求回归估计式(5.15)得到辅助回归函数的可决系数 nR 2 ,n 为样本容量。4.提出假设H0 : a2 = .= a6 = 0,H1 : a(j =2,3,.,6)不全为零j375.检验在零假设成立下,有 nR 2 渐进服从自由度为5的 2 2分布。给定显著性水平 a ,
17、查 分布表得临界 222值 a (5) ,如果 nR a (5),则拒绝原假设,表明模型中随机误差存在异方差 。38EViews软件中:建立回归模型:LS YCX检验异方差性:在方程窗口中依次点击ViewResidual TestWhite Heteroskedastcity 一般是直接观察p值的大小,若p值 较小,认为模型存在异方差性。39四、Park检验和Glejser检验(一)检验的基本思想由OLS法得到残差,然后将残差的某种形式对某个解释变量回归,根据回归模型的显著性和拟合优度来判断是否存在异方差。(二)检验的特点不仅能对异方差的存在进行判断,而且还能对异方差随某个解释变量变化的函数形
18、式该检验要求变量的观测值为大样本。40进行诊断。(三)模型形式帕克检验的模型形式为:2ie = axi eb2iui或:ln e = ln a + b ln xi + uihi戈里瑟检验的模型形式为:ei = a + bx + uih = 1,2,1 2 ,L经检验某个方程是显著的,表明存在异方差性。41五、ARCH检验(一)ARCH 过程设ARCH 过程为 = a0 +a +.+a 2t 21 t-1 2p t- p+vta0 0,ai 0i = 1, 2,., pp 为ARCH过程的阶数,并且 vt 为随机误差。(二)检验的基本思想在时间序列数据中,可认为存在的异方差性为ARCH过程,并通
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量经济学课件第五章 异方差性 计量 经济学 课件 第五 方差
限制150内