计量研—学习教程.pptx
第四章第一节第1页/共71页 4.1 异方差性的概念及其产生的原因一、异方差(Heteroscedasticity)的概念同方差:(4.1)异方差:即,扰动项方差不同。第2页/共71页异方差定义:扰动项存在异方差本质:被解释变量存在异方差误解:解释变量存在异方差同方差:被解释变量的离散程度是相同的,同权对待,用OLS估计。异方差模型:被解释变量的离散程度不同,做加权处理,用加权最小二乘法。第3页/共71页异方差问题主要出现在截面数据模型中,因此,一般来说,对截面数据模型要考察是否存在异方差,时间序列数据模型也可能出现异方差,但是相对少见些。第4页/共71页二、异方差产生的原因1经济规模的大小差异对于截面数据而言,其来源于同一时期或同一时点上的不同经济主体或同一主体中的不同成员的样本数据。当这些经济主体或成员之间的经济规模或者绝对数量水平差异较大时,就容易出现异方差问题。规模差异在现实经济中时有发生,国家规模有大有小,省市、工厂、企业、消费者或消费群体均有规模大小之分。第5页/共71页2模型回归函数的设定与变量的选取误差(1)模型回归函数的设定误差。由于我们并不知道总体回归函数的精确分布,而只能是根据解释变量与被解释变量的样本变化规律来设定总体回归函数,也许真实的总体回归函数并不是线性的,而只是接近于线性或者甚至是非线性的,这样,在所选回归函数与真实回归函数之间就出现了误差,这一误差被并入扰动项中,第6页/共71页当这一误差存在异方差时,就给扰动项带来了异方差。(2)省略解释变量的误差。像第一章中谈到的,实际操作过程中,不可能将对被解释变量有影响的所有解释变量统统考虑进来,只能是选取主要的以及可以量化的变量,所省略的解释变量也被并入扰动项中,当所省略的解释变量存在异方差时,第7页/共71页可能给扰动项带来异方差。比如,研究某商品的需求函数模型,我们只选取了消费者收入、该商品的价格作为解释变量,而没有考虑可替代品的价格变化对该商品需求的影响,当可替代品的价格波动出现异方差时,将给模型扰动项带来异方差。第8页/共71页三、异方差模型的例子研究我国城镇居民年通讯消费支出与可支配收入之间的变动关系。选取我国城镇居民2007截面数据资料,根据对样本数据变化的研究,我们发现,城镇居民在通讯上的消费支出与居民可支配收入之间有一定的线性关系,于是设定模型为:第9页/共71页其中,X为城镇居民年可支配收入(单位:元),Y为城镇居民年通讯消费支出(单位:元)。按照可支配收入水平,将我国31个省市区分为6个组,各组的收入水平用其组内省市区的收入水平之平均数,各组平均收入水平及组内各省市年通讯消费支出的数据列于下表4-1。第10页/共71页 图4-1A通讯消费支出的离散程度(2005)第11页/共71页 图4-1B通讯消费支出的离散程度(2007)第12页/共71页第四章第二节第13页/共71页 4.2 异方差的后果及其检验 一、异方差的后果当模型的扰动项存在异方差时,OLS估计量不再是有效的,具体来说,有以下几个方面。1异方差性不破坏OLS估计量的线性性、无偏性 第14页/共71页回顾多元线性回归模型OLS估计量的线性、无偏性的证明过程,分析可知,这两点的证明中用到的是解释变量非随机性、零均值性等,没有用到扰动项的同方差性及序列无关性,因此,如果模型仅仅是异方差问题,经典假设的其他条件仍然满足,这时OLS估计量仍然是线性、无偏的。第15页/共71页2异方差性破坏了OLS估计量的有效性OLS估计量的有效性即OLS估计量在所有的线性、无偏估计量中方差是最小的,其证明要用到扰动项的同方差及序列无关性假设,如果扰动项为异方差,则有效性证明无从谈起;第16页/共71页3异方差使OLS估计量的t-显著性检验及模型预测结果失效OLS估计量的t-统计量值是在总体同方差条件下导出的,当模型存在异方差时,再用同样的方法来计算t-统计量值,也可能低估了其值,也可能高估了其值,如果是高估了,则显著的结论不可信,如果是低估了,会使本来应该显著的参数变为不显著。第17页/共71页二、异方差性的检验1图示法由于扰动项的具体变动我们并不知道,只能根据残差变化来研究扰动项的异方差问题。由于扰动项为零均值,故其平方的期望正是它的方差,因此,我们用残差的平方来作为扰动项方差的推断。第18页/共71页图示法即首先对模型进行OLS估计,计算出残差的估计量,作残差绝对值的变化图。一般可作两种图,一种是残差绝对值关于解释变量变化的散点图,即以解释变量的样本为横轴,残差绝对值为纵轴,描绘散点图。如果散点呈现出规律性,比如有明确向上或向下的线性趋势,或其他非线性趋势,这表明残差绝对值与解释变量是有关联的,也就是说残差平方与第19页/共71页解释变量的变化有关,进一步说明模型存在异方差;另一种是残差绝对值关于被解释变量拟合值变化的散点图,即以被解释变量的拟合值为横轴,残差绝对值为纵轴,描绘散点图。如果散点呈现出规律性,说明模型存在异方差,否则,不存在异方差。第20页/共71页无异方差的例子第21页/共71页存在异方差的例子第22页/共71页2.戈 徳 菲 尔 徳 夸 特 检 验(GoldfeldQuandt检验)戈徳菲尔徳夸特检验的思路是为检验残差是否与解释变量的变化有关,将样本按照解释变量的大小分为两组,一组为解释变量取值较大的,另一组为解释变量取值较小的,如果这两组分别回归的残差平方和有显著差异,就说明模型存在异方差,否则,不存在异方差。第23页/共71页对于线性回归模型:第一步:将样本按照解释变量从小到大的顺序进行排序(若解释变量有负值,则按照绝对值大小进行排序)。第二步:去掉中间的c个样本(为明确区分样本取值的大小),使两边所剩均为(n-c)/2个样本(这就要求所剩样本数为偶数)。第24页/共71页第三步:分别对所剩余的两组样本进行OLS回归估计,得残差 平 方 和 ESS1和 ESS2,其 中,ESS1对应为解释变量样本较小的那一组,ESS2对应为解释变量样本较大的那一组。第四步:计算F-统计量:第25页/共71页 可以证明,在扰动项为正态分布及同方差的假设下,(4.8)式服从分子、分母自由度均为的F-分布。(对于现在的一元模型,自由度为 第26页/共71页 给定水平,查F-分布的临界值表,得临界值,与之比较,若(4.8)式所计算出的F-值大于临界值,则模型存在异方差,否则,为同方差。戈徳菲尔徳夸特检验过程中要去掉中间的c个样本,c的大小的选取对检验结果有影响,当方差变化差异较大时,这一影响较小,当方差变化较小时,c的选取最为重要。第27页/共71页3戈莱泽(H.Glejser)检验戈莱泽异方差检验的思路与帕克检验类似,也是要检验模型OLS估计的残差是否与解释变量有关,其采用的是试验的方式。还是以一元线性回归模型为例。首先作OLS估计,求得残差ei,然后作残差绝对值关于解释变量各种函数的回归估计,比如:第28页/共71页第29页/共71页对每个回归方程均作回归参数的t-显著性,若发现显著且拟合较好的,则说明模型方差与解释变量的相应函数相关,即模型为异方差。如果没有显著的回归方程,则用该种方法作异方差检验失效。第30页/共71页第四章第三节第31页/共71页 4.3 异方差模型的估计方法一、加权最小二乘估计(WLS)假定线性回归模型的经典假设中解释变量非随机、扰动项零均值、正态分布、序列无关以及解释变量线性无关这几条仍然满足,只是扰动项的同方差性不存在了,即扰动项具有异方差性。第32页/共71页由上可知,这时OLS估计方法不能直接使用了,我们用加权最小二乘方法(WeightedLeastSquares简称WLS)来估计模型的参数。设多元线性回归模型的矩阵形式为:(4.12)扰动项U满足:第33页/共71页其中,W为扰动项U的方差与协方差矩阵,当扰动项满足同方差、序列无关假设时,W为数量矩阵,在扰动项只存在异方差的条件下,W为对角矩阵。第34页/共71页令第35页/共71页 即P为扰动项的标准差之倒数组成的对角矩阵。由(4.5)可知,(4.13)在(4.12)式两边同乘以矩阵P得:令第36页/共71页于是原模型变为:(4.14)由于由(4.13)式可知,于是第37页/共71页式中,I表示单位矩阵,即变换之后的模型(4.14)满足经典假设,为零均值、同方差、序列无关的,于是对(4.14)应用OLS方法估计其参数得:第38页/共71页我们称(4.15)为原模型的加权最小二乘估计量(WLS)。可以导出,加权最小二乘估计量(4.15)式的方差与协方差矩阵为:(4.16)第39页/共71页在实际应用中,由于扰动项的方差是未知的,我们可以用原模型的OLS估计的残差的平方来推断扰动项的方差,即WLS估计式中的W矩阵为:第40页/共71页用残差平方作为方差的近似值 来 做 加 权 最 小 二 乘 估 计 的Eviews命令为:LSYCXGENREE=1/RESID(将OLS估计残差的倒数赋给变量EE)LS(W=EE)YCX(作加权最小二乘估计)第41页/共71页二、模型变换形式法 下面介绍根据扰动项异方差检验所确定的异方差形式来对模型进行变换,使变换之后的模型为同方差模型,从而可以用普通最小二乘法进行估计参数。需要注意的问题是在模型变为同方差的条件下,是否仍是序列无关的,否则,又带来了新的问题。第42页/共71页1假设 其中,为常数,即方差与解释变量成正比。对于一元回归模型:模型式两边同时除以 得:第43页/共71页 令则模型变为:由于 第44页/共71页即变换之后的模型为同方差模型,对其应用OLS方法估计即得原模型的两个参数(不过现在变成了二元回归,无常数项)。上述计算的Eviews命令如下:首先输入X、Y的样本数据(省略)。GENRYY=Y/SQR(X)GENRXX1=1/SQR(X)GENRXX2=SQR(X)第45页/共71页LSYYXX1XX2 (不要写常数项,新模型没有常数项)或者不必生成新变量,也可以直接回归如下:LSY/SQR(X)1/SQR(X)SQR(X)二者是等价的。第46页/共71页2假设 其中,为正的常数,即方差与解释变量的平方成正比。对于一元回归模型:模型式两边同时除以得:第47页/共71页 令则模型变为:由于 第48页/共71页即变换之后的模型为同方差模型,对其应用普通最小二乘方法估计即得原模型的两个参数。(不过现在的常数项是原模型解释变量的系数,而现在新解释变量的系数为原模型的常数项,要注意次序。)上述估计的Eviews命令如下:首先输入X、Y的样本数据(省略)。第49页/共71页GENRYY=Y/XGENRXX=1/XLSYYXXC (将常数项写在后面是为了参数的次序与原模型参数顺序相同,这样估计出的第一个参数正是原常数项)或者不必生成新变量,也可以直接回归如下:第50页/共71页LSY/X1/XC 二者是等价的。更为一般地假设方差与解释变量的某函数成正比。第51页/共71页第四章第四节第52页/共71页 4.4 异方差模型应用实例例4.1我国城镇居民消费模型研究我国城镇居民生活费支出关于其可支配收入变化的规律,即城镇居民消费函数,已取得2007年我国31个省市自治区的城镇居民可支配收入消费性支出的截面数据,样本数据见表4-2,单位都是人民币元。由样本数据画散布点及拟合线于图4-4。第53页/共71页图4-4我国城镇居民收入与消费散点图 第54页/共71页图4-5我国城镇居民收入与消费散点图 第55页/共71页数据来源:中国国家统计局网,中国统计年鉴2008数据转换:从EXCEL到EVIEWS。第56页/共71页图。第57页/共71页图。第58页/共71页图4-4中那个最高点是上海市的数据,上海市的居民人均消费水平、人均GDP、城镇居民人均可支配收入以及农村居民人均纯收入在我国均处在第一位。从图中可以看出,我国城镇低收入与低消费水平省市占多数,高收入与高消费水平省市只有个别几个。因此今后我国缩小居民收入差距任重而道远,需要提高收入水平的省市是一大批而不只是几个。第59页/共71页作OLS回归估计得:第60页/共71页经过使用残差图示法、等级相关检验等方法进行检验,模型存在异方差。1.用图示法进行异方差性检验作残差绝对值关于解释变量的散布点图,见图4-5。第61页/共71页 图4-5 异方差检验的图示第62页/共71页 从图4-5可以看出,残差绝对值与解释变量之间有一定的关联,但是趋势性不是十分明显,进一步用其他方法检验。第63页/共71页 2.用戈徳菲尔徳夸特检验法进行异方差检验如下:将样本按照解释变量从小到大的顺序进行排序,去掉中间的7个,收入水平较小的样本组剩余12个样本,收入水平较大的样本组也有12个样本。分别进行OLS估计,得两组的残差平方和分别为:第64页/共71页ESS1=1529518,ESS2=5681095计算F-统计量的值,得:由于自由度v1=v2=10,给定显著水平=0.05,查得临界值为2.98,显然F-统计量值大于临界值,即拒绝同方差的假设,模型存在异方差。第65页/共71页由以上三种检验可知,结果是一样的,即模型存在异方差,下面用加权最小二乘法进行参数估计。作加权最小二乘估计,以ei2作为扰动项方差的估计量,将原模型两边同除以残差的绝对值|ei|得:第66页/共71页 令 于是原模型变为:估计得:第67页/共71页从而得原模型的加权小最二乘估计式(WLS):第68页/共71页以上加权OLS估计过程在Eviews中可用如下指令完成:首先创建工作文件,输入数据(命令省略)。然后输入:LSYCXGENRR=ABS(RESID)(将残差绝对值定义为R变量)LS(W=1/R)YCX(作加权OLS估计,权数为1/R)加权最小二乘估计的拟合优度比较高。第69页/共71页 本章内容结束,谢谢观看!若结束学习,请退出幻灯片放映,若继续学习下一章内容,请点击下面的下一章按钮。下一章 第70页/共71页谢谢您的观看!第71页/共71页