第四章违背古典假定的计量经济模型新精选文档.ppt
第四章违背古典假定的计量经济模型新本讲稿第一页,共一百五十六页 第一节第一节 概述概述一、古典假定一、古典假定 假定假定1、随机项、随机项 i具有零均值具有零均值 E(i)=0 i=1,2,n 假定假定2、随机项、随机项 i具有同方差具有同方差 Var(i)=2 i=1,2,n 假定假定3、随机项、随机项 i无无序列相关性序列相关性 Cov(i,j)=0 ij i,j=1,2,n 假定假定4、随机项、随机项 与解释变量与解释变量X之间不相关:之间不相关:Cov(Xj,i)=0 i=1,2,n本讲稿第二页,共一百五十六页 假定假定5、服从正态分布服从正态分布 iN(0,2 )i=1,2,n 假定假定6、多元回归模型中解释变量之间不存在多重共、多元回归模型中解释变量之间不存在多重共线性线性 rank(X)=k+1 k+1n 根据根据Gauss-Markov定理可知,古典回归模型定理可知,古典回归模型的最小二乘估计量(的最小二乘估计量(OLSE)是线性无偏有效的估)是线性无偏有效的估计量,而且由于正态性假定,它们服从正态分布计量,而且由于正态性假定,它们服从正态分布的。因此,就有可能得出区间估计式,而且也可的。因此,就有可能得出区间估计式,而且也可以检验真实总体回归系数。以检验真实总体回归系数。本讲稿第三页,共一百五十六页二、古典假定的违背及造成的后果二、古典假定的违背及造成的后果 在实际经济问题中,上述的古典假定不一定都在实际经济问题中,上述的古典假定不一定都能得到满足。如果这些假定不完全满足,则能得到满足。如果这些假定不完全满足,则OLSE的的BLUE特性将不复存在。当然,每一个假定特性将不复存在。当然,每一个假定不满足所造成的后果是不同的。在本章中,我们将不满足所造成的后果是不同的。在本章中,我们将严格考察上述假定,找出如果有一个或多个假定得严格考察上述假定,找出如果有一个或多个假定得不到满足时,估计量的性质将会发生什么变化不到满足时,估计量的性质将会发生什么变化,并研并研究当出现这些情况时,应该如何处理,即古典模型究当出现这些情况时,应该如何处理,即古典模型假定违背的经济计量问题。假定违背的经济计量问题。本讲稿第四页,共一百五十六页 关于假定关于假定1,一般地我们认为假定,一般地我们认为假定E(i)=0 是合是合理的。因为随机项理的。因为随机项 是多种因素的综合,而每种是多种因素的综合,而每种因素的影响都因素的影响都“均匀均匀”地微小,它对因变量的影地微小,它对因变量的影响不是系统的,且正负影响相互抵消,故所有可响不是系统的,且正负影响相互抵消,故所有可能取值平均起来为零。即使有轻度的违反,从实能取值平均起来为零。即使有轻度的违反,从实践的观点来看可能不会产生严重的后果,因为它践的观点来看可能不会产生严重的后果,因为它可能只影响回归方程的截距项可能只影响回归方程的截距项。关于随机项正态性分布的假定,如果我们的目关于随机项正态性分布的假定,如果我们的目的仅仅是估计,这种假定并不是绝对必要的。事的仅仅是估计,这种假定并不是绝对必要的。事实上,无论是否是正态分布,实上,无论是否是正态分布,OLSE估计式都是估计式都是BLUE。剩下的四个假定将在下面的四节中分别加以讨剩下的四个假定将在下面的四节中分别加以讨论。论。本讲稿第五页,共一百五十六页三、广义最小二乘法(三、广义最小二乘法(GLS)给定线性回归模型给定线性回归模型 Y=X+U 若古典假定完全满足,根据若古典假定完全满足,根据Gauss-Markov定理,其系数的最小二乘估计量定理,其系数的最小二乘估计量 B(XT X)1 XT Y 具有具有 BLUE性质。性质。若古典假定得不到完全满足,特别是若古典假定得不到完全满足,特别是假定假定2(同方差性)和假定(同方差性)和假定3(无序列相(无序列相关性)得不到满足时,对关性)得不到满足时,对OLSE的影响更的影响更大。大。本讲稿第六页,共一百五十六页 广义最小二乘法广义最小二乘法(General Least SquaresGLS)就是为)就是为了解决上述问题提出的。其基本思路是:若了解决上述问题提出的。其基本思路是:若 假定假定2(同方(同方差性)和假定差性)和假定3(无序列相关性)得不到满足时,我们可(无序列相关性)得不到满足时,我们可以采取适当的变换,使原模型变为以下的形式:以采取适当的变换,使原模型变为以下的形式:使得其中使得其中 的重新满足假定的重新满足假定2(同方差性)和假定(同方差性)和假定3(无序列相关性)。这样就可以对上式使用(无序列相关性)。这样就可以对上式使用OLS估估计参数,从而使得上式的计参数,从而使得上式的OLSE仍然为仍然为BLUE。若因假定若因假定2和假定和假定3不满足时,有不满足时,有 其中其中 I,是一个是一个nn的正定对称方阵。的正定对称方阵。本讲稿第七页,共一百五十六页 此时可可以觅得一个此时可可以觅得一个nn的非奇异矩阵的非奇异矩阵P,使得:,使得:P PT=I 然后用觅得的然后用觅得的P乘以原模型的两边,有:乘以原模型的两边,有:PY=PX+PU 记记 原模型就原模型就转换为转换为:可可证证明明转换转换后的模型其随机后的模型其随机项满项满足同方差性和无序列相关足同方差性和无序列相关性,即可以采用性,即可以采用OLS估估计计参数了。参数了。本讲稿第八页,共一百五十六页第二节第二节 异方差性异方差性一、异方差的一、异方差的涵义涵义二、异方差性的后果二、异方差性的后果三、异方差的检验三、异方差的检验四、异方差的消除方法四、异方差的消除方法五、案例五、案例本讲稿第九页,共一百五十六页对于模型对于模型如果出现如果出现即即对于不同的样本点对于不同的样本点,随机误差项的方差不再是随机误差项的方差不再是常数常数,而互不相同而互不相同,则认为出现了则认为出现了异方差性异方差性(Heteroscedasticity)。一、异方差的概念一、异方差的概念本讲稿第十页,共一百五十六页异方差举例异方差举例例:截面资料下研究居民家庭的储蓄行为例:截面资料下研究居民家庭的储蓄行为 Yi=0+1Xi+uiYi:第第i个家庭的储蓄额个家庭的储蓄额 Xi:第第i个家庭的可支配收入个家庭的可支配收入 高收入家庭:储蓄的差异较大高收入家庭:储蓄的差异较大 低收入家庭:储蓄则更有规律性,差异较小低收入家庭:储蓄则更有规律性,差异较小ui的方差呈现单调递增型变化的方差呈现单调递增型变化本讲稿第十一页,共一百五十六页 例例 以某一行业的企业为样本建立企业生产函数模型以某一行业的企业为样本建立企业生产函数模型 Yi=A LiKi e i 被解释变量:产出量被解释变量:产出量Y 解释变量:资本解释变量:资本K、劳动力、劳动力L 那那么么:每每个个企企业业所所处处的的外外部部环环境境对对产产出出量量的的影影响响被被包包含在随机误差项中。含在随机误差项中。每每个个企企业业所所处处的的外外部部环环境境对对产产出出量量的的影影响响程程度度不不同同,造成了随机误差项的异方差性。造成了随机误差项的异方差性。这这时时,随随机机误误差差项项的的方方差差并并不不随随某某一一个个解解释释变变量量观观测测值值的的变化而呈规律性变化,呈现复杂型。变化而呈规律性变化,呈现复杂型。本讲稿第十二页,共一百五十六页异方差产生的原因:异方差产生的原因:一模型中省略的解释变量;一模型中省略的解释变量;二测量的误差;二测量的误差;三截面数据中总体各单位的差异三截面数据中总体各单位的差异本讲稿第十三页,共一百五十六页 二、异方差产生的后果二、异方差产生的后果 计量经济学模型一旦出现异方差性,如果仍采用计量经济学模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果:估计模型参数,会产生下列不良后果:1 1、参数估计量非有效、参数估计量非有效 OLS估计量估计量仍然具有仍然具有无偏性无偏性,但,但不具有不具有有效性有效性 因为在有效性证明中利用了因为在有效性证明中利用了 E(uuT)=2I 而且,在大样本情况下,尽管参数估计量而且,在大样本情况下,尽管参数估计量具有具有一致性一致性,但仍然但仍然不具有不具有渐近有效性渐近有效性。本讲稿第十四页,共一百五十六页 2 2、变量的显著性检验和置信区间失去意义、变量的显著性检验和置信区间失去意义 变量的显著性检验中,构造了变量的显著性检验中,构造了t统计量统计量 t=b1/s(b1)它是建立在它是建立在2 2不变而正确估计了参数方差不变而正确估计了参数方差s(bs(b1 1)的基础之上的。的基础之上的。如果出现了异方差,估计的如果出现了异方差,估计的s(b1)出现偏误(偏大出现偏误(偏大或偏小),或偏小),t检验失去意义。检验失去意义。其他检验也是如此。其他检验也是如此。本讲稿第十五页,共一百五十六页3、参数方差的估计量是有偏的参数方差的估计量是有偏的 虽然最小二乘法参数的估计量是无偏的,但虽然最小二乘法参数的估计量是无偏的,但这些参数方差的估计量、是有偏的。正的偏差会这些参数方差的估计量、是有偏的。正的偏差会高估参数估计值的真实方差,负的偏差会低估参高估参数估计值的真实方差,负的偏差会低估参数估计值的真实方差。数估计值的真实方差。本讲稿第十六页,共一百五十六页 4 4、模型的预测失效、模型的预测失效 一一方方面面,由由于于上上述述后后果果,使使得得模模型型不不具具有有良良好的统计性质;好的统计性质;所以,当模型出现异方差性时,参数所以,当模型出现异方差性时,参数OLS估计值估计值的变异程度增大,从而造成对的变异程度增大,从而造成对Y的预测误差变大,降的预测误差变大,降低预测精度,预测功能失效。低预测精度,预测功能失效。本讲稿第十七页,共一百五十六页 三、异方差性的检验三、异方差性的检验检验思路:检验思路:由于由于异方差性异方差性就是相对于不同的解释变量观测值,就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么:随机误差项具有不同的方差。那么:检验异方差性,也就是检验随机误差项的方差检验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的与解释变量观测值之间的相关性及其相关的“形形式式”。本讲稿第十八页,共一百五十六页 (一一)图示法图示法 既可利用因变量既可利用因变量Y与解释变量与解释变量X的散点图的散点图,也可也可利用残差利用残差e2-X的散点图,对随机项的散点图,对随机项u的异方差作近的异方差作近似的直观判断。似的直观判断。(1)用)用X-Y的散点图进行判断的散点图进行判断 看是否存在明显的看是否存在明显的散点扩大散点扩大、缩小缩小或或复杂型趋复杂型趋势势(即不在一个固定的带型域中)(即不在一个固定的带型域中)本讲稿第十九页,共一百五十六页本讲稿第二十页,共一百五十六页看是否形成一斜率为零的直线看是否形成一斜率为零的直线本讲稿第二十一页,共一百五十六页 (二)(二)戈德菲尔德戈德菲尔德-匡特匡特(Goldfeld-Quandt)(Goldfeld-Quandt)检验检验 G-Q检验以检验以F检验为基础,适用于大样本、异方检验为基础,适用于大样本、异方差递增或递减的情况。差递增或递减的情况。G-QG-Q检验的思想检验的思想:先排序先排序,将样本去掉中间的将样本去掉中间的c个个,然后一然后一分为二,对子样分为二,对子样和子样和子样分别作回归,然后利用两个子样分别作回归,然后利用两个子样的残差平方和之比构造统计量进行异方差检验。的残差平方和之比构造统计量进行异方差检验。H:随随x递增(或递减)递增(或递减)本讲稿第二十二页,共一百五十六页 G-Q G-Q检验的步骤:检验的步骤:将将n对样本观察值对样本观察值(Xi,Yi)按观察值按观察值Xi的大小排队的大小排队将序列中间的将序列中间的c=n/4个观察值除去,并将剩下的观察个观察值除去,并将剩下的观察值划分为较小与较大的相同的两个子样本,每个值划分为较小与较大的相同的两个子样本,每个子样样本容量均为子样样本容量均为(n-c)/2对每个子样分别进行对每个子样分别进行OLS回归,并计算各自的残差回归,并计算各自的残差平方和平方和 分别用分别用RSS1与与RSS2表示解释变量较小与较大的残差表示解释变量较小与较大的残差平方和平方和(自由度均为自由度均为(n-c)/2-k);本讲稿第二十三页,共一百五十六页 给定显著性水平给定显著性水平,确定临界值,确定临界值F(v1,v2),若若F F(v1,v2),则拒绝同方差性假设,则拒绝同方差性假设,表明表明存存在异方差在异方差。在同方差性假定下,选择如下满足在同方差性假定下,选择如下满足F分布的分布的统计量如果检验递增方差统计量如果检验递增方差 F=F(k,k )如果检验递减方差如果检验递减方差 F=F(k,k )本讲稿第二十四页,共一百五十六页(三)戈里瑟(三)戈里瑟(Gleiser)检验检验 基本思想基本思想:尝试建立尝试建立|ei|关于解释变量关于解释变量X的各种幂次方程:如:的各种幂次方程:如:|ei|=0+1Xi+vi|ei|=0+1Xi-1+vi 等等等等选择关于变量选择关于变量X的不同的函数形式,对方程进行估计并进行的不同的函数形式,对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在异方差性。则说明原模型存在异方差性。本讲稿第二十五页,共一百五十六页(四)(四)Spearman等级(秩)相关检验等级(秩)相关检验 这是一种非参数检验。方法为:这是一种非参数检验。方法为:1.利用最小二乘法对模型进行回归,计算残差利用最小二乘法对模型进行回归,计算残差 ei及其绝对值及其绝对值|ei|;2.给出给出X的每个的每个Xi的位次和的位次和|ei|的位次;的位次;3.计算每个样本点的计算每个样本点的Xi的位次和的位次和|ei|的位次的差的位次的差 di 4.计算计算Spearman等级(秩)相关系数:等级(秩)相关系数:本讲稿第二十六页,共一百五十六页5.对对Spearman等级(秩)相关系数进行显著性等级(秩)相关系数进行显著性检验。检验统计量为检验。检验统计量为 上述统计量服从自由度为(上述统计量服从自由度为(n2)的)的t分布。分布。对应对应 给定显著性水平的临界值给定显著性水平的临界值 ,若,若t ,则认为不存在异方差,若,则认为不存在异方差,若t ,则认为存在异方差。,则认为存在异方差。本讲稿第二十七页,共一百五十六页(五五).).怀特(怀特(White)检验)检验 怀特检验不需要排序,且适合任何形式的异方怀特检验不需要排序,且适合任何形式的异方差。差。怀特检验的基本思想与步骤怀特检验的基本思想与步骤(以二元为例):(以二元为例):然后做如下辅助回归然后做如下辅助回归本讲稿第二十八页,共一百五十六页 可以证明,在同方差假设下:可以证明,在同方差假设下:(*)R2为为(*)的可决系数,的可决系数,h为为(*)式解释变量的个数,式解释变量的个数,表示渐近服从某分布。表示渐近服从某分布。做如下辅助回归做如下辅助回归本讲稿第二十九页,共一百五十六页注意:注意:辅助回归仍是检验辅助回归仍是检验 与解释变量可能的与解释变量可能的组合的显著性,因此,辅助回归方程中还可引入组合的显著性,因此,辅助回归方程中还可引入解释变量的更高次方。解释变量的更高次方。如如果果存存在在异异方方差差性性,则则表表明明确确与与解解释释变变量量的的某某种种组组合合有有显显著著的的相相关关性性,这这时时往往往往显显示示出出有有较较高的可决系数高的可决系数以及以及某一参数的某一参数的t检验值较大检验值较大。当当然然,在在多多元元回回归归中中,由由于于辅辅助助回回归归方方程程中中可可能能有有太太多多解解释释变变量量,从从而而使使自自由由度度减减少少,有有时时可去掉交叉项。可去掉交叉项。本讲稿第三十页,共一百五十六页四、异方差的消除方法异方差的消除方法 异方差消除的异方差消除的基本思路基本思路是将原模型加以是将原模型加以“变换变换”,使,使得得“变换变换”后的模型具有同方差性。但是变换的形式与后的模型具有同方差性。但是变换的形式与每个随机项方差的真实值是已知还是未知有关。每个随机项方差的真实值是已知还是未知有关。(一)随机项方差一)随机项方差i2已知已知 当当i2已知或者可以估计出来的情况,可利用广已知或者可以估计出来的情况,可利用广义的最小二乘法。下面介绍广义最小二乘法的另义的最小二乘法。下面介绍广义最小二乘法的另一种情形一种情形:加权最小二乘法加权最小二乘法(Weighted Least Squares,WLS)本讲稿第三十一页,共一百五十六页乘以模型的两端,得乘以模型的两端,得以一元线性回归模型为例,变换的方法是用以一元线性回归模型为例,变换的方法是用 令令把它称为把它称为变换后的随机项变换后的随机项.因为因为而而 所以所以本讲稿第三十二页,共一百五十六页由此可得由此可得 所以所以中随机项中随机项 满足了同方差性的假定。满足了同方差性的假定。故可以用常规的故可以用常规的对其进行估计对其进行估计.本讲稿第三十三页,共一百五十六页 加权最小二乘法的基本思想:加权最小二乘法的基本思想:加权最小二乘法加权最小二乘法是对原模型加权,实质是用方差是对原模型加权,实质是用方差i2的平方根的平方根i对原模型进行变换。使之变成一个新的不对原模型进行变换。使之变成一个新的不存在异方差性的模型,然后采用存在异方差性的模型,然后采用OLS估计其参数。估计其参数。本讲稿第三十八页,共一百五十六页注意注意:加权最小二乘法的思路很简单,但在具体实践中有加权最小二乘法的思路很简单,但在具体实践中有关随机项方差的信息极少,我们很难找出真实的关随机项方差的信息极少,我们很难找出真实的随机项方差随机项方差i2。因此加权最小二乘法仅是。因此加权最小二乘法仅是理论上理论上的存在的存在,实际上往往很难使用它。所以,当,实际上往往很难使用它。所以,当i2未知或未知或者利用已知观测数据无法估计的情况下,必须寻者利用已知观测数据无法估计的情况下,必须寻求其它的方法。求其它的方法。(二)随机项方差未知(二)随机项方差未知从异方差的意义看,异方差就是随机项在解释变量从异方差的意义看,异方差就是随机项在解释变量取不同数值时方差不同。这就意味着异方差取不同数值时方差不同。这就意味着异方差i2是解是解释变量释变量x的函数,这种函数形式我们可假设出来的函数,这种函数形式我们可假设出来。本讲稿第三十九页,共一百五十六页 例如例如,如果只与一个解释变量有关,可假设,如果只与一个解释变量有关,可假设可以用去除该模型,得可以用去除该模型,得本讲稿第四十页,共一百五十六页新模型中,存在新模型中,存在 即满足同方差性即满足同方差性,可用,可用OLS法估计。法估计。本讲稿第四十一页,共一百五十六页若与若与m(1mk)个解释变量有关,则异方差形式个解释变量有关,则异方差形式可写作可写作本讲稿第四十二页,共一百五十六页以遍除原模型,得:以遍除原模型,得:记记本讲稿第四十三页,共一百五十六页可以对转换后的模型可以对转换后的模型OLS应用进行参数估计。应用进行参数估计。这说明转换后的模型具有了同方差性。这说明转换后的模型具有了同方差性。本讲稿第四十四页,共一百五十六页如果给定的模型为如果给定的模型为:假定假定1:此时用此时用X去乘以原模型去乘以原模型,可得可得(其中其中,)则有则有:这样转换后的模型具有同方差性这样转换后的模型具有同方差性。本讲稿第四十五页,共一百五十六页对转换后的模型应用对转换后的模型应用OLS,OLS,即可求得即可求得 对的对的回归方程回归方程:将上式两边同乘,可得原模型的回归方程为:将上式两边同乘,可得原模型的回归方程为:本讲稿第四十六页,共一百五十六页假定假定2此时用此时用 去除原模型去除原模型,可得可得 其中其中则有则有:对转换后的模型即可应用普通最小二乘法进行参数对转换后的模型即可应用普通最小二乘法进行参数估计可得:估计可得:本讲稿第四十七页,共一百五十六页所以原模型的回归方程为:所以原模型的回归方程为:本讲稿第四十八页,共一百五十六页注意:注意:(1).实际应用实际应用WLS时,经常用自变量的幂函数的倒数时,经常用自变量的幂函数的倒数 形式形式 作为权数对原模型进行加权,作为权数对原模型进行加权,但但m究竟取何值合适,需要通过估计。究竟取何值合适,需要通过估计。(2).如果异方差是由省略的解释变量造成的,最好的解如果异方差是由省略的解释变量造成的,最好的解 决方决方 法是在模型中加入省略的解释变量。法是在模型中加入省略的解释变量。(3).对于多元线性回归模型,异方差问题同样存在。用对于多元线性回归模型,异方差问题同样存在。用 哪一个自变量构造权数呢?通行的做法是:首先哪一个自变量构造权数呢?通行的做法是:首先 用用 OLS估计估计 样本回归方程,计算出各样本点的绝对样本回归方程,计算出各样本点的绝对 残差;然后分别计算每一个自变量与绝对残差序列的残差;然后分别计算每一个自变量与绝对残差序列的 等级相关系数;选取等级相关系数;选取 Spearman等级相关系数大的自变等级相关系数大的自变 量构造权数。权数的构造量构造权数。权数的构造 方法同一元线性回归模型。方法同一元线性回归模型。本讲稿第四十九页,共一百五十六页五、案例五、案例储蓄与收入模型储蓄与收入模型 例例 表表(见见Eviews)是储蓄与收入的样本观测值,试进是储蓄与收入的样本观测值,试进行异方差性分析行异方差性分析,并建立储蓄并建立储蓄y关于收入关于收入x的线性回归模的线性回归模型。型。本讲稿第五十页,共一百五十六页(1)根据表中数据,做出)根据表中数据,做出X与与Y的散点图。方法为:打开的散点图。方法为:打开Eviews工作文件。点击工作文件。点击quick,选选Graph,点击,点击ok;在对话框在对话框中从中从Graph Type中选中选scatterDiagram,点击,点击“ok”。散。散点图如下:点图如下:(一)异方差检验(一)异方差检验本讲稿第五十一页,共一百五十六页(2)根据表中数据,做出残差图)根据表中数据,做出残差图运行运行Eviews,进行进行OLS估计;点击估计;点击Resids,可得拟合,可得拟合与残差图,选与残差图,选View中的中的Actual,Fitted,Residual Actual,Fitted,Residual Table功能就得到可用来进行功能就得到可用来进行残差分析表;利用该结果画出残差分析表;利用该结果画出X与残差平方的散点与残差平方的散点图输出结果整理如下:图输出结果整理如下:本讲稿第五十二页,共一百五十六页 x与残差平方的散点图与残差平方的散点图 从上面两图可以看出,在较高的收入水平上储蓄的离散程从上面两图可以看出,在较高的收入水平上储蓄的离散程度增大,表明随机项可能存在度增大,表明随机项可能存在递增型递增型的异方差。的异方差。本讲稿第五十三页,共一百五十六页进一步的统计检验进一步的统计检验 G-Q检验检验 将原始数据按将原始数据按排成升序,去掉中间的排成升序,去掉中间的个观测点数个观测点数据,得两个容量为据,得两个容量为1的子样本。的子样本。对两个子样本分别作对两个子样本分别作OLS回归,求各自的残差平方和回归,求各自的残差平方和RSS1和和RSS2:子样本子样本1:(189.4)(0.015)R2=0.787 RSS1=144771.5子样本子样本2:(709.8)(0.022)R2=0.152 RSS2=769889.2本讲稿第五十四页,共一百五十六页计算计算F F统计量:统计量:F=RSS2/RSS1=769889.2/144771.5=5.3 查表查表 给定给定=5%,查得临界值,查得临界值 F0.05(9,9)=3.18判断判断 F F0.05(9,9)否否定定两两组组子子样样方方差差相相同同的的假假设设,从从而而该该总总体体随随机机项项存在递增异方差性。存在递增异方差性。本讲稿第五十五页,共一百五十六页 (二二)异方差的处理异方差的处理1.最优权数的确定最优权数的确定以上检验证实了以上检验证实了y的异方差性的存在。所以需要用的异方差性的存在。所以需要用加权最小二乘法估计参数。使用加权最小二乘法估计参数。使用WLS首先需要估首先需要估计权数。我们采用自变量幂函数的倒数权数的形式:计权数。我们采用自变量幂函数的倒数权数的形式:利用利用SPSS,可以求得幂的最佳取值。打开,可以求得幂的最佳取值。打开SPSS,依次点击,依次点击AnalyzeRegressionWeight Estimate,本例通过运行,本例通过运行SPSS得到的取值为得到的取值为2,即,即权数为:权数为:本讲稿第五十六页,共一百五十六页相当于对原总体回归模型变换为:相当于对原总体回归模型变换为:从而消除异方差性的影响。从而消除异方差性的影响。其拟合优度检验、其拟合优度检验、F检验、检验、t检验均高度显著。加权回归的检验均高度显著。加权回归的结果比不加权的回归结果有很大的改进结果比不加权的回归结果有很大的改进 (0.004484)(74.165566)(19.815)(9.985)R2=0.93122 F=392.644532.加权回归加权回归从输出结果看,还原后的加权最小二乘法的估计结果为:从输出结果看,还原后的加权最小二乘法的估计结果为:本讲稿第五十七页,共一百五十六页一、一、自相关的涵义自相关的涵义二、二、自相关产生的后果自相关产生的后果三、自相关检验三、自相关检验四、自相关模型的经济计量方法四、自相关模型的经济计量方法五、案例五、案例第三节第三节 自相关自相关 本讲稿第五十八页,共一百五十六页 一、自相关的涵义一、自相关的涵义 如果对于不同的样本点,随机误差项之间不再是不相关的,如果对于不同的样本点,随机误差项之间不再是不相关的,而是存在某种相关性,则认为出现了而是存在某种相关性,则认为出现了序列相关性序列相关性或称或称存在存在自相关自相关。对于模型对于模型 Yi=0+1X1i+2X2i+kXki+i i=1,2,n随机项互不相关的基本假设表现为随机项互不相关的基本假设表现为 Cov(i,j)=0 i j,i,j=1,2,n本讲稿第五十九页,共一百五十六页或或本讲稿第六十页,共一百五十六页称为称为一阶序列相关一阶序列相关,或一阶,或一阶自回归自回归.其其 中中:被被 称称 为为自自 协协 方方 差差 系系 数数(coefficient of autocovariance)或或 一一 阶阶 自自 回回 归归 系系 数数(first-order coefficient of autocorrelation)i是满足以下标准的是满足以下标准的OLS假定的随机干扰项:假定的随机干扰项:如果仅存在如果仅存在 E(i i+1)0 i=1,2,n 一阶自回归一阶自回归往往可写成如下形式往往可写成如下形式:i=i-1+i -1 1 由于序列相关性经常出现在以时间序列为样本的模型中,因此,本由于序列相关性经常出现在以时间序列为样本的模型中,因此,本节将用下标节将用下标t代表代表i。本讲稿第六十一页,共一百五十六页 自相关产生的原因自相关产生的原因 (一)被解释变量的自相关(一)被解释变量的自相关 (二)模型省略了自相关的解释变量(二)模型省略了自相关的解释变量 (三)随机项本身存在自相关(三)随机项本身存在自相关(四)回归模型的数学形式不正确(四)回归模型的数学形式不正确(五五)经济变量的惯性作用经济变量的惯性作用.本讲稿第六十二页,共一百五十六页 计量经济学模型一旦出现序列相关性,如果仍采计量经济学模型一旦出现序列相关性,如果仍采用用OLS法估计模型参数,会产生下列不良后果:法估计模型参数,会产生下列不良后果:二、自相关产生的后果二、自相关产生的后果 1 1、参数估计量非有效、参数估计量非有效 因为,在有效性证明中利用了因为,在有效性证明中利用了 E(UUT)=2I 即同方差性和不相关性的假定条件。即同方差性和不相关性的假定条件。而且,在大样本情况下,参数估计量虽然具有一致而且,在大样本情况下,参数估计量虽然具有一致性,但仍然不具有渐近有效性。性,但仍然不具有渐近有效性。本讲稿第六十三页,共一百五十六页 2、变量的显著性检验失去意义、变量的显著性检验失去意义 在变量的显著性检验中,统计量是建立在参数方在变量的显著性检验中,统计量是建立在参数方差正确估计基础之上的,这只有当随机误差项具有同差正确估计基础之上的,这只有当随机误差项具有同方差性和互相独立性时才能成立。方差性和互相独立性时才能成立。其他检验也是如此。其他检验也是如此。本讲稿第六十四页,共一百五十六页3、模型的预测失效模型的预测失效区间预测与参数估计量的方差有关,在区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准方差有偏误的情况下,使得预测估计不准确,预测精度降低。确,预测精度降低。所以,所以,当模型出现序列相关性时,它的当模型出现序列相关性时,它的预测功能失效。预测功能失效。本讲稿第六十五页,共一百五十六页 然然后后,通通过过分分析析这这些些“近近似似估估计计量量”之之间间的的相相关关性性,以以判断随机误差项是否具有序列相关性。判断随机误差项是否具有序列相关性。序列相关性序列相关性检验方法有多种,但基本思路相同:检验方法有多种,但基本思路相同:基本思路基本思路:三、自相关的检验三、自相关的检验本讲稿第六十六页,共一百五十六页 (一)图示法(一)图示法本讲稿第六十七页,共一百五十六页(二)杜宾(二)杜宾-瓦森(瓦森(Durbin-WatsonDurbin-Watson)检验法)检验法 D-W检检验验是是杜杜宾宾(J.Durbin)和和瓦瓦森森(G.S.(G.S.Watson)Watson)于于19511951年年提提出出的的一一种种检检验验序序列列自自相相关关的的方方法法,该该方方法法的的假假定条件是定条件是:(1 1)解释变量)解释变量X非随机;非随机;(2)随机误差项)随机误差项 i为一阶自回归形式:为一阶自回归形式:i=i-1+i(3)回回归归模模型型中中不不应应含含有有滞滞后后因因 变变量量作作为为解解释释变变量量,即不应出现下列形式:即不应出现下列形式:Yi=0+1X1i+kXki+Yi-1+i(4)大样本)大样本,回归含有截距项回归含有截距项本讲稿第六十八页,共一百五十六页 该统计量该统计量的分布与出现在给定样本中的的分布与出现在给定样本中的X值有复杂的关值有复杂的关系,因此其系,因此其精确的分布很难得到精确的分布很难得到。但是但是,他们他们成功地导出了临界值的下限成功地导出了临界值的下限dL和上限和上限dU,且这些上下限只与样本的容量,且这些上下限只与样本的容量n和解释变量和解释变量的个数的个数k有关,而与解释变量有关,而与解释变量X的取值无关。的取值无关。杜宾和瓦森针对原杜宾和瓦森针对原假设:假设:H0:=0,即不存在一阶即不存在一阶自回归,构如下造统计量:自回归,构如下造统计量:D.W.统计量统计量:d=本讲稿第六十九页,共一百五十六页 当当D.W.值在值在2左右时,模型不存在一阶自相关。左右时,模型不存在一阶自相关。证明:证明:展开D.W.统计量:(*)本讲稿第七十页,共一百五十六页如果存在如果存在完全一阶正相关完全一阶正相关,即,即=1,则,则 D.W.0 完全一阶负相关完全一阶负相关,即,即=-1,则则 D.W.4 完全不相关完全不相关,即即=0,则,则 D.W.2这里,为一阶自回归模型i=i-1+i 的参数估计。本讲稿第七十一页,共一百五十六页 D.W检验步骤检验步骤:(1)计算)计算DW值值(2)给定)给定,由,由n和和k的大小查的大小查DW分布表,得临界值分布表,得临界值dL和和dU(3)比较、判断)比较、判断 若若 0D.W.dL 存在正自相关存在正自相关 dLD.W.dU 不能确定不能确定 dU D.W.4dU 无自相关无自相关 4dU D.W.4 dL 不能确定不能确定 4dL D.W.4 存在负自相关存在负自相关 0dLdU24-dU4-dL4正相关不能确定无自相关不能确定负相关本讲稿第七十二页,共一百五十六页 如果模型被检验证明存在序列相关性,则需要分析原因如果模型被检验证明存在序列相关性,则需要分析原因,若是若是由省略某些解释变量造成的由省略某些解释变量造成的,则应找出省略的变量则应找出省略的变量,将它包含在模将它包含在模型中型中;如果是由于错误地确定模型的数学形式引起如果是由于错误地确定模型的数学形式引起,则应该修正其数则应该修正其数学形式学形式.排除以上原因后仍然存在的自相关可以发展新的方法估计模型。排除以上原因后仍然存在的自相关可以发展新的方法估计模型。最常用的方法是最常用的方法是广义最小二乘法广义最小二乘法(GLS:Generalized least squares)和)和广义差分法广义差分法(Generalized Difference)。四、自相关的经济计量方法四、自相关的经济计量方法本讲稿第七十三页,共一百五十六页 1 1、广义差分法、广义差分法 广广义义差差分分法法是是将将原原模模型型变变换换为为满满足足OLS法法的的差分模型,再进行差分模型,再进行OLS估计。估计。如果原模型为如果原模型为可以将原模型变换为可以将原模型变换为:令原模型可变为原模型可变为:其中本讲稿第七十七页,共一百五十六页这种变换叫这种变换叫广义差分变换广义差分变换。变换后的模型称为。变换后的模型称为广义差广义差分模型。分模型。其中将原回归模型进行广义差分变换得广义差分模型,对将原回归模型进行广义差分变换得广义差分模型,对广义差分模型应用普通最小二乘法,这种方法称为广义差分模型应用普通最小二乘法,这种方法称为广广义差分法义差分法。可取可取补全数据补全数据本讲稿第七十八页,共一百五十六页时,上式变为:即即其中其中该种变换叫做该种变换叫做一阶差分变换一阶差分变换,变换后的模型,变换后的模型叫做叫做一阶一阶差分模型差分模型。这种模型的一个重要特征是没有常数项。这种模型的一个重要特征是没有常数项。易得:易得:本讲稿第七十九页,共一百五十六页 随机误差项相关系数的估计随机误差项相关系数的估计应应用用广广义义差差分分法法,必必须须已已知知随随机机误误差差项项的的相相关关系系数数。实实际际上上,人人们们并并不不知知道道它它们们的的具具体体数数值值,所所以以必须首先对它们进行估计。必须首先对它们进行估计。常用的估计方法有:常用的估计方法有:科克伦科克伦-奥科特奥科特(Cochrane-Orcutt)迭代法迭代法。杜宾杜宾(durbin)两步法两步法本讲稿第八十页,共一百五十六页2、杜宾杜宾(durbin)两步法两步法该方法仍是先估计该方法仍是先估计,再对差分模型进行估计,再对差分模型进行估计 第一步第一步,变换差分模型为下列形式,变换差分模型为下列形式进行OLS估计,得Yj(j=t-1)前的系数估计值令则本讲稿第八十一页,共一百五十六页(2).用估计值对原模型进行差分变换对差分模型应用OLS方法,可得、的估计值、从而还可以用其它的方法求的估计值,如:存在两个问题。其一,所得参数估计值的精确度依赖于存在两个问题。其一,所得参数估计值的精确度依赖于的精确度;其二,差分模型的随机项有可能仍存在自的精确度;其二,差分模型的随机项有可能仍存在自相关。相关。本讲稿第八十二页,共一百五十六页、科克伦科克伦-奥科特迭代法奥科特迭代法。以一元线性模型为例:首先首先,采用OLS法估计原模型Yi=0+1Xi+i得到的的“近似估计值”,并以之作为观测值使用OLS法估计下式求得的估计值,记作:利用进行广义差分变换得广义差分模型对原模型本讲稿第八十三页,共一百五十六页其中其中对模型应用普通最小二乘法进行估计,得到对模型应用普通最小二乘法进行估计,得到 参数的估参数的估计值并对模型中的随机项计值并对模型中的随机项 是否存在自相关进行检验。是否存在自相关进行检