第8章多元回归分析:推断问题.ppt
第八章第八章 多元回归分析:推断问题多元回归分析:推断问题第八章第八章 多元回归分析:推断问题多元回归分析:推断问题 学习目的学习目的 理解多元线性回归模型的区间估计和假设检验。多元回归中的假设检验多元回归中的假设检验检验个别偏回归系数的假设检验个别偏回归系数的假设检验样本回归的总显著性检验样本回归的总显著性检验线性等式约束条件检验线性等式约束条件邹至庄检验邹至庄检验第八章第八章 多元回归分析:推断问题多元回归分析:推断问题第一节第一节 多元回归的假设检验多元回归的假设检验 一、正态性假定一、正态性假定假定假定ui 遵循均遵循均值为值为零、方差零、方差2 为常数的正常数的正态分布。分布。前面前面证证明明过过,偏回,偏回归归系数的系数的OLS估估计计量,是最量,是最优线优线性无偏估性无偏估计计量。量。此外,估此外,估计量量 、本身也是正本身也是正态分布的,期均分布的,期均值等于等于1、2、3 。方差由第方差由第7章章给出。在出。在标准差的准差的计算中,算中,2 由它的无偏估由它的无偏估计 代替代替时知:知:均遵循自由度均遵循自由度为n-3的的t分布。因分布。因为在在计算算 和和 之前,我之前,我们要先估要先估计三个偏回三个偏回归系数,系数,从而从而给残差平方和残差平方和RSS的的计算加上了三个算加上了三个约束。束。二、多元回归中的假设检验:总评二、多元回归中的假设检验:总评一旦我一旦我们们走出走出简单简单的双的双变变量量线线性回性回归归模型的范模型的范围围,假,假设检验设检验就会以就会以多种有趣的形式出多种有趣的形式出现现:1.检验检验关于个关于个别别偏回偏回归归系数的假系数的假设设。2.检验检验所估所估计计的多元回的多元回归归模型的模型的总显总显著性,即判明是否全部偏斜著性,即判明是否全部偏斜率系数同率系数同时为时为零。零。3.检验检验两个或多个系数是否相等。两个或多个系数是否相等。4.检验检验偏回偏回归归系数是否系数是否满满足某种足某种约约束条件。束条件。5.检验检验所估所估计计的回的回归归模型在模型在时间时间上或不同横截面上或不同横截面单单元上的元上的稳稳定性。定性。6.检验检验回回归归模型的函数形式。模型的函数形式。第二节第二节 检验个别偏回归系数的假设检验个别偏回归系数的假设引用假定引用假定 ,我,我们们可用可用t检验统计检验统计量量对对任一个任一个别别的偏回的偏回归归系数的假系数的假设进设进行行检验检验。考。考虑虑儿童死亡率的例子:儿童死亡率的例子:例例8.1 8.1 修正儿童死亡率例子修正儿童死亡率例子在第在第7章,我章,我们们用一个用一个64个国家构成的个国家构成的样样本将儿童死亡率本将儿童死亡率对对人均人均GNP和和妇妇女女识识字率字率进进行回行回归归。回。回归结归结果如下:果如下:第一行括号是估第一行括号是估计标计标准差,第二行准差,第二行为为假假设设相关相关总总体系数体系数为为零下的零下的t值值,第三行第三行为为估估计计的的p值值。接下来我接下来我们们要要检验检验:PGNP和和FLR的系数是否是的系数是否是统计显统计显著的呢?著的呢?假假设设:虚虚拟拟假假设设表明,保持表明,保持X3 不不变变,X2 对对Y无影响。利用无影响。利用8.1节给节给出的出的t检验检验:本例中自由度本例中自由度为为61,查查表最接近的自由度是表最接近的自由度是60。假。假设显设显著性水平著性水平为5%,则双尾双尾检验的的 =2.0(本例中(本例中对立建立建设是双是双侧的。)的。)2.81872.0,拒,拒绝PGNP对儿童死亡率没有影响的虚儿童死亡率没有影响的虚拟假假设。更明确的更明确的讲,保持,保持妇女女识字率不字率不变,人均,人均GNP对儿童死亡率具有儿童死亡率具有显著的著的负面影响,面影响,这与先与先验预期完全一致。如期完全一致。如图。接受域临界域实际实际上,我上,我们们不必假定一个特定的不必假定一个特定的值值来来进进行假行假设检验设检验,仅仅使用使用p值值即可。即可。本例中的本例中的p值值是是0.0065,其解,其解释为释为:如果虚:如果虚拟拟假假设设正确,正确,则则得到一个得到一个大于等于大于等于2.8187的的t值值的概率的概率仅为仅为0.65%,这这个概率比人个概率比人为选为选定的定的=5%小得多。小得多。既然推既然推测测儿童死亡率与人均儿童死亡率与人均GNP负负相关,那我相关,那我们们就就应该应该使用使用单单位位检检验验。即虚。即虚拟拟和和对对立假立假设应该设应该是:是:单单位位检验检验的的 =1.671,拒,拒绝绝虚虚拟拟假假设设。假假设检验设检验和置信区和置信区间间估估计计之之间间的关系的关系2 的的95%置信区置信区间间是:是:具体到本例具体到本例变为变为:即是:即是:这样这样,如果,如果选选取了大小同取了大小同为为64的的100个个样样本并构造像(本并构造像(8.4.2)这样这样的的100个置信区个置信区间间,则则我我们预们预期其中的期其中的95个包含着真个包含着真实总实总体参数体参数2。由。由于虚于虚拟拟假假设设的零的零值值不落在(不落在(8.4.2)区)区间间内,故以内,故以95%的置信系数拒的置信系数拒绝绝虚虚拟拟假假设设2=0。qtdist(p,v):自由度自由度为为v的的t统计统计量的量的p显显著性水平(双尾)。著性水平(双尾)。scalar h1=eq01.coefs(2)+qtdist(0.975,61)*stderrs(2)scalar h2=eq01.coefs(2)-qtdist(0.975,61)*stderrs(2)注意:注意:t检验检验是基于是基于误误差差项项ui 服从正服从正态态分布的假定。我分布的假定。我们们能能够观测够观测到到误误差差项项的代理的代理变变量量 ,即残差。,即残差。对对儿童死亡率一例而言,残差直方儿童死亡率一例而言,残差直方图为图为:第三节第三节 检验样本回归的总显著性检验样本回归的总显著性前面两前面两节讨论节讨论的是个的是个别别的偏回的偏回归归系数系数为为零假零假设设下的下的显显著性著性问题问题,现现考考虑虑如下假如下假设设:该该虚虚拟拟假假设设是关于是关于2 和和3 同同时时等于零的一个等于零的一个联联合假合假设设(joint hypothesis)。对这样对这样一个假一个假设设的的检验检验被称作被称作对对所估回所估回归线归线的的总总显显著性著性检验检验(overall significance)。能否用上能否用上节节逐一逐一检验检验 和和 的的显显著性的方法来著性的方法来检验联检验联合假合假设设呢?呢?答案是否定的。答案是否定的。我我们隐们隐含的假定是每一个含的假定是每一个显显著性著性检验检验都是根据一个不同的都是根据一个不同的样样本本进进行的。行的。如果用同一如果用同一样样本数据去本数据去检验联检验联合假合假设设,和和 有可能相关,有可能相关,则违则违背背了了检验检验方法的基本假定。方法的基本假定。怎怎样检验联样检验联立的虚立的虚拟拟假假设设 呢?呢?一、检验多元回归的总显著性的方差分析法:一、检验多元回归的总显著性的方差分析法:F检验检验TSS有有n-1个自由度,个自由度,RSS有有n-3个自由度,个自由度,ESS是是TSS和和RSS的函数,有的函数,有2个自由度。个自由度。则则在在ui 的正的正态态分布假定下以及在虚分布假定下以及在虚拟拟假假设设 下,下,变变量量遵循自由度遵循自由度为为2和和n-3的的F分布。分布。可以可以证证明,在明,在 的假定下:的假定下:再加一个假定再加一个假定 ,可以,可以证证明:明:因此,如果虚因此,如果虚拟拟假假设为设为真,真,则则(8.5.4)和()和(8.5.5)都将)都将对对真真实实2 给出同出同样估估计。如果虚。如果虚拟假假设错误,即,即X2 和和X3 确确实实影响影响Y,则则不能在不能在这这两式两式划等号。划等号。(8.5.3)(8.5.4)(8.5.5)如果从(如果从(8.5.3)算出的)算出的F值值大于大于2%显显著水平的著水平的F表中的表中的临临界界F值值,我,我们们就拒就拒绝绝H0;否;否则则不拒不拒绝绝。另一种方法是,如果所。另一种方法是,如果所测测的的p值值足足够够低,可拒低,可拒绝绝H0.得到一个大于等于得到一个大于等于73.8325的的F值值的的p值值几乎几乎为为0,从而拒,从而拒绝绝虚虚拟拟假假设设。如果使用如果使用惯惯常的常的5%的的显显著性水平,分子自由度著性水平,分子自由度为为2和分母自由度和分母自由度为为60(实际为实际为61)的)的临临界界F值约为值约为3.15。若用。若用1%的的显显著性水平,著性水平,临临界界F值约值约为为4.98.显显然,然,观观察到察到约为约为74的的F值值比比临临界界值值大得多,大得多,则则拒拒绝绝PGNP和和FLR同同时时对对儿童死亡率都没有影响的假儿童死亡率都没有影响的假设设。二、检验多元回归的总显著性:二、检验多元回归的总显著性:F检验检验决策规则决策规则给给定定k变变量回量回归归模型:模型:假假设检验设检验:相相对对于于H1:非全部斜率系数同:非全部斜率系数同时为时为零。零。计计算:算:如果如果 ,则则拒拒绝绝H0;否;否则则不拒不拒绝绝它,其中它,其中 是是显著水平、(著水平、(k-1)个分子自由度和)个分子自由度和(n-k)个分母自由度的个分母自由度的临界界F值。另一种方法,如果另一种方法,如果F的的p值足足够低,即可拒低,即可拒绝H0。三、三、R2和和F之间的一个重要关系式之间的一个重要关系式假定干假定干扰项扰项ui为为正正态态分布,并且虚分布,并且虚拟拟假假设设 成立,成立,对对于三于三变变量情形曾看到:量情形曾看到:推广到推广到k变变量情形,如果假定干量情形,如果假定干扰项扰项是正是正态态分布的,且虚分布的,且虚拟拟假假设设:则则有:有:遵循遵循k-1和和n-k个自由度的个自由度的F分布。分布。待估参数的待估参数的总总个数个数为为k,其中之一,其中之一为为截距截距项项。做如下演算:做如下演算:其中其中 。该该式可以看出,式可以看出,F和和R2是同向是同向变变化的。化的。当当R2=0时时,F=0;当当R2 越大,越大,F值值也越大。也越大。当当R2=1,F变为变为无限大。无限大。因此,因此,F检验检验既是所估回既是所估回归归的的总显总显著著性的度量,也是性的度量,也是R2 的一个的一个显显著性著性检验检验。例例四、检验用四、检验用R2 表示的多元回归表示的多元回归 的总显著性的总显著性决策规则决策规则给给定定k变变量回量回归归模型:模型:假假设检验设检验:相相对对于于H1:非全部斜率系数同:非全部斜率系数同时为时为零。零。计计算:算:如果如果 ,则则拒拒绝绝H0;否;否则则不拒不拒绝绝它,其中它,其中 是是显著水平、(著水平、(k-1)个分子自由度和)个分子自由度和(n-k)个分母自由度的个分母自由度的临界界F值。另一种方法,如果另一种方法,如果F的的p值足足够小,即可拒小,即可拒绝H0。例例 119119个发展中国家个发展中国家1960-19851960-1985年的年的GDPGDP增长率与相对增长率与相对人均人均GDPGDP 该该模型只解模型只解释释了了GDPG变动变动的的53%。但。但查查F表可得,在表可得,在5%的的显显著性著性水平上是水平上是显显著的,著的,p值实际值实际上是上是0.0425。因此,尽管。因此,尽管R2只有只有0.053,我我们们仍能拒仍能拒绝这绝这两个回两个回归归元元对对回回归归子没有影响的虚子没有影响的虚拟拟假假设设。五、解释变量的五、解释变量的“增量增量”或或“边际边际”贡献贡献第第7章章说过说过,我,我们们一般不能将一般不能将R2 值值在各个回在各个回归归元之元之间间分配。在儿童死分配。在儿童死亡率的例子中,我亡率的例子中,我们发现们发现R2 为为0.7077,但由于,但由于这这两个回两个回归归元在元在样样本中本中可能相关,我可能相关,我们们不知道哪些属于不知道哪些属于PGNP的功的功劳劳,哪些属于,哪些属于妇妇女女识识字率字率的功的功劳劳。利用。利用协协方差分析方差分析的方法,可以有更深入的了解。的方法,可以有更深入的了解。首先,将儿童死亡率首先,将儿童死亡率对对PGNP回回归归并并评评价其价其显显著性,然后在模型中增著性,然后在模型中增加加FLR,以判明它是否有任何,以判明它是否有任何贡贡献。献。所谓贡献,是指增加一个变量到模型中来,是否相对于所谓贡献,是指增加一个变量到模型中来,是否相对于RSSRSS“显著地显著地”增加了增加了ESSESS。把这一贡献称作一个解释变量。把这一贡献称作一个解释变量的的增量增量(incremental)(incremental)或边际或边际(marginal)(marginal)贡献。贡献。假假设设先做儿童死亡率先做儿童死亡率对对PGNP的回的回归归,得到如下,得到如下结结果:果:由于由于p=0.0008,所以,所以这这个个值值是高度是高度显显著的。我著的。我们们拒拒绝绝PGNP对对CM没没有影响的假有影响的假设设。这时这时把把X3引入到模型中来,需回答:引入到模型中来,需回答:(1)知道)知道PGNP在模型中和在模型中和CM有有显显著关系,著关系,FLR的的边际贡边际贡献献为为何?何?(2)FLR的增量的增量贡贡献在献在统计统计上上显显著著吗吗?(3)根据什么准)根据什么准则则把把变变量加量加进进模型?模型?为为了了评评估在扣除估在扣除X2的的贡贡献后献后X3的增量的增量贡贡献,我献,我们们构造:构造:新回归元个数新模型中的参数个数例子例子Q2Q4这这个个F值值是高度是高度显显著的,表明模型中增加了著的,表明模型中增加了FLR明明显显提高了提高了ESS并因并因此提高此提高R2值值。F比率比率还还可可仅仅用用R2值值重新表达出来:重新表达出来:新回归元个数新模型中的参数个数第四节第四节 受约束的最小二乘法:受约束的最小二乘法:检验线性等式约束条件检验线性等式约束条件经济经济理理论论有有时时会提出某一回会提出某一回归归模型中的系数模型中的系数满满足一些足一些线线性等式性等式约约束条件。考察束条件。考察Cobb-Douglas生生产产函数:函数:对对数形式:数形式:,。Y=产产出,出,X2=劳劳力投入,力投入,X3=资资本投入。本投入。现现在如果是在如果是规规模模报报酬不酬不变变(每一同比例的投入(每一同比例的投入变变化有同比例的化有同比例的产产出出变变化),化),经济经济理理论论将提出:将提出:这这就是就是线线性等式性等式约约束条件束条件。如何判断如何判断约约束条件是否正确?束条件是否正确?(8.7.2)一、一、t检验方法检验方法步步骤骤:1.先不考先不考虑约虑约束条件,按通常方法估束条件,按通常方法估计计,做所,做所谓谓的无的无约约束或无束或无限制的回限制的回归归(unrestricted or unconstrained regression)。2.用用OLS法估法估计计出了出了2 和和3,就可通,就可通过t检验来来检验约束:束:3.如果如果计算的算的t值超超过选定定显著性水平上的著性水平上的临界界t值,则拒拒绝规模模报酬不酬不变的假的假设;否;否则不拒不拒绝。二、二、F检验法:受约束最小二乘法检验法:受约束最小二乘法步步骤骤:1.利用利用 把把Cobb-Douglas生生产产函数写成:函数写成:=产产出出/劳动劳动比率,比率,=资资本本/劳动劳动比率,有重要比率,有重要经济经济意意义义。2.一旦我一旦我们们从(从(8.7.8)计计算出算出3,2 很容易从第一个关系式得出。很容易从第一个关系式得出。(8.7.8)所描述的程序被称)所描述的程序被称为受受约束的最小二乘法束的最小二乘法(restricted least squares,RLS)。(8.7.8)(8.7.7)怎怎样样比比较较无无约约束和受束和受约约束的两个最小二乘回束的两个最小二乘回归归呢?可通呢?可通过过F检验检验达到。达到。令:令:=无无约约束回束回归归(8.7.2)的的RSS =受受约约束回束回归归(8.7.7)的)的RSS m =线线性性约约束个数束个数 k =无无约约束回束回归归中的参数个数中的参数个数 n =观测观测次数次数于是,于是,注意:注意:和和 分分别别得自得自(8.7.2)无无约约束和束和(8.7.7)受受约约束回束回归归的的R2 值值。(8.7.10)表表8.8 墨西哥的真实墨西哥的真实GDP、就业和真实固定资本、就业和真实固定资本年份年份GDP就业就业固定资本固定资本1955114043831018211319561204108529193749195712918787382051921958134705895221513019591399609171225021196015051195692370261961157897952724889719621652869662260661196317849110334275466196419945710981295378196521232311746315715196622697711521337642196724119411540363599196826088112066391847196927749812297422382197029653012955455049197130671213338484677197232903013738520553197335405715924561531197437497714154609825例例8.3 1955-8.3 1955-19741974年墨西哥年墨西哥经济的经济的Cobb-Cobb-DouglasDouglas生产生产函数函数Dependent Variable:LNGDPMethod:Least SquaresDate:02/21/12 Time:16:22Sample:1955 1974Included observations:20VariableCoefficientStd.Errort-StatisticProb.C-1.652420.606198-2.725870.0144LNEMPLOYMENT0.3397320.1856921.8295480.0849LNCAPITAL0.8459970.0933529.0624880R-squared0.99508 Mean dependent var12.22605Adjusted R-squared0.994501 S.D.dependent var0.381497S.E.of regression0.028289 Akaike info criterion-4.15522Sum squared resid0.013604 Schwarz criterion-4.00586Log likelihood44.55221 Hannan-Quinn criter.-4.12606F-statistic1719.231 Durbin-Watson stat0.425667Prob(F-statistic)0如上表所如上表所见见,产产出出/劳动劳动的的弹弹性性约为约为0.34,而,而产产出出/资资本的本的弹弹性性约为约为0.85。两个系数相加两个系数相加则则得到得到1.19,表明考察期内墨西哥正,表明考察期内墨西哥正经历经历着着规规模模报报酬酬递递增的增的阶阶段。是否段。是否显显著异于著异于1?先看先看规规模模报报酬不酬不变变的的约约束,束,给给出如下回出如下回归归:Dependent Variable:LNGDPEMPTMethod:Least SquaresDate:02/21/12 Time:16:33Sample:1955 1974Included observations:20VariableCoefficientStd.Errort-StatisticProb.C-0.494720.121816-4.061180.0007LNCAPITALEMPT1.0153010.03612428.105640R-squared0.977721 Mean dependent var2.92368Adjusted R-squared0.976483 S.D.dependent var0.1982S.E.of regression0.030395 Akaike info criterion-4.05447Sum squared resid0.016629 Schwarz criterion-3.9549Log likelihood42.5447 Hannan-Quinn criter.-4.03503F-statistic789.9271 Durbin-Watson stat0.306521Prob(F-statistic)0注:因为只施加了一个约束,所以注:因为只施加了一个约束,所以m=1;因为我们有;因为我们有20个观测,无约束回归个观测,无约束回归中有中有3个参数,所以个参数,所以n-k=17.此此F值服从自由度为值服从自由度为1和和17的的F分布。查分布。查表容易验证,即使在表容易验证,即使在25%的显著性水平的显著性水平上,这个上,这个F值仍不显著。值仍不显著。结论:墨西哥经济在样本期内可能具有规模报酬不变的特征。结论:墨西哥经济在样本期内可能具有规模报酬不变的特征。资本劳动比资本劳动比提高提高1%,劳,劳动生产率也动生产率也平均上升平均上升1%三、一般的三、一般的F检验法检验法F检验方法的一般策略是:检验方法的一般策略是:1.先有一个较大的模型,如无约束模型。先有一个较大的模型,如无约束模型。2.通过从中删除某些变量,或通过对较大模型的一或多个参数加以某种线通过从中删除某些变量,或通过对较大模型的一或多个参数加以某种线性约束,而有一个较小的受约束或较大的受限制模型。性约束,而有一个较小的受约束或较大的受限制模型。3.分别用无约束和受约束模型去拟合数据,以获得判定系数分别用无约束和受约束模型去拟合数据,以获得判定系数 和和 。4.注意无约束模型的自由度为注意无约束模型的自由度为n-k,而受约束模型自由度为,而受约束模型自由度为m,m为线性约为线性约束个数。束个数。5.按照(按照(8.7.10)计算)计算F,并使用决策规则:如果计算的,并使用决策规则:如果计算的F超过超过 这里这里 是显著性水平为是显著性水平为的的临界界F值,我,我们就拒就拒绝虚虚拟假假设;否否则不拒不拒绝它。它。例例8.4 1960-19828.4 1960-1982年美国子鸡需求年美国子鸡需求考虑以下对子鸡的需求函数:考虑以下对子鸡的需求函数:其中其中Y=每人子每人子鸡鸡消消费费量,量,X2=每人每人实际实际可支配收入,可支配收入,X3=每磅子每磅子鸡实际鸡实际零零售价格,售价格,X4=每磅猪肉每磅猪肉实际实际零售价格,零售价格,X5=每磅牛肉每磅牛肉实际实际零售价格。零售价格。在此模型中在此模型中2,3,4,5 分分别是收入、自价格、交叉价格(猪肉)和是收入、自价格、交叉价格(猪肉)和交叉价格(牛肉)交叉价格(牛肉)弹性。性。根据根据经济理理论,如果鸡和猪肉是替代如果鸡和猪肉是替代(competing)产品产品如果鸡和猪肉是互补如果鸡和猪肉是互补(complementary)产品产品如果鸡和猪肉是无关产品如果鸡和猪肉是无关产品如果鸡和牛肉肉是替代产品如果鸡和牛肉肉是替代产品如果鸡和牛肉是互补产品如果鸡和牛肉是互补产品如果鸡和牛肉是互补产品如果鸡和牛肉是互补产品表表7.9YEARYX2X3X4X5X6196027.8397.542.250.778.365.8196129.9413.338.15279.266.9196229.8439.240.35479.267.8196330.8459.739.555.379.269.6196431.2492.937.354.777.468.7196533.3528.638.163.780.273.6196635.6560.339.369.880.476.3196736.4624.637.865.983.977.2196836.7666.438.464.585.578.1196938.4717.840.17093.784.7197040.4768.238.673.2106.193.3197140.3843.339.867.8104.889.7197241.8911.639.779.1114100.7197340.4931.152.195.4124.1113.5197440.71021.548.994.2127.6115.3197540.11165.958.3123.5142.9136.7197642.71349.657.9129.9143.6139.2197744.11449.456.5117.6139.2132197846.71575.563.7130.9165.5132.1197950.61759.161.6129.8203.3154.4198050.11994.258.9128219.6174.9198151.72258.166.4141221.6180.8198252.92478.770.4168.2232.6189.4假设鸡与猪肉和牛肉为无关产品,即鸡的消费不受猪肉和牛肉价格假设鸡与猪肉和牛肉为无关产品,即鸡的消费不受猪肉和牛肉价格影响。则:影响。则:从而有受约束回归:从而有受约束回归:无约束回归:无约束回归:受约束回归:受约束回归:因两模型有相同的因变量,故两个因两模型有相同的因变量,故两个R2值是可比的。值是可比的。显然在显然在5%水平上这个水平上这个F值是统计上不显著的。值是统计上不显著的。P值值是是0.3472.因此没有理由拒因此没有理由拒绝绝虚虚拟拟假假设设对对子子鸡鸡的需求不依的需求不依赖赖于于猪肉和牛肉价格。可以接受受猪肉和牛肉价格。可以接受受约约束回束回归归作作为为子子鸡鸡需求的表达式。需求的表达式。注意,在自价注意,在自价弹弹性性为负为负和收入和收入弹弹性性为为正的意正的意义义上,需求函数符合先上,需求函数符合先验验的的经济预经济预期。然而,估期。然而,估计计的价格的价格弹弹性在性在绝对值绝对值上上统计统计地小于地小于1,这这意味着子意味着子鸡鸡需求是缺乏价格需求是缺乏价格弹弹性的性的(price inelastic)。这这表明子表明子鸡鸡不是不是奢侈品;按照奢侈品;按照惯惯例,如果一种商品的收入例,如果一种商品的收入弹弹性大于性大于1,它就被称作奢,它就被称作奢侈品。侈品。第五节第五节 检验回归模型的结构或参数检验回归模型的结构或参数 稳定性:邹至庄检验稳定性:邹至庄检验结结构构变动变动(Structure change):在我):在我们们使用一个使用一个设计时间设计时间序列数据序列数据的回的回归时归时,模型中的参数,模型中的参数值值在整个期在整个期间间内不能保持相同。内不能保持相同。结结构构变动变动源自:源自:外部力量,外部力量,e.g.1973-1979年年OPEC石油卡特石油卡特尔尔提出的石油提出的石油涨涨价。价。政策政策变变化,化,e.g.1973年布雷年布雷顿顿森林体系破解美国从固定森林体系破解美国从固定汇汇率制改成浮率制改成浮动汇动汇率制。率制。国会所采取的行国会所采取的行动动,e.g.里根里根总统总统在其两任任期内的税收在其两任任期内的税收变变化或最小化或最小工工资资率的率的变变化。化。其他原因。其他原因。如何如何发现结发现结构构变动变动确确实实存在?存在?例例8.5 8.5 美国美国1970-19951970-1995年储蓄和个人可支配收入年储蓄和个人可支配收入Table 8.9 观测观测储蓄储蓄收入收入观测观测储蓄储蓄收入收入197061727.119831672522.4197168.6790.21984235.72810197263.6855.31985206.23002197389.69651986196.53187.6197497.61054.21987168.43363.11975104.41159.21988189.13640.8197696.412731989187.83894.5197792.51401.41990208.74166.81978112.61580.11991246.44343.71979130.11769.51992272.64613.71980161.81973.31993214.44790.21981199.12200.21994189.45021.71982205.52347.31995249.35320.8假如我假如我们们想估想估计储计储蓄蓄(Y)与个人可支配收入与个人可支配收入(Disposable personal income,DPI)(X)之之间间的的简单储简单储蓄函数。若用数据得到蓄函数。若用数据得到Y对对X的的OLS回回归归,则认为储则认为储蓄和蓄和DPI之之间间的关系的关系26年年间间没多大没多大变变化。但美国化。但美国1982年遭受年遭受了最大衰退,失了最大衰退,失业业率达到率达到1948年以来最高水平年以来最高水平9.7%。这这种事件会破坏种事件会破坏储储蓄和蓄和DPI之之间间的关系。的关系。把把样样本分本分为为两个两个时时期:期:1970-1981年的衰退前年的衰退前时时期和期和1982-1995年的衰退年的衰退后后时时期。期。我我们现们现在有三个可能的回在有三个可能的回归归:回回归归(8.8.3)假定)假定这这两个两个时时期之期之间间没有区没有区别别,因此,因此对对26个个观测观测构成的构成的整个整个时时期估期估计储计储蓄和蓄和DPI之之间间的关系。若如此,的关系。若如此,则则 ,。上述三个回上述三个回归归的的结结果如下果如下页页:可以看出,可以看出,储储蓄和蓄和DPI之之间间的关系在两个子的关系在两个子时时期并不相同。上述期并不相同。上述储储蓄蓄-收入回收入回归归中的斜率表示中的斜率表示边际储边际储蓄蓄倾倾向向(marginal propensity to save,MPS),即可个人可支配收入增加一美元,即可个人可支配收入增加一美元导导致致储储蓄的平均蓄的平均变变化。化。在在1970-1981年期年期间间,MPS约为约为0.08。在。在1982-1995年期年期间间,MPS约约为为0.015。这进这进一步表明将两个一步表明将两个时时期的数据放在一起做回期的数据放在一起做回归归不适当。不适当。结结构构变动变动可能由斜率和截距或二者共同所致,可能由斜率和截距或二者共同所致,规规范的范的检验检验更有帮助。更有帮助。邹邹至庄至庄检验检验(Chow test)假定:假定:1.和和 ,两个子期,两个子期间间回回归归的的误误差差项项是有是有相同方差相同方差 的(同方差性)正的(同方差性)正态态分布分布变变量。量。2.两个两个误误差差项项 和和 是独立分布的。是独立分布的。邹邹至庄至庄检验检验的机制如下:的机制如下:1.估估计计回回归归(8.8.3)并得到)并得到RSS3,其自由度,其自由度为为 ,其中,其中k为为所估参数的个数,本例所估参数的个数,本例为为2。本例中本例中RSS3=23248.30,称,称RSS3 为为约约束残差平方和束残差平方和(restricted residual sum of squares,RSSR),因,因为为施施加了加了 和和 两个两个约约束条件。束条件。2.估估计计(8.8.1)并在)并在 下得到下得到RSS1,本例中,本例中RSS1=1785.032,df=10.3.估估计计(8.8.2)并在)并在 下得到下得到RSS2,本例中,本例中RSS2=10005.22,df=12.4.这这两个两个样样本集被本集被视为视为独立,独立,则则能把能把RSS1 和和RSS2 相加得到相加得到无无约约束残束残差平方和差平方和(unrestricted residual sum of squares,RSSUR)在本例中在本例中5.邹邹至庄至庄检验检验背后的思想是:若不存在背后的思想是:若不存在结结构构变动变动,则则RSSR 和和RSSUR 在在统计统计上不上不应该应该不同。因此,构造如下比率:不同。因此,构造如下比率:邹邹至庄已至庄已经证经证明,在回明,在回归归(8.8.1)和()和(8.8.2)在)在统计统计上相同(即没上相同(即没 有有结结构构变动变动或者或者转转折)的虚折)的虚拟拟假假设设下,以上下,以上给给出出F比率服从比率服从k和和 的的F分布。分布。6.因此,若在因此,若在应应用中用中计计算出的算出的F值值没有超没有超过过F表中表中选选定定显显著性水平上的著性水平上的 临临界界F值值,则则不能拒不能拒绝绝参数参数稳稳定定(parameter stability)(即没有即没有结结构构变变 动动)的虚)的虚拟拟假假设设。若。若计计算出的算出的F值值超超过过了了临临界界值值,则则拒拒绝绝参数参数稳稳定的定的 假假设设,并断定(,并断定(8.8.1)和()和(8.8.2)是不同的。)是不同的。在本例中,在本例中,查查表得知,自由度表得知,自由度为为2和和22的的1%临临界界F值为值为7.22。因此得到一个大于。因此得到一个大于等于等于10.69的的F值值的概率的概率远远小于小于1%。因此,因此,邹邹至庄至庄检验检验支持我支持我们们之前的之前的预预期,假期,假设该检验设该检验背后的假定都背后的假定都满满足,美国足,美国1970-1995年期年期间间的的储储蓄蓄-收入关系收入关系经历经历了一次了一次结结构性构性变动变动。BTW,邹邹至庄至庄检验还检验还可以推广到不止一次可以推广到不止一次结结构构变动变动的情况。比如,的情况。比如,若若储储蓄蓄-收入关系在克林收入关系在克林顿总统顿总统1992年年1月入主白月入主白宫宫后后发发生了生了变变化,那化,那么我么我们们就把就把样样本分本分为为三个三个时时期:期:1970-1981,1982-1991,1992-1995,并,并进进行行邹邹至庄至庄检验检验。我。我们们将有将有4个个RSS项项。邹邹至庄至庄检验检验(Chow test)的一些警告:的一些警告:1.必必须满须满足足该检验该检验背后的假定。即必背后的假定。即必须须弄清楚回弄清楚回归归(8.8.1)和回)和回归归(8.8.2)中的)中的误误差方差是否相同。差方差是否相同。2.邹邹至庄至庄检验检验只告只告诉诉我我们们回回归归(8.8.1)和()和(8.8.2)是否有差)是否有差别别,并没有告并没有告诉诉我我们们差差别别是来自截距、斜率是来自截距、斜率还还是二者都有。是二者都有。讨论讨论虚虚拟变拟变量量时时将会解决。将会解决。3.邹邹至庄至庄检验检验假定我假定我们们知道知道结结构构转转折点。若不能确定折点。若不能确定结结构构变动变动何何时发时发生,就必生,就必须须用其他方法。用其他方法。1.下面考察第一个假定,两个下面考察第一个假定,两个时时期的期的误误差方差相同。我差方差相同。我们们可以从可以从(8.8.1a)和()和(8.8.2a)中)中给给出的出的RSS来估来估计误计误差方差:差方差:给给定定邹邹至庄至庄检验检验的假定,的假定,和和 为为两个子期两个子期间间真真实实方差的无偏估方差的无偏估计计两。两。因此,可以因此,可以证证明,若明,若 ,则则 服从自由度服从自由度为为(n1-k)和)和(n2-k)的的F分布。分布。使上述使上述F检验简检验简化化为计为计算算 。在在应应用中用中计计算算这这个个值值并与适当并与适当df的的临临界界F值值比比较较,就能决定是否,就能决定是否拒拒绝绝两个子两个子总总体的方差相同的虚体的方差相同的虚拟拟假假设设。若虚。若虚拟拟假假设设未被拒未被拒绝绝,则则可以可以使用使用邹邹至庄至庄检验检验。回到回到储储蓄蓄-收入回收入回归归,得到如下,得到如下F值值:查查表得自由度表得自由度为为12和和10的的5%和和1%临临界界F值值分分别别是是2.91和和4.71。计计算出来的算出来的F值值在在5%