计量经济学多元线性回归模型的统计检验.ppt
3.2 3.2 多元线性回归模型的统计检验多元线性回归模型的统计检验Statistical Test of Multiple Statistical Test of Multiple Linear Regression ModelLinear Regression Model 说说 明明计量经济学模型是应用数理统计方法建立的一类计量经济学模型是应用数理统计方法建立的一类经济数学模型,所以在模型参数估计出来后,必经济数学模型,所以在模型参数估计出来后,必须检验其估计的可靠程度是否满足数理统计学理须检验其估计的可靠程度是否满足数理统计学理论与方法上的要求。论与方法上的要求。计量经济学模型的统计检验主要包括计量经济学模型的统计检验主要包括:拟合优度检验拟合优度检验方程的显著性检验方程的显著性检验变量的显著性检验变量的显著性检验 一、拟合优度检验一、拟合优度检验(Testing the Simulation Level)拟合优度检验:拟合优度检验:检验模型对样本观测值的拟合检验模型对样本观测值的拟合程度。程度。在一元回归模型中,拟合优度检验是通过构造在一元回归模型中,拟合优度检验是通过构造一个可以表征拟合程度的一个可以表征拟合程度的统计量统计量R R2 2来实现。来实现。在多元回归模型中,也可以用在多元回归模型中,也可以用该统计量该统计量来衡量来衡量样本回归线对样本观测值的拟合程度。样本回归线对样本观测值的拟合程度。总离差平方和、回归平方和及残差平方和总离差平方和、回归平方和及残差平方和定义定义TSSTSS为为总离差平方和总离差平方和(Total Sum of SquaresTotal Sum of Squares),反映,反映被解释变被解释变量量样本观测值总体离差的大小;样本观测值总体离差的大小;ESSESS为为回归平方和回归平方和(Explained Sum of SquaresExplained Sum of Squares),反映反映被解释被解释变量变量回归估计值的变差大小,也是模型中的解释变量所解释的回归估计值的变差大小,也是模型中的解释变量所解释的那部分离差的大小那部分离差的大小;RSSRSS为为残差平方和残差平方和(Residual Sum of SquaresResidual Sum of Squares),反映,反映被解释被解释变量变量样本观测值与估计值偏离的大小,也是模型中解释变量未样本观测值与估计值偏离的大小,也是模型中解释变量未解释的那部分离差的大小。解释的那部分离差的大小。那么,那么,TSS、ESS、RSS之间存在的如下关系:之间存在的如下关系:总离差平方和总离差平方和 =回归平方和回归平方和 +残差平方和残差平方和 TSS =ESS +RSS关于关于TSS=ESS+RSS的证明过程的证明过程(教材(教材P73P73)证明:证明:将TSS,即总离差平方和进行分解:其中根据正规方程组正规方程组(见教材(见教材P67P67()式)()式),有:所以 TSS=RSS+ESS 注意:注意:回归平方和回归平方和反映了反映了总离差平方和总离差平方和中可由样本回归线解释中可由样本回归线解释的部分,它越大,的部分,它越大,残差平方和残差平方和越小,样本回归线对样本观测值越小,样本回归线对样本观测值的拟合程度越高。的拟合程度越高。(教材(教材P74)所以,可以用可以用回归平方和占总离差平方和的比重回归平方和占总离差平方和的比重来衡量样本回来衡量样本回归线对样本观测值的拟合程度归线对样本观测值的拟合程度。也即用检验模型的拟合优度。从而R2叫做多重可决系数多重可决系数,也简称为可决系数可决系数或判定系数判定系数。但是在应用过程中人们发现,如果在模型中增加一个解释变量,但是在应用过程中人们发现,如果在模型中增加一个解释变量,那么模型的回归平方和随之增大,从而那么模型的回归平方和随之增大,从而R2也随之增大也随之增大。这就给人一个这就给人一个错觉错觉:要使模型拟合得好,就必须增加解释变量。:要使模型拟合得好,就必须增加解释变量。所以,所以,用来检验拟合优度的统计量必须能够用来检验拟合优度的统计量必须能够防止防止这种倾向。这种倾向。毫无疑问,毫无疑问,R2越接近于越接近于1,模型的拟合优度越高。,模型的拟合优度越高。式中,(n-k-1)为残差平方和RSS的自由度,(n-1)为总离差平方和TSS的自由度。(教材(教材P74)在实际应用中,在实际应用中,R2达到多大才算模型通过了检验?达到多大才算模型通过了检验?答案是:没有绝对的标准。答案是:没有绝对的标准。模型的拟合优度并不是判断模型质量的唯一标准,模型的拟合优度并不是判断模型质量的唯一标准,有时甚至为了追求模型的经济意义,可以牺牲一点有时甚至为了追求模型的经济意义,可以牺牲一点拟合优度。拟合优度。如:如:H钱纳里等:发展的型式钱纳里等:发展的型式1950-1970,P50-52,经济科学出版社。,经济科学出版社。而在第三版教材而在第三版教材P72例例的中国内地城镇居民人均消费支出模型的中国内地城镇居民人均消费支出模型(二元回归)(二元回归)中,中,R R2 2,比如,第三版教材比如,第三版教材P53例例中的中国内地城镇居民人均消费支出中的中国内地城镇居民人均消费支出模型模型(一元回归)(一元回归)中,中,R R2 2,可见,对于中国内地城镇居民的人均消费支出中国内地城镇居民的人均消费支出,二元回归二元回归比一元回归一元回归的效果更好。(注意:教材(注意:教材P75的表述有问题!)的表述有问题!)可决系数可决系数R2 的的简捷计算公式:简捷计算公式:()其中 对于一元一元线性回归:对于多元多元线性回归:*赤池信息准则和施瓦茨准则赤池信息准则和施瓦茨准则(教材(教材P75P75)为了比较所含解释变量个数不同的多元回归模型的拟合优度,常用的标准还有:(2)(2)施瓦茨准则施瓦茨准则(Schwarz criterion,SC)这两准则均要求:这两准则均要求:仅当所增加的解释变量能够仅当所增加的解释变量能够减少减少AICAIC值或值或SCSC值时,才在原模型中增加该解释变量值时,才在原模型中增加该解释变量。(1)(1)赤池信息准则赤池信息准则(Akaike information criterion,AIC)nnknSClnln+=ee二、方程显著性检验二、方程显著性检验(教材(教材P75P75)Testing the Overall Significance方程的显著性检验:方程的显著性检验:对模型中被解释变量与解释变量之模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立间的线性关系在总体上是否显著成立作出推断。直观上看,拟合优度高,则解释变量对被解释变量的解释程度就高,可以推测模型总体线性关系成立;反之,就不成立。但这只是一个模糊的推测,不能给出一个在统计上严格的结论。这就要求进行方程的显著性检验。方程的显著性检验所应用的方法,是数理统计学中的假假设检验设检验。1.1.关于假设检验关于假设检验(教材(教材P46P46)假设检验假设检验是统计推断的一个主要方面,它的是统计推断的一个主要方面,它的基本任基本任务是根据样本所提供的信息,对务是根据样本所提供的信息,对未知总体未知总体某些方面某些方面(如参数或分布类型)的假设作出合理的判断。(如参数或分布类型)的假设作出合理的判断。假设检验的程序:假设检验的程序:先根据实际问题的要求提出一个先根据实际问题的要求提出一个论断,称为统计假设,记为论断,称为统计假设,记为H0;然后根据样本的有;然后根据样本的有关信息,对关信息,对H0的真伪进行判断,作出拒绝的真伪进行判断,作出拒绝H0或接受或接受H0的决策。的决策。假设检验的基本思想是假设检验的基本思想是概率性质的反证法概率性质的反证法。也就是说,为了检验原假设H0是否正确,先假定这个假设是正确的,看由此能推出什么结果。如果导致一个不合理的如果导致一个不合理的结果,结果,则表明“假设H0为正确”是错误的,即原假设H0不正确,因此要拒绝拒绝原假设H0。如果没有导致一个如果没有导致一个不合理现象的出现,不合理现象的出现,则不能认为原假设H0不正确,因此不能拒绝不能拒绝原假设H0。概率性质的反证法的根据是概率性质的反证法的根据是小概率事件原理小概率事件原理。该原理认。该原理认为为“小概率事件在一次试验中几乎是不可能发生的小概率事件在一次试验中几乎是不可能发生的”。换句话说,这里构造了一个小概率事件(“检验统计量的样本值落入拒绝域”)。如果在一次试验中该事件就发生了,就违背了小概率事件原理,也就意味着导致了一个不合理的结果。显著性检验的步骤:显著性检验的步骤:()(1)提出原假设)提出原假设H0和备择假设和备择假设H1;(2)计算检验统计量的样本值;)计算检验统计量的样本值;(3)确定临界值和拒绝域;)确定临界值和拒绝域;(4)下结论:是否拒绝)下结论:是否拒绝H0。检验模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立,也就是要检验模型 2.2.方程显著性的方程显著性的F F检验检验(注意(注意补充补充的内容!)的内容!)(i=1,2,n)中的参数是否显著不为0。(1)按照假设检验的原理与步骤,首先应提出假设:(注:(注:教材教材P75有错!有错!)显然,当当H0成立时,即表示模型的线性关系成立时,即表示模型的线性关系不成立不成立;当;当H1成成立时,即表示模型的线性关系立时,即表示模型的线性关系成立成立。(2)并且,并且,RSS与与ESS相互独立。相互独立。所以,所以,统计量统计量 直观上看,回归平方和ESS是解释变量整体对被解释变量Y的线性作用的结果,如果ESS/RSS的比值较大,则解释变量整体对Y的解释程度高,可以认为总体存在线性关系;反之,总体可能不存在线性关系。因此因此,可以通过该比值的大小对总体线性关系可以通过该比值的大小对总体线性关系进行推断进行推断。该统计量即为用于方程显著性检验的该统计量即为用于方程显著性检验的F统计量统计量。(4)(3)例例 在第三版在第三版教材教材P72P72例例的中国内地城镇居民人均消费的中国内地城镇居民人均消费模型模型(二元回归二元回归)中,。中,。给定给定=0.05,=0.05,查得(。查得(。所以所以,该模型的线性关系在该模型的线性关系在95%95%的置信水平下显著的置信水平下显著成立。成立。关于拟合优度检验与方程显著性检验关系的讨论关于拟合优度检验与方程显著性检验关系的讨论 拟合优度检验和方程总体线性的显著性检验是从不同原理出发的拟合优度检验和方程总体线性的显著性检验是从不同原理出发的两类检验:两类检验:前者前者是从已经得到估计的模型出发,检验它对样本观测值的拟合程度;后者后者是从样本观测值出发检验模型总体线性关系的显著性。但是二者又是关联的:但是二者又是关联的:F检验检验和拟合优度检验拟合优度检验都是在总变差TSS分解为回归平方和ESS与残差平方和RSS的基础上构造统计量进行的检验;模型对样本观测值的拟合程度高,模型总体线性关系的显著性就强;两个检验统计量之间存在如下的数量关系:两个检验统计量之间存在如下的数量关系:或可见,F与R2同向变化。当R2=0时,F=0;当R2 越大时,F也越大;当R2=1时,F。(注:注:教材教材P76-77文字有错!)文字有错!)多大才算通过拟合优度检验?多大才算通过拟合优度检验?重新回到前面的问题:重新回到前面的问题:对于第三版教材第三版教材P72例例,给定显著性水平时,查F分布表,得到临界值F,即是说,只要F统计量的值大于,模型的线性关系在 95%的水平下就是显著成立的。将该数值代入()式,计算得到对应的调整后的可决系数为实际上,实际上,有许多著名的模型,有许多著名的模型,R R2 2小于,支持了重要的小于,支持了重要的结论。结论。例:例:西蒙西蒙库兹涅茨库兹涅茨关于收入差距的倒关于收入差距的倒U U型规型规律、律、H钱纳里钱纳里的发展的型式的发展的型式1950-1970。如果我们首先得到调整后的可决系数调整后的可决系数为,肯定认为该模型的质量不高,殊不知它的总体线性关系的置信置信水平达到了95%。方程显著性检验(F检验)的步骤()(1)对多元线性回归模型的参数提出联合假设:(2)在原假设H0的基础上,根据样本数据计算F统计量的样本值:1.1.什么是变量的显著性检验?什么是变量的显著性检验?(教材(教材P77P77)对对于于多多元元线线性性回回归归模模型型,方方程程的的总总体体线线性性关关系系显显著著成成立立,并并不能说明不能说明每个每个解释变量对被解释变量的影响都是显著的。解释变量对被解释变量的影响都是显著的。因因此此,必必须须对对每每个个解解释释变变量量进进行行显显著著性性检检验验,以以决决定定是是否否作作为为解解释释变变量量被被保保留留在在模模型型中中。如如果果某某个个变变量量对对被被解解释释变变量量的的影影响响并并不不显显著著,应应该该将将它它剔剔除除,以以建建立立更更为为简简单单的的模模型型。这这就就是是变量显著性检验的任务。变量显著性检验的任务。变变量量显显著著性性检检验验针针对对的的原原假假设设为为H0:j=0(j=0,1,2,k),而应用最为普遍的是而应用最为普遍的是t检验检验。三、变量显著性检验三、变量显著性检验Testing the Individual Significance2.2.变量显著性的变量显著性的t t检验检验(1)检验统计量检验统计量(t 统计量)统计量)的构造:的构造:(对教材(对教材P77P77的补充!)的补充!)(j=0,1,2,k)于是因此,可以构造统计量因此,可以构造统计量 该统计量即为用于变量显著性检验的该统计量即为用于变量显著性检验的 t 统计量统计量。(2)变量显著性的变量显著性的t 检验检验(思路)(思路)计算计算检验统计量检验统计量tj的值的值【模型有几个解释变量,就要计算几个【模型有几个解释变量,就要计算几个tj】。(j=0,1,2,k)例:例:在教材教材P72例例 中国内地城镇居民人均消费支出中国内地城镇居民人均消费支出的二元回归模型二元回归模型中,由Eviews软件计算得到:变量变量X X1 1和和X X2 2各自的各自的t t统计量样本值统计量样本值分别为分别为 t tX1X1=7.378320 t=7.378320 tX2X2 给定给定=0.05,=0.05,查得查得临界值临界值t t。由于由于t tX1 X1、t tX2X2都都大于临界值大于临界值t(28)t(28),所以,变量,所以,变量X X1 1和和X X2 2在在95%95%的水平下的水平下都都显著。显著。变量显著性检验(t 检验)的步骤()(1)对总体参数提出假设:(2)在原假设H0的基础上,根据样本数据计算t 统计量的经验值:(j=0,1,2,k)3.3.在一元线性回归(在一元线性回归(k=1k=1)中,)中,t t检验与检验与F F检验是检验是一致的。一致的。(教材(教材P78P78)另一方面另一方面,两个统计量之间有如下关系:一方面一方面,t检验与F检验都是对相同的原假设H0:1=0=0 进行检验;所以,在第二章(一元线性回归模型)中,没有没有关于方程显著性检验的内容。注注 意意在利用计量模型来研究现实经济问题时,经常会碰到这样的情形:各个变量的t值相差较大,有的在很高的显著性水平下影响显著,有的则在不太高的显著性水平下影响显著,是否都认为通过显著性检验?没有绝对的显著性水平。关键是考察变量在经济关系上是否对被解释变量有影响,显著性检验仅起到验证的作用。同时,还要看显著性水平不太高的变量在模型中及模型应用中的作用,不要简单地剔除变量。(教材P78)