计量经济学多种检验__王志刚.pptx
《计量经济学多种检验__王志刚.pptx》由会员分享,可在线阅读,更多相关《计量经济学多种检验__王志刚.pptx(60页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、经济计量学的几种检验王志刚2003.6多重共线性n .Multicollinearity arises because we have put in too many variables that measure the same thing.nAs the degree of multicollinearity increases, the regression model estimates of the coefficients become unstable and the standard errors for the coefficients can get wildly infl
2、ated. nMeasure :vif, tol=1/vif,condition index;etc.kXXrank )(多重共线性的后果n1.存在完全多重共线性时,参数的估计值无法确定,而且估计值的方差变为无穷大.n2.存在不完全多重共线性时,可以估计参数值,但是数值不稳定,而且方差很大.n3.多重共线性会降低预测的精度,甚至失效,增大零假设接受的可能性(t值变小).多重共线性的检测方法(1)样本可决系数法n如果样本的可决系数R-square 比较大,且回归系数几乎没有统计上的显著性,则可认为存在多重共线性。nTheil 提出了一个指标:多重共线性效应系数,存在多重共线性。接近于线性;,则认
3、为不存在多重共若该系数接近于数后的回归方程的可决系去掉指标10;);( 22212jjjpjxRRRRTheilTheil test resultsnSas 结果:n结果表明有多重共线性。19376. 0tcoefficien effects l9828. 0;9473. 0;9913. 0;9919. 02322212theiRRRR多重共线性检测方法(2)辅助回归检验法n若存在多重共线性,则至少有一个解释变量可精确或近似地表示为其余皆是变量的线性组合。n相应的检验统计量为:因;是造成多重共线性的原则可认为性;若显著则存在多重共线的可决系数量的回归个自变量对其余解释变为第iiiiixiRpT
4、pFpTRpRF;), 1()/()1 () 1/(222辅助回归检验结果nSas 结果:nKlein经验法则:若存在一个i,使得nR(i)-squareR-square,则认为多重共线性严重;本例中x1,x3有多重共线性。;9946. 0);01. 0(44.740;0186. 0);9278. 0(0186. 0;9946. 0);01. 0(99.739233212211RprobFRprobFRprobF多重共线性检验方法(3)样本相关系数检验法否则不存在;,则认为有多重共线性如果拒绝检验统计量:共线性严重。进一步,共线性;较大,则认为存在多重如果之间的相关系数和两个变量0202);1
5、(5 . 0();log(det()52(611(; 1)det(; 1)det(:,HppFGRpTFGRHRHRrrrxxaijijijjiFG test resultsnfg=20.488013401 p=0.0001344625;n拒绝零假设,认为存在多重共线性。n具体那些变量之间存在多重共线性,除了上面提到的辅助回归的方法外,还有以下提到的条件数检验和方差膨胀因子法。多重共线性检验方法:(4)特征值分析法所用的检验统计指标n ; 为第k各自变量和其余自变量回归的可决系数. VIF10,有多重共线性;TOL=1/VIF;n条件指数: n条件数条件数: ;C20,共线性严重.12)1 (
6、kkRVIF2kRminiiC minmaxC多重共线性的检验和补救n例一:进口总额和三个自变量之间回归;nSas 结果如下:Pearson Correlation Coefficients, N = 11 Prob |r| under H0: Rho=0n x1 x2 x3nx1 1.00000 0.02585 0.997260.99726nGDP 0.9399 .0001.0001nx2 0.02585 1.00000 0.03567n存蓄量 0.9399 0.9171nx3 0.997260.99726 0.03567 1.00000n总消费 .0001 |t| InflationnIn
7、tercept 1 -10.12799 1.21216 -8.36 .0001 0nx1 1 -0.05140 0.07028 -0.73 0.4883 185.99747nx2 1 0.58695 0.09462 6.20 0.0004 1.01891nx3 1 0.28685 0.10221 2.81 0.0263 186.11002n发现x1的系数为负,和现实经济意义不符,出现原因就是x1 和x3之间的线性相关.补救措施n增加样本;岭回归或主分量回归;n至少去掉一个具有多重共线性的变量;对具有多重共线性的变量进行变换.n对所有变量做滞后差分变换(一般是一阶差分),问题是损失观测值,可能有
8、自相关.n采用人均形式的变量(例如在生产函数估计中)n在缺乏有效信息时,对系数关系进行限制,变为有约束回归(Klein,Goldberger,1955),可以降低样本方差和估计系数的标准差,但不一定是无偏的(除非这种限制是正确的).n对具有多重共线性的变量,设法找出其因果关系,并建立模型和原方程构成联立方程组.岭回归n岭回归估计: nK=0, b(k)=b即为OLSE;nK的选取: n即使b(k)的均方误差比b的均方误差小.YXkIXXkb1)()()()(minkbkbk岭迹图岭回归结果Obs _MODEL_ _TYPE_ _DEPVAR_ _RIDGE_k _PCOMIT_ _RMSE_
9、Intercept x1 x2 x3 y 1 MODEL1 PARMS y 0.48887 -10.1280 -0.051 0.58695 0.287 -1 2 MODEL1 RIDGEVIF y 0.00 方差膨胀因子方差膨胀因子 185.997 1.01891 186.110 1 3 MODEL1 RIDGE y 0.00 0.48887 -10.1280 -0.051 0.58695 0.287 1 4 MODEL1 RIDGEVIF y 0.01 8.599 0.98192 8.604 -1 5 MODEL1 RIDGE y 0.01 0.55323 -9.1805 0.046 0.5
10、9886 0.144 1 6 MODEL1 RIDGEVIF y 0.02 2.858 0.96219 2.859 -1 7 MODEL1 RIDGE y 0.02 0.57016 -8.9277 0.057 0.59542 0.127 -1 8 MODEL1 RIDGEVIF y 0.03 1.502 0.94345 1.502 -1 9 MODEL1 RIDGE y 0.03 0.57959 -8.7337 0.061 0.59080 0.120 -1 10 MODEL1 RIDGEVIF y 0.04 0.979 0.92532 0.979 -1 11 MODEL1 RIDGE y 0.
11、04 0.58745 -8.5583 0.064 0.58591 0.116 -1 主分量回归n主分量回归是将具有多重相关的变量集综合得出少数几个互不相关的主分量.n两步:(1)找出自变量集的主分量,建立y与互不相关的前几个主分量的回归式.(2)将回归式还原为原自变量结果.n详见,方开泰;主分量回归结果Obs _MODEL_ _TYPE_ _DEPVAR_ _PCOMIT_ _RMSE_ Intercept x1 x2 x3 y 1 MODEL1 PARMS y 0.48887 -10.1280 -0.05140 0.58695 0.28685 1 2 MODEL1 IPCVIF y 1 0.
12、25083 1.00085 0.25038 1 3 MODEL1 IPC y 1 0.55001 -9.1301 0.07278 0.60922 0.10626 14 MODEL1 IPCVIF y 2 0.24956 0.00095 0.24971 -15 MODEL1 IPC y 2 1.05206 -7.7458 0.07381 0.08269 0.10735 -1主分量回归结果n由输出结果看到在删去第三个主分量(pcomit=1)后的主分量回归方程:nY=-9.1301+0.07278x1+0.60922x2+0.10626x3;n该方程的系数都有意义,且回归系数的方差膨胀因子均小于1
13、.1;主分量回归方程的均方根误差(_RMSE=0.55) 比普通OLS方程的均方根误差(_RMSE=0.48887) 有所增大但不多。Sas 程序ndata ex01;ninput x1 x2 x3 y;nlabel x1=国内生产总值;nlabel x2=存储量;nlabel x3=消费量;nlabel y=进口总额;ncards;n149.3 4.2 108.1 15.9n161.2 4.1 114.8 16.4n171.5 3.1 123.2 19.0n175.5 3.1 126.9 19.1n180.8 1.1 132.1 18.8n190.7 2.2 137.7 20.4n202.1
14、 2.1 146 22.7n212.4 5.6 154.1 26.5n226.1 5.0 162.3 28.1n231.9 5.1 164.3 27.6 n239.0 0.7 167.6 26.3n;nrun;nproc corr data=ex01;nvar x1-x3;nrun;n*岭回归*;nproc reg data=ex01 outest=ex012 graphics outvif;nmodel y=x1-x3/ridge=0.0 to 0.1 by 0.01;nplot/ridgeplot;nrun;nproc print data=ex012;run;n*主分量回归法*;npro
15、c reg data=ex01 outest=ex103;nmodel y=x1-x3/pcomit=1,2 outvif;*pcomit表示删去最后面的1或2个主分量,用前面m-1或 m-2各主分量进行回归*;nrun;nproc print data=ex103;run;Sas 程序n/*theil test*/;nproc reg data=ex01;nequation3:model y=x1 x2;nequation2:model y=x1 x3;nequation1:model y=x2 x3;nrun;/*r-.9473;r3s=0.9828*/;ndata theil;nrsq=
16、0.9919;r1s=0.9913;r2s=0.9473;r3s=0.9828;ntheil=rsq-(3*rsq-(r1s+r2s+r3s);put theil=;nrun;n/*辅助回归检验法*/;nproc reg data=ex01;nequation3:model x3=x1 x2;nequation2:model x2=x1 x3;nequation1:model x1=x2 x3;nrun;n/*FG test*/;nproc corr data=ex01 outp=corr nosimple;var x1-x3;run;nproc print data=corr;run;nti
17、tle 计算相关矩阵的行列式;nproc iml;nR=1.000 0.026 0.997,0.026 1 0.036,0.9152 0.6306 1;nd=det(R);nprint d;nrun;/*d=0.081371*/;ntitle 计算检验统计量及其p值;ndata fg;nn=11;p=3;d=0.081371;nfg=-(n-1-1/6*(2*p+5)*log(d);df=p(p-1)/2;np=1-probchi(fg,df);nput fg= p=;nrun;/*fg=20.488013401 p=0.0001344625,拒绝零假设*/;异方差的检验和补救n nOLSE
18、unbiased,inefficient;t, F test invalid; forecast accuracy decreased.nIf the model is well-fitted, there should be no pattern to the residuals plotted against the fitted values. If the variance of the residuals is non-constant, then the residual variance is said to be heteroscedastic. matrix; positiv
19、e diagonal a ,)(2isVar异方差的检测nThere are graphical and non-graphical methods for detecting heteroscedasticity. A commonly used graphical method is to plot the residuals versus fitted (predicted) values. nExample :grade:educated years;potexp:working years;exp2=potexp2;union:dummy variable.unionpotgrade
20、wage432102expexp)log(收入方程回归的结果n Dependent Variable: LNWAGE n Analysis of Variancen Sum of Meann Source DF Squares Square F Value Pr Fn Model 4 12.42236 3.10559 14.06 |t|n Intercept 1 0.59511 0.28349 2.10 0.0384n GRADE 1 0.08354 0.02009 4.16 Fn Model 12 1.18881 0.09907 0.88 0.5731n Error 87 9.83078 0
21、.11300nCorrected Total 99 11.01958n Root MSE 0.33615 R-Square 0.1079n Dependent Mean 0.20989 Adj R-Sq -0.0152n Coeff Var 160.15281n Parameter Standardn Variable DF Estimate Error t Value Pr |t|n Intercept 1 -0.07767 0.98580 -0.08 0.9374n GRADE 1 -0.01220 0.12502 -0.10 0.9225n POTEXP 1 0.07784 0.0718
22、8 1.08 0.2819n EXP2 1 -0.00399 0.00409 -0.97 0.3325n UNION 1 0.64879 0.86160 0.75 0.4535n grade2 1 0.00220 0.00425 0.52 0.6065n exp4 1 -3.34378E-7 0.00000151 -0.22 0.8256n exp3 1 0.00006170 0.00014192 0.43 0.6648n gx2 1 0.00011683 0.00011102 1.05 0.2955n gp 1 -0.00375 0.00494 -0.76 0.4498n gu 1 -0.0
23、5137 0.04430 -1.16 0.2494n pu 1 0.00193 0.06061 0.03 0.9746n eu 1 -0.00022185 0.00126 -0.18 0.8605n残差项平方对所有一阶,二阶及交叉项回归.n1.由左边的结果可知:n故同方差的假设未被拒绝.n2.Proc reg data=aa;nModel y=x/spec;nRun;n可得到相同的结果。03.21)12(79.10205. 02nR布罗施-帕甘/戈弗雷检验怀特检验的特例(1)OLS残差额et和一个估计的干扰误差 n(2)用OLS将 对选中的解释变量进行回归,并计算解释平方和(ESS);n(3)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 经济学 多种 检验 _ 王志刚
限制150内