2022年非线性模型中多个交互项的估计 .pdf
W orldEconomicPapers2006第 3期52非线性模型中多个交互项的估计张爽*摘要:非线性模型中交互项的偏效应并不等同于交互项的系数或由简单回归得到的偏效应,而应该由被解释变量对交互的解释变量求交叉偏导得到。本文将对交互项的估计扩展到包含多个交互项的非线性模型中,提出了在包含多个交互项的非线性模型中估计交互项的正确方法,并编写了相应的程序。关键词:非线性模型多个交互项偏效应一、引言在计量经济学模型里,当一个解释变量对被解释变量的偏效应取决于另一个解释变量的大小时,经济学家通常在模型中加入这两个解释变量的交互项来进行分析。无论是连续变量还是离散变量都有可能在回归模型中产生交互作用。当两个解释变量存在交互作用时,如果不在模型中引入交互项,将会产生遗漏变量偏误而无法得到对解释变量的无偏估计。近年来,交互项在实证研究中的运用越来越广泛,除了能够用它来判断两个解释变量之间的交互作用之外,它还经常被作为政策评估的工具,在使用混合截面或面板数据的模型中进行两阶段差分法(Differ ence In Differ ence)。在线性模型里,我们能非常直接地得到交互项以及交互的解释变量的偏效应。交互项的偏效应等于简单回归得到的交互项的系数,交互项的显著性也直接由系数的 t 检验来判断。然而,在非线性模型里,我们却不能直接得到交互项以及交互的解释变量的偏效应。与线性模型不同的是,非线性模型里交互项的偏效应和显著性都有可能与简单回归得到的结果不同。因此,尽管交互项的运用非常广泛,但是在非线性模型里正确地估计交互项却并不那么容易。A i 和 Norton(2003)提出,Jstor 列出的在 1980 到 2000 年间发表在13种期刊上的在非线性模型中使用交互项的文章,几乎都没有正确地估计出交互项的偏效应。A i 和 Norton(2003)编写了命令/inteff 0来对非线性模型里的交互项进行正确的估计。但是,命令/inteff 0只能在包含一个交互项的非线性模型里对交互项进行估计,却不能用于包含一个以上交互项的非线性模型。Marinescu(2005)在包含了两个交互项的 probit 模型里使用/inteff 0来估计交互项的偏效应和标准差,得到的结果是有偏误的。因此,本文将对交互项的估计从只包含一个交互项的非线性模型扩展到包含一个以上交互项的非线性模型,并编写了在包含多个交互项的非线性模型里正确估计交互项的程序。*张爽,复旦大学经济学系和复旦大学就业与社会保障研究中心,E-mail:。本文提到的命令都在STATA8.0 里进行的。名师资料总结-精品资料欢迎下载-名师精心整理-第 1 页,共 4 页 -张爽非线性模型中多个交互项的估计2006第 3 期53二、交互项的估计(一)线性模型首先,我们来看线性模型中交互项的估计,以包含一个交互项的线性模型为例:y=A+B1x1+B2x2+B1 2x1+Biother+L(1)在(1)式里,other 表示其他没有交互作用的解释变量。交互项的偏效应为被解释变量 y 对交互的两个解释变量x1和 x2求交叉偏导:52y5x15x2=B12(2)由此可见,交互项的偏效应就等于交互项本身的系数B12,交互项的显著性由系数B12的 t 检验来判断。因此,交互项的偏效应和显著性可以直接由简单回归得到的结果报告。而交互的解释变量x1的偏效应为:5y5x1=B1+B12x2(3)x1的偏效应取决于x2的大小,通常在 x2的均值处求解。求 x2的偏效应也同理。(二)包含一个交互项的非线性模型然后,我们在非线性模型里对交互项进行估计,以包含一个交互项的probit 模型为例:p(y=1)=5(A+B1x1+B2x2+B12x1#x2+Biother+L)(4)我们通常用命令/dprobit 0或在 pr obit0后用/mfx compute0来报告解释变量的偏效应,而由上述命令报告的交互项x1#x2的偏效应为:5p(y=1)5(x1#x2)=5#B12(5)Ai 和 Nor ton(2003)指出,大多数已有文献都错误地直接用这个简单回归的结果来报告交互项的偏效应。但是,这个结果并不等同于交互项真正的偏效应。因为命令/dprobit0或/mfx compute0将 x1#x2看作一个单独的解释变量进行求导,而无法辨别出交互项是两个解释变量的乘积形式。对交互项正确的估计方法是被解释变量y对交互的两个解释变量x1和 x2求交叉偏导:52p(y=1)5x15x2=5#(B2+B12x1)#(B1+B12x2)+5#B12(6)由(6)可知,非线性模型里交互项的偏效应并不等于由命令/dprobit 0或/mfx com-pute0报告的结果,而且交互项的显著性也不能由上述命令报告的z 检验来判断。Ai 和 Nor ton(2003)编写了命令/inteff 0,该命令在probit 或 logit 模型只包含一个交互项时,能够按照(6)式正确地估计出交互项的偏效应,并报告交互项的标准差。命令/inteff 0用在/probit 0或/logit0之后,写法如下:Inteffyx1x2x1#x2other(7)该命令解决了在包含一个交互项的线性模型里对交互项进行估计的问题,但是并不能用于包含一个以上交互项的非线性模型。因为,正如(7)所示,命令/inteff 0在估计交互项时只考虑前四个变量,而不考虑other 代表的其他解释变量。然而,当非线性模型中包含一个以上的交互项时,忽略其他解释变量将会对交互项的估计产生名师资料总结-精品资料欢迎下载-名师精心整理-第 2 页,共 4 页 -W orldEconomicPapers2006第 3期54偏误。(三)包含一个以上交互项的非线性模型我们以包含两个交互项的probit 模型为例:p(y=1)=5(A+B1x1+B2x2+B3x3+B13x1#x3+B23x2#x3+Biother+L)(8)在(8)式里,交互项 x1#x2的偏效应为:52p(y=1)5x15x3=5#(B3+B13x1+B23x2)#(B1+B1 3x3)+5#B13(9)由(9)式可知,交互项x1#x2的偏效应取决于x1、x2和 x3的取值。当我们用命令/inteff 0估计 x1#x3时,该命令写为:Inteffyx1x3x1#x3other(10)这里在估计x1#x3的偏效应时,只考虑了x1和 x3的取值,而 x2被包含在用other 表示的其他解释变量里被忽略掉了。因此,用命令/inteff 0估计出来的交互项x1#x3的偏效应和标准差是不准确的。我们用一个更一般的命令/predictnl 0来解决/inteff 0无法解决的问题。Ai 和Norton(2003)提到的唯一一篇正确地估计了交互项的文章DeL eire(2000),也正是使用命令/predictnl 0编写的程序得到了正确估计。不过,DeLeire(2000)的模型里的交互项是由虚拟变量构成,他编写的程序(DeLeire,2004)只能用于在两阶段差分(Differ-enceIn Difference)时虚拟变量的交互项的估计,而并不能用于估计由连续变量构成的交互项。因此,我们按照(9)式编写了估计交互项的程序(见附录),该程序可以用于估计由连续变量构成的交互项。与命令/inteff0相比,0predictnl 0可以用在任何包含多个交互项 的非线性模型里,得到交互项以及交互的解释变量的正确估计。三、结论通过以上的分析,我们可以确认:在非线性模型中,交互项的偏效应和标准差不等同于直接由简单回归得到的结果。要正确估计交互项的偏效应,必须用被解释变量对交互的解释变量求交叉偏导,而且交互项的显著性也应该根据求交叉偏导得到的结果来进行检验。当非线性模型中出现一个以上的交互项时,使用命令/inteff 0来估计交互项将会出现偏误,而应该用命令/predictnl 0 来得到交互项的正确估计。在包含多个交互项的非线性模型里估计交互项的实证研究范例请参见我们的另一篇文章/社会资本的作用会被市场化减弱还是加强?)来自中国农村贫困的实证研究 0。参考文献:A i,C.R.and E.C.N orton,2003,/Interact ion Terms in Logit and ProbitModels,0 Eco-nomics Letter,80(1),pp.123-129.DeL eire,T.,2000,/The Wage and EmploymentEffectsof the Americans wit h Disabilit iesA ct,0 J ournal of H uman Resource,35(4),pp.693-715.Deleire,T.,2004,/A N ote on Calculating Dif ference In Difference U sing Probit M odels ver-sus L inear ProbabilityModels,0 Michigan State U niversity,WorkingPaper.名师资料总结-精品资料欢迎下载-名师精心整理-第 3 页,共 4 页 -张爽非线性模型中多个交互项的估计2006第 3 期55M arinescu,I.,2005,/A re Judges Sensitive to Economic Condit ions?-Evidence from UKEmploymentT ribunals,0 London School of Economics and Political Science,H arvard U-niversit y,WorkingPaper.张爽,陆铭,章元,2006,/社会资本的作用会被市场化减弱还是加强?)来自中国农村贫困的实证研究,0复旦大学工作论文。附录:在包含一个以上交互项的非线性模型里估计交互项的程序)以(8)式的模型为例(为简便起见,我们在这里将其他解释变量other 认为是一个变量):1,估计交互项x1#x3的偏效应和标准差的程序如下(其他交互项也同理)probit y x1 x2 x3 x1x2 x1x3 other,robustqui sum x1 if e(sample)local meanx1=r(mean)qui sum x2 if e(sample)local meanx2=r(mean)qui sum x3 if e(sample)local meanx3=r(mean)qui sum other if e(sample)local meanother=r(mean)local xb _b x1*meanx1+_b x2*meanx2+_b x3*meanx3+_b x1x2*meanx1*meanx2+_b x1x3*meanx1*meanx3+_b other*meanot her+_b _conspredictnldydx1x 3=normden(x b)*(-(xb)*(_b x3+_b x1x3*meanx1+_b x2x3*meanx2)*(_b x1+_b x1x3*meanx3)+normden(xb)*(_b x1x3)in 1,se(sedydx1x3)list dydx1x3 sedydx1x3 in 12,估计交互的解释变量x1的偏效应和标准差(其他交互的解释变量也同理)在(8)式的模型里:5p(y=1)5x1=5#(B1+B13x3)程序如下:probit y x1 x2 x3 x1x2 x1x3 other,robustqui sum x1 if e(sample)local meanx1=r(mean)qui sum x2 if e(sample)local meanx2=r(mean)qui sum x3 if e(sample)local meanx3=r(mean)qui sum other if e(sample)local meanother=r(mean)local xb _b x1*meanx1+_b x2*meanx2+_b x3*meanx3+_b x1x2*meanx1*meanx2+_b x1x3*meanx1*meanx3+_b other*meanot her+_b _conspredictnldydx1=normden(xb)*(_b x1+_b x1x 3*meanx3)in 1,se(sedydx1)list dydx1 sedydx1 in 1名师资料总结-精品资料欢迎下载-名师精心整理-第 4 页,共 4 页 -