6 广义最小二乘法(GLS)与异方差解析.ppt
1参数非线性参数非线性v当模型为参数非线性形式时,需要采用非线性估计技术。v非线性模型的一般形式为:Yi=f(Xi,b)+ei式中f(.)为一个可微分的非线性函数,b为(K+1)1未知参数向量,X为 n(K+1)解释变量矩阵,e为服从某种形式统计分布的误差项(通常用正态分布)。v此时我们无法将待估计参数表示为由已知的X和Y表示的线性函数,这种情况被称作参数非线性。2关于关于C-D生产函数的残差加性项形式:生产函数的残差加性项形式:3NLS估计技术估计技术非线性最小二乘法(NLS)-以残差平方和最小为标准获得参数估计通常基于误差项满足正态分布的假定一般计量经济软件有标准的指令和算法4NLSNLS估计技术估计技术用最小二乘法估计非线性回归方程的原理与估计线性回归方程相同,即求解使残差平方和最小的参数;对于线性函数,模型参数可以通过求解由一阶条件构成的方程组估计得出;对于非线性方程,我们常常无法确保得到估计参数的解析解,但通常能够利用数值逼近方法得到方程组的近似解。此时估计参数可能不是唯一的,并且存在收敛困难。5求解非线性方程组的常用方法:线性化迭代求解法(Iterative linearization method),即从一组参数的初始值开始将非线性函数线性化,然后求解线性方程组并得到新的估计值;重复上述步骤直到估计结果达到收敛标准或达到最大迭代次数时为止。NLSNLS估计技术估计技术6注意:NLS方法并不能够保证总是收敛到最优解,可能出现的情况有:收敛速度缓慢、收敛到局部最优解、估计系数出现发散情况收敛到错误结果时,R2可能出现负值。在应用工作中,当遇到上述情况时,一种做法是改变初始值,然后重新进行迭代求解过程。NLSNLS估计技术估计技术 Chapter 6 广义最小二乘法广义最小二乘法(GLS)与与 异方差异方差(Heteroskedasticity)主要内容一、GLS法原理二、异方差的来源及后果三、异方差的检验四、消除异方差和估计模型五、EViews的应用六、案例 一、广义最小二乘法(一、广义最小二乘法(GLSGLS)1、模型:、模型:Y=X+u 的的OLSE 特性:线性性、无偏性、方差最小不成立。特性:线性性、无偏性、方差最小不成立。2 2、GLS GLS 原理原理 Y=X+u Var(u)=u2=u2 P P (P为非奇异阵)为非奇异阵)以以P-1 左乘原模型:左乘原模型:P-1 Y=P-1 X+P-1 u 即:即:Y*=X*+u*则:则:Var(u*)=Var(P-1 u)=E(P-1 u u P-1)=u2 I3、GLSE 1)=(X P-1P-1 X)-1 X P-1 P-1 Y =(X -1 X)-1 X -1 Y 若 =I,则 =b 2)的统计特性的统计特性 线性性、无偏性、最小方差性线性性、无偏性、最小方差性4、的估计:二、异方差二、异方差1、含义、含义 即:即:在解释变量取不同值时方差不同,异方差是在解释变量取不同值时方差不同,异方差是X 的函数。的函数。可通过散点图观察。可通过散点图观察。2、异方差的来源、异方差的来源主要存在于横断面资料中主要存在于横断面资料中 1)被解释变量的测量误差随时间而变化;)被解释变量的测量误差随时间而变化;2)某些被省略的解释变量进入)某些被省略的解释变量进入u中;中;3)模型的数学形式错误;)模型的数学形式错误;4)分组数据中;)分组数据中;5)人们的经济行为。)人们的经济行为。3、异方差的后果:、异方差的后果:1)参数估计量的方差变大;)参数估计量的方差变大;2)t检验无法进行(检验无法进行(无法求得);无法求得);3)降低预测精度。)降低预测精度。三、异方差的检验 1、图示检验法:解释变量与、图示检验法:解释变量与e的散点图。的散点图。2、戈里瑟(、戈里瑟(Glejser)检验:检验:a.Y OLS X1,X2,Xk,得得序列序列e。b.建立方程寻找导致异方差的建立方程寻找导致异方差的X:c.用用WLS法消除。法消除。3、怀特(、怀特(White)检验检验 a.建立模型建立模型 例如例如:b.检验统计量检验统计量:n为样本容量,为样本容量,R2为可决系数,为可决系数,m 即即LM统计量统计量(朗格朗格拉日乘子统计量),近似服从自由度为拉日乘子统计量),近似服从自由度为 k(解释变量解释变量的个数的个数)的的 分布分布。c.判断判断:在Eviews的模型估计结果输出窗口中,选 View/Residual Test/White Heteroskedasticity 4、戈德菲尔特、戈德菲尔特夸特(夸特(Goldfield-quandt)检验)检验(集团集团法法)a.将将X顺序排列,并保持与顺序排列,并保持与Y 的对应关系;的对应关系;b.将数据分为两组将数据分为两组(子样本子样本),中间剔除,中间剔除 c(n/3 n/4);c.建立两个子方程,得建立两个子方程,得 、和和 、;d.检验判断:检验判断:五、模型估计五、模型估计GLSGLS 1、对分组资料情况,、对分组资料情况,已知已知给给模型模型左乘左乘2、未知,令未知,令 六、案例中国农村居民人均消费函数 中国农村居民人均消费支出主要由人均纯收中国农村居民人均消费支出主要由人均纯收入来决定。入来决定。农村人均纯收入包括:农村人均纯收入包括:(1)(1)从事农业经营的收入;从事农业经营的收入;(2(2)从事其他产业的经营性收入;从事其他产业的经营性收入;(3)3)工资性收入;工资性收入;(4)(4)财产收入;财产收入;(4)(4)转移支付收入。转移支付收入。考察考察从事农业经营的收入从事农业经营的收入(X1 1)和和其他收入其他收入(X2 2)对中国对中国农村居民消费支出农村居民消费支出(Y)增长的影响增长的影响:表表 中国中国2001年各地区农村居民家庭人均纯收入与消费支出相关数据(单位:元)年各地区农村居民家庭人均纯收入与消费支出相关数据(单位:元)地区 人均消费 支出 Y 从事农业经营 的收入 1X 其他收入 2X 地区 人均消费 支出 Y 从事农业经营 的收入 1X 其他收入 2X 北 京 3552.1 579.1 4446.4 湖 北 2703.36 1242.9 2526.9 天 津 2050.9 1314.6 2633.1 湖 南 1550.62 1068.8 875.6 河 北 1429.8 928.8 1674.8 广 东 1357.43 1386.7 839.8 山 西 1221.6 609.8 1346.2 广 西 1475.16 883.2 1088.0 内蒙古 1554.6 1492.8 480.5 海 南 1497.52 919.3 1067.7 辽 宁 1786.3 1254.3 1303.6 重 庆 1098.39 764.0 647.8 吉 林 1661.7 1634.6 547.6 四 川 1336.25 889.4 644.3 黑龙江 1604.5 1684.1 596.2 贵 州 1123.71 589.6 814.4 上 海 4753.2 652.5 5218.4 云 南 1331.03 614.8 876.0 江 苏 2374.7 1177.6 2607.2 西 藏 1127.37 621.6 887.0 浙 江 3479.2 985.8 3596.6 陕 西 1330.45 803.8 753.5 安 徽 1412.4 1013.1 1006.9 甘 肃 1388.79 859.6 963.4 福 建 2503.1 1053.0 2327.7 青 海 1350.23 1300.1 410.3 江 西 1720.0 1027.8 1203.8 宁 夏 2703.36 1242.9 2526.9 山 东 1905.0 1293.0 1511.6 新 疆 1550.62 1068.8 875.6 河 南 1375.6 1083.8 1014.1 普通最小二乘法的估计结果:普通最小二乘法的估计结果:异方差检验异方差检验(1)图示法)图示法进一步的统计检验进一步的统计检验(2)G-Q检验检验 将原始数据按将原始数据按X2排成升序,去掉中间的排成升序,去掉中间的7个个数据,得两个容量为数据,得两个容量为12的子样本。的子样本。对两个子样本分别作对两个子样本分别作OLS回归,求各自的回归,求各自的残差平方和残差平方和 和和 :子样本子样本1:(3.18)(4.13)(0.94)R2=0.7068,RSS1=0.0648 子样本子样本2:(0.43)(0.73)(6.53)R2=0.8339,RSS2=0.2729计算计算F F统计量:统计量:F=/=0.2792/0.0648=4.31 查表:查表:给定给定=5%,查得临界值,查得临界值 F0.05(9,9)=2.97 判断:判断:F F0.05(9,9)否否定定两两组组子子样样方方差差相相同同的的假假设设,从从而而该该总总体体随机项存在递增异方差性。随机项存在递增异方差性。(3 3)怀特检验)怀特检验 作辅助回归作辅助回归:(-0.04 (0.10)(0.21)(-0.12)(1.47)(-1.11)R2=0.4638 似乎没有哪个参数的似乎没有哪个参数的t检验是显著的检验是显著的。但。但 n*R2=310.4638=14.38 =5%下,临界值下,临界值 20.05(5)=11.07,拒绝同方差性。,拒绝同方差性。去掉交叉项后的辅助回归结果:去掉交叉项后的辅助回归结果:(1.36)(-0.64)(0.64)(-2.76)(2.90)R2=0.4374lnX2、(ln(lnX2)2的参数的的参数的t t检验是显著的,且:检验是显著的,且:m=n R2 =31 0.4374=13.56 =5%显著性水平下显著性水平下,临界值,临界值 20.05(4)=9.49,拒绝同方差的拒绝同方差的原假设。原假设。EViews中,在回归结果输出窗口中点击:View/Residual Tests/White Heteroskedasticity,然后查看Obs*R的伴随概率P值,如果大于显著性水平就是同方差的,反之是有异方差的。有有交交叉叉项项无无交交叉叉项项 原模型的加权最小二乘法回归原模型的加权最小二乘法回归 对原模型进行OLS估计,得到随机误差项的近似估计量e,以此构成随机干扰项的标准差的估计量,即Var(ui)ei2;再以1/|e|为权重进行WLS估计,得:各项统计检验指标全面改善各项统计检验指标全面改善