线性回归方程中多重共线性诊断方法及其实证分析.pdf
《线性回归方程中多重共线性诊断方法及其实证分析.pdf》由会员分享,可在线阅读,更多相关《线性回归方程中多重共线性诊断方法及其实证分析.pdf(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、华中农业大学学报(社会科学版),(总 74 期)2008(2)Journal of Huazhong Agricultural University(Social Sciences Edition)?收稿日期:2008-03-20作者简介:马雄威(1983-),男,硕士研究生;研究方向:农产品市场研究。线性回归方程中多重共线性诊断方法及其实证分析马雄威(华中农业大学 经济管理学院,湖北 武汉 430070)摘要?在使用回归模型进行多元回归分析时,容易忽视?自变量不存在近似线性关系?这一应用条件,造成分析结果不准确甚至严重偏离变量间本来的依存关系。论文对多重共线性的产生原因、对线性回归模型的影响
2、以及诊断方法进行了论述,并从理论和实例两个方面探讨了如何运用岭回归模型来克服和解决多重共线性问题。关键词?多重回归分析;线性回归方程;多重共线性中图分类号:O212?文献标识码:A?文章编号:1008-3456(2008)02-0078-04Diagnosis and Empirical Analysis on Multicollinearity in Linear Regression ModelMa Xiong-wei(College of Economics and Management,Huaz hong A gricultural University,Wuhan,H ubei,43
3、0070)Abstract?With the popularity of computer application,multiple regression analysis has been exten-sively applied in production,as well as scientific research in practice.But in the application of multiple re-gression analysis,the application condition that there is no linear relationship between
4、 independent varia-bles is apt to be overlooked;therefore,the obtained result may become incorrect and even be far fromthe original relationship among the variables.T herefore,it is necessary to analyze the causes and the im-pact of multicollinearity in the linear regression model,and introduces som
5、e of the diagnosis methods ofmulticollinearity.Then this paper introduces the theory of the ridge regression model,and the scope of itsapplication,as well as advantages and disadvantages.T hen with the example of pork prices factors analy-sis and the aid of SAS program,this paper objectively evaluat
6、es the characteristics of the method and itsstrength and weakness.Key words?multiple regression analysis;linear regression model;multicollinearity?一、多重共线问题的提出线性回归方法已被广泛应用于变量与变量间关系的研究。但是对变量的条件特别是变量间的线性相关性不加任何考虑,盲目地应用回归分析模型往往得不到理想的结果,甚至导致错误的结论。因此对多重共线性问题进行研究是非常有意义的。1.多重相关性的含义多重共线性是指在自变量之间存在线性相关关系的现象。对
7、一组自变量 x1,?,xm,如果存在?0,?1,?,?m,使得线性等式?1x1+?2x2+?+?mxm=?0(1.1)?对所有案例都成立,即至少存在一个 Xk,它可以由其他的变量决定:Xk=(?0-?j?k?jxj)?k(1.2)?则称 x1,?,xm之间存在完全的多重共线性,第 2 期马雄威:线性回归方程中多重共线性诊断方法及其实证分析?即其相关系数为 1;如果式(1.2)对所有数据都不成立,则它们之间没有相关性,即其相关系数为 0。如果式(1.2)近似的对所有数据成立,则称 x1,?,xm之间存在近似的多重共线性,其相关系数就介于0和 1之间。2.多重共线性产生的原因产生多重相关性的原因主
8、要包括四方面:?趋同性:经济变量随时间的变化过程存在共同变化趋势;?用截面数据建模;?模型中大量地采用滞后变量;?建模时由于认识的局限性导致变量选择不当。3.多重共线性的危害?完全共线性下参数估计量不存在:多元线性模型 Y=X B+N 的普通二乘参数估计是?(X?X)-1X?Y。如果存在多重共线性,则(X?X)-1不存在,无法得到参数估计量。?一般共线性下普通最小二乘法参数估计量非有效:在一般共线性(或称近似共线性)下,虽然可以得到 OLS 法参数估计量,但是参数估计量方差的表达式为 Cov(?)=?2(X?X)-1,由于此时|X?X|?0,引起(X?X)-1主对角线上的元素较大,从而使参数估
9、计值的方差增大,OLS 参数估计量非有效。?参数估计量经济含义不合理:如果模型中两个解释变量具有线性相关性,例如 X1和X2,那么它们中的一个变量可以由另一个变量表征,这时 X1和 X2前的参数并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响,所以各自的参数已经失去了应有的经济含义,于是经常表现出似乎反常的现象,例如本来应该是正的影响,结果参数估计量符号恰是负的。?变量的显著性检验失去意义。?模型的预测功能失效:变大的方差容易使区间预测的?区间?变大,使预测失去意义。?二、共线性的诊断1.经验式的诊断方法通过观察,得到一些多重相关性严重存在的迹象。?在自变量的简单相关
10、系数矩阵中,有某些自变量的相关系数值较大。?回归系数的代数符号与专业知识或一般经验相反;或者该自变量与因变量的简单相关系数符号相反。?对重要自变量的回归系数进行 t 检验,其结果不显著。特别是当 F 检验能在高精度下通过,测定系数 R2的值也很大,但自变量的 t 检验却全都不显著,这时多重相关性的可能将会很大。?如果增加或删除一个变量,或者增加或删除一个观测值,回归系数发生了明显的变化。?重要自变量的回归系数置信区别明显过大。?在自变量中,某一个自变量是另一部分自变量的完全或近似完全的线性组合。?对于一般的观测数据,如果样本点的个数过少,比如接近于变量的个数或者少于变量的个数,样本数据中的多重
11、相关性就会经常存在。2.统计检验方法共线性的诊断方法是基于对自变量的观测数据构成的矩阵 X?X 进行分析,使用各种反映自变量间相关性的指标。共线性诊断常用的统计量有方差膨胀因子 VIF 或容限 TOL、条件指数和方差比例等。方差膨胀因子 VIF 是指回归系数的估计量由于自变量的共线性使其方差增加的一个相对度量。对于第 i 个回归系数,它的方差膨胀因子定义为VIFi=第 i 个回归系数的方差自变量不相关时第i 个回归系数的方差=11-R2i=1T OLi其中 R2i是自变量Xi对模型中其余自变量线性回归模型的 R平方。VIFi的倒数 TOLi也称为容限。一般建议,若VIF 10,模型中有很强的共
12、线问题。若矩阵 X?X 的特征值为 d1?d2?dk,是刻画它的奇性一个指标,故也称d1dk(j=1,?,k)为条件指数。一般认为,若条件指数值在 10 与 30 间为弱相关,在 30 与 100 间为中等相关,大于 100 表示有强相关。对于大的条件指数可找出那些变量间存在强的线性相关关系,因为每个条件指数对应一个特征向量,而大的条件指数对应的特征值较小,故构成这一特征向量的变量间有近似的线性关系。在统计中用方差比例来说明各个自变量在构成这个特征值向量中的贡献。一般建议,在大的条件指数中由方差比例超过 0.5的自变量构成的子集就认为是相关变量集 1-2。3.岭回归模型由上述讨论可知,当设计阵
13、存在多重共线性时,最小二乘估计的性质不够理想甚至很差。在这种情况下,就需要一些新的估计方法,A.E.Hoerl(1962)针对出现多重共线时普通最小二乘法回归效果明显变差的问题,提出了一种叫岭回归的回归估计方法。岭回归 的 核 心思 想 是当 出 现 多重 共 线 性时,79?华 中 农 业 大 学 学 报(总 74期)|X?X|?0,使参数的?(k)=(X?X)-1X?Y 很不稳定,出现不合乎实际含义的估计值时,给 X?X 加上一个正常数矩阵 K I(K 0),则|X?X+K I|等于零的可能性就比|X?X|的可能性要小得多,再用?(k)=(X?X+K I)-1X?Y 来估计?,这样比用普通
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 线性 回归 方程 多重 诊断 方法 及其 实证 分析
限制150内