欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    模型的建立与估计中的问题及对策.pptx

    • 资源ID:80052524       资源大小:1.04MB        全文页数:155页
    • 资源格式: PPTX        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    模型的建立与估计中的问题及对策.pptx

    1经典假设与违背假设的情况:经典假设与违背假设的情况:异方差异方差自相关自相关多重共线性多重共线性第1页/共155页24.1 误设定误设定模型设定偏误主要有两大类模型设定偏误主要有两大类解释变量选取的偏误解释变量选取的偏误,主要包括漏选相关变量和多选无关变量。主要包括漏选相关变量和多选无关变量。模型函数形式选取的偏误。模型函数形式选取的偏误。当模型设定出现偏误时,模型估计结果也会与“实际”有偏差。这种偏差的性质及程度与模型设定偏误的类型密切相关。第2页/共155页3遗漏相关变量遗漏相关变量(omitting relevant variables)例如,如果例如,如果“正确正确”的模型为的模型为:而我们将模型设定为而我们将模型设定为:即设定模型时漏掉了一个相关的解释变量。即设定模型时漏掉了一个相关的解释变量。这类错误称为遗漏相关变量。这类错误称为遗漏相关变量。模型中遗漏了对因变量有显著影响的解释变量将使模型参数估计量不再是无偏估计量。第3页/共155页4误选无关变量误选无关变量(including irrevelant variables)例如,如果例如,如果为为“真真”,但我们将模型设定为,但我们将模型设定为:即设定模型时,多选了一个无关解释变量。即设定模型时,多选了一个无关解释变量。这类错误称为误选无关变量。这类错误称为误选无关变量。模型中包括无关的解释变量,参数估计量仍无偏,但会增大估计量的方差,即增大误差。第4页/共155页5错误的函数形式错误的函数形式(wrong functional form)例如,如果例如,如果“真实真实”的回归函数为的回归函数为:但却将模型设定为但却将模型设定为:这就是设定了错误的函数形式。这就是设定了错误的函数形式。这类错误中比较常见的是将非线性关系作为线性关系处理。函数形式选择错误,所建立的模型当然无法反映所研究现象的实际情况,后果是显而易见的。第5页/共155页6解决解释变量误设定问题的原则在模型设定中的一般原则是尽量不漏掉有关的解释变量。因为估计量有偏比增大误差更严重。但如果方差很大,得到的无偏估计量也就没有多大意义了,因此也不宜随意乱增加解释变量。在回归实践中,有时要对某个变量是否应该作为解释变量包括在方程中作出准确的判断确实不是一件容易的事,因为目前还没有行之有效的方法可供使用。第6页/共155页7理论:从理论上看,该变量是否应该作为解释变量包括在方程中?t检验:该变量的系数估计值是否显著?:该变量加进方程中后,是否增大?偏倚:该变量加进方程中后,其它变量的系数估计值是否显著变化?如果对四个问题的回答都是肯定的,则该变量应该包如果对四个问题的回答都是肯定的,则该变量应该包括在方程中;如果对四个问题的回答都是括在方程中;如果对四个问题的回答都是“否否”,则该变则该变量是无关变量,可以安全地从方程中删掉它。这是两种容量是无关变量,可以安全地从方程中删掉它。这是两种容易决策的情形。易决策的情形。选择解释变量的四条准则第7页/共155页8在很多情况下,这四项准则的判断结果会出现不一致。例如,有可能某个变量加进方程后,增大,但该变量不显著。在这种情况下,作出正确判断不是一件容易的事,处理的原则是将理论准则放在第一位,再多的统计证据也不能将一个理论上很重要的变量变成“无关”变量。在选择变量的问题上,应当坚定不移地根据理论而不是满意的拟合结果来作决定,对于是否将一个变量包括在回归方程中的问题,理论是最重要的判断准则。如果不这样做,产生不正确结果的风险很大。第8页/共155页9检验模型误设定的RESET方法拉姆齐(J.B.Ramsey)于1969年提出了一种回归设定误差检验法(RESET法)。RESET检验法的思路是在要检验的回归方程中加进 等项作为解释变量,然后看结果是否有显著改善。如有,则可判断原方程存在遗漏有关变量的问题或其它的误设定问题。第9页/共155页10直观地看,这些添加的项是任何可能的遗漏变直观地看,这些添加的项是任何可能的遗漏变量或错误的函数形式的替身,如果这些替身能量或错误的函数形式的替身,如果这些替身能够通过够通过F 检验检验,表明它们改善了原方程的拟合表明它们改善了原方程的拟合状况,则我们有理由说原方程存在误设定问题。状况,则我们有理由说原方程存在误设定问题。等项形成多项式函数形式,多等项形成多项式函数形式,多项式是一种强有力的曲线拟合装置,因而如果项式是一种强有力的曲线拟合装置,因而如果存在误设定,则用这样一个装置可以很好地代存在误设定,则用这样一个装置可以很好地代表它们。表它们。第10页/共155页11(1)用用OLS法估计要检验的方程,得到法估计要检验的方程,得到(2)由由上上一一步步得得到到的的值值 (i=1,2,n),计计算算 ,然后用然后用OLS法估计:法估计:(3)用用F检检验验比比较较两两个个方方程程的的拟拟合合情情况况,如如果果两两方方程程总总体体拟拟合合情情况况显显著著不不同同,则则我我们们得得出出原原方方程程可可能能存存在在误误设设定定的的结结论。使用的检验统计量为:论。使用的检验统计量为:RESET检验法的步骤第11页/共155页12 RSSM为为第第一一步步中中回回归归的的残残差差平平方方和和,RSS为为第第二二步步中中回回归归的的残残差差平平方方和和,M为为约约束束条条件件的的个个数数,这这里是里是M=3。注注意意:拉拉姆姆齐齐RESET检检验验仅仅能能检检验验误误设设定定的的存存在在,而而不不能能告告诉诉我我们们到到底底是是哪哪一一类类的的误误设设定定,或或者者说说,不不能能告告诉诉我我们们正正确确的的模模型型是是什什么么。但但该该方方法法毕毕竟竟能能给给出出模模型型误误设设定定的的信信号号,以以便便我我们们去去进进一一步步查查找找问问题题。另另一一方方面面,如如果果模模型型设设定定正正确确,RESET检检验验使使我我们们能能够够排排除除误误设设定定的的存存在在,转转而而去查找其它方面的问题。去查找其它方面的问题。第12页/共155页13软件实现软件实现EviewsEviews实现的步骤:方程窗口实现的步骤:方程窗口ViewViewStability TestsStability TestsRamsey RESET Ramsey RESET TestTest输入输入Number of fittedNumber of fittedOKOK。第13页/共155页144.2 多重共线性多重共线性 多重共线性的概念 多重共线性产生的原因及后果 多重共线性的检验 解决多重共线性问题的方法 实例第14页/共155页15一、多重共线性的概念一、多重共线性的概念 定义:如果某两个或多个解释变量高度线性相关,定义:如果某两个或多个解释变量高度线性相关,则称模型中存在则称模型中存在多重共线性多重共线性(Multicollinearity)。对于模型 Yi=0+1X1i+2X2i+kXki+ui,i=1,2,n,其基本假设之一是解释变量是互相独立的。表示为矩阵的秩,有rank(X)=k+1n,即解释变量之间不存在严格的线性关系,观测值个数大于待估参数的个数。第15页/共155页16 如果存在c1X1i+c2X2i+ckXki=0,i=1,2,n,其中 ci 不全为0,则称为解释变量间存在完全的多重共线性(perfect multicollinearity)如果存在c1X1i+c2X2i+ckXki+vi=0,i=1,2,n,其中ci不全为0,vi 为随机误差项,则称为近似的多重共线性(approximate multicollinearity)第16页/共155页17 在矩阵表示的线性回归模型在矩阵表示的线性回归模型Y=X +u中,完全的多重共线性指:中,完全的多重共线性指:rank(X)k+1,即,即中,至少有一列向量可由其他列向量(不包括第中,至少有一列向量可由其他列向量(不包括第一列)线性表出。一列)线性表出。如:如:X2=X1,则,则 X2 对对 Y 的作用可由的作用可由 X1 代替。代替。第17页/共155页18二、多重共线性产生的原因及后果二、多重共线性产生的原因及后果主要原因包括以下三个方面:主要原因包括以下三个方面:经济变量共同的变动趋势 时间序列数据:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。第18页/共155页19 滞后变量的引入 在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。例如:消费=f(当期收入,前期收入)显然,两期收入间具有较强的线性相关性。第19页/共155页20 样本资料的限制 由于完全符合理论模型所要求的样本数据较难收集,特定样本可能存在某种程度的多重共线性。例如:消费=f(收入,财富水平),当我们获得收入和财富的样本数据时,两个自变量可能高度相关。我们很难找到足够多的财富少而收入高的样本。第20页/共155页21 一般来说,简单线性模型中涉及到时间序列数据样本时往往会存在多重共线性;而对于截面数据样本,问题不那么严重,但多重共线性仍然是存在的。在多元线性回归模型中,我们关心的并不是多重共线性的有无,而是多重共线性的程度。当多重共线性的程度较高时,会给最小二乘估计量带来严重的后果。如何看待多重共线性呢?如何看待多重共线性呢?第21页/共155页22多重共线性的后果多重共线性的后果的的OLS估计量为:估计量为:完全共线性下参数估计量不存在 如果存在完全共线性,则必有 ,故(XX)1 不存在,因此无法得到参数的估计量。第22页/共155页23例:对于二元线性回归模型例:对于二元线性回归模型 如果两个解释变量完全相关,如如果两个解释变量完全相关,如X2=X1,则二元模型就会退化为一元线性回归模型:则二元模型就会退化为一元线性回归模型:这时,只能确定综合参数这时,只能确定综合参数 1+2 的估计值:的估计值:第23页/共155页24 近近似似共共线线性性下下,可可以以得得到到OLS参参数数估估计计量,但参数估计量方差的表达式为:量,但参数估计量方差的表达式为:由由于于|XX|0,引引起起(XX)-1 主主对对角角线线元元素素较较大大,即即使使得得参参数数估估计计值值的的方方差差增增大大,估估计计值值的的精精度降低。度降低。近似共线性下OLS估计量的方差增大第24页/共155页25仍以二元线性模型仍以二元线性模型 为例为例:恰为恰为 X1与与 X2的线性相关系数的平方的线性相关系数的平方r 2由于由于 r 2 1,故,故 1/(1-r2)1。第25页/共155页26 多重共线性使参数估计值的方差增大,多重共线性使参数估计值的方差增大,1/(1-r 2)为方差膨胀因子为方差膨胀因子(Variance Inflation Factor,VIF)当完全不共线时当完全不共线时,r 2=0 当近似共线时,0 r 2 10作为存在严重多重共线作为存在严重多重共线性的标准性的标准,特别在解释变量多的情形应当如此。特别在解释变量多的情形应当如此。需要指出的是,所有VIF值都低,并不能排除严重多重共线性存在的可能性。第34页/共155页35 条件指数高,表明存在多重共线性。条件指数高,表明存在多重共线性。“经经验法则验法则”告诉我们:告诉我们:CI在在5到到10之间为弱相关性;之间为弱相关性;在在10到到30之间为中强度多重共线性,而大于之间为中强度多重共线性,而大于30表明存在严重的多重共线性。表明存在严重的多重共线性。3.通过条件指数检验通过条件指数检验第35页/共155页36四、四、解决多重共线性问题的方法解决多重共线性问题的方法方法一、增加数据多重共线性实质上是样本的问题,或者说是数据问题,因此,增加数据就有可能消除或减缓多重共线性。具体方法包括增加观测值、将时间序列数据与截面数据并用或采用新的样本等。当然,如果解释变量的总体存在多重共线性,那么增加样本容量就不能降低解释变量之间的线性关系。第36页/共155页37在存在多重共线性的模型中,依据经济理论施加某些约束条件,将减小系数估计量的方差。最典型的例子是在CobbDouglas生产函数中加进规模报酬不变的约束,可以解决资本和劳动的高度相关而引起的多重共线性问题。方法二、对模型施加某些约束条件方法二、对模型施加某些约束条件第37页/共155页38这样做,实际上就是利用给定数据估计较少的参数,从而降低对观测信息的需求,以解决多重共线性问题。删除哪些变量,可根据经典理论和假设检验的结果确定。另一种思路就是在建模的过程中避免引入共线性较大的变量,具体可以采用逐步回归的方法。方法三、略去一个或几个共线变量方法三、略去一个或几个共线变量第38页/共155页39逐步回归法逐步回归法 以以 Y 为被解释变量,逐个引入解释变量,为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计。根据拟合优度构成回归模型,进行模型估计。根据拟合优度的变化决定新引入的变量是否独立。的变化决定新引入的变量是否独立。如果拟合优度变化显著,则说明新引入如果拟合优度变化显著,则说明新引入的变量是一个独立解释变量;如果拟合优度变的变量是一个独立解释变量;如果拟合优度变化很不显著,则说明新引入的变量与其它变量化很不显著,则说明新引入的变量与其它变量之间存在共线性关系。之间存在共线性关系。第39页/共155页401.用被解释变量分别对每个解释变量进行线性回归,根据经济理论和统计检验从中选择一个最合适的回归方程作为基本回归方程,通常选取拟合优度最大的回归方程。2.在基本回归方程中逐个增加解释变量,重新进行线性回归:若新变量的引入提高了R2,并且回归方程中的其他参数统计上仍然显著,就在模型中保留该解释变量;若新变量的引入未能改进R2,则不在模型中保留该解释变量;若新变量的引入提高了R2,且显著地影响了其他回归参数估计值的符号与数值,说明模型中存在多重共线性,对该解释变量同与之相关的其他解释变量进行比较,在模型中保留对被解释变量影响较大的,略去较小的。逐步回归法的一般步骤:逐步回归法的一般步骤:第40页/共155页41如果某些解释变量之间高度相关,可以根据研究目的等实际情况,通过改变模型的形式来避免多重共线性。方法四、改变模型的形式方法四、改变模型的形式例如:例如:某商品的需求函数为:某商品的需求函数为:其其中中Q为为需需求求量量,X 为为收收入入,P是是该该商商品品的的价价格格,P*为为替替代代商商品品的的价价格格。通通常常P和和P*往往往往呈呈同同方方向向变变动动,它它们们之之间间高高度度相关。相关。如如果果研研究究目目的的只只是是预预测测该该商商品品的的需需求求量量,则则可可以以用用相相对价格来替代两个价格对对价格来替代两个价格对Q的影响,即:的影响,即:这样就可以解决多重共线性问题。这样就可以解决多重共线性问题。第41页/共155页42 时间序列数据、线性模型:将原模型变换时间序列数据、线性模型:将原模型变换为差分模型为差分模型:Yi=1 X1i+2 X2i+k Xki+ui可以有效地消除原模型中的多重共线性。可以有效地消除原模型中的多重共线性。一般来说,增量之间的线性关系远比总量一般来说,增量之间的线性关系远比总量之间的线性关系弱得多。之间的线性关系弱得多。使用差分形式的模型第42页/共155页43 例如:例如:个人消费取决于现期收入和过去的收入,模个人消费取决于现期收入和过去的收入,模型为:型为:用被解释变量的滞后值替代解释变量的滞后值:如果多重共线性是由解释变量的现期值与过去值高度相关引起的,则可以使用被解释变量的一期滞后值替代解释变量的滞后值,来避免多重共线性。第43页/共155页44 对于多项式回归模型,即模型中包含解释对于多项式回归模型,即模型中包含解释变量的不同次幂,它们之间一般存在较高的相关变量的不同次幂,它们之间一般存在较高的相关性。在实践中,如果将解释变量表达为离差的形性。在实践中,如果将解释变量表达为离差的形式,即原值减去均值,多重共线性就可大为降低。式,即原值减去均值,多重共线性就可大为降低。使用离差形式的模型第44页/共155页45思路:将共线变量组合在一起形成一个或几个综合指数(变量),用它来代表这组变量。构造综合指数的最常用方法是主成分法。主成分的特点是,各主成分之间互不相关,并且,用很少几个主成分就可以解释全部解释变量的绝大部分方差,因而在出现多重共线性时,可以用主成分替代原有解释变量进行回归计算,然后再将所得到的系数还原成原模型中的参数估计值。关于主成分分析的方法参考多元统计分析中有关主成分分析的内容。方法五、主成分回归方法五、主成分回归第45页/共155页46运用多元统计技术的其他方法,如因子分析岭回归构造联立方程模型无为而治、置之不理其他方法其他方法第46页/共155页47 根根据据理理论论和和经经验验分分析析,影影响响粮粮食食生生产产(Y)的的主要因素有:主要因素有:农业化肥施用量(农业化肥施用量(X1)粮食播种面积粮食播种面积(X2)受灾面积受灾面积(X3)农业机械总动力农业机械总动力(X4)农业劳动力农业劳动力(X5)已知中国粮食生产的相关数据,建立中国粮已知中国粮食生产的相关数据,建立中国粮食生产函数:食生产函数:Y=0+1 X1+2 X2+3 X3+4 X4+4 X5+u五、实例五、实例第47页/共155页481.1.用用OLS法估计上述模型:法估计上述模型:R2 接近于接近于1;给定;给定 =5%,得,得 F 的临界的临界值值F0.05(5,12)=3.11,F=638.4 15.19,故认上述粮食生产的总体线性关系显著成立。,故认上述粮食生产的总体线性关系显著成立。但但X4、X5 的参数未通过的参数未通过 t 检验,且符号不正检验,且符号不正确,说明解释变量间可能存在多重共线性。确,说明解释变量间可能存在多重共线性。(-0.91)(8.39)(3.32)(-2.81)(-1.45)(-0.14)第48页/共155页492.2.检验简单相关系数检验简单相关系数发现:发现:X1与与 X4 之间存在高度相关性。之间存在高度相关性。列出列出X1,X2,X3,X4,X5 的相关系数矩阵:的相关系数矩阵:第49页/共155页503.3.找出最简单的回归形式找出最简单的回归形式可见,应选可见,应选第一个方程为初始的回归模型。第一个方程为初始的回归模型。分别作分别作Y与与X1,X2,X4,X5间的回归:间的回归:(25.58)(11.49)R2=0.8919 F=132.1 DW=1.56 (-0.49)(1.14)R2=0.075 F=1.30 DW=0.12 (17.45)(6.68)R2=0.7527 F=48.7 DW=1.11 (-1.04)(2.66)R2=0.3064 F=7.07 DW=0.36第50页/共155页514.4.逐步回归逐步回归 将将其其他他解解释释变变量量分分别别导导入入上上述述初初始始回回归归模模型型,寻找最佳回归方程。寻找最佳回归方程。第51页/共155页52 回归方程以回归方程以Y=f f(X1,X2,X3)为最优:为最优:5.5.结论结论第52页/共155页53总结总结多重共线性是普遍存在的,轻微的多重共线多重共线性是普遍存在的,轻微的多重共线性问题可以不采取措施。性问题可以不采取措施。如果模型仅用于预测,则只要拟合程度好,如果模型仅用于预测,则只要拟合程度好,可以不处理多重共线性问题,因为它不会影可以不处理多重共线性问题,因为它不会影响到预测的结果。响到预测的结果。如果模型用于结构分析,特别是要分解解释如果模型用于结构分析,特别是要分解解释变量的单独效应,多重共线性则是一个非常变量的单独效应,多重共线性则是一个非常严重的问题,最好能够合理解决。严重的问题,最好能够合理解决。第53页/共155页544.3 异方差异方差 异方差的概念及类型 异方差产生的后果 异方差的检验 解决异方差问题的方法 实例第54页/共155页55 P(Y|X)o Y x2 x3 x4 X iiXYE10)(+=X1 第55页/共155页56 即对于不同的样本点,随机误差项的方差即对于不同的样本点,随机误差项的方差不再是常数,而互不相同,则认为随机误差项不再是常数,而互不相同,则认为随机误差项出现了异方差性出现了异方差性(Heteroskedasticity)。一、异方差的概念及类型一、异方差的概念及类型对于模型 Yi=0+1X1i+2X2i+kXki+ui,i=1,2,n,如果出现:第56页/共155页57异方差的类型异方差的类型 同方差:同方差:i2=常数常数 异方差:异方差:i2=f(Xi)异方差一般可归结为三种类型:异方差一般可归结为三种类型:(1)单调递增型:单调递增型:i2 随随 X 的增大而增大的增大而增大 (2)单调递减型:单调递减型:i2 随随 X 的增大而减小的增大而减小 (3)复复 杂杂 型:型:i2 与与 X 的变化呈复杂形式的变化呈复杂形式第57页/共155页58第58页/共155页59实际经济问题中的异方差性实际经济问题中的异方差性 例例1:截面资料下研究居民家庭的储蓄行为截面资料下研究居民家庭的储蓄行为:Yi=0+1Xi+ui Yi:第第 i 个家庭的储蓄额个家庭的储蓄额 Xi:第第 i 个家庭的可支配收入。个家庭的可支配收入。高收入家庭:储蓄的差异较大;高收入家庭:储蓄的差异较大;低收入家庭:储蓄则更有规律性,差异较小;低收入家庭:储蓄则更有规律性,差异较小;u ui 的方差呈现单调递增型变化的方差呈现单调递增型变化第59页/共155页60 例例2:以绝对收入假设为理论假设、以截面数据以绝对收入假设为理论假设、以截面数据为样本建立居民消费函数:为样本建立居民消费函数:Ci=0+1Yi+ui 将居民按照收入等距离分成将居民按照收入等距离分成 n 组,取组平均组,取组平均数为样本观测值。数为样本观测值。一般情况下,居民收入服从正态分布:中等收入组人数多,两端收入组人数少。而人数多的组平均数的误差小,人数少的组平均数的误差大。所以样本观测值的观测误差随着解释变量观测值的不同而不同,往往引起异方差性。第60页/共155页61 例例3:以某一行业的企业为样本建立企业生产以某一行业的企业为样本建立企业生产函数模型:函数模型:Y产出量;K资本;L劳动;A技术。每个企业所处的外部环境对产出量的影响被包含在随机误差项中。每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。这时,随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。第61页/共155页62二、异方差产生的后果二、异方差产生的后果 计量经济学模型一旦出现异方差性,如果仍采计量经济学模型一旦出现异方差性,如果仍采用用OLS估计模型参数,会产生下列不良后果:估计模型参数,会产生下列不良后果:OLS估计量仍然具有无偏性,但不具有有效性。估计量仍然具有无偏性,但不具有有效性。因为在有效性证明中利用了因为在有效性证明中利用了 E(uu)=2I 而且,在大样本情况下,尽管参数估计量具而且,在大样本情况下,尽管参数估计量具有一致性,但仍然不具有渐近有效性。有一致性,但仍然不具有渐近有效性。参数估计量非有效第62页/共155页63 变量的显著性检验失去意义 变量的显著性检验中,变量的显著性检验中,构造了构造了t 统计量统计量如果出现异方差性,估计的 会出现偏误(偏大或偏小),t 检验则失去意义。第63页/共155页64 模型的预测失效 一方面,由于上述后果,使得模型不具有良好的统计性质;所以,当模型出现异方差性时,参数所以,当模型出现异方差性时,参数OLS估计估计值的变异程度增大,从而造成对值的变异程度增大,从而造成对 Y 的预测误差变大,的预测误差变大,降低预测精度,预测功能失效。降低预测精度,预测功能失效。另一方面,在预测值的置信区间中也包含有参数方差的估计量 。第64页/共155页65检验思路:检验思路:由于异方差就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么:检验异方差是否存在,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的“形式”。三、异方差的检验第65页/共155页66 关键关键问题是用什么来表示随机误差项的方差问题是用什么来表示随机误差项的方差 一般的处理方法为:首先采用OLS估计模型,以求得随机误差项的估计量(注意:该估计量是不严格的),我们称之为“近似估计量”。olsiiiYYe)(-=ie表示近似估计量,于是有:用第66页/共155页67常用的检验方法有:常用的检验方法有:图示法图示法帕克检验帕克检验(Park test)格里瑟检验格里瑟检验(Glesjer test)戈德弗尔德戈德弗尔德-匡特检验匡特检验 (Goldfeld-Quandt test)怀特检验怀特检验 (Whites General Heteroscedasticity test)布罗施布罗施-培甘培甘(Breusch-Pagan)检验检验第67页/共155页681.图示法(1)用)用 X-Y 的散点图进行判断的散点图进行判断 看是否存在明显的散点扩大、缩小或复杂型看是否存在明显的散点扩大、缩小或复杂型趋势(即不在一个固定的带型域中)趋势(即不在一个固定的带型域中)第68页/共155页69看是否形成一斜率为零的直线第69页/共155页702帕克(Park)检验 基本思路是基本思路是:设定随机误差项的方差为解:设定随机误差项的方差为解释变量的某个函数,从而把图示法进一步描述释变量的某个函数,从而把图示法进一步描述为具体的公式。帕克提出的函数形式为:为具体的公式。帕克提出的函数形式为:第70页/共155页71 格里瑟检验的思路与帕克检验基本一致,格里瑟检验的思路与帕克检验基本一致,但格里瑟建议使用残差的绝对值与解释变量做但格里瑟建议使用残差的绝对值与解释变量做回归,而且他提出了多种函数形式:回归,而且他提出了多种函数形式:3.3.格里瑟格里瑟(Glejser)检验检验第71页/共155页724.4.戈德弗尔德戈德弗尔德-匡特匡特(Goldfeld-Quandt)检验检验G-Q 检验以 F 检验为基础,适用于样本容量较大、异方差递增或递减的情况。其基本思想是:先将样本一分为二,对子样和子样分别作回归,然后利用两个子样的残差平方和之比构造统计量进行异方差检验。由于该统计量服从 F 分布,因此假如存在递增的异方差,则 F统计量远大于1;反之就会等于1(同方差)、或小于1(递减方差)。第72页/共155页73(1)将 n 对样本观察值(Xi,Yi)按观察值 Xi 的大小排队;(2)将序列中间的c=n/4个观察值除去,并将剩下的观察值划分为较小与较大的相同的两个子样本,每个子样样本容量均为(n-c)/2;(3)对每个子样分别进行OLS回归,并计算各自的残差平方和;G-Q 检验的具体步骤:第73页/共155页74(4)在同方差性假定下,构造如下满足)在同方差性假定下,构造如下满足 F 分布分布的统计量:的统计量:(5)给定显著性水平给定显著性水平 ,确定临界值,确定临界值 F(v1,v2),若若 F F(v1,v2),则拒绝同方差性假设,表明存则拒绝同方差性假设,表明存在异方差。当然,还可根据两个残差平方和对应在异方差。当然,还可根据两个残差平方和对应的子样的顺序判断是递增型异方差还是递减型异的子样的顺序判断是递增型异方差还是递减型异方差。方差。第74页/共155页755.5.怀特怀特(White)检验检验 怀特检验不需要排序,且适合任何形式的异方差。怀特检验的基本思想与步骤(以二元为例):(2)(2)做如下辅助回归:做如下辅助回归:(3)(3)在同方差假设下:在同方差假设下:R2为辅助回归的可决系数,为辅助回归的可决系数,n为样本容量,为样本容量,m为为辅助回归的解释变量的个数。辅助回归的解释变量的个数。第75页/共155页76(4)(4)在大样本下,对统计量在大样本下,对统计量 nR2 进行相应的进行相应的 检检验。如果统计量大于一定显著性水平的临界验。如果统计量大于一定显著性水平的临界 值,值,则意味着原模型存在异方差性则意味着原模型存在异方差性。如果存在异方差性,则表明确与解释变量的某种组合有显著的相关性,这时往往显示出有较高的可决系数以及某一参数的 t 检验值较大。当然,在多元回归中,由于辅助回归方程中可能有太多解释变量,从而使自由度减少,有时可去掉交叉项。第76页/共155页776.6.布罗施布罗施-培甘培甘(Breusch-Pagan)检验检验即即 为非随机变量为非随机变量z的函数的函数(z);部分或全部解释变量Xj可以作为z。假设异方差性的模型由以下更一般的形式给出:H0:1=2=m=0,(即,(即 )H1:存在某个:存在某个 j0,j=1,2,m原假设与备择假设如下:第77页/共155页78B-P检验的具体步骤如下:(1)对模型运用)对模型运用OLS,求出残差,求出残差 e i(4)用)用pi 对以下模型运用对以下模型运用OLS回归回归(2)求出)求出 :(3)构造变量)构造变量 pi:第78页/共155页79,对给定的显著性水平,对给定的显著性水平,当当 时,拒绝原假设,时,拒绝原假设,即异方差性存在。即异方差性存在。其中其中为自由度为自由度m的临界值。的临界值。使用B-P检验时,不需要特别对函数(z)的类型进行限制,只需要其中包含常数项。(5)得到回归平方和)得到回归平方和ESS,并且定义,并且定义可以证明如果有同方差性,则第79页/共155页80四、解决异方差问题的方法基本思路:变换原模型,使经过变换后的模基本思路:变换原模型,使经过变换后的模型具有同方差性,然后再用型具有同方差性,然后再用OLS法进行估计。法进行估计。对于模型对于模型 设随机扰动项的方差表示为:设随机扰动项的方差表示为:第80页/共155页81 所以变换后随机扰动项的方差为常数,可以应用OLS法进行估计,得到的参数估计量为BLUE。但这里得到的OLS估计量是模型变形后的OLS估计量。对于原模型而言,它已不是OLS估计量,我们称为广义最小二乘估计量(GLS估计量)。第81页/共155页82广义最小二乘法广义最小二乘法(Generalized least squares)下下面面用用矩矩阵阵形形式式的的模模型型来来推推导导出出GLS估估计计量量的的一一般计算公式。般计算公式。设设GLS模型为:模型为:Y=X+u 满足满足 E(u)=0,E(uu)=2,X非随机,非随机,X的秩的秩=k+1n n,其中,其中为正定矩阵。为正定矩阵。根据矩阵代数知识可知,对于任一正定矩阵根据矩阵代数知识可知,对于任一正定矩阵,存在着一个满秩矩阵存在着一个满秩矩阵P P,使得,使得第82页/共155页83第83页/共155页84 这这表表明明,新新模模型型中中的的扰扰动动项项u*满满足足OLS法法的的基基本本假假设设,可直接用可直接用OLS估计,估计量向量为:估计,估计量向量为:这这就就是是广广义义最最小小二二乘乘估估计计量量(GLS估估计计量量)的的公公式式,该该估计量是估计量是BLUE。从从上上述述证证明明过过程程可可知知,我我们们可可将将GLS法法应应用用于于为为任任意意正定矩阵的情形。正定矩阵的情形。第84页/共155页85如果只存在异方差性,则如果只存在异方差性,则其中其中显然有显然有:第85页/共155页86第86页/共155页87 这种作法实际上等价于在代数形式的原模型这种作法实际上等价于在代数形式的原模型Yi=0+1X1 i+k X ki+u i 的的两两端端除除以以 i,得得变变换换模型:模型:这这相相当当于于在在回回归归中中给给因因变变量量和和解解释释变变量量的的每每个个观观测测值值都都赋赋予予了了一一个个与与相相应应扰扰动动项项的的方方差差相相联联系系的的权权数数,然然后后再再对对这这些些变变换换后后的的数数据据进进行行OLS回回归归,因因为为这这种种作作法法相相当当于于每每个个观观测测值值都都以以相相应应扰扰动动项项的的标标准准差差的的估估计计值值 的的倒倒数数(即即 )为为权权数数,因因而而被被称称为为加加权权最最小小二二乘乘法法(WLS,Weighted Least Squares)。)。第87页/共155页88 加权最小二乘法是广义最小二乘法的一个特例,在加权最小二乘法是广义最小二乘法的一个特例,在矩阵为对角矩阵矩阵为对角矩阵这种特殊情形下,我们既可以直接应用矩阵形式的广义最小二乘估计量公式这种特殊情形下,我们既可以直接应用矩阵形式的广义最小二乘估计量公式得到得到GLS估计值,亦可避开矩阵运算,采用加权最小二乘法得到其估计值,亦可避开矩阵运算,采用加权最小二乘法得到其WLS估估计值,两者结果完全相同,无论你称之为计值,两者结果完全相同,无论你称之为GLS估计值还是估计值还是WLS估计值,二估计值,二者是一码事。者是一码事。第88页/共155页89 加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用OLS估计其参数。在采用OLS方法时:对较小的残差平方ei2赋予较大的权数,对较大的残差平方ei2赋予较小的权数。我们设所加的权数矩阵为:我们设所加的权数矩阵为:关键的问题就是如何来确定权重!关键的问题就是如何来确定权重!第89页/共155页90即随机误差项的方差与解释变量即随机误差项的方差与解释变量Xj之间存在相关性,之间存在相关性,那么可以用那么可以用 去除原模型,得:去除原模型,得:例如:多元模型,经检验知:例如:多元模型,经检验知:该模型随机误差项的方差为:该模型随机误差项的方差为:即满足同方差性即满足同方差性,可用,可用OLS法估计,在这里法估计,在这里“权权”就是就是 第90页/共155页91 这表明干扰项方差与X的平方成比例在模型的两边除以Xji,对模型进行变换。残差平方对X作散点图,若发现一个喇叭形:可用可用WLS法估计法估计,在这里在这里“权权”就就是是 特殊情况特殊情况1:第91页/共155页92残差平方对X作散点图,若发现一个锥形:特殊情况特殊情况2:这时候可以用这时候可以用 去除原模型。去除原模型。可用可用WLS法估计法估计,在这里在这里“权权”就就是是 第92页/共155页93对数变换常常能减低异方差性,原因就是对数变换压缩了测量变量的尺度,把两个值的10倍之差降低到约2倍之差。但要注意对数变换的前提是所有变量的水平值都必须大于0。在实际操作中我们也可以不对原模型进行异方差性检验,而是直接选择加权最小二乘法,尤其是采用截面数据作样本时。n如果确实存在异方差,则被有效地消除了。n如果不存在异方差性,则加权最小二乘法等价于普通最小二乘法。注意:注意:第93页/共155页94五、实例五、实例中国农村居民人均消费函数模型中国农村居民人均消费函数模型中国农村居民人均消费支出主要由人均纯收入来决中国农村居民人均消费支出主要由人均纯收入来决定。农村人均纯收入包括:定。农村人均纯收入包括:(1)(1)从事农业经营的收从事农业经营的收入;入;(2)(2)包括从事其他产业的经营性收入;包括从事其他产业的经营性收入;(3)(3)工工资性收入;资性收入;(4)(4)财产收入;财产收入;(5)(5)转移支付收入。转移支付收入。我们考察从事农业经营的收入我们考察从事农业经营的收入(X1)和其他收入和其他收入(X2)对中国农村居民消费支出对中国农村居民消费支出(Y)增长的影响增长的影响:第94页/共155页95第95页/共155页96普通最小二乘法的估计结果:普通最小二乘法的估计结果:第96页/共155页97进一步的统计检验进一步的统计检验(1)G-Q 检验检验 将原始数据按将原始数据按 X2 排成升序,去掉中间的排成升序,去掉中间的7个数据,得两个容量为个数据,得两个容量为 12 的子样本。的子样本。对两个子样本分别作对两个子样本分别作OLS回归,求各自的回归,求各自的残差平方和残差平方和RSS1和和RSS2:

    注意事项

    本文(模型的建立与估计中的问题及对策.pptx)为本站会员(莉***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开