中级计量经济学重点(42页).doc
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《中级计量经济学重点(42页).doc》由会员分享,可在线阅读,更多相关《中级计量经济学重点(42页).doc(41页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、-中级计量经济学重点-第 39 页 第一章 满足经典假定下的参数估计一、 基本概念变量、数据与模型(一)、经济变量 具有特定的经济含义影响经济系统的因素,它是构成方程式的最基本要素,变量的基本特征是要求具有可观测和可计量。 1、变量的类型被解释变量(应变量、因变量) 解释变量 (自变量)被解释变量与解释变量之间的关系强调的是单向因果关系,即解释变量影响被解释变量,反之不行。注:被解释变量为服从正态分布的连续随机变量(这是“经典”的核心)。 内生变量(强调其随机性和不可控制性) 外生变量(强调其确定性和可控制性) 内生变量与外生变量的关系:外生变量控制影响内生变量,而内生变量不能控制影响外生变量
2、滞后内生变量(动态变量、能否控制信息)前定变量=外生变量+滞后内生变量 (二)数据1、时间数列数据;2、截面数据;3、面板数据4、虚拟变量数据(离散数据) (三)模型设定1、 模型和方程:方程是模型的基本单位; 决定方程的两要素是变量的个数和方程的函数形式。2、在模型设定过程中应注意的问题基于经济理论的认识;模型的数学形式;变量的取舍。 3、计量经济模型对数据质量的基本要求真实性 可靠性 完整性 一致性 可比性 二、在总体回归函数中引入随机扰动项的原因:初级计量P26-27. 三、经典假定的内容 (一)经典假定 1、零均值假定。2、同方差假定。3、无自相关假定。4、解释变量与随机误差项不相关。
3、5、无多重共线性假定。6、正态性假定。还有:回归模型关于参数线性;在重复抽样中X值是固定的(或X是非随机的);X的值要有变异;模型设定是正确的。 (二)多元线性回归模型的基本假定(用矩阵表示)。 1、零均值假定 2、同方差和无自相关假定 (条件方差不变、条件自相关等于0) 3、随机扰动项与解释变量不相关假定 4、无多重共线性假定。 5、正态性假定 独立同分布,且N(0, 2 ) (三)经典假定的再认识1、零均值(1)对固定的X值,随机扰动项的条件均值为零。由可以得到两个基本含义:一是;二是的均值不依赖于X,这意味着与X,包括X的任何函数都不相关,如等形式。 (2)在固定X值下,对于Y的变动总是
4、围绕其均值上下波动,离开均值上下方的距离就是。正的与负的相互抵消,它们对Y的平均影响应该为零。(3)假定,也就意味着,只能成立。(4)Y值的变动无异常(即无极端值表现)。(5)如果成立,则X具有强外生性。此时,X为非随机的。(6)模型的函数关系无错误设定;没有缺失重要解释变量。2、X与u不相关 该假定保证了获得参数的可靠估计。否则,我们就不能估计出在其它条件不变下的影响程度。(1)该假定意味着,在模型中,X和u对Y有各自的影响。(2)如果X与u是相关的,就不能评估它们各自对Y的影响。(3)对于,如果X是非随机的,这时有;但如果X是随机的,由于不一定有,所以这时提出该假定就有意义了。(4)在模型
5、中, 如果u中的(其它)因素保持不变,就意味着u的变化为零,即,那么X对Y的线性影响为:,Y的变化量是和X的变化量的简单乘积。如果没有该假定,上述解释就不成立。(5) 在正态性下,该假定意味着与之间随机独立。 (6)在为强外生的情况下,有: 如果X与u相互独立,则X具有强外生性。通常该假定 只意味着X是外生的。3、同方差(1)在固定X值的条件下,随机扰动项的方差为一固定常数。(2)在这假定下,消费支出方差在所有的收入水平上都保持不变。即表明对应于X值的全部Y值都有同样的重要性。(3)同方差性意味着,。4、无自相关(无序列相关)(1)给定X,任意两个Y值对其的离差都不会表现为相关关系。(2)在该
6、假定下,只考虑X对Y的系统性影响和是否有影响,而不去担心由于u之间的可能相关造成的其它作用于Y的影响。5、正态性(1)因为有了正态性假定,就有,也就有,进一步可推导出参数估计的分布。(2)根据中心极限定理,在大样本下,可得到u渐进服从正态分布。6、除了以上假定外,还要注意:(1)X在重复抽样中取固定值(2)X的值要有变异性(3)样本观测次数要大于参数个数(4)正确设定了模型 四、最小二乘估计OLS(一)OLS估计式的离差形式:(二)OLS回归线的性质 1、分别是样本的线性组合,由于Y的随机性使得是随机变量,并且是的点估计。2、回归线通过样本均值点; 3、 ; 4、5、; 6、(三)过原点回归定
7、义:设一元线性回归模型为 ; 当时,则称此式为“过原点回归”。特点:由最小二乘法,对表达式: (2) 求使式(2)有最小值。即对式(2)求导数得 (3)令其等于零,并化简得: (4)将代入上式得: (5) 显然,满足,并且,在令式(3)等于零时,即有;对于有截距项的模型,除了这个性质外,还有。但对于无截距项的模型,就不一定成立。事实上,如果成立,则对于样本回归模型有: 由假定 成立,则:解出有: (6)式(6)与式(4)估计的结果矛盾,所以,当模型无截距项时,就不一定成立。进一步还可得到不一定成立。对于无截距项的模型式(1),拟合优度有可能出现负值。事实上,由拟合优度定义可知: 当有截距项时,
8、并且,表明,所以,拟合优度不可能为负值。但对于无截距项的模型,则为如下结果: 并且,当出现时,则将大于(),这时会是负值。 综合上述分析,一般情况下,没有充分的理由,不要轻易去掉截距项。五、最小二乘估计的统计性质1、线性性。 即参数估计是关于被解释变量的线性函数2、无偏性。 即。 3、最小方差性。 即具有最小方差性的无偏估计量,称估计的有效性 4、一致性。 初级计量:P37 无偏性和有效性,在小样本下也行;一致性必须为大样本。 六、多元线性回归模型的检验 (一)拟合优度检验1、拟和优度的度量可决系数: 对TSS=RSS+ESS的说明。TSS为总离差平方和,反映了Y的样本观测值的平均差异程度;E
9、SS为Y的估计值与均值的离差平方和,它反映了解释变量的变化所引起的对Y的波动大小,即解释变量在模型中存在的重要程度;RSS为残差平方和,反映的是Y依据回归直线没有得到解释的变差。因此,ESS越大说明回归直线拟和效果越好,而RSS越小说明回归直线拟和误差越小2、多重可决系数多重可决系数用表示。 3、修正的可决系数。为什么要用修正的可决系数?实际上从的计算可看出:(1)在方程中增加一个解释变量,TSS不发生变化,而ESS会明显增大,这是因为方程的解释力增强了,这就造成一种错觉,只要增加解释变量就会提高方程的解释力;(2)在样本容量一定的情况下,增加解释变量会使自由度减小,从而降低模型的可靠性。因此
10、,需要对这一情况做适当修正,得到修正的可决系数,即式中k为参数的个数,n为样本容量。 4、与的关系或者, 当k=1时,即只有截距项时,。当k1时,。有时可能会出现负值,这时令=0。 利用修正的可决系数可以判断新增加的解释变量对被解释变量的影响程度,当模型中增加一个解释变量时,如果变小,则会增大,便可认为这个解释变量是对Y有显著性影响,这时可将该变量放进模型,否则,应于放弃。(二)回归方程显著性的检验(F检验)1、F检验的意义(1)检验的不足。尽管具有对模型整体拟合状况的判断,但它并不能得到到底要多大时回归方程才算通过了拟合优度检验。虽然R2能够给出评价模型拟合好坏的度量,但它只是对样本的拟合程
11、度进行评价,不能回答总体的真实状况。 (2)F检验的目的。对于总体多元线性回归模型,从整体上看,多个解释变量与被解释变量之间是否存在显著的线性关系,或者说Y的变动是否依赖于这些解释变量的变化。;不全为零F(k-1,n-k)由F统计量的构成可以看出(可以证明ESS服从自由度为k-1的分布,RSS服从自由度为n-k的分布),如果ESS显著地大于RSS,则表明不能认为所有的全为零,这时在很大程度上要拒绝。则在该意义下,说明回归方程中的所有解释变量对应变量存在显著性影响。 F检验的一般步骤是:(1)构造F统计量,即。(2)给定显著性水平,查F分布表,得临界值,其中k为参数的个数,n为样本容量。(3)比
12、较判断。若F,则拒绝原假使,表明回归函数从整体上看是显著的,即所有解释变量对应变量有显著性影响。(三)回归参数显著性的检验(t检验)1、t检验在多元线性回归模型里与一元的情况是一致的。需要注意的是在多元线性回归模型对参数的t检验中,即t(n-k) (在成立下)这里是服从自由度为(n-k)的t分布。因此,在多元的情况下,运用t检验的操作过程如下(1)提出假设(2)构造检验统计量在H0成立的情况下,有:t(n-k)(3)计算t统计量值,。(4)根据t分布,给定显著性水平,查表得临界值。(5)比较判断,若,则拒绝H0,同时接受H1。表明第j个解释变量Xj对被解释变量Y存在显著性影响;否则,表明第j个
13、解释变量Xj对被解释变量Y不存在显著性影响。2、F检验与t检验的联系与区别(1)联系。在一元回归模型中,有t2=F,即一元回归模型条件下,t检验与F检验是一致的。但在多元回归模型中,则没有这一关系,甚至有的时候它们之间存在完全相反的检验结果。(2)区别:t检验是针对个别参数的显著性,而F检验是针对模型整体的显著性。3、F检验与可决系数R2的关系 根据这一关系式(或初级计量;P87),可知当样本容量较大时,拟合优度可低一些,但当样本容量较小时,则拟合优度要求就高。否则显著性检验难以通过。通过可决系数与F检验的特点,实际上F检验可以看是对R2的显著性检验。 七、一般线性框架下的假设检验 (一)“有
14、约束”与“无约束”检验。 对未知参数有约束限制的模型进行回归后的结果,与对没有约束限制的模型回归后的参数检验的结果是否一致?答案:一致的。(中级计量;P21-P22)(二)三大检验的理解和认识由于三大检验均来自F检验的一般形式(即另一种形式),所以,从理论上讲,如果把F检验放在一起的话,并且,t检验看成是F检验的一个特殊情况,对模型检验(包括系数和函数)的方法应该有四种,即F检验、LR似然比检验、Wald检验和LM拉格朗日乘数检验。 1、F检验其中,为参数中非零的个数,k为无约束的参数个数。F检验的思想是当有约束与无约束很接近的时候,F的值应该比较小(小于给定显著性水平下的临界值),这个时候不
15、拒绝约束条件。反过来,当F的值大于给定显著性水平下的临界值,则拒绝约束条件,认为有约束与无约束存在显著性差异。F检验的不足是只能检验线性约束条件2、似然比检验() 检验只适用于对线性约束的检验。该检验的基本思路:如果约束条件成立,则相应的约束条件的对数似然函数的最大值与无约束条件的对数似然函数的最大值应该是近似相等的,这个时候构造的LR似然比应该比较接近1,即。由此得到统计量 计算统计量需要分别拟合无约束模型和有约束模型。在大样本下,统计量服从自由度为假设中约束条件个数的卡方分布。事实上,前面讲的各种检验,如检验、检验等都可以根据似然比原理推导出来。这说明似然比检验是统计检验的理论基础。 3、
16、沃尔德检验()检验适用于线性或非线性约束条件的检验,其优点是只需要估计出无约束模型,当约束模型的估计很困难时,该方法尤其适用。检验的原理是通过测量无约束估计量与约束估计量之间的距离来实现对约束条件的检验。 当约束条件成立时,有约束的估计量的结果与约束条件应该一致。但无约束的估计量是否也是一样?则须构造无约束估计量的统计分布,以此判断约束假设的真伪。 4、拉格朗日乘数检验()检验只需估计有约束模型,当施加约束条件后的模型形式变得简单时,通常使用该检验。检验的具体步骤如下:1、用OLS估计约束模型,计算残差序列。2、建立辅助回归式: 其中,为随机误差项,3、用OLS估计上式并计算可决系数。4、得到
17、统计量: 5、给定显著性水平,查卡方分布表,得临界值,若,则拒绝原假设,说明无约束模型成立。5、和的比较(一)三种检验方法一致之处1、三种检验方法都由极大似然估计而来。2、三种检验方法都用到了对数似然的函数。3、三种检验方法都是针对模型约束条件进行检验。(二)三种检验方法不一致之处1、检验只适用于线性约束的检验,检验需要计算带约束和无约束的对数似然函数值。2、检验和检验既适用于线性约束也适用于非线性约束的检验。3、检验只需要估计无约束的模型,而检验只需要估计约束模型,所以,当施加约束条件后模型形式变得简单时,使用检验更方便。(三)三种检验方法的关系对于、和三个检验方法的选择应以实际计算难易程度
18、二定,一般来说,和检验优于检验,因为和检验只需估计一个模型即可,而检验需要估计有约束和无约束两种模型。并且,在小样本条件有说明只有当检验的结果为拒绝原假设(约束条件不成立),或者检验的结果为接受原假设(约束条件成立)时,三种检验结果才是一致的。所以,三种检验方法有可能得出相互不一致的结论。总之,当检验拒绝原假设时,其他检验也一样。当检验没有拒绝原假设时,其他检验也不会拒绝原假设。尽管在小样本时三个值可能有所不同,但在大样本情形,这三个检验近似相等。就计算而言,检验最麻烦,其他两种还算简单。另外,在小样本情况下,并且约束条件为线性时,用检验比用这三个检验更可靠。三大检验方法的比较:方法适用范围计
19、算方式以一元线性回归为例的计算及直观意义()只适用线性约束的检验计算带约束和无约束的对数似然值与之间的垂直距离线性约束和非线性约束检验只需估计无约束的模型(检验) 度量与之间的水平距离同上只需估计约束模型考察对数似然函数在处的斜率 第二章 违背经典假定下的参数估计第一节 多重共线性一、多重共线性的定义1、完全多重共线性的定义。对于变量,如果存在不全为零的数使得成立,则称变量之间存在完全的多重共线性。 2、不完全多重共线性的定义。 解释变量之间的共线性非精确表示,是一种近似的关系,所以在上述表达式中引入随机误差项,即对于变量,如果存在不全为零的数使得成立,其中为随机误差项,或者是线性相关的一种近
20、似关系 则称变量之间存在不完全的多重共线性,或者说是近似的多重共线性。二、多重共线性产生的后果(一)完全多重共线性下的后果如果解释变量之间存在完全的多重共线性,则从结论上看有:1、参数估计值不确定。 2、参数估计值的方差会无限大。 (二)不完全多重共线性下的后果1、有可能求出参数的估计值,但估计值很不稳定。 2、参数估计值的方差会随多重共线性(近似)程度的提高而增大。 3、对总体参数的区间估计将会降低精确度(置信区间变宽)。评价区间估计的两个标准: (1)估计的可靠度。(2)估计的精确度 . 4、对总体参数的显著性检验(t检验)在统计上将会不显著。 三、多重共线性的检验 (一)简单相关系数矩阵
21、法 (二)t检验与F检验的综合判断该方法的思想是,利用对参数的t检验与对模型整体的F检验的不一致,判断模型中解释变量之间存在不完全多重共线性。如果当计算出的或很大,F值显著性地超过给定显著性水平下所对应地临界值,但变量所对应地偏回归系数的t统计量值不显著,则说明该模型中的解释变量存在多重共线性。(三)辅助回归法在k个解释变量中,求每一个对剩余变量的回归,即式中为随机误差项,并计算出相应的,记为;同时观察对应的F统计量值的大小。如果很大,F统计量值超过给定的临界值水平,则说明模型中解释变量存在不完全多重共线性。(四)方差扩大(膨胀)因子法(五)特征值与病态指数法四、多重共线性的补救措施(一)增加
22、样本容量。 (二)利用先验信息。思路:利用先验信息,实现对变量的降维(即减少解释变量的个数),最终达到修正多重共线性目的。 (三)变换模型的形式:对变量进行差分,还可将变量转换为增量形式 (四)逐步回归法 (五)岭回归1、岭回归是 一种改进最小二乘估计的方法,也叫岭估计。当解释变量之间存在多重共线性时,则会增大,原因在于接近奇异。如果将加上一个正常数对角矩阵kI (k0,I为单位矩阵),即,使得的可能性比的可能性小,那么接近奇异的程度就会比小得多。由此,建立的如下估计为 (1)称为的岭回归估计量,为岭回归参数。当解释变量之间存在多重共线性时,以作为的估计应比普通最小二乘估计稳定。可以证明,当较
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中级 计量 经济学 重点 42
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内