《计量经济学多元线性回归说课讲解.ppt》由会员分享,可在线阅读,更多相关《计量经济学多元线性回归说课讲解.ppt(92页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、计计量量经济经济学多元学多元线线性回性回归归1、多元线性回归模型、多元线性回归模型 多元线性回归模型多元线性回归模型:表现在线性回归模型中的解释变量有多个。一般表现形式一般表现形式:i=1,2,n其中:k为解释变量的数目,j称为回归参数回归参数(regression coefficient)。也也被被称称为为总总体体回回归归函函数数的的随随机机表表达达形形式式。它它 的的非随机表达式非随机表达式为为:表示:表示:各变量各变量X X值固定时值固定时Y Y的平均响应的平均响应。习惯上习惯上:把常数项常数项看成为一虚变量虚变量的系数,该虚变量的样本观测值始终取1。于是:模型中解释变量的数目为(模型中
2、解释变量的数目为(k+1)总体回归模型n个随机方程的矩阵表达式矩阵表达式为:j也被称为偏回归系数偏回归系数,表示在其他解释变量保持不变的情况下,X j每变化1个单位时,Y的均值E(Y)的变化;或者说j给出了X j的单位变化对Y均值的“直接”或“净”(不含其他变量)影响。用来估计总体回归函数的样本回归函数样本回归函数为:其中其中其其随机表示式随机表示式:ei称为残差残差或剩余项剩余项(residuals),可看成是总体回归函数中随机扰动项ui的近似替代。样本回归函数样本回归函数的矩阵表达矩阵表达:或或其中其中:基本形式小结基本形式小结矩阵形式矩阵形式2、多元线性回归模型的基本假定、多元线性回归模
3、型的基本假定 例:例:在一项调查大学生一学期平均成绩在一项调查大学生一学期平均成绩Y与每周在学习与每周在学习(X1)、睡觉)、睡觉(X2)、娱乐)、娱乐(X3)和其它活动)和其它活动(X4)所用时间关系的研究中,建立了如下模型:所用时间关系的研究中,建立了如下模型:如果这些活动所用时间的总和为一周的总小时数如果这些活动所用时间的总和为一周的总小时数168小小时。问:保持其它变量不变,而改变其中一个变量的说时。问:保持其它变量不变,而改变其中一个变量的说法是否有意义?该模型是否有违背基本假定的情况?如法是否有意义?该模型是否有违背基本假定的情况?如何修改此模型使其更合理?何修改此模型使其更合理?
4、二、多元线性回归模型的估计二、多元线性回归模型的估计 1 1、普通最小二乘估计、普通最小二乘估计 2 2、极大似然估计、极大似然估计 3 3、参数估计量的性质、参数估计量的性质 4 4、样本容量问题、样本容量问题说说 明明估计方法:估计方法:两大类方法:两大类方法:OLS、ML在经典模型中多应用在经典模型中多应用OLS在非经典模型中多应用在非经典模型中多应用ML在本节中,在本节中,ML为选学内容为选学内容1 1、普通最小二乘估计、普通最小二乘估计对于随机抽取的n组观测值如果样本函数样本函数的参数估计值已经得到,则有:i=1,2n 根据最最小二乘原小二乘原理理,参数估计值应该是右列方程组的解 其
5、中 于是得到关于待估参数估计值的正规方程组正规方程组:解该(k+1)个方程组成的线性代数方程组,即可得到(k+1)个待估参数的估计值$,jj=012L。k正规方程组正规方程组的矩阵形式矩阵形式即由于XX满秩,故有 将上述过程用矩阵表示矩阵表示如下:即求解方程组:即即补充:补充:得到:于是:售价X销售量Q2.0412.5383.0343.5324.0294.5285.0255.5226.020例:利用下表数据,计算例:利用下表数据,计算 和和正规方程组正规方程组 的另一种写法对于正规方程组正规方程组 于是 或(*)或(*)是多元线性回归模型正规方程组正规方程组的另一种写法。(*)(*)样本回归函
6、数的离差形式样本回归函数的离差形式i=1,2n 其矩阵形式矩阵形式为:其中:在离差形式下,参数的最小二乘估计结果为 随机误差项随机误差项u的方差的方差 2 2的无偏估计的无偏估计 可以证明,随机误差项u的方差的无偏估计量为:2 2、极大似然估计、极大似然估计对于多元线性回归模型对于多元线性回归模型易知易知Y的随机抽取的的随机抽取的n组样本观测值的联合概率组样本观测值的联合概率 对数似然函数为对对数似然函数求极大值,也就是对 求极小值。即为变量Y的似然函数似然函数 因此,参数的极大似然估计极大似然估计为为结果与参数的普通最小二乘估计相同。结果与参数的普通最小二乘估计相同。3 3、参数估计量的性质
7、、参数估计量的性质 在满足基本假设的情况下,其结构参数 的普通最小二乘估计及最大或然估计最大或然估计仍具有:线性性线性性、无偏性无偏性、有效性有效性。同时,随着样本容量增加,参数估计量具有:一致性一致性。(1)线性性)线性性 其中,C=(X X)-1 X 为一仅与固定的X有关的行向量。(2)无偏性)无偏性 U)(3)有效性(最小方差性)有效性(最小方差性)这里利用了假设:E(X u)=0其中利用了 和4 4、样本容量问题、样本容量问题 所谓“最小样本容量最小样本容量”,即从最小二乘原理和极大似然原理出发,欲得到参数估计量,不管其质量如何,所要求的样本容量的下限。(1)最小样本容量最小样本容量
8、样本最小容量必须不少于模型中解释变量样本最小容量必须不少于模型中解释变量的数目(包括常数项)的数目(包括常数项),即 n k+1因为,无多重共线性要求:秩(X)=k+1(2 2)满足基本要求的样本容量)满足基本要求的样本容量 从统计检验的角度从统计检验的角度:n30 时,Z检验才能应用;n-k8时,t分布较为稳定 一般经验认为一般经验认为:当n30或者至少n3(k+1)时,才能说满足模型估计的基本要求。模型的良好性质只有在大样本下才能得到理模型的良好性质只有在大样本下才能得到理论上的证明。论上的证明。三、拟合优度检验三、拟合优度检验1、可决系数与调整的可决系数、可决系数与调整的可决系数则 总离
9、差平方和的分解总离差平方和的分解=0 可决系数可决系数该统计量越接近于该统计量越接近于1,模型的拟合优度越高。,模型的拟合优度越高。问题:问题:在应用过程中发现,如果在模型中增在应用过程中发现,如果在模型中增加一个解释变量,加一个解释变量,R2往往增大(往往增大(Why?Why?)这就给人这就给人一个错觉一个错觉:要使得模型拟合得好,要使得模型拟合得好,只要增加解释变量即可只要增加解释变量即可。但是,现实情况往但是,现实情况往往是,由增加解释变量个数引起的往是,由增加解释变量个数引起的R2的增大与拟的增大与拟合好坏无关合好坏无关,R2需调整需调整。调整的可决系数调整的可决系数(adjusted
10、 coefficient of determination)在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平将残差平方和与总离差平方和分别除以各自的自由度,以方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响剔除变量个数对拟合优度的影响:其中:n-k-1为残差平方和的自由度,n-1为总体平方和的自由度。说明说明 例例 设 n=20,k=3,R2=0.70 求 。若n=10,则 =0.55;若n=5,则 =0.20下面改变n的值,看一看 的值如何变化。由本例可看出,有可能为负值。这与R2不同 ()解解 *2、赤池信息准则和施瓦茨准则、赤池信息
11、准则和施瓦茨准则 为了比较所含解释变量个数不同的多元回归模型的拟合优度,常用的标准还有:赤池信息准则赤池信息准则(Akaike information criterion,AIC)施瓦茨准则施瓦茨准则(Schwarz criterion,SC)这两准则均要求这两准则均要求仅当所增加的解释变量能够减少仅当所增加的解释变量能够减少AICAIC值或值或ACAC值时才在原模型中增加该解释变量值时才在原模型中增加该解释变量。四、非线性关系的处理四、非线性关系的处理 1 1、模型的类型与变换、模型的类型与变换 2 2、非线性回归、非线性回归在实际经济活动中,经济变量的关系是复杂的,在实际经济活动中,经济变
12、量的关系是复杂的,直接表现为线性关系的情况并不多见。直接表现为线性关系的情况并不多见。如著名的如著名的恩格尔曲线恩格尔曲线(Engle curves)表现为表现为幂函幂函数曲线数曲线形式、宏观经济学中的形式、宏观经济学中的菲利普斯曲线菲利普斯曲线(Pillips cuves)表现为)表现为双曲线双曲线形式等。形式等。但是,大部分非线性关系又可以通过一些简单但是,大部分非线性关系又可以通过一些简单的数学处理,使之化为数学上的线性关系,从的数学处理,使之化为数学上的线性关系,从而可以运用线性回归模型的理论方法。而可以运用线性回归模型的理论方法。说明说明(1 1)倒数模型、多项式模型与变量的直接置换
13、法)倒数模型、多项式模型与变量的直接置换法 例如,例如,描述税收与税率关系的描述税收与税率关系的拉弗曲线:拉弗曲线:抛物线抛物线 s=a+b r+c r2+u c0 s:税收;:税收;r:税率:税率设设X1=r,X2=r2,则原方程变换为则原方程变换为 s=a+b X1+c X2 +u c0 1、模型的类型与变换、模型的类型与变换(2)幂函数模型、指数函数模型与对数变换法)幂函数模型、指数函数模型与对数变换法 例如例如,Cobb-Dauglas生产函数生产函数:幂函数:幂函数 Q=AK L euQ:产出量,:产出量,K:投入的资本;:投入的资本;L:投入的劳动:投入的劳动 方程两边取对数:方程
14、两边取对数:ln Q=ln A+ln K+ln L+u(3)复杂函数模型与级数展开法)复杂函数模型与级数展开法 方程两边取对数后,得到:方程两边取对数后,得到:Q:产出量,产出量,K:资本投入,:资本投入,L:劳动投入:劳动投入 :替代参数,:替代参数,1、2:分配参数:分配参数例如,例如,常替代弹性常替代弹性CES生产函数生产函数2、非线性回归、非线性回归 对于不可线性化的模型,可采用非线性回归技术对参对于不可线性化的模型,可采用非线性回归技术对参数进行估计,常用的非线性回归技术有非线性最小二乘法数进行估计,常用的非线性回归技术有非线性最小二乘法(NLS),该方法的原则仍是使残差平方和达到最
15、小。该方法的原则仍是使残差平方和达到最小。其步骤如下:其步骤如下:(1)给出各参数的初始估计值;)给出各参数的初始估计值;(2)用上述参数值及)用上述参数值及X的观测值计算的观测值计算Y的预测值的预测值;(3)计计算残差平方和算残差平方和e2;(4)对对一个或多个参数的估一个或多个参数的估计值计值作微小作微小变动变动;(5)计算计算Y的新预测值的新预测值;(6)再计算残差平方和)再计算残差平方和e2;(7)若残差平方和减小了,则说明新参数的估计值优)若残差平方和减小了,则说明新参数的估计值优于老的,则以它们为新的起点;于老的,则以它们为新的起点;(8)重复步骤()重复步骤(4),(),(5),
16、(),(6),直至无法减少),直至无法减少残差平方和为止;残差平方和为止;(9)最后的参数估计值即为非线性最小二乘估计值。)最后的参数估计值即为非线性最小二乘估计值。五、假设检验五、假设检验 1、系数的显著性检验、系数的显著性检验(1 1)单个系数显著性检验)单个系数显著性检验 目的是检验某个解释变量的系数目的是检验某个解释变量的系数j是否为是否为0,即该解释,即该解释变量是否对被解释变量有影响。变量是否对被解释变量有影响。原假设:原假设:H0:j=0检验统计量是自由度为检验统计量是自由度为 n-k-1 的的 t 统计量:统计量:t(n-k-1)其中,其中,为矩阵为矩阵 主对角线上第主对角线上
17、第 j+1个元素。而个元素。而例:柯布例:柯布-道格拉斯生产函数道格拉斯生产函数 用柯布和道格拉斯最初使用的数据(美国用柯布和道格拉斯最初使用的数据(美国1899-1922年制造业数据)估计经过线性变换的模型年制造业数据)估计经过线性变换的模型得到如下结果得到如下结果(括号内数字为标准误差)(括号内数字为标准误差):请检验请检验“斜率斜率”系数系数 和和 的显著性。的显著性。解:解:(1)检验检验 的显著性的显著性 原假设:原假设:H0:=0由回归结果,我们有:由回归结果,我们有:t0.23/0.06=3.83用自由度为用自由度为24321,查,查t表,表,5%显著性水平下,显著性水平下,t/
18、2 2.08.t3.83 t/2 2.08,故拒绝故拒绝原假设原假设H0。结论:结论:显著异于显著异于0。(2)检验检验 的显著性的显著性 原假设:原假设:H0:=0由回归结果,我们有:由回归结果,我们有:t0.81/0.15=5.4t5.4 t/2 2.08,故拒绝故拒绝原假设原假设H0。结论:结论:显著异于显著异于0。有有时时需需要要同同时时检检验验若若干干个个系系数数是是否否为为0,这这可可以以通通过建立单一的原假设来进行。过建立单一的原假设来进行。设设要要检检验验g个个系系数数是是否否为为0,即即与与之之相相对对应应的的g个个解解释释变变量量对对因因变变量量是是否否有有影影响响。不不失
19、失一一般般性性,可可设设原原假假设和备择假设为:设和备择假设为:H0:1=2=g g =0 H1:H0不成立不成立(即即X1,Xg中至少有一个变量对中至少有一个变量对Y有有 影响影响)(2 2)若干个系数的显著性检验(联合假设检验)若干个系数的显著性检验(联合假设检验)分析:分析:这实际上相当于检验这实际上相当于检验g个约束条件个约束条件 1=0,2=0,g g =0 是否同时成立。是否同时成立。若若H0为真,则正确的模型是:为真,则正确的模型是:据此进行回归(有约束回归),得到残差平方和据此进行回归(有约束回归),得到残差平方和 SR是是H0为真时的残差平方和。为真时的残差平方和。若若H1为
20、真,正确的模型即原模型:为真,正确的模型即原模型:据此进行无约束回归(全回归),得到残差平方和据此进行无约束回归(全回归),得到残差平方和 S是是H1为真时的残差平方和。为真时的残差平方和。如如果果H0为为真真,则则不不管管X1,Xg这这g个个变变量量是是否否包包括括在在模模型型中中,所得到的结果不会有显著差别,因此应该有:所得到的结果不会有显著差别,因此应该有:S SR如如果果H1为为真真,则则由由前前面面所所讨讨论论的的残残差差平平方方和和e2的的特特点点,无无约约束回归增加了变量的个数,应有束回归增加了变量的个数,应有 S SR 通过检验二者差异是否显著地大,就能检验原假设是否成立。通过
21、检验二者差异是否显著地大,就能检验原假设是否成立。所使用的检验统计量是:所使用的检验统计量是:F(g,n-k-1)其中,其中,g为分子自由度,为分子自由度,n-k-1为分母自由度。为分母自由度。使用使用 的作用是消除具体问题中度量单位的作用是消除具体问题中度量单位的的影影响响,使使计计算算出出的的 F 值值是是一一个个与与度度量量单单位位无无关关的量。的量。假设已得到下面结果:假设已得到下面结果:(1)全回归)全回归 估计估计 得到:得到:S=e2=25(2)有约束回归)有约束回归 估计估计 得到:得到:SR=e2=30例:给定例:给定20组组Y,X1,X2,X3的观测值,试检验模型中的观测值
22、,试检验模型中X1和和X3对对Y是否有影响?是否有影响?解解 原假设原假设 H0:1=3=0 备择假设备择假设 H1:H0不成立不成立 我们有:我们有:n=20,g=2,K=3 用自由度(用自由度(2,16)查)查F分布表,分布表,5%显著性水平下,显著性水平下,F=3.63 F=1.6 F=3.63,故接受故接受H0。结论:结论:X1和和X3对对Y无显著影响无显著影响 上上一一段段结结果果的的一一个个特特例例是是所所有有斜斜率率系系数数均均为为0的的检检验验,即回归方程的显著性检验:即回归方程的显著性检验:H0:1=2=k =0 也就是说,所有解释变量对也就是说,所有解释变量对Y均无影响。均
23、无影响。注意到注意到 g=k,则该检验的检验统计量为:则该检验的检验统计量为:(3 3)全部斜率系数为)全部斜率系数为0 0的检验(即方程的显著性检验)的检验(即方程的显著性检验)分子分母均除以分子分母均除以 ,有,有 从从上上式式不不难难看看出出,全全部部斜斜率率为为0的的检检验验实实际际是是检检验验R2的的值值是是否否显显著著异异于于0,如如果果接接受受原原假假设设,则则表表明明被被解解释释变变量量的的行行为为完完全全归归因因于于随随机机变变化化。若若拒拒绝绝原原假假设设,则则表表明明所所选选择择模模型对被解释变量的行为能够提供某种程度的解释。型对被解释变量的行为能够提供某种程度的解释。2
24、、关于拟合优度检验与方程显著性检验关系的讨论关于拟合优度检验与方程显著性检验关系的讨论 由由得得你认为建立的模型质量如何?你认为建立的模型质量如何?假设检验小结:假设检验小结:模型:模型:假设:假设:方差分析表方差分析表变变差来源差来源平方和平方和自由度自由度H0成立成立时时的的RSSH1为为真真时时的的RSS检验统计量:检验统计量:上上面面所所介介绍绍的的检检验验若若干干个个系系数数显显著著性性的的方方法法,也也可可以以应应用于检验施加于系数的其他形式的约束条件,如用于检验施加于系数的其他形式的约束条件,如 检检验验的的方方法法仍仍是是分分别别进进行行有有约约束束回回归归和和无无约约束束回回
25、归归,求求出各自的残差平方和出各自的残差平方和 SR 和和 S,然后用,然后用 F 统计量进行检验。统计量进行检验。当当然然,单单个个系系数数的的假假设设检检验验,如如 H0:3=1.0,亦亦可可用用t检检验验统计量进行检验。统计量进行检验。3 3、检验其他形式的系数约束条件、检验其他形式的系数约束条件检验步骤如下:检验步骤如下:例例:Cobb-Douglas生生产产函函数数Y=AKLu u,试试根根据据美美国国制制造造业业1899-1922年数据检验规模效益不变的约束:年数据检验规模效益不变的约束:+=1=1解:(解:(1)全回归)全回归(2)有约束回归:)有约束回归:将约束条件代入,得将约
26、束条件代入,得 Y=AKL1-u,为避免回归系数的不为避免回归系数的不一致问题,一致问题,两边除以两边除以L,模型变换为:,模型变换为:Y/L=A(K/L)u 回归,得:回归,得:可得到约束回归和全回归的残差平方和为可得到约束回归和全回归的残差平方和为SR=0.0716,S=0.0710 (3)检验)检验 原假设原假设 备择假设备择假设本例中,本例中,g=1,k=2,n=24 用用自自由由度度(1,21)查查F表表,5%显显著著性性水水平平下,下,F=4.32F=0.18 临界值,拒绝参数稳定的原假设,临界值,拒绝参数稳定的原假设,表明中国城镇居民食品人均消费需求在表明中国城镇居民食品人均消费
27、需求在19941994年年前后发生了显著变化。前后发生了显著变化。解解H0:=在回归分析中,常常碰到这样一种情况,即被解释变量在回归分析中,常常碰到这样一种情况,即被解释变量的波动不仅依赖于那种能够很容易按某种尺度定量化的变量的波动不仅依赖于那种能够很容易按某种尺度定量化的变量(如收入、产出、价格、身高、体重等),而且依赖于某些(如收入、产出、价格、身高、体重等),而且依赖于某些定性的变量(如性别、地区、季节)。定性的变量(如性别、地区、季节)。在在经经济济系系统统中中,许许多多变变动动是是不不能能定定量量的的。如如经经济济体体制制的的改改革革、固固定定汇汇率率变变为为浮浮动动汇汇率率、从从战
28、战时时经经济济转转为为和和平平时时期期经经济济等等。些些变变动动都都可可以以用用大大家家所所熟熟悉悉的的0-10-1变变量量来来表表示示,用用1 1表表示示具具有有某某一一“品品质质”或或属属性性,用用0 0表表示示不不具具有有该该“品品质质”或或属属性性。这这种种变变量量在在计计量量经经济济学学中中称称为为“虚虚拟拟变变量量”。虚虚拟拟变变量量使使得得我我们们可可以以将将那那些些无无法法定定量量化化的的变变量量引引入入回回归归模模型型中中。下面给出几个可以引入虚拟变量的例子。下面给出几个可以引入虚拟变量的例子。八、八、虚拟变量虚拟变量(Dummy variablesDummy variabl
29、es)1、虚拟变量的概念、虚拟变量的概念例例1:研究学历和收入之间的关系,在你的样本中,既有:研究学历和收入之间的关系,在你的样本中,既有 女性又有男性,你打算研究在此关系中,性别是否女性又有男性,你打算研究在此关系中,性别是否 会导致差别。会导致差别。例例2:研究某省家庭收入和支出的关系,采集的样本中既:研究某省家庭收入和支出的关系,采集的样本中既 包括农村家庭,又包括城镇家庭,你打算研究二者包括农村家庭,又包括城镇家庭,你打算研究二者 的差别。的差别。例例3:研究通货膨胀的决定因素,在你的观测期中,有些:研究通货膨胀的决定因素,在你的观测期中,有些 年份政府实行了一项收入政策。你想检验该政
30、策是年份政府实行了一项收入政策。你想检验该政策是 否对通货膨胀产生影响。否对通货膨胀产生影响。上上述述各各例例都都可可以以用用两两种种方方法法来来解解决决,一一种种解解决决方方法法是是分分别别进进行行两两类类情情况况的的回回归归,然然后后看看参参数数是是否否不不同同。另另一一种种方方法法是是用用全全部部观观测测值值作作单单一一回回归归,将将定定性性因因素素的的影影响响用用虚虚拟变量引入模型。拟变量引入模型。引入虚拟变量个数的原则:引入虚拟变量个数的原则:如果一个属性变量有如果一个属性变量有m种类型,则只需引入种类型,则只需引入m-1个虚拟变量。个虚拟变量。引入虚拟变量的形式:引入虚拟变量的形式
31、:(1)如果斜率系数不变,只研究截距的变化,则以加法形式)如果斜率系数不变,只研究截距的变化,则以加法形式引入虚拟变量;引入虚拟变量;(2)如果斜率系数不同,则以乘法形式引入虚拟变量;)如果斜率系数不同,则以乘法形式引入虚拟变量;设设Y表示消费,表示消费,X表示收入,我们有:表示收入,我们有:假定假定不变。不变。对对于于5年年战战争争和和5年年和和平平时时期期的的数数据据,我我们们可可分分别别估估计计上上述两个模型,一般将给出述两个模型,一般将给出 的不同值。的不同值。现引入虚拟变量现引入虚拟变量D,将两式并为一式:将两式并为一式:其中其中 2、虚拟变量的使用方法、虚拟变量的使用方法(1)截距
32、变动)截距变动 此式等价于下列两式:此式等价于下列两式:截距变动,斜率不变截距变动,斜率不变 在在包包含含虚虚拟拟变变量量的的模模型型中中,D的的数数据据为为0,0,0,0,0,1,1,1,1,1。估计结果如下图所示:估计结果如下图所示:应用应用t检验,检验,2是否显著是否显著 可以表明截距项在两个时可以表明截距项在两个时 期是否有变化。期是否有变化。如如果果我我们们认认为为战战时时和和平平时时的的消消费费函函数数中中,截截距距项项不不变变,而而斜斜率率不不同同,即即变变动动,则则可可用用下下面面的的模模型型来来研研究究两两个个时时期边际消费倾向的差异:期边际消费倾向的差异:其中,其中,D=D
33、=不难看出,上式相当于下列两式:不难看出,上式相当于下列两式:同同样样,包包括括虚虚拟拟变变量量的的模模型型中中,2是是否否显显著著可可以以表表明明斜斜率在两个时期是否变化。率在两个时期是否变化。(2)斜率变动)斜率变动在这种情况下,模型可设为:在这种情况下,模型可设为:其中,其中,D=D=此式等价于下列两个单独的回归式:此式等价于下列两个单独的回归式:引进了虚拟变量的回归模型对于检验两个时期中是否引进了虚拟变量的回归模型对于检验两个时期中是否 发生结构性变化很方便。发生结构性变化很方便。如上例中,相当于检验如上例中,相当于检验 H H0 0:2 2=4 4=0=0(3)斜率和截距都变动)斜率
34、和截距都变动 许许多多变变量量展展示示出出季季节节性性的的变变异异(如如商商品品零零售售额额、电电和和天天然然气气的的消消费费等等),我我们们在在建建立立模模型型时时应应考考虑虑这这一一点点,这这有有两两种种方法:方法:(1)在估计前对数据进行季节调整;在估计前对数据进行季节调整;(2)采用虚拟变量将季节性差异反映在模型中。采用虚拟变量将季节性差异反映在模型中。例:设例:设Y=购买汽车的实际支出额购买汽车的实际支出额 X=实际总消费支出实际总消费支出 用用美美国国1973(1)-1980(2)的的季季度度数数据据(按按1975年年价价格格计计算),得回归结果如下:算),得回归结果如下:(4)季
35、节虚拟变量的使用)季节虚拟变量的使用 这这一一结结果果很很不不理理想想,低低R2值值,低低t值值,X的的符符号号也也不不对对。考虑到可能是季节性变异的问题,我们建立下面的模型:考虑到可能是季节性变异的问题,我们建立下面的模型:其中,其中,Q Q1 1=Q Q2 2=Q Q3 3=请注意我们仅用了请注意我们仅用了3个虚拟变量就可表示个虚拟变量就可表示4个季度的情况。个季度的情况。各季度的截距分别为:各季度的截距分别为:1季度:季度:0+12季度:季度:0+23季度:季度:0+34季度:季度:0 估计结果如下:估计结果如下:结果得到了改善。四个季度的截距项分别为:结果得到了改善。四个季度的截距项分别为:-1039.2,-1122.7,-1161.4,-1455.8。所所得得到到的的实实际际总总支支出出的的参参数数估估计计值值(0.1044)是是一一个个不不受季节变动影响的估计值。受季节变动影响的估计值。(5)分段线性回归)分段线性回归方法一:分两段进行回归方法一:分两段进行回归自由度会减少自由度会减少方法二:使用虚拟变量方法二:使用虚拟变量此课件下载可自行编辑修改,仅供参考!此课件下载可自行编辑修改,仅供参考!感谢您的支持,我们努力做得更好!谢谢感谢您的支持,我们努力做得更好!谢谢
限制150内