经典单方程计量经济学模型一元回归模型.ppt
经典单方程计量经济学经典单方程计量经济学模型一元回归模型模型一元回归模型本章内容本章内容 回归分析概述回归分析概述一元线性回归模型的基本假设一元线性回归模型的基本假设一元线性回归模型的参数估计一元线性回归模型的参数估计 一元线性回归模型的检验一元线性回归模型的检验一元线性回归模型的预测一元线性回归模型的预测实例及时间序列问题实例及时间序列问题2.1 2.1 回归分析概述回归分析概述(Regression Analysis)一、变量间的关系及回归分析的基本概念一、变量间的关系及回归分析的基本概念二、总体回归函数二、总体回归函数三、随机扰动项三、随机扰动项四、样本回归函数四、样本回归函数一、变量间的关系及回归分析一、变量间的关系及回归分析的基本概念的基本概念1 1、变量间的关系、变量间的关系确定性关系或函数关系:确定性关系或函数关系:研究的是确定性现象非研究的是确定性现象非随机变量间的关系。随机变量间的关系。统计依赖或相关关系:统计依赖或相关关系:研究的是非确定性现象随研究的是非确定性现象随机变量间的关系。机变量间的关系。函数关系函数关系 指某一经济变量可直接表示为其他经济变量的确定的函数,指某一经济变量可直接表示为其他经济变量的确定的函数,函数表达式中没有未知参数,不存在参数估计的问题。函数表达式中没有未知参数,不存在参数估计的问题。1)某一商品的销售收入某一商品的销售收入Y与单价与单价P、销售数量、销售数量Q之间的关系之间的关系Y=PQ 2)某一农作物的产量某一农作物的产量Q与单位面积产量与单位面积产量q、种植面积、种植面积S之间的关系之间的关系Q=q S例如例如:相关关系相关关系 指不同经济变量的变化趋势之间存在某种不确定的联系,某一或指不同经济变量的变化趋势之间存在某种不确定的联系,某一或某几个经济变量的取值确定后,对应的另一经济变量的取值虽不能唯某几个经济变量的取值确定后,对应的另一经济变量的取值虽不能唯一确定,但按某种规律有一定的取值范围。一确定,但按某种规律有一定的取值范围。居民消费居民消费C与可支配收入与可支配收入Y之间的关系,可支配收入的取值确定后,之间的关系,可支配收入的取值确定后,消费的取值虽不能唯一确定,但有一定的取值范围,消费的取值虽不能唯一确定,但有一定的取值范围,0 C t /2(n-2),则以(,则以(1)的)的置信度(置信度(confidence coefficient)拒绝拒绝H0,接受,接受H1;若若|t|t /2(n-2),则以(,则以(1)的置信度)的置信度不拒绝不拒绝H0。自学教材自学教材p48p48例题,学会检验的全过程。例题,学会检验的全过程。3、关于常数项的显著性检验、关于常数项的显著性检验T T检验同样可以进行。检验同样可以进行。一般不以一般不以t检验决定常数项是否保留在模型中,而是检验决定常数项是否保留在模型中,而是从经济意义方面分析回归线是否应该通过原点。从经济意义方面分析回归线是否应该通过原点。三、参数三、参数 的置信区间的置信区间Confidence Interval of Parameter1 1、概念、概念回归分析希望通过样本得到的参数估计量能够代回归分析希望通过样本得到的参数估计量能够代替总体参数。替总体参数。假设检验假设检验可以通过一次抽样的结果检验总体参数可以通过一次抽样的结果检验总体参数可能的假设值的范围(例如是否为零),但它并可能的假设值的范围(例如是否为零),但它并没有指出在一次抽样中样本参数值到底离总体参没有指出在一次抽样中样本参数值到底离总体参数的真值有多数的真值有多“近近”。要判断样本参数的估计值在多大程度上要判断样本参数的估计值在多大程度上“近似近似”地替代总体参数的真值,需要通过构造一个以样地替代总体参数的真值,需要通过构造一个以样本参数的估计值为中心的本参数的估计值为中心的“区间区间”,来考察它以,来考察它以多大的可能性(概率)包含着真实的参数值。这多大的可能性(概率)包含着真实的参数值。这种方法就是参数检验的种方法就是参数检验的置信区间估计置信区间估计。如如果果存存在在这这样样一一个个区区间间,称称之之为为置置信信区区间间;1-1-称称为为置置信信系系数数(置置信信度度)(confidence coefficient),称称为为显显著著性性水水平平;置置信信区区间间的的端端点点称称为为置置信信限限(confidence limit)。2、一元线性模型中、一元线性模型中 i 的置信区间的置信区间T分布为双尾分布(1-(1-)的置信度的置信度下下,i的置信区的置信区间是间是 在上述收入收入-消费支出消费支出例题中,如果给定=0.01,查表得:由于于是,1 1、0 0的置信区间分别为:的置信区间分别为:(0.6056,0.7344)0.6056,0.7344)(-6.719,291.52-6.719,291.52)显然,在该例题中,我们对结果的正确陈述应该显然,在该例题中,我们对结果的正确陈述应该是:是:边际消费倾向边际消费倾向1 1是以是以99%99%的置信度处于以的置信度处于以0.6700.670为中心的区间(为中心的区间(0.6056,0.7344)0.6056,0.7344)中。中。回答:回答:边际消费倾向等于边际消费倾向等于0.6700.670的置信度是多少?的置信度是多少?边际消费倾向以边际消费倾向以100%100%的置信度处于什么区间?的置信度处于什么区间?由于置信区间一定程度地给出了样本参数估计值由于置信区间一定程度地给出了样本参数估计值与总体参数真值的与总体参数真值的“接近接近”程度,因此置信区间程度,因此置信区间越小越好。越小越好。要缩小置信区间,需要要缩小置信区间,需要增大样本容量增大样本容量n n。因为在同样的置信水平下,因为在同样的置信水平下,n n越大,越大,t t分布表中的临界值越小;同时,增大样本容量,还分布表中的临界值越小;同时,增大样本容量,还可使样本参数估计量的标准差减小;可使样本参数估计量的标准差减小;提高模型的拟合优度。提高模型的拟合优度。因为样本参数估计量的标准差因为样本参数估计量的标准差与残差平方和呈正比,模型拟合优度越高,残差平方与残差平方和呈正比,模型拟合优度越高,残差平方和越小。和越小。四、Eviews实验操作例2-1-3家庭可支配收入与消费支出操作步骤1、建立工作文件e2132、输入和编辑数据(建数据组)3、画出Y和X之间的散点图4、建立一元回归模型点击点击View中的中的Representation可得到回归表达式。可得到回归表达式。点击按钮栏中的点击按钮栏中的Resids,可得残差值(,可得残差值(Residual)、)、实际值(实际值(Actual)、拟合值()、拟合值(Fitted)的图形。)的图形。5、拟合优度检验:可决系数、拟合优度检验:可决系数越接近1,模型的拟合效果越好。6、变量显著性检验:、变量显著性检验:在Eviews中可以直接判断是否拒绝H0,是用t检验量对应的P值作判断,在给定的检验水平下,若P,则拒绝H0,反之则不能拒绝H0。常数项的检验:常数项的检验:P=0.01250.05拒绝常数项为拒绝常数项为0的假设。的假设。解释变量系数检验:解释变量系数检验:P=0.00000.01拒绝解释变量系数为拒绝解释变量系数为0的假设。的假设。参数估计与检验结果的表述参数估计与检验结果的表述 以例以例2-3-1,可按规范格式将分析结果表述为可按规范格式将分析结果表述为第一行是样本回归函数;第一行是样本回归函数;第二行是对应参数估计值的第二行是对应参数估计值的t 统计值统计值 第三行是模型的拟合优度第三行是模型的拟合优度(3.204)(34.916)2.5 2.5 一元线性回归分析的应用:一元线性回归分析的应用:预测问题预测问题一、预测值条件均值一、预测值条件均值或或个值的一个无偏估计个值的一个无偏估计二、总体条件均值与个值预测值的置信区间二、总体条件均值与个值预测值的置信区间 对于一元线性回归模型对于一元线性回归模型 给定样本以外的解释变量的观测值给定样本以外的解释变量的观测值X0,可以得到,可以得到被解释变量的预测值被解释变量的预测值 0 0 ,可以此作为其,可以此作为其条件均值条件均值E(Y|X=X0)或或个别值个别值Y0的一个近似估计。的一个近似估计。严格地说,这只是被解释变量的预测值的估计值,严格地说,这只是被解释变量的预测值的估计值,而不是预测值。原因而不是预测值。原因:参数估计量不确定;参数估计量不确定;随机项的影响。随机项的影响。说说 明明一、预测值是条件均值或个值的一个无一、预测值是条件均值或个值的一个无偏估计偏估计1 1、0是条件均值是条件均值E(Y|X=X0)的无偏估计的无偏估计2 2、0是个值是个值Y0的无偏估计的无偏估计二、总体条件均值与个值预测值的置信二、总体条件均值与个值预测值的置信区间区间在在1-的置信度下,的置信度下,总体均值总体均值E(Y|X0)的置信区间为的置信区间为 1、总体均值预测值的置信区间、总体均值预测值的置信区间 2 2、总体个值预测值的预测区间、总体个值预测值的预测区间 在在1-的置信度下,的置信度下,Y0的置信区间的置信区间为为 3 3、例题、例题收入收入-消费支出消费支出样本回归函数为样本回归函数为则在则在 X0=1000处,处,0=142.4+0.6701000=812.4 因此,因此,总体均值总体均值E(Y|X=1000)的的95%的置信区间为:的置信区间为:(812.42.30627.6,812.4+2.30627.6)(748.8,875.9)同样地,对于Y在X=1000的个体值个体值,其95%的置信区间为:(812.4-2.30659.1,812.4+2.30659.1)(676.1,948.7)2.6 2.6 实例及时间序列问题实例及时间序列问题一、一、2006年中国城镇居民年中国城镇居民人均消费支出数据人均消费支出数据样本回归函数(1.047)(31.395)经济意义检验:拟合优度检验:变量显著性检验:双击Range用用Eviews软件软件计算预测值计算预测值双击双击yf打开打开此数列,查此数列,查看预测值看预测值预测评价指标:预测评价指标:均方根误差(均方根误差(RMSE)平均绝对误差(平均绝对误差(MAE)平均绝对百分误差(平均绝对百分误差(MAPE)希尔不等系数(希尔不等系数(TIC)偏差率(偏差率(BP)方差率(方差率(VP)协变率(协变率(CP)预测评价均方根误差(均方根误差(RMSE),平均绝对误差(),平均绝对误差(MAE)绝对误差比较指标,取值大小受量纲的影响,不绝对误差比较指标,取值大小受量纲的影响,不能形成统一的评价指标。能形成统一的评价指标。平均绝对百分误差(平均绝对百分误差(MAPE)希尔不等系数()希尔不等系数(TIC)相对比较指标,可以形成一致的评价标准。相对比较指标,可以形成一致的评价标准。MAPE的取值在的取值在05之间说明预测精度极高,在之间说明预测精度极高,在10以以内说明预测精度高;内说明预测精度高;TIC的取值范围是的取值范围是01之间,取之间,取值越小越好。值越小越好。偏差率(偏差率(BP)方差率()方差率(VP)协变率()协变率(CP)BP+VP+CP=1,BP,VP应尽可能小,应尽可能小,CP尽可能尽可能大大在在1-的置信度下,的置信度下,总体均值总体均值E(Y|X0)的置信区间为的置信区间为 1、总体均值预测值的置信区间、总体均值预测值的置信区间 2 2、总体个值预测值的预测区间、总体个值预测值的预测区间 在在1-的置信度下,的置信度下,Y0的置信区间的置信区间为为 t /2(n-2):可查分布表得到:可查分布表得到二、中国居民总量消费函数:时间序列数据模型二、中国居民总量消费函数:时间序列数据模型1、计算生成新的变量2、回归模型、检验、预测三、时间序列问题三、时间序列问题从理论上讲,经典线性回归模型理论是以随机抽样的截从理论上讲,经典线性回归模型理论是以随机抽样的截面数据或者平稳的时间序列数据为基础的。面数据或者平稳的时间序列数据为基础的。对于非平稳时间序列数据,存在理论方法方面的障碍对于非平稳时间序列数据,存在理论方法方面的障碍“伪回归问题伪回归问题”。如何处理?本书第。如何处理?本书第8 8章将专门讨论。章将专门讨论。在在2727章中大量采用非平稳时间序列数据作为实例,暂章中大量采用非平稳时间序列数据作为实例,暂时不考虑理论方法方面的障碍。时不考虑理论方法方面的障碍。