02-一元线性回归模型.ppt
第第2章章 一元一元线线性回性回归归模型模型 模型的建立及其假定条件模型的建立及其假定条件最小二乘估计(最小二乘估计(OLS)OLS回归函数的性质回归函数的性质最小二乘估计量的特性最小二乘估计量的特性yt的分布和的分布和 的分布的分布 的估计的估计 拟合优度的测量拟合优度的测量回归参数的显著性检验与置信区间回归参数的显著性检验与置信区间yF 的点预测与区间预测的点预测与区间预测案例分析案例分析相关系数相关系数EViews操作操作file:li-2-1file:li-2-3file:case1file:5kepler3file:food第第2章章 一元线性回归模型一元线性回归模型 1.模型的建立及其假定条件模型的建立及其假定条件 一元线性回归模型一元线性回归模型 Yt=0+1 Xt+ut (第(第3版教材第版教材第7页)页)(各部分名称)(各部分名称)(第(第3版教材第版教材第9页)页)(第(第3版教材第版教材第9页)页)2.最小二乘估计(OLS)通常通常真实的回归直线是观测不到的真实的回归直线是观测不到的。收集样本的目的就是。收集样本的目的就是要对这条真实的回归直线做出估计。要对这条真实的回归直线做出估计。(第(第3版教材第版教材第10页)页)(课课本上用本上用ei表示。)表示。)(第(第3版教材第版教材第11页)页)(第(第3版教材第版教材第13页)页)谁提出的谁提出的OLS估计方法?估计方法?(课本上用英文小写字母表示离差课本上用英文小写字母表示离差)(C F Gauss,1777-1855)C F Gauss 1809年提出年提出OLS估计方法估计方法。例题例题2.1 人均鲜蛋需求量Y与人均可支配收入X关系 OLS估计结果:估计结果:(第第3版教材第版教材第15页)页)(file:li-2-1)Yt:千克:千克Xt:元:元3.OLS回归函数的性质回归函数的性质(第第3版版教材第教材第13页)页)(第第3版版教材第教材第13页)页)3.OLS回归函数的性质回归函数的性质(第第3版版教材第教材第18页)页)0(3)最小方差性最小方差性 0,1的的OLS估计量的方差比其他估计量的方差小。估计量的方差比其他估计量的方差小。(第第3版教材第版教材第19页)页)(第第3版版教材第教材第14页)页)(第第3版版教材第教材第27页)页)(第第3版版教材第教材第28页)页)例题例题2.1 人均鲜蛋需求量Y与人均可支配收入X关系 估计结果:估计结果:(第第3版版教材第教材第29页)页)(file:li-2-1)7拟合优度的测量拟合优度的测量 拟合优度是指回归直线对观测值的拟合程度。拟合优度是指回归直线对观测值的拟合程度。(第第3版版教材第教材第24页)页)(第第3版版教材第教材第24页)页)正规方程之一正规方程之一残差和等于零残差和等于零度量拟合优度的统计量:可决系数(确定系数)度量拟合优度的统计量:可决系数(确定系数)(第第3版版教材第教材第25页)页)对于一组数据,对于一组数据,TSS是不变的,所以是不变的,所以RSS(),),ESS()。)。RSS:旧指回归平方和(:旧指回归平方和(regression sum of squares),),现指残差平方和(现指残差平方和(sum of squared residuals)ESS:旧指残差平方和(:旧指残差平方和(error sum of squares(sum of squared errors)),),现指回归平方和(现指回归平方和(explained sum of squares)(R2的取值范围是的取值范围是 0,1)TSS=RSS+ESS例题例题2.1 人均鲜蛋需求量Y与人均可支配收入X关系 可决系数可决系数:(第第3版版教材第教材第25页)页)(file:li-2-1)8回归参数的显著性检验与置信区间回归参数的显著性检验与置信区间(第第3版版教材第教材第29页)页)例题2.1 人均鲜蛋需求量Y与人均可支配收入X关系 回归参数的显著性检验回归参数的显著性检验:H0:1=0;H1:1 0。在。在H0成立条件下,成立条件下,H0:0=0;H1:0 0。在。在H0成立条件下,成立条件下,Prob=P|t|t-Statistic|检验结果:检验结果:回归参数显著不为零。回归参数显著不为零。(第第3版版教材第教材第29页)页)临界值临界值 t0.05(9)=2.26例题例题2.1 人均鲜蛋需求量Y与人均可支配收入X关系 OLS估计表达式:估计表达式:(7.7)(4.3)R2=0.67,DW=1.32,T=11,(1988 1998)(file:li-2-1)临界值临界值 t0.05(9)=2.26例题例题2.1 人均鲜蛋需求量Y与人均可支配收入X关系 真实值真实值拟合值拟合值残差残差S.E.-S.E.分析残差的正态分布性分析残差的正态分布性(file:li-2-1)分析残差分析残差(第第3版版教材第教材第30页)页)8回归参数的显著性检验与置信区间回归参数的显著性检验与置信区间 例题例题2.1 人均鲜蛋需求量Y与人均可支配收入X关系 1 1的置信区间:的置信区间:0 0的置信区间:的置信区间:(第第3版版教材第教材第31页)页)(file:li-2-1)8回归参数的显著性检验与置信区间回归参数的显著性检验与置信区间(第第3版版教材第教材第34页)页)9YF 的点预测与区间预测的点预测与区间预测例题例题2.1 人均鲜蛋需求量Y与人均可支配收入X关系 9.yF 的点预测的点预测:(演示演示EViews操作操作)(第第3版版教材第教材第36页)页)Y1999的点估计值的点估计值:Y1999=10.77+0.005069 1863=20.21Y2000的点估计值的点估计值:Y2000=10.77+0.005069 1983=20.82(file:li-2-1)例题例题2.1 人均鲜蛋需求量Y与人均可支配收入X关系 9.yF 的区间预测的区间预测Y1999的置信区间的置信区间:20.2089 2.26 1.4417 16.9507,23.4671Y2000的置信区间的置信区间:20.8171 2.26 1.5297 17.3600,24.2742(第第3版版教材第教材第36页)页)Y1999的点估计值:的点估计值:Y1999=10.77+0.005069 1863=20.21Y2000的点估计值:的点估计值:Y2000=10.77+0.005069 1983=20.82(file:li-2-1)教材教材2.8节节 案例分析案例分析 人均消费性支出与可支配收入关系人均消费性支出与可支配收入关系(第第3版版教材第教材第39页)页)整个样本整个样本区间预测的区间预测的EViews操作操作(file:li-2-3)补充案例补充案例1:用回归模型预测木材剩余物用回归模型预测木材剩余物(file:case1)伊春林区位于黑龙江省东北部,有森林面积伊春林区位于黑龙江省东北部,有森林面积219万公顷,万公顷,木材蓄积量为木材蓄积量为2.3亿亿m3。森林覆盖率为。森林覆盖率为62.5%,是我国主,是我国主要的木材工业基地之一。要的木材工业基地之一。1999年伊春林区木材采伐量为年伊春林区木材采伐量为532万万m3。按此速度。按此速度44年之后,年之后,1999年的蓄积量将被采伐年的蓄积量将被采伐一空。一空。为缓解森林资源危机,并解决部分职工就业问题,除了做为缓解森林资源危机,并解决部分职工就业问题,除了做好木材的深加工外,还要充分好木材的深加工外,还要充分利用木材剩余物生产林业产利用木材剩余物生产林业产品,如纸浆、纸袋、纸板等。因此预测林区的年木材剩余品,如纸浆、纸袋、纸板等。因此预测林区的年木材剩余物是安排木材剩余物加工生产的一个关键环节。物是安排木材剩余物加工生产的一个关键环节。黑龙江省伊春林区 观测点近似服从线性关系。建立一元线性回归模型观测点近似服从线性关系。建立一元线性回归模型 Yt=0+1 Xt+ut年剩余物年剩余物Yt和年木材采伐量和年木材采伐量Xt散点图散点图分析分析EViews输出结果。注意:输出结果。注意:S.D.和和S.E.的区别。的区别。S.E.和和RSS的关系。的关系。=-0.7629+0.4043 Xt (-0.6)(12.1)R2=0.91,T=16上述模型的上述模型的经济解释经济解释是,对于是,对于伊春林区每采伐伊春林区每采伐1 m3木材,木材,将平均产生将平均产生0.4 m3的剩余物。的剩余物。问题问题3:为什么离群值对回归参数为什么离群值对回归参数OLS估计量的影响大?估计量的影响大?问题问题2:估计一元线性回归模型,最少需要多少组观测值?估计一元线性回归模型,最少需要多少组观测值?10.EViews操作操作附录附录1:怎样建立:怎样建立EViews新工作文件。新工作文件。EViews 5EViews 7从从EViews主菜主菜单单中中单击单击File键键,选择选择New,Workfile。10.EViews操作操作附录附录2:怎样用:怎样用EViews通过键盘输入,复制、粘贴功能通过键盘输入,复制、粘贴功能 输入数据。输入数据。注意注意:(1)变量命名时,字符不得超过)变量命名时,字符不得超过16个。个。(2)给变量命名时,避免使用下列名字:)给变量命名时,避免使用下列名字:ABS,ACOS,AR,ASIN,C,CON,CNORM,COEF,COS,D,DLOG,DNORM,ELSE,ENDIF,EXP,LOG,LOGIT,LPT1,LPT2,MA,NA,NRND,PDL,RESID,RND,SAR,SIN,SMA,SQR,THEN。附录附录3:OLS估计的操作步骤。估计的操作步骤。QuickEstimate Equation。对话框中输入对话框中输入 y c x。点击。点击“确定确定”键。键。附录附录4:怎样用:怎样用EViews预测。预测。11相关系数相关系数相关(相关(correlation):指两个或两个以上变量间相互关系的:指两个或两个以上变量间相互关系的程度或强度。程度或强度。分类:分类:按强度分按强度分 完全相关完全相关:变量间存在函数关系。:变量间存在函数关系。高度相关高度相关(强相关):变量间近似存在函数关系。(强相关):变量间近似存在函数关系。弱相关弱相关:变量间有关系但不明显。:变量间有关系但不明显。零相关零相关:变量间不存在任何关系。:变量间不存在任何关系。完全相关完全相关 高度相关、线性相关、正相关高度相关、线性相关、正相关 弱相关弱相关 (第第3版版教材第教材第26页)页)按变量个数分按变量个数分简单相关:指两个变量间相关。简单相关:指两个变量间相关。按形式分:线性相关按形式分:线性相关,非线性相关非线性相关 按符号分:正相关按符号分:正相关,负相关负相关,零相关零相关复相关(多重相关和偏相关):复相关(多重相关和偏相关):指指3个或个或3个以上变量间的相关。个以上变量间的相关。11相关系数相关系数非线性相关非线性相关 负相关负相关 零相关零相关 11.2 简单线性相关的度量简单线性相关的度量 简单线性相关系数,简称相关系数(简单线性相关系数,简称相关系数(correlation coefficient)。度量两个变量间的线性相关强度,用度量两个变量间的线性相关强度,用 表示。表示。(第第3版版教材第教材第26页)页)11.2 简单线性相关的度量简单线性相关的度量 11.3 相关系数的取值范围相关系数的取值范围 图图1 正相关正相关 图图2 负相关负相关 图图3 r=0.92 图图4 r=0.99 散点图与相关系数散点图与相关系数 值的对应关系值的对应关系11.4 线性相关系数的局限性线性相关系数的局限性(1)只适用于考察变量间的线性相关关系。变量不相关与变量相互独立在只适用于考察变量间的线性相关关系。变量不相关与变量相互独立在概念上是不同的。概念上是不同的。(2)相关系数的计算是一个数学过程相关系数的计算是一个数学过程,但不能揭示变量间关系的实质。但不能揭示变量间关系的实质。(3)一般说二变量相关时,可能属于如下一种关系。一般说二变量相关时,可能属于如下一种关系。单向因果关系单向因果关系。如施肥量与农作物产量;对金属的加热时间与温度值。如施肥量与农作物产量;对金属的加热时间与温度值。双向因果关系双向因果关系。如工业生产与农业生产;商品供给量与商品价格。如工业生产与农业生产;商品供给量与商品价格。另有隐含因素影响二变量变化。虚假相关另有隐含因素影响二变量变化。虚假相关。(1997-2001)13宗宗/分分Francis Galton(1822-1911)11.5 简单相关系数的检验简单相关系数的检验复习复习计量经济学基础计量经济学基础表表2.3 计算公式一览表。计算公式一览表。EViews操作:操作:打开数据组窗口,选打开数据组窗口,选View/covariance analysis/Correlation(第(第3版教材第版教材第37页)页)(第第3版版教材第教材第26页)页)补充案例补充案例2:刻卜勒(刻卜勒(J.Kepler)行星运行第三定律)行星运行第三定律 刻卜勒(刻卜勒(Johannes Kepler,1571-1630)(file:5kepler3)用回归分析验证用回归分析验证第三定律第三定律(file:6kepler3)log(T)=1.5 log(D)+(4492)R2=0.999999,N=9log(T)=(3/2)log(D)2 log(T)=3 log(D)log(T2)=log(D3)T 2=D 3恩斯特恩斯特恩格爾恩格爾(Ernst Engel,1821年年3月月21日日-1896年年12月月8日日),19世紀德世紀德國著名統計學家和經濟學家,以恩格國著名統計學家和經濟學家,以恩格爾曲線和恩格爾定律聞名於世。爾曲線和恩格爾定律聞名於世。第2章结束