一元线性回归模型.doc
《一元线性回归模型.doc》由会员分享,可在线阅读,更多相关《一元线性回归模型.doc(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、如有侵权,请联系网站删除,仅供学习与交流一元线性回归模型【精品文档】第 16 页一元线性回归模型 1一元线性回归模型 有一元线性回归模型(统计模型)如下, yt = b0 + b1 xt + ut 上式表示变量yt 和xt之间的真实关系。其中yt 称被解释变量(因变量),xt称解释变量(自变量),ut称随机误差项,b0称常数项,b1称回归系数(通常未知)。上模型可以分为两部分。(1)回归函数部分,E(yt) = b0 + b1 xt,(2)随机部分,ut 。图2.1 真实的回归直线 这种模型可以赋予各种实际意义,收入与支出的关系;如脉搏与血压的关系;商品价格与供给量的关系;文件容量与保存时间的
2、关系;林区木材采伐量与木材剩余物的关系;身高与体重的关系等。以收入与支出的关系为例。假设固定对一个家庭进行观察,随着收入水平的不同,与支出呈线性函数关系。但实际上数据来自各个家庭,来自各个不同收入水平,使其他条件不变成为不可能,所以由数据得到的散点图不在一条直线上(不呈函数关系),而是散在直线周围,服从统计关系。随机误差项ut中可能包括家庭人口数不同,消费习惯不同,不同地域的消费指数不同,不同家庭的外来收入不同等因素。所以在经济问题上“控制其他因素不变”是不可能的。回归模型的随机误差项中一般包括如下几项内容,(1)非重要解释变量的省略,(2)人的随机行为,(3)数学模型形式欠妥,(4)归并误差
3、(粮食的归并)(5)测量误差等。回归模型存在两个特点。(1)建立在某些假定条件不变前提下抽象出来的回归函数不能百分之百地再现所研究的经济过程。(2)也正是由于这些假定与抽象,才使我们能够透过复杂的经济现象,深刻认识到该经济过程的本质。通常线性回归函数E(yt) = b0 + b1 xt 是观察不到的,利用样本得到的只是对E(yt) = b0 + b1 xt 的估计,即对b0和b1的估计。在对回归函数进行估计之前应该对随机误差项ut做出如下假定。(1) ut 是一个随机变量,ut 的取值服从概率分布。(2) E(ut) = 0。(3) D(ut) = Eut - E(ut) 2 = E(ut)2
4、 = s 2。称ui 具有同方差性。(4) ut 为正态分布(根据中心极限定理)。以上四个假定可作如下表达。ut N (0, s 2 )。 (5) Cov(ui, uj) = E(ui - E(ui) ) ( uj - E(uj) ) = E(ui, uj) = 0, (i j )。含义是不同观测值所对应的随机项相互独立。称为ui 的非自相关性。(6) xi是非随机的。(7) Cov(ui, xi) = E(ui - E(ui) ) (xi - E(xi) ) = Eui (xi - E(xi) = Eui xi - ui E(xi) = E(ui xi) = 0.ui 与xi 相互独立。否则
5、,分不清是谁对yt的贡献。 (8) 对于多元线性回归模型,解释变量之间不能完全相关或高度相关(非多重共线性)。在假定(1),(2)成立条件下有E(yt) = E(b0 + b1 xt + ut ) = b0 + b1 xt 。2最小二乘估计(OLS)对于所研究的经济问题,通常真实的回归直线是观测不到的。收集样本的目的就是要对这条真实的回归直线做出估计。怎样估计这条直线呢?显然综合起来看,这条直线处于样本数据的中心位置最合理。怎样用数学语言描述“处于样本数据的中心位置”?设估计的直线用 =+ xt表示。其中称yt的拟合值(fitted value),和分别是 b0 和b1的估计量。观测值到这条直
6、线的纵向距离用表示,称为残差。 yt =+=+ xt +称为估计的模型。假定样本容量为T。(1)用“残差和最小”确定直线位置是一个途径。但很快发现计算“残差和”存在相互抵消的问题。(2)用“残差绝对值和最小”确定直线位置也是一个途径。但绝对值的计算比较麻烦。(3)最小二乘法的原则是以“残差平方和最小”确定直线位置。用最小二乘法除了计算比较方便外,得到的估计量还具有优良特性。(这种方法对异常值非常敏感)设残差平方和用Q表示, Q = = = ,则通过Q最小确定这条直线,即确定和的估计值。以和为变量,把Q看作是和的函数,这是一个求极值的问题。求Q对和的偏导数并令其为零,得正规方程, = 2(-1)
7、 = 0 (1) = 2(- xt) = 0 (2)下面用代数和矩阵两种形式推导计算结果。首先用代数形式推导。由(1)、(2)式得, = 0 (3) xt = 0 (4)(3)式两侧用除T,并整理得,= (5)把(5)式代入(4)式并整理,得,xt = 0 (6)= 0 (7)= (8)因为= 0,= 0,分别在(8)式的分子和分母上减和得,= (9)= (10)下面用矩阵形式推导 T + () = 这种形式在单位根检验的理论分析中非常有用。3最小二乘估计量和的特性(1) 线性特性 这里指和分别是yt的线性函数。令 kt = ,代入上式得 = kt yt可见是yt的线性函数,是b1的线性估计量
8、。同理b0也具有线性特性。(2) 无偏性利用上式E() = E( kt yt) = E kt (b0 + b1 xt + ut) = E ( b0 kt + b1 kt xt + kt ut) = Eb1 kt (xt-) + kt ut = b1 + E( kt ut ) = b1 (3) 有效性 b0, b1的OLS估计量的方差比其他估计量的方差小。 Gauss-Marcov定理:若ut满足E(ut) = 0,D(ut) = s 2,那么用OLS法得到的估计量就具有最佳线性无偏性。估计量称最佳线性无偏估计量。最佳线性无偏估计特性保证估计值最大限度的集中在真值周围,估计值的置信区间最小。上面
9、的评价是对小样本而言,若是对大样本而言还应讨论估计量的渐近无偏性,一致性和渐近有效性。先给出渐近分布的概念。渐近分布。用T1 T2 TN 表示连续递增样本容量。设在每个样本容量Ti下重复抽样。则每个xTi 都应有自己的均值E(xTi) 与方差Var (xTi)。利用递增样本可以求得随机变量序列,xT = xT1, xT2, , xTN其中每个元素都是相应样本容量下的一个随机变量。当TN 趋于无穷大时,这些分布收敛于某一分布。则称该分布为渐近分布或极限分布。渐近期望。对于期望值序列,E(xT ) = E(xT1), E(xT2), , E(xTN) 如随着T ,期望值E(xT )收敛于某一常数m
10、,则称m 为xT的渐近期望。记为 = m (与期望概念不同)与期望值序列相对应,也可以写出方差序列。 Var(xT) = E(xT -E(xT)2 =ExT1 - E(xT1) 2, ExT2 - E(xT2) 2, ExTN - E(xTN ) 2但在许多情形下,(xT -E(xT)2 = 0,即xT的分布退化为一点。例如,已知的分布是 N (m, )。当T ,Var()0。为防止分布发生退化,可以用T乘Var()。当T ,T Var()s 2。渐近方差。若上述随机变量序列有渐近期望,同时有新序列,ET(xT - E(xT) ) 2 = ET xT1 - E(xT1)2, ET xT2 -
11、E(xT2) 2 , ET xTN - E(xTN ) 2 满足 T (xT -E(xT)2 = v则定义xT的渐近方差为 T (xT -E(xT)2 = v 渐近无偏性。若的渐近期望为b,则为 b 的渐近无偏估计量,即 一致性 若满足(1)渐近无偏性,(2)= 0,则具有一致性,为 b 的一致估计量。 渐近有效性。若满足(1)具有一致性,(2)与其他估计量的方差相比,的渐进方差较小,Var() ta (T-2) ,则 b1 0; 若 | t | 2.15落在了H0的拒绝域,所以结论是b1不为零。输出格式的最下部分给出了评价估计的回归函数的若干个统计量的值。依纵向顺序,这些统计量依次是可决系数
12、R2、调整的可决系数(第3章介绍)、回归函数的标准差(s.e.,即均方误差的算术根)、残差平方和、对数极大似然函数值(第2章介绍)、DW统计量的值、被解释变量的平均数()、被解释变量的标准差()、赤池(Akaike)信息准则(是一个选择变量最优滞后期的统计量)、施瓦茨(Schwatz)准则(是一个选择变量最优滞后期的统计量)、F统计量(第3章介绍)的值以及F统计量取值大于该值的概率。注意:S.D.和s.e.的区别。s.e.和SSE的关系。根据EViews输出结果(图2.15),写出OLS估计式如下:= -0.7629 + 0.4043 xt (2.64) (-0.6) (12.1) R2 =
13、0.91, s. e. = 2.04其中括号内数字是相应t统计量的值。s.e.是回归函数的标准误差,即=。R2是可决系数。R 2 = 0.91说明上式的拟合情况较好。yt变差的91%由变量xt解释。检验回归系数显著性的原假设和备择假设是(给定a = 0.05)H0:b1 = 0; H1:b1 0图2.16 残差图因为t = 12.1 t0.05 (14) = 2.15,所以检验结果是拒绝b1 = 0,即认为年木材剩余物和年木材采伐量之间存在回归关系。上述模型的经济解释是,对于伊春林区每采伐1 m3木材,将平均产生0.4 m3的剩余物。图2.16给出相应的残差图。Actual表示yt的实际观测值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一元 线性 回归 模型
限制150内