「02一元线性回归模型」.pdf
《「02一元线性回归模型」.pdf》由会员分享,可在线阅读,更多相关《「02一元线性回归模型」.pdf(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、一元线性回归模型 1.一元线性回归模型 有一元线性回归模型(统计模型)如下,y=1 xt+u 上式表示变量 yt 和 x之间的真实关系。其中 yt 称被解释变量(因变量),xt称解释变量(自变量),ut称随机误差项,0称常数项,称回归系数(通常未知)。上模型可以分为两部分。(1)回归函数部分,E(t)+1 xt,(2)随机部分,u。图 2.1 真实的回归直线 这种模型可以赋予各种实际意义,收入与支出的关系;如脉搏与血压的关系;商品价格与供给量的关系;文件容量与保存时间的关系;林区木材采伐量与木材剩余物的关系;身高与体重的关系等。以收入与支出的关系为例。假设固定对一个家庭进行观察,随着收入水平的
2、不同,与支出呈线性函数关系。但实际上数据来自各个家庭,来自各个不同收入水平,使其他条件不变成为不可能,所以由数据得到的散点图不在一条直线上(不呈函数关系),而是散在直线周围,服从统计关系。随机误差项 u中可能包括家庭人口数不同,消费习惯不同,不同地域的消费指数不同,不同家庭的外来收入不同等因素。所以在经济问题上“控制其他因素不变”是不可能的。回归模型的随机误差项中一般包括如下几项内容,(1)非重要解释变量的省略,(2)人的随机行为,(3)数学模型形式欠妥,(4)归并误差(粮食的归并)(5)测量误差等。回归模型存在两个特点。(1)建立在某些假定条件不变前提下抽象出来的回归函数不能百分之百地再现所
3、研究的经济过程。(2)也正是由于这些假定与抽象,才使我们能够透过复杂的经济现象,深刻认识到该经济过程的本质。通常线性回归函数 E(yt)=1 xt 是观察不到的,利用样本得到的只是对 E(yt)=0+1 xt 的估计,即对0和1的估计。在对回归函数进行估计之前应该对随机误差项 ut做出如下假定。(1)ut 是一个随机变量,ut 的取值服从概率分布。(2)E(u)=0。(3)D(ut)Eu-E(u)2 E(ut)2=2。称 u 具有同方差性。(4)ut 为正态分布(根据中心极限定理)。以上四个假定可作如下表达。u N(,)。()Cov(ui,uj)=E(ui E(ui))(j E(j))E(ui
4、,j)=,(j)。含义是不同观测值所对应的随机项相互独立。称为 ui 的非自相关性。(6)xi是非随机的。(7)Co(i,xi)=E(ui-E(ui)(i-E(i)=i(-E(x)=ui xi ui E(xi)=E(u x)=0.ui 与 xi 相互独立。否则,分不清是谁对 yt的贡献。(8)对于多元线性回归模型,解释变量之间不能完全相关或高度相关(非多重共线性)。在假定(1),(2)成立条件下有 E(yt)=E(+1 xt+ut)=0+1 xt。2.最小二乘估计(LS)对于所研究的经济问题,通常真实的回归直线是观测不到的。收集样本的目的就是要对这条真实的回归直线做出估计。怎样估计这条直线呢?
5、显然综合起来看,这条直线处于样本数据的中心位置最合理。怎样用数学语言描述“处于样本数据的中心位置”?设估计的直线用 ty 0+1 xt 表示。其中ty 称 y的拟合值(fitte ale),0和1分别是 和1的估计量。观测值到这条直线的纵向距离用tu 表示,称为残差。t=ty+tu 01 t+tu 称为估计的模型。假定样本容量为 T。(1)用“残差和最小”确定直线位置是一个途径。但很快发现计算“残差和”存在相互抵消的问题。(2)用“残差绝对值和最小”确定直线位置也是一个途径。但绝对值的计算比较麻烦。(3)最小二乘法的原则是以“残差平方和最小”确定直线位置。用最小二乘法除了计算比较方便外,得到的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 02 一元 线性 回归 模型
限制150内