第二章简单线性回归模型课件.ppt
《第二章简单线性回归模型课件.ppt》由会员分享,可在线阅读,更多相关《第二章简单线性回归模型课件.ppt(74页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 (一)具有相关关系的变量(一)具有相关关系的变量 举一个例子举一个例子身高和体重人均消费与收入温度与二氧化碳排放量房地产价格与地理区位股票价格与利率工资与受教育年限第二章 简单线性回归模型(二)相关关系的统计概念(二)相关关系的统计概念第二章 简单线性回归模型 第一节 回归分析与回归方程一、回归与相关一、回归与相关(一)经济变量之间的两类关系 1、确定性的函数关系确定性的函数关系变量X取确定值时,变量Y有唯一确定的值与之相对应。2、不确定性的统计关系不确定性的统计关系变量X取一定数值时,变量Y有数值与之对应,但不能事先确定,事后才能确定。不过所取的不同值按某种规律在一定范围内变化。这种关系有
2、时也称为相关关系。(三)回归分析(三)回归分析几何图示:(三)回归与相关的联系与区别(三)回归与相关的联系与区别 (三)回归与相关的联系与区别(三)回归与相关的联系与区别第二章 简单线性回归模型 第二节 总体回归函数 一个例子:假如某地区有100个家庭构成的总体,我们要研究每月家庭消费支出Y和每月家庭可支配收入X之间的关系,并要根据已知的家庭可支配收入去预测该总体每月家庭消费支出的平均水平。为了研究的方便,把这个总体(即100个家庭)按收入水平分为10个组,并分别考察每组的家庭消费支出,见表:将将总总体体应应变变量量的的条条件件期期望望表表示示为为解解释释变变量量的的某某种种函函数数,这这个个
3、函函数称为总体回归函数。数称为总体回归函数。总总体体回回归归函函数数所所对对应应的的图图形形叫叫做做总总体体回回归归曲曲线线,其其几几何何意意义义就是解释变量取给定值时应变量的条件均值或期望值的轨迹。就是解释变量取给定值时应变量的条件均值或期望值的轨迹。一般表示为:一般表示为:此类型的总体回归函数称为此类型的总体回归函数称为条件期望形式条件期望形式。总体回归函数概念问题:当当总总体体所所包包含含的的单单元元数数相相当当多多时时,用用计计算算的的值值与与之之间间规规律律去确定回归函数形式是有困难的。去确定回归函数形式是有困难的。解决思路:(1)利用经济理论对总体回归函数形式作合理的假设;(2)利
4、用局部散点图,观察总体回归函数的形式;(3)就设定总体回归函数为线性函数 (1)模型就变量而言是线性的;(2)模型就参数而言是线性的;例:就变量X而言不是线性的在计量经济学中线性模型的在计量经济学中线性模型的“线性线性”有两种解释有两种解释(1次课)次课)三、随机扰动项三、随机扰动项 条件期望值与条件期望值与各个别的各个别的Y值的偏差称为随机扰动项值的偏差称为随机扰动项,即即 称i为观察值Yi围绕它的期望值E(Y|Xi)的离离差差(deviation),是一个不可观测的随机扰动项,则有总体回归函数的随机设定形式:仍然取例1的数据说明 随机误差项主要包括下列因素的影响:随机误差项主要包括下列因素
5、的影响:1)在解释变量中被忽略的因素的影响;2)变量观测值的观测误差的影响;3)模型关系的设定误差的影响;4)其它随机因素的影响。产生并设计随机误差项的主要原因产生并设计随机误差项的主要原因1)理论的含糊性;2)数据的欠缺;3)节省原则四、样本回归函数四、样本回归函数问题1:当当总总体体中中所所包包含含的的单单位位数数很很多多时时,将将所所有有单单位位纳纳入入考考察范围是有困难的,在这种情况下如何得到总体回归函数?察范围是有困难的,在这种情况下如何得到总体回归函数?解决思路:选出总体中部分单位(样本)加以考察,近似代替总体。问题2:部分在什么情况下可以近似代替总体?部分在什么情况下可以近似代替
6、总体?解决思路:一般要满足几个条件(样本分布应尽可能与总体保持一致;样本的选择应是随机的;样本容量要达到一定的数量要求。)问题问题3:用不同的样本,得到不同的样本回归函数,在总用不同的样本,得到不同的样本回归函数,在总体未知的情况下,怎样才知道,哪一个更接近总体,更优体未知的情况下,怎样才知道,哪一个更接近总体,更优呢?即如何寻求一种规则与方法,使所建立的样本回归函呢?即如何寻求一种规则与方法,使所建立的样本回归函数的参数,能够尽可能地数的参数,能够尽可能地“接近接近”总体回归函数中的参数总体回归函数中的参数?解决思路:解决思路:一般是对所建立的样本回归函数中的参数进一般是对所建立的样本回归函
7、数中的参数进行一些检验,达到一定的检验指标,就认为模型是可接行一些检验,达到一定的检验指标,就认为模型是可接受的,即可以作为总体的近似。受的,即可以作为总体的近似。以上两个线性回归函数来源于样本,称为样本回归函数以上两个线性回归函数来源于样本,称为样本回归函数 第二节第二节 简单线性回归模型的最小二乘简单线性回归模型的最小二乘法估计法估计一、简单线性回归模型的基本假定一、简单线性回归模型的基本假定1、关于变量和模型的假定、关于变量和模型的假定(1 1)解解释释变变量量X X看看作作是是非非随随机机的的,在在重重复复抽抽样样中中取取一一组组固固定的数值定的数值(2 2)若解释变量)若解释变量X
8、X是随机的,也与随机扰动项是随机的,也与随机扰动项相独立;相独立;(3 3)解释变量的观测值无测量误差;)解释变量的观测值无测量误差;(4 4)变量和函数形式的设定是正确,无设定误差。)变量和函数形式的设定是正确,无设定误差。一元线性回归模型 计量模型:y=0+1x+u,The coefficients 0,1是回归系数(regression coefficients).1、0 是常数项(constant term),或者截矩项 2、1 代表解释变量X的边际效果(marginal effects of the regressor,x).也称作斜率参数 0,1被称为回归系数 u 为误差项或扰动项
9、,代表了除了x之外,可以影响y的其他所有因素Examples 一个简单的工资方程:工资=0+1 教育年限+u上述简单工资函数描述了工资和受教育年限,以及其他不可观测因素u之间的关系.1 衡量的是,在其他因素(包含在误差项u里面)不变的情况下,多接受一年教育,可以增加多少工资。其他因素包括:劳动力市场经验、内在的能力、目前所从事工作的工龄、职业道德,以及其他许多因素,包含在u中。居民消费函数:Y=c+aX1+bX2+随机误差项u 其中,Y代表居民支出;X1代表居民收入;X2代表家庭财富;c是常数,即居民基本消费此时随机误差项代表的是:GDP、消费者价格指数、工业品价格指数、本币汇率、大宗商品价格
10、指数、房价均值、子女教育费均值等等我们知道,收入和财富是决定居民支出较为直接的变量,所以我们将其引入模型中,而宏观经济情况和价格水平都是间接影响着居民支出的。如果我们需要更详细全面的模型,那么我们需要引入更多的变量;但引入更多变量的成本也较大,比如多重共线、自相关问题等。2、关于随机扰动项的假定(称高斯假定或经典假定)(1)零均值假定。即(2)同方差假定。即(3)无自相关假定。即(4)随机扰动项与解释变量不相关假定。即 (5)正态性假定。即 异方差XYXY序列自相关XXYY负相关正相关 不相关不相关 自相关自相关(正正)自相关自相关(负负)3、关于被解释变量、关于被解释变量y的假定(的假定(2
11、次课次课)二、模型估计:普通最小二乘法(二、模型估计:普通最小二乘法(OLS)yX.Y1Y2最小二乘法的原理:找一条直线使得所有这些点到该直线的纵向距离的和(平方和)最小 对 求导,得到正规方程组普通最小二乘法参数估计量的离差形式普通最小二乘法参数估计量的离差形式Excel估计 例1(P27)三、三、OLS回归的统计性质回归的统计性质1、回归线通过样本均值。、回归线通过样本均值。即即 2、估计值的均值等于实际观测值的均值。、估计值的均值等于实际观测值的均值。即即 3、剩余项的均值为零。、剩余项的均值为零。即即 4、应变量估计值与剩余项不相关。、应变量估计值与剩余项不相关。即即 5、解释变量、解
12、释变量X与剩余项与剩余项e不相关。不相关。即即 四、最小二乘估计量的性质四、最小二乘估计量的性质 当模型参数估计出后,需考虑参数估计值的精度,即是否能代表总体参数的真值,或者说需考察参数估计量的统计性质。一个用于考察总体的估计量,可从如下几个方面考察其优劣性:(1)线性性)线性性,即它是否是另一随机变量的线性函数;(2)无偏性)无偏性,即它的均值或期望值是否等于总体的真实值;(3)有效性)有效性,即它是否在所有线性无偏估计量中具有最小方差。在给定经典线性回归的假定下,最小二乘估计量是具有最小方差的线性无偏估计量概率密度的估计值无偏性概率密度的估计值最小方差性是关于样本观测值是关于样本观测值Yi
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二 简单 线性 回归 模型 课件
限制150内