元线性回归模型(2).ppt
《元线性回归模型(2).ppt》由会员分享,可在线阅读,更多相关《元线性回归模型(2).ppt(99页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1第二章第二章 经典单方程计量经济学模型:经典单方程计量经济学模型:一元线性回归模型一元线性回归模型 回归分析概述回归分析概述 一元线性回归模型的参数估计一元线性回归模型的参数估计 一元线性回归模型检验一元线性回归模型检验一元线性回归模型预测一元线性回归模型预测实例分析实例分析2授课目标与要求:授课目标与要求:经典单方程计量经济学模型的一元线性回归模型,是经典单方程计量经济学模型的一元线性回归模型,是课程最基础的内容。通过教学,要求学生达到:课程最基础的内容。通过教学,要求学生达到:理解经典线性单方程计量经济学模型的数理统计学基理解经典线性单方程计量经济学模型的数理统计学基础,包括回归分析、假
2、设检验和区间估计;础,包括回归分析、假设检验和区间估计;熟练掌握经典线性单方程计量经济学模型的理论与方熟练掌握经典线性单方程计量经济学模型的理论与方法,包括基本假设、模型估计和统计检验;法,包括基本假设、模型估计和统计检验;理解最小二乘原理和最大或然原理,以及在模型估计理解最小二乘原理和最大或然原理,以及在模型估计中的应用。中的应用。本章重点和难点:本章重点和难点:第二节:一元线性回归模型的参数估计第二节:一元线性回归模型的参数估计 第三节:一元线性回归模型的统计检验第三节:一元线性回归模型的统计检验 32.1 2.1 回归分析概述回归分析概述一、一、回归分析的基本概念回归分析的基本概念二、二
3、、简单线性相关分析简单线性相关分析三、三、总体回归函数(总体回归函数(PRFPRF)四、四、随机扰动项随机扰动项五、五、样本回归函数(样本回归函数(SRFSRF)4一、回归分析的基本概念一、回归分析的基本概念 变量间的关系变量间的关系 相关分析的基本概念相关分析的基本概念 回归分析的基本概念回归分析的基本概念 几点注意事项几点注意事项 51.1.变量间的关系变量间的关系确定性关系或函数关系:研究的是确定现象非随机变确定性关系或函数关系:研究的是确定现象非随机变量间的关系。量间的关系。统计依赖或相关关系:研究的是随机变量间的非确定统计依赖或相关关系:研究的是随机变量间的非确定关系。关系。又分为简
4、单相关(存在于两个变量之间的相关又分为简单相关(存在于两个变量之间的相关关系)和多重相关(存在于三个及以上变量之间的相关系)和多重相关(存在于三个及以上变量之间的相关关系)。关关系)。模糊关系(随机变量的似有似无)模糊关系(随机变量的似有似无)62 2、相关分析的基本概念、相关分析的基本概念相关关系,相关关系,是指两个或两个以上的变量,其是指两个或两个以上的变量,其样本序列观测样本序列观测值值之间表现出来的随机数学关系,常用相关系数来衡量,之间表现出来的随机数学关系,常用相关系数来衡量,主要用来判断变量间是否相关。如果两个变量样本序列观主要用来判断变量间是否相关。如果两个变量样本序列观测值之间
5、的相关系数的绝对值为测值之间的相关系数的绝对值为1 1,则二者之间具有完全的,则二者之间具有完全的相关关系。相关关系。偏相关关系,偏相关关系,是指一个变量与其他两个或两个以上变量的是指一个变量与其他两个或两个以上变量的线性组合之间的相关关系。该变量与每一个变量间的相关线性组合之间的相关关系。该变量与每一个变量间的相关系数又称系数又称偏相关系数。偏相关系数。因果关系,因果关系,是指两个或两个以上的变量,在行为机制等方是指两个或两个以上的变量,在行为机制等方面上的依赖性。面上的依赖性。因果关系有单向因果关系和双向因果关系因果关系有单向因果关系和双向因果关系之分。之分。如:价格与供给,价格与需求,投
6、资与如:价格与供给,价格与需求,投资与GDPGDP等。等。具有具有因果关系的变量之间一定具有数学上的相关关系;而因果关系的变量之间一定具有数学上的相关关系;而具有相关关系的变量之间并不一定就具有因果关系。具有相关关系的变量之间并不一定就具有因果关系。如:如:GDPGDP与一棵小树的生长速度,中国与一棵小树的生长速度,中国GDPGDP与印度人口的关系。与印度人口的关系。相关分析,相关分析,是判断变量之间是否具有相关关系的一种数学是判断变量之间是否具有相关关系的一种数学分析方法,一般是通过计算变量之间的相关系数来实现。分析方法,一般是通过计算变量之间的相关系数来实现。7对变量间对变量间统计依赖关系
7、统计依赖关系的考察主要是通过的考察主要是通过相关分析相关分析(correlation)或或回归分析(回归分析(regression)来完成的。来完成的。相关分析是讨论变量之间相关程度的一种统计分析方法。相关分析是讨论变量之间相关程度的一种统计分析方法。在相关分析中,通常假设两个变量:在相关分析中,通常假设两个变量:对其是同等看待的,对其是同等看待的,不考虑其因果关系,不考虑其因果关系,对自变量和因变量不加区别,对自变量和因变量不加区别,两个变量均是两个变量均是随机变量随机变量。正相关正相关线性相关线性相关 不相关不相关 相关系数相关系数(-11)统计依赖关系统计依赖关系 负相关负相关 有因果关
8、系有因果关系 回归分析回归分析 正相关正相关无因果关系无因果关系 相关分析相关分析 非线性相关非线性相关 不相关不相关 负相关负相关83 3、回归分析的基本概念、回归分析的基本概念回归分析,回归分析,回归分析也是判断变量间是否相关的一种数学回归分析也是判断变量间是否相关的一种数学分析方法,他着重判断一个随机变量与一个或几个可控变分析方法,他着重判断一个随机变量与一个或几个可控变量之间是否具有依赖关系的计算方法和理论。量之间是否具有依赖关系的计算方法和理论。其目的其目的在于通过后者的已知或设定值,去估计和(或)预在于通过后者的已知或设定值,去估计和(或)预测前者的(总体)均值。测前者的(总体)均
9、值。因果分析,因果分析,是分析变量之间的原因和结果。由于回归分析是分析变量之间的原因和结果。由于回归分析的特定功能,回归分析也通常被用来进行变量之间的因果的特定功能,回归分析也通常被用来进行变量之间的因果分析。但仅靠回归分析还不能对变量间的因果关系做出最分析。但仅靠回归分析还不能对变量间的因果关系做出最后的判断,必须与经济行为的定性分析等相结合。后的判断,必须与经济行为的定性分析等相结合。回归分析是计量经济学的方法论基础,其主要内容包括:回归分析是计量经济学的方法论基础,其主要内容包括:根据样本观察值对经济计量模型参数进行估计,求得回归根据样本观察值对经济计量模型参数进行估计,求得回归方程;方
10、程;对回归方程、参数估计值进行显著性检验;对回归方程、参数估计值进行显著性检验;利用回归方程进行分析、评价及预测。利用回归方程进行分析、评价及预测。94 4、注意事项、注意事项不线性相关并不意味着不相关。不线性相关并不意味着不相关。有相关关系并不意味着一定有因果关系。有相关关系并不意味着一定有因果关系。回归分析和相关分析:都是回归分析和相关分析:都是研究随机变量间的统计研究随机变量间的统计依赖关系,并能测度线性依赖程度的大小,不关注依赖关系,并能测度线性依赖程度的大小,不关注具体的依赖关系。但它们并不意味着一定有因果关具体的依赖关系。但它们并不意味着一定有因果关系。系。相关分析:仅仅从统计数据
11、上测度变量间的相关程相关分析:仅仅从统计数据上测度变量间的相关程度,无需考察两者间的因果关系,度,无需考察两者间的因果关系,对称地对待任何对称地对待任何(两个)变量,两个变量都被看作是随机的。(两个)变量,两个变量都被看作是随机的。回归分析:更注重变量间的因果关系和具体的依赖回归分析:更注重变量间的因果关系和具体的依赖关系,关系,对变量的处理方法存在不对称性,即区分应对变量的处理方法存在不对称性,即区分应变量(被解释变量)和自变量(解释变量),前者变量(被解释变量)和自变量(解释变量),前者是随机变量,后者不是。是随机变量,后者不是。10二、简单线性相关分析二、简单线性相关分析 总体相关系数总
12、体相关系数 样本相关系数样本相关系数 样本相关系数的取值范围样本相关系数的取值范围 相关系数的显著性检验相关系数的显著性检验 线性相关理论的局限性线性相关理论的局限性111 1、总体相关系数、总体相关系数总体相关系数。总体相关系数。通过观察散点图只能得到两个变量之通过观察散点图只能得到两个变量之间相关关系的一个粗略概念。要想精确刻画他们之间间相关关系的一个粗略概念。要想精确刻画他们之间的相关程度,需要采用一个数量指标的相关程度,需要采用一个数量指标相关系数来描相关系数来描述。大致进行分析判断。两个变量述。大致进行分析判断。两个变量X、Y之间真实的相之间真实的相关程度,使用总体相关系数关程度,使
13、用总体相关系数来表示的,即:来表示的,即:=Cov(X,Y)/(Var(X)Var(Y)1/2=XY/(X2Y2)1/2可以证明总体相关系数的取值范围定义为可以证明总体相关系数的取值范围定义为-1到到1之间,之间,即:即:-1,1,当,当其取不同值时,两变量间的相关其取不同值时,两变量间的相关关系也就确定了。关系也就确定了。122 2、样本相关系数、样本相关系数样本相关系数。样本相关系数。由于由于两个变量两个变量X、Y之间的总体相关系数之间的总体相关系数一般无一般无法获得,因此经常用某个特定的样本相关系数法获得,因此经常用某个特定的样本相关系数r作为总体相关系作为总体相关系数数的一个估计值(或
14、替代值)。假定:有一个样本容量为的一个估计值(或替代值)。假定:有一个样本容量为n的的样本,在样本,在X、Y平面上的散点图如下:平面上的散点图如下:今令均值为:今令均值为:X=Xi/n,Y=Yi/n;令离差变量为:令离差变量为:xi=Xi-X,yi=Yi-Y。Yi在散点图上作均值在散点图上作均值X、Y的直线。的直线。.xi、yi表示第表示第i个观测点与均值个观测点与均值 .(X、Y)偏离的远近和方向。偏离的远近和方向。.在散点图上:在散点图上:在散点图上:在散点图上:当当(Xi,Yi)落在落在 Y .、象限时,象限时,xi、yi同号,同号,.yi .即即xiyi0;否则;否则xiyi0;否则;
15、否则xiyi r时,则时,则X,Y显著线性相关,否显著线性相关,否则不显著。则不显著。165 5、线性相关理论的局限性、线性相关理论的局限性 上述线性相关理论,上述线性相关理论,只适应于两个变量间的线性关系,当只适应于两个变量间的线性关系,当r=0时,只表示时,只表示X,Y线性无关,并不意味着线性无关,并不意味着X,Y相互独立。相互独立。线性相关理论,线性相关理论,只能反映变量之间相互关系的密切程度,只能反映变量之间相互关系的密切程度,并不意味着任何函数关系。并不意味着任何函数关系。X,Y间的高度相关可能源于以下几种情况:间的高度相关可能源于以下几种情况:、X,Y间间存在因果关系;存在因果关系
16、;、X,Y同时受到某个因素的影响,但并同时受到某个因素的影响,但并无因果关系,如时间;无因果关系,如时间;、X,Y间的相关关系纯属偶然,间的相关关系纯属偶然,称之为假相关、伪相关或偶然相关。称之为假相关、伪相关或偶然相关。线性相关系数线性相关系数r是用来衡量所有观测值的点是用来衡量所有观测值的点(Xi,Yi)围绕直围绕直线的密集程度线的密集程度,但它不能确定直线方程及其任何形式,不,但它不能确定直线方程及其任何形式,不能给出该直线的函数式及其参数值。能给出该直线的函数式及其参数值。不同斜率的直线,其相关系数可能是相同的。不同斜率的直线,其相关系数可能是相同的。17三、总体回归函数三、总体回归函
17、数 回归分析回归分析 案例分析案例分析 总体回归函数总体回归函数181 1、回归分析、回归分析回归分析:回归分析:相关关系的特征是不确定性,一个变量不能依相关关系的特征是不确定性,一个变量不能依据其他有关变量的数值,精确地、一一对应地求出其数值。据其他有关变量的数值,精确地、一一对应地求出其数值。但是,我们可以根据大量的统计数据,找出变量之间在数但是,我们可以根据大量的统计数据,找出变量之间在数量变化方面的统计规律,这种统计规律所表现出来的数量量变化方面的统计规律,这种统计规律所表现出来的数量关系就叫做关系就叫做回归关系回归关系,描述这种回归关系的数学公式就称,描述这种回归关系的数学公式就称为
18、为回归方程回归方程;有关回归关系的计算方法和理论称为有关回归关系的计算方法和理论称为回归分析回归分析。又分为:。又分为:一元回归分析(方程)、多元回归分析(方程);线性回一元回归分析(方程)、多元回归分析(方程);线性回归分析(方程)、非线性回归分析(方程)。归分析(方程)、非线性回归分析(方程)。回归分析回归分析关心的是根据解释变量的已知或给定值,考察被关心的是根据解释变量的已知或给定值,考察被解释变量的总体均值,即当解释变量取某个确定值时,与解释变量的总体均值,即当解释变量取某个确定值时,与之统计相关的被解释变量所有可能出现的之统计相关的被解释变量所有可能出现的对应值的平均值对应值的平均值
19、对应值的平均值对应值的平均值回归分析回归分析的主要目的有三点:的主要目的有三点:、根据样本观测值,对模、根据样本观测值,对模型参数进行估计,求得回归方程;型参数进行估计,求得回归方程;、对回归方程、模型、对回归方程、模型参数估计值进行显著性检验;参数估计值进行显著性检验;、利用回归方程进行预测、利用回归方程进行预测和控制。和控制。192 2、案例分析:、案例分析:案例案例2.1.22.1.2:一个假想的社区有一个假想的社区有100100户家庭组成,要研究户家庭组成,要研究该社区每月该社区每月家庭消费支出家庭消费支出Y Y与每月与每月家庭可支配收入家庭可支配收入X X的关的关系。系。即如果知道了
20、家庭的月收入,能否预测该社区家即如果知道了家庭的月收入,能否预测该社区家庭的平均月消费支出水平?庭的平均月消费支出水平?为达到此目的,将该为达到此目的,将该100100户家庭划分为组内收入差不大户家庭划分为组内收入差不大(可支配收入水平)的(可支配收入水平)的1010组,以分析每一可支配收入组组,以分析每一可支配收入组的家庭消费支出。的家庭消费支出。由于不确定因素的影响,对同一收入水平由于不确定因素的影响,对同一收入水平X X,不同家庭,不同家庭的消费支出可能不完全相同;见下表:的消费支出可能不完全相同;见下表:21但由于调查的完备性,给定收入水平但由于调查的完备性,给定收入水平X X的消费支
21、出的消费支出Y Y的的分布是确定的,即以分布是确定的,即以X X的给定值为条件的的给定值为条件的Y Y的的条件分布条件分布(Conditional distributionConditional distribution)是已知的,例如:)是已知的,例如:P(Y=561|X=800P(Y=561|X=800)=1/4=1/4。因此,给定收入因此,给定收入X X的某一个值的某一个值X Xi,可得消费支出,可得消费支出Y Y的的条件条件均值均值(conditional meanconditional mean)或)或条件期望值条件期望值(conditional expectationconditi
22、onal expectation):):E(Y|X=XE(Y|X=Xi)。该例中:该例中:E(Y|XE(Y|Xi=800)=605=800)=605描出散点图发现:虽然不同的家庭其消费支出存在差描出散点图发现:虽然不同的家庭其消费支出存在差异,但是,随着收入的增加,消费异,但是,随着收入的增加,消费“平均地说平均地说”也在也在增加,且增加,且Y Y的条件均值均落在一根正斜率的直线上。这的条件均值均落在一根正斜率的直线上。这条直线称为条直线称为总体回归线总体回归线。05001000150020002500300035005001000150020002500300035004000每月可支配收入
23、X(元)每月消费支出Y(元)233 3、总体回归函数、总体回归函数在给定解释变量在给定解释变量Xi条件下被解释变量条件下被解释变量Yi的期望轨迹称为的期望轨迹称为总体总体回归线回归线(population regression line),或更一般地称为),或更一般地称为总体总体回归曲线回归曲线(population regression curve)。)。相应的函数:相应的函数:称为(双变量)称为(双变量)总体回归函数总体回归函数(population regression function,PRF)。)。含义:含义:回归函数(回归函数(PRF)说明被解释变量)说明被解释变量Y的平均状态(总
24、的平均状态(总体条件期望)随解释变量体条件期望)随解释变量X变化的规律。变化的规律。函数形式:函数形式:可以可以是线性或非线性的。是线性或非线性的。案例中,将居民消费支出看成是其可支配收入的线性函数案例中,将居民消费支出看成是其可支配收入的线性函数时,为一时,为一线性函数线性函数:其中,其中,0,1是未知参数,称为是未知参数,称为总体回归系数总体回归系数(regression coefficients)。)。24四、随机扰动项四、随机扰动项 随机扰动项随机扰动项 总体回归模型总体回归模型 引入随机误差项的主要原因引入随机误差项的主要原因251 1、随机扰动项、随机扰动项在案例在案例2.1.2中
25、,总体回归函数说明在给定的收入水平中,总体回归函数说明在给定的收入水平Xi下,该社区家庭平均的消费支出水平下,该社区家庭平均的消费支出水平Y。但对某一个别的家庭,其消费支出但对某一个别的家庭,其消费支出Yi可能与该平均水可能与该平均水平平Y有偏差,并且聚集在平均水平有偏差,并且聚集在平均水平Y 的周围。的周围。对任何个别家庭,记:对任何个别家庭,记:称称 i为观察值为观察值Yi围绕它的期望值的围绕它的期望值的离差离差(deviation),它),它是一个不可观测的随机变量,又称为是一个不可观测的随机变量,又称为随机干扰项随机干扰项(stochastic disturbance)或)或随机误差项
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 线性 回归 模型
限制150内