计量经济学庞皓第二章简单线性回归模型.ppt
《计量经济学庞皓第二章简单线性回归模型.ppt》由会员分享,可在线阅读,更多相关《计量经济学庞皓第二章简单线性回归模型.ppt(77页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1 第二章第二章 简单线性回归模型简单线性回归模型 计量经济学引子引子:中国旅游业总收入将超过中国旅游业总收入将超过30003000亿美元吗?亿美元吗?未来我国旅游需求将快速增长,根据中国政府所制定的未来我国旅游需求将快速增长,根据中国政府所制定的远景目标,到远景目标,到20202020年,中国入境旅游人数将达到年,中国入境旅游人数将达到2.12.1亿人亿人次;国际旅游外汇收入次;国际旅游外汇收入580580亿美元,国内旅游收入亿美元,国内旅游收入25002500亿亿美元。到美元。到20202020年,中国旅游业总收入将超过年,中国旅游业总收入将超过30003000亿美元,亿美元,相当于国内生
2、产总值的相当于国内生产总值的8%8%至至11%11%。(来源:(来源:2008年中国旅行社发展研究咨询报告年中国旅行社发展研究咨询报告)(参考现状:第一产业占(参考现状:第一产业占GDP的的15%,建筑业占,建筑业占GDP的的7%)什么决定性因素能使中国什么决定性因素能使中国旅游业总收入超过旅游业总收入超过30003000亿美元亿美元?旅游业的发展与这种决定性因素的数量关系究竟是什么?旅游业的发展与这种决定性因素的数量关系究竟是什么?怎样具体测定旅游业发展与这种决定性因素的数量关系怎样具体测定旅游业发展与这种决定性因素的数量关系?2需要研究经济变量之间数量关系的方法需要研究经济变量之间数量关系
3、的方法为了不使问题复杂化为了不使问题复杂化,我们先在某些标准的我们先在某些标准的(古典的古典的)假定条件下,用最简单的模型,对最简单的变量间数假定条件下,用最简单的模型,对最简单的变量间数量关系加以讨论量关系加以讨论显然,对旅游起决定性影响作用的是显然,对旅游起决定性影响作用的是“中国居民的收入中国居民的收入水平水平”以及以及“入境旅游人数入境旅游人数”等因素。等因素。“旅游业总收入旅游业总收入”(Y Y)与)与“居民平均收入居民平均收入”(X1X1)或)或者者“入境旅游人数入境旅游人数”(X2X2)有怎样的数量关系呢?有怎样的数量关系呢?能否用某种线性或非线性关系式能否用某种线性或非线性关系
4、式 Y=f(X)Y=f(X)去表现这种去表现这种数量关系呢数量关系呢?具体该具体该怎样去表现和计量呢怎样去表现和计量呢?4 第一节第一节 回归分析与回归函数回归分析与回归函数 一、相关分析与回归分析一、相关分析与回归分析1 1、相关分析、相关分析 变量性质:变量性质:都是随机变量且关系对等。都是随机变量且关系对等。分析方法:分析方法:图表法和相关系数。图表法和相关系数。分析目的:分析目的:判定变量之间相关的方向和关系的密切判定变量之间相关的方向和关系的密切程度。程度。5相关关系度量:相关关系度量:X和和Y的的总体线性相关系数总体线性相关系数:其中:其中:-X的方差的方差-Y的方差的方差-X和和
5、Y的协方差的协方差6如果只知道如果只知道X和和Y的样本观测值,则的样本观测值,则X和和Y的的样本线性样本线性相关系数为:相关系数为:其中:其中:和和分别是变量分别是变量X和和Y的样本观测值,的样本观测值,和和分别是变量分别是变量X和和Y样本值的平均值样本值的平均值注意注意:是随抽样而变动的随机变量。是随抽样而变动的随机变量。相关系数较为简单相关系数较为简单,也可以在一定程度上测定变量也可以在一定程度上测定变量间的数量关系间的数量关系,但是对于具体研究变量间的数量规律但是对于具体研究变量间的数量规律性还有局限性。性还有局限性。X X和和Y Y 都是相互对称的随机变量,都是相互对称的随机变量,线线
6、性性相相关关系系数数只只反反映映变变量量间间的的线线性性相相关关程程度度,不不能说明非线性相关关系能说明非线性相关关系 样样本本相相关关系系数数是是总总体体相相关关系系数数的的样样本本估估计计值值,由由于抽样波动,样本相关系数是随抽样而变动的随机变量,于抽样波动,样本相关系数是随抽样而变动的随机变量,其统计显著性还有待检验其统计显著性还有待检验 7对相关系数的正确理解和使用对相关系数的正确理解和使用82 2、回归分析、回归分析回归的古典意义古典意义:高尔顿遗传学的回归概念高尔顿遗传学的回归概念 (父母身高与子女身高的关系父母身高与子女身高的关系)子女的身高有向人的平均身高子女的身高有向人的平均
7、身高 回归回归 的趋势的趋势回归的现代意义现代意义:一个被解释变量对若干个一个被解释变量对若干个解释变量依存关系的研究解释变量依存关系的研究回归的目的目的(实质实质):由解释变量去估计被解释变由解释变量去估计被解释变量的平均值量的平均值9 被解释变量被解释变量Y Y的的条件分布和条件概率条件分布和条件概率:当当解解释释变变量量X X取取某某固固定定值值时时(条条件件),Y Y 的的值值不不确确定定,Y Y的的不不同同取取值值会会形形成成一一定定的的分分布布,这这是是 Y Y 的的条条件件分分布布。X X取某固定值时,取某固定值时,Y Y 取不同值的概率称为取不同值的概率称为条件概率条件概率。被
8、解释变量被解释变量 Y Y 的的条件期望条件期望:对于对于 X X 的每一个取值,的每一个取值,对对 Y Y 所形成的分布确所形成的分布确 定其期望或均值,称定其期望或均值,称 为为 Y Y 的的条件期望或条件均条件期望或条件均 值,值,用用 表示。表示。注意注意:Y:Y的条件期望是随的条件期望是随X X的变动而变动的的变动而变动的 YX明确几个概念明确几个概念(为深刻理解“回归”)10回归线回归线:对于每一个:对于每一个X的取值的取值,都有,都有Y的条件期望的条件期望 与与之之对对应应,代代表表Y的的条条件件期期望望的的点点的的轨轨迹迹形形成成的直线或曲线称为回归线。的直线或曲线称为回归线。
9、回归函数回归函数:被解释变量:被解释变量Y的条件期望的条件期望 随随解释变量解释变量X的变化而有规律的变化而有规律的变化,如果把的变化,如果把Y的条件期的条件期望表现为望表现为X 的某种函数的某种函数 ,这个函数称为回归函数。这个函数称为回归函数。回归函数分为:总体回归函数和样本回归函数回归函数分为:总体回归函数和样本回归函数 X Y11每每月月家家庭庭可可支支配配收收入入X200025003000350040004500500055006000650013121530163118432037227724692924351535211340161917261974221023882889333
10、8372139541400171317862006232525263090365038654108每每1548175018352265241926813156380240264345月月1688181418852367252228873300408741654812家家173819851943248526653050332142984380庭庭180020412037251527993189365443124580消消19022186207826892887335338424413费费220021792713291335344074支支231222982898303837104165出出231
11、6292331673834Y Y238730533310249831873510268932861591191520922586275430393396385340364148举例举例:假如已知由假如已知由100100个家庭构成的总体的数个家庭构成的总体的数据据 (单位单位:元元)二、总体回归函数二、总体回归函数(PRF)12消费支出的条件期望与收入关系的图形消费支出的条件期望与收入关系的图形对于本例的总体,家庭消费支出的条件期望对于本例的总体,家庭消费支出的条件期望与家庭收入与家庭收入 基本是线性关系基本是线性关系,可以把家庭消费支出可以把家庭消费支出的条件均值表示为家庭收入的线性函数:的条
12、件均值表示为家庭收入的线性函数:13 1.1.总体回归函数的概念总体回归函数的概念 前提:前提:假如已知假如已知所研究的经济现象的总体的被解释变量所研究的经济现象的总体的被解释变量Y和解释变量和解释变量X的每个观测值的每个观测值(通常这是不可能的!)(通常这是不可能的!),那,那么,可以计算出总体被解释变量么,可以计算出总体被解释变量Y的条件期望的条件期望,并将其表现为解释变量并将其表现为解释变量X的某种函数的某种函数这个函数称为这个函数称为总体回归函数(总体回归函数(PRF)本质本质:总体回归函数实际上表现的是特定总体中被解释变总体回归函数实际上表现的是特定总体中被解释变量随解释变量的变动而
13、变动的某种规律性。量随解释变量的变动而变动的某种规律性。计量经济学的根本目的是要探寻变量间数量关系的规律计量经济学的根本目的是要探寻变量间数量关系的规律,也也就要努力去寻求总体回归函数就要努力去寻求总体回归函数。14 条件期望条件期望表现形式表现形式例如例如Y的条件期望的条件期望是解是解释变量释变量X的线性函数,可表示为:的线性函数,可表示为:个别值个别值表现形式表现形式(随机设定形式)(随机设定形式)对于一定的对于一定的,Y的各个别值的各个别值并不一定等于条件期望,而并不一定等于条件期望,而是分布在是分布在的周围,若令各个的周围,若令各个与条件期望与条件期望的的偏差为偏差为,显然,显然是个随
14、机变量是个随机变量则有则有 2.2.总体回归函数的表现形式总体回归函数的表现形式PRF作为总体运行的客观规律,总体回归函数是客观存在作为总体运行的客观规律,总体回归函数是客观存在的,但在实际的经济研究中总体回归函数通常是的,但在实际的经济研究中总体回归函数通常是未知未知的,的,只能根据经济理论和实践经验去只能根据经济理论和实践经验去设定设定。计量经济学研究中计量经济学研究中“计量计量”的根本目的就是要寻求总体的根本目的就是要寻求总体回归函数。回归函数。我们所设定的计量模型实际就是在设定总体回归函我们所设定的计量模型实际就是在设定总体回归函数的具体形式。数的具体形式。总体回归函数中总体回归函数中
15、 Y Y 与与 X X 的关系可以是的关系可以是线性线性的,也可的,也可以是以是非线性非线性的。的。153.3.如何理解总体回归函数如何理解总体回归函数16计量经济学中计量经济学中计量经济学中计量经济学中,线性回归模型的线性回归模型的线性回归模型的线性回归模型的“线性线性线性线性”有两种解释有两种解释有两种解释有两种解释:就变量而言就变量而言就变量而言就变量而言是线性的是线性的是线性的是线性的 Y Y Y Y的条件期望(均值)是的条件期望(均值)是的条件期望(均值)是的条件期望(均值)是X X X X的线性函数的线性函数的线性函数的线性函数 就参数而言就参数而言就参数而言就参数而言是线性的是线
16、性的是线性的是线性的 Y Y Y Y的条件期望(均值)是参数的条件期望(均值)是参数的条件期望(均值)是参数的条件期望(均值)是参数的线性函数的线性函数的线性函数的线性函数例如:例如:例如:例如:对变量、参数均为对变量、参数均为对变量、参数均为对变量、参数均为“线性线性线性线性”对参数对参数对参数对参数“线性线性线性线性”,对变量,对变量,对变量,对变量”非线性非线性非线性非线性”对变量对变量对变量对变量“线性线性线性线性”,对参数,对参数,对参数,对参数”非线性非线性非线性非线性”注意:注意:在计量经济学中,线性回归模型主要指在计量经济学中,线性回归模型主要指就参数而言就参数而言是是“线线性
17、性”的的,因为只要对参数而言是线性的因为只要对参数而言是线性的,都可以用类似的方法去估都可以用类似的方法去估计其参数,都可以归于线性回归。计其参数,都可以归于线性回归。“线性线性”的判断的判断概念概念 在总体回归函数中,各个在总体回归函数中,各个的值与其条件期望的值与其条件期望的偏差的偏差有很重有很重要的意义。若只有要的意义。若只有的影响的影响,与与不应有偏差。若偏不应有偏差。若偏差差存在,说明还有其他影响因素。存在,说明还有其他影响因素。实际代表了排除在模型以外的所有因素对实际代表了排除在模型以外的所有因素对Y 的影响。的影响。性质性质 是其期望为是其期望为0有一定分布的随机变量有一定分布的
18、随机变量重要性:重要性:随机扰动项的性质决定着计量经济分析结随机扰动项的性质决定着计量经济分析结果的性质和计量经济方法的选择果的性质和计量经济方法的选择17 三、随机扰动项三、随机扰动项 是是未知未知影响因素影响因素的代表的代表(理论的模糊性理论的模糊性)是是无法取得数据无法取得数据的已知影响因素的代表的已知影响因素的代表(数据欠缺数据欠缺)是是众多细小影响因素众多细小影响因素的综合代表的综合代表(非系统性影响非系统性影响)模型可能存在模型可能存在设定误差设定误差(变量、函数形式的设定)变量、函数形式的设定)模型中变量可能存在模型中变量可能存在观测误差观测误差(变量数据不符合实际变量数据不符合
19、实际)变量可能有内在变量可能有内在随机性随机性(人类经济行为的内在随机性人类经济行为的内在随机性)18引入随机扰动项引入随机扰动项的原因的原因样本回归线:样本回归线:对于对于X的一定值,取得的一定值,取得Y的样本观测值,可计算其条件均值,的样本观测值,可计算其条件均值,样本观测值条件均值的轨迹,称为样本回归线。样本观测值条件均值的轨迹,称为样本回归线。样本回归函数:样本回归函数:如果把被解释变量如果把被解释变量Y的样本条件均值的样本条件均值表示为解释变量表示为解释变量X的某种函数,的某种函数,这个函数称为样本回归函数(这个函数称为样本回归函数(SRF)19XYSRF四、样本回归函数四、样本回归
20、函数(SRF)20 样本回归函数如果为线性函数,可表示为样本回归函数如果为线性函数,可表示为其中:其中:是与是与相对应的相对应的Y的样本条件均值的样本条件均值和和分别是样本回归函数的参数分别是样本回归函数的参数个别值(实际值)形式:个别值(实际值)形式:被被解解释释变变量量Y的的实实际际观观测测值值不不完完全全等等于于样样本本条条件件均均值值,二者之差用二者之差用表示,表示,称为称为剩余项剩余项或或残差项残差项:则则或或样本回归函数的函数形式样本回归函数的函数形式条件均值形式:条件均值形式:样本回归线随抽样波动而变化样本回归线随抽样波动而变化:每次抽样都能获得一个样本,就可以拟合一条样本回每次
21、抽样都能获得一个样本,就可以拟合一条样本回归线,归线,(SRF不唯一不唯一)样本回归函数的函数形式样本回归函数的函数形式应与设定的总体回归函数的应与设定的总体回归函数的函数形式一致。函数形式一致。样本回归线只是样本条件均值的轨迹,还不是总体样本回归线只是样本条件均值的轨迹,还不是总体回归线,它至多只是未知的总体回归线的近似表现。回归线,它至多只是未知的总体回归线的近似表现。21样本回归函数样本回归函数的特点的特点SRF1SRF2 YX A X 22PRFSRF样本回归函数与总体回归函数的关系样本回归函数与总体回归函数的关系 如果能够通过某种方式获得如果能够通过某种方式获得和和的数值,显然的数值
22、,显然:和和是对总体回归函数参数是对总体回归函数参数和和的估计的估计是对总体条件期望是对总体条件期望的估计的估计在概念上类似总体回归函数中的在概念上类似总体回归函数中的,可视,可视为对为对的估计。的估计。23对比:对比:总体回归函数总体回归函数 样本回归函数样本回归函数对样本回归的理解对样本回归的理解24 目的:计计量量经经济济分分析析的的目目标标是是寻寻求求总总体体回回归归函函数数。即即用用样样本本回回归函数归函数SRF去估计总体回归函数去估计总体回归函数PRF。由于样本对总体总是存在代表性误差,由于样本对总体总是存在代表性误差,SRF总会总会过高或过低估计过高或过低估计PRF。要解决的问题
23、:要解决的问题:寻求一种规则和方法,使其得到的寻求一种规则和方法,使其得到的SRF的参数的参数和和尽可能尽可能“接近接近”总体回归函数中的参数总体回归函数中的参数和和的的真真实实值值。这这样样的的“规规则则和和方方法法”有有多多种种,如如矩矩估估计计、极极大大似似然然估估计计、最最小小二二乘乘估估计计等等。其其中中最最常常用用的的是是最最小小二乘法。二乘法。回归分析的目的回归分析的目的用样本去估计总体回归函数,总要使用特定的方法,而任何估用样本去估计总体回归函数,总要使用特定的方法,而任何估计参数的方法都需要有一定的前提条件计参数的方法都需要有一定的前提条件假定条件假定条件 一、简单线性回归的
24、基本假定一、简单线性回归的基本假定为什么要作基本假定?为什么要作基本假定?只只有有具具备备一一定定的的假假定定条条件件,所所作作出出的的估估计计才才具具有有良良好好的的统统计计性质。性质。模模型型中中有有随随机机扰扰动动项项,估估计计的的参参数数是是随随机机变变量量,显显然然参参数数估估计计值值的的分分布布与与扰扰动动项项的的分分布布有有关关,只只有有对对随随机机扰扰动动的的分分布布作作出出假假定定,才才能能比比较较方方便便地地确确定定所所估估计计参参数数的的分分布布性性质质,也才可能进行假设检验和区间估计等统计推断。也才可能进行假设检验和区间估计等统计推断。假定分为:假定分为:对模型和变量的
25、假定对模型和变量的假定对随机扰动项的假定对随机扰动项的假定 25第二节第二节 简单线性回归模型的最小二乘估计简单线性回归模型的最小二乘估计例如对于例如对于 假定模型设定是正确的(变量和模型无设定误差)假定模型设定是正确的(变量和模型无设定误差)假定解释变量假定解释变量X在重复抽样中取固定值。在重复抽样中取固定值。假定解释变量假定解释变量X是非随机的,或者虽然是非随机的,或者虽然X是随机的,是随机的,但与扰动项但与扰动项u是不相关的。是不相关的。(从变量从变量X角度看是外生的角度看是外生的)注意注意:解释变量非随机在自然科学的实验研究中相对解释变量非随机在自然科学的实验研究中相对容易满足,经济领
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 经济学 第二 简单 线性 回归 模型
限制150内