计量经济学ppt课件(完整版).ppt
计量经济学ECONOMETRICS第一章概概 述述1.1 什么是计量经济学?什么是计量经济学?1930年年12月月29日,在耶鲁大学经济学家欧文日,在耶鲁大学经济学家欧文费雪费雪(Irving Fisher)和挪威经济学家弗里希)和挪威经济学家弗里希(Ragnar Frisch)的倡议下,计量经济学会)的倡议下,计量经济学会(Econometric Society)在美国俄亥俄州克里)在美国俄亥俄州克里夫兰成立,由弗里希担任主编的计量经济学会的夫兰成立,由弗里希担任主编的计量经济学会的刊物刊物计量经济学学刊计量经济学学刊(Econometrica)于)于1933年创刊。年创刊。1一般认为,计量经济学会的成立,一般认为,计量经济学会的成立,标志着计量经济学作为经济学的一门独立学科被标志着计量经济学作为经济学的一门独立学科被正式确定。正式确定。1 http:/www.econometricsociety.org/.在在计量经济学学刊计量经济学学刊创刊号上创刊号上,弗里希进一步,弗里希进一步指出:指出:“但经济学中的数量方法有几个方面,不但经济学中的数量方法有几个方面,不应该将其中任何一个单方面与计量经济学相混淆。应该将其中任何一个单方面与计量经济学相混淆。计量经济学与经济统计学绝非一码事;它也不同计量经济学与经济统计学绝非一码事;它也不同于我们所说的一般经济理论,尽管经济理论具有于我们所说的一般经济理论,尽管经济理论具有明显的数量特征;计量经济学也不应被看成是数明显的数量特征;计量经济学也不应被看成是数学在经济学中的应用。经验表明,统计学、经济学在经济学中的应用。经验表明,统计学、经济理论和数学这三方面对于要真正理解现代经济生理论和数学这三方面对于要真正理解现代经济生活的数量关系来说,都是必要的,但没有哪一个活的数量关系来说,都是必要的,但没有哪一个方面是足够的,这三者结合起来才是力量,这种方面是足够的,这三者结合起来才是力量,这种结合便构成了计量经济学。结合便构成了计量经济学。”11 http:/www.econometricsociety.org/.1.2 计量经济学是一门独立的经济计量经济学是一门独立的经济学科学科一、计量经济学与其他学科的不同经济理论经济理论主要是根据逻辑推理得出结论,说明研究经济现象的本质和规律,大多数是定性定性的。经济理论所涉及到的数量关系也都是确定的,并不能给出具体的数值度量不能给出具体的数值度量。计量经济学计量经济学所要研究的就是如何估计这个具估计这个具体的数值体的数值,并且计量经济学所研究的数量关系不是确定的变量关系而是随机变量关随机变量关系。系。数理经济学数理经济学是要用数学形式数学形式来表述经济理论。计量经济学家计量经济学家就是把数理经济学家提出来的数学方程式(公式)改造成适合于经验改造成适合于经验验证的形式。验证的形式。这种从数学公式到计量经济学方程式(公式)的转换需要许多的创造性和实际技巧。经济统计学经济统计学主要是收集、加工并用图表的形式来体现经济数据。计量经济学计量经济学根据需要的原始资料进行参数估计,验证经济理论。二、计量经济学在经济学中的地位克莱因克莱因(Lawrence R.Klein)认为:认为:“计量经济已计量经济已经在经济学科中居于重要的地位经在经济学科中居于重要的地位”,“大多数大大多数大学的学院中,计量经济学的讲授已经成为经济学学的学院中,计量经济学的讲授已经成为经济学课程表中最有权威的一部分课程表中最有权威的一部分”。萨缪尔森甚至认。萨缪尔森甚至认为:为:“第二次世纪大战后的经济学是计量经济学第二次世纪大战后的经济学是计量经济学的时代的时代”。从。从1969年诺贝尔经济学设立到年诺贝尔经济学设立到2012年,年,共有共有71位经济学家获奖,覆盖了经济学各分支学位经济学家获奖,覆盖了经济学各分支学科分支学科,直接因对计量经济学的创立和发展科分支学科,直接因对计量经济学的创立和发展作出贡献而获奖的经济学家达作出贡献而获奖的经济学家达12人,居经济学个人,居经济学个分支学科之首(详见附录分支学科之首(详见附录1.1)。)。三、计量经济学有自己独特的研究经济问题的方法首先,计量经济学要根据观测(首先,计量经济学要根据观测(observational)数据而不是实验(数据而不是实验(experimental)数据来建立模)数据来建立模型。型。其次,从建立与应用计量经济学模型的全过程来其次,从建立与应用计量经济学模型的全过程来看,理论模型的设定和样本数据的收集,都必须看,理论模型的设定和样本数据的收集,都必须对经济理论和所要研究的经济现象有深刻的认识。对经济理论和所要研究的经济现象有深刻的认识。所购建的计量经济学模型必须与实际经济现象和所购建的计量经济学模型必须与实际经济现象和经济理论相符合,否则,模型将毫无意义。这一经济理论相符合,否则,模型将毫无意义。这一点正是为什么说计量经济学不是数学或数学在经点正是为什么说计量经济学不是数学或数学在经济学上的应用,而是经济学的理由。济学上的应用,而是经济学的理由。最后,计量经济学在某种角度是一门综合综合方法论学科方法论学科,其核心内容是模型参数估计参数估计方法方法,但是,在整个计量经济学的分析中,涉及到各种方法与思想。这也恰恰是让学习者感觉到这门学科难以掌握、不是很系统的原因所在。1.3 计量经济学方法论计量经济学方法论什么是计量经济学方法论呢?实际上,就是计量经济学家们对一个经济问题到底是怎么分析的呢?使用什么样的方法呢?计量经济学的思想方法有若干派别,我们这里讲的主要是至今仍在经济学及其他社会和行为科学领域研究中占主导地位的传统传统或经典方法论。或经典方法论。一、在理论和假说的基础上建立计量经济学模型凯恩斯(JohnMaynardKeynes)在就业、利息和货币通论中说,存在一条基本的心理规律:通常或平均而言,人们倾向于随着他们收入的增加而增加其消费,但是消费的增加不如收入增加那么多。消费与收入的这种关系被称作消费函数或消费倾消费函数或消费倾向向。那么,增加的消费与增加的收入之比率,也就是说增加的1单位收入中用于增加消费部分的比率,称为边际消费倾向边际消费倾向(marginalpropensitytoconsume,MPC)。边际消费倾向的公式是:表示增加的消费,表示增加的收入;代表消费,代表收入。如果我们把消费和收入之间的关系看成函数关系,那么就可以建立一个函数方程来:(1.3.1)根据微积分的知识,我们知道MPC实际上就是函数的导数,即可以写成:凯恩斯设想,边际消费倾向MPC是大于零小于1的。进一步,我们可以看到凯恩斯假设的消费与收入之间的关系是正向关系,但他并没有明确指出二者之间准确的函数关系。为了简单起见,数理经济学家建立了一个如下的凯恩斯消费函数消费函数(consumptionfunction):(1.3.2)其中,代表消费,代表收入,而和分别表示截距截距(intercept)和斜率斜率(slope)方程(1.3.2)的几何意义是一条直线,见图1.1。这种函数关系,我们称为线性关系,即消费与收入之间的关系是线性关系。图图1.1 凯恩斯消费函数凯恩斯消费函数1现在来定义一些概念和说明一下计量经济学模型建立的思想。1解释变量与被解释变量。解释变量与被解释变量。2.截距截距和斜率斜率、模型模型(model)、模型参参数数(parameter)3.“线性线性”的含义。的含义。4在线性函数方程(在线性函数方程(1.3.2)中具有非常重)中具有非常重要的意义。要的意义。5计量经济学模型建立的思想计量经济学模型建立的思想。计量经济学模型方程(1.3.1)和方程(1.3.2)修改成如下的形式:(1.3.3)(1.3.4)变量是一个随机变量随机变量(randomvariable,stochasticvariable),被称为随机干扰项随机干扰项(stochasticdisturbanceterm)或随机误差项随机误差项(stochasticerrorterm)。二、统计数据的获得与参数估计1.数据类型。数据类型。时间序列数据时间序列数据(timeseriesdata)。截面数据截面数据(cross-sectiondata)。面板数据面板数据(paneldata)。2.参数估计。参数估计。利用回归分析回归分析(regressionanalysis)方法,得到参数和的估计值估计值。表表1.1 1978-20111.1 1978-2011年间中国人均国内生产总值与居民消费水平数据年间中国人均国内生产总值与居民消费水平数据(单位:元)年份人均国内生产总值(X)居民消费水平(Y)年份人均国内生产总值(X)居民消费水平(Y)1978381 18419955046 23551979419 20819965846 27891980463 23819976420 30021981492 26419986796 31591982528 28819997159 33461983583 31620007858 36321984695 36120018622 3887 1985858 44620029398 4144 1986963 497200310542 4475 19871112 565200412336 5032 19881366 714200514185 5596 19891519 788200616500 6299 19901644 833200720169 7310 19911893 932200823708 8430 19922311 1116200925608 9283 19932998 1393201030015 10522 19944044 1833201135181 12272 图图1.2 1978-2011年间中国人均国内年间中国人均国内生产总值与居民消费水平的关系生产总值与居民消费水平的关系和的估计值分别为374.6882和0.350334。从而所估计的消费函数是,(1.3.5)什么是“回归”?什么是“回归分析方法”?为什么估计出来的消费函数变量Y顶上有帽(或尖)符号,并且和变量X一样都有下标符号t?首先,计量经济模型(首先,计量经济模型(1.3.4)是一个随机模型,)是一个随机模型,因为有随机变量因为有随机变量 的存在,但是,这个模型也是的存在,但是,这个模型也是纯随机数学模型,因此,不可能写成带有具体数纯随机数学模型,因此,不可能写成带有具体数值的模型来;值的模型来;其次,要写成带有具体数值,或者讲,带有具体其次,要写成带有具体数值,或者讲,带有具体的参数数值的模型来,也就是说,把抽象的参数的参数数值的模型来,也就是说,把抽象的参数符号赋予具体的数值,就必须利用具体的数据来符号赋予具体的数值,就必须利用具体的数据来估计。因此,我们得到的估计。因此,我们得到的 和和 的数值是通过具的数值是通过具体一组数据估计获得的体一组数据估计获得的-样本。样本。方程(方程(1.3.5)叫做样本回归函数()叫做样本回归函数(sample regression function,SRF)或样本回归方程)或样本回归方程(sample regression equation);图);图1-2中所中所显示出的直线称为样本回归线(显示出的直线称为样本回归线(sample regression lines)。)。样本估计值用帽表示:样本估计值用帽表示:-样本回归函数样本回归函数下标下标 表示不同样本观测值。表示不同样本观测值。N个不同样本,确定与随机的关系。个不同样本,确定与随机的关系。样本函数一旦确定,对于某个样本来讲,这个样本函数一旦确定,对于某个样本来讲,这个样本函数就是一个确定的、具体的函数关系。但样本函数就是一个确定的、具体的函数关系。但是同时因为样本本身的随机性,参数又是随机变是同时因为样本本身的随机性,参数又是随机变量。量。三、假设检验首先,通过统计推断统计推断(statisticalinference)即假假设检验设检验(hypothesistesting)来肯定或否定经济理论,这是本书最重要的内容。其次,需要考虑的问题是:数据的选择是不是有问题?建立的模型一定存在因果关系吗?经济理论一定能够得到模型验证吗?建立的经济模型一定能够发现新的经济理论呢?例如,在19世纪晚期,英国经济学家威廉姆斯坦利杰文斯(WilliamStanleyJevons)曾经假设太阳黑子导致经济活动增加。四、模型应用如果所选择的模型经过验证肯定了所考虑的经济理论或假说,那么就可以根据模型来预测与预报。比如根据样本回归方程(1.3.5)来预测2012年的居民消费水平。假设2012年人均国内生产总值为X=36000元,代入方程(1.3.5)得到:图图1.3 计量经济学的研究过程计量经济学的研究过程1.4 计量经济学的类型计量经济学的类型理论计量经济学理论计量经济学(theoreticaleconometrics)和应用计量经济学应用计量经济学(appliedeconometrics)。经典计量经济学经典计量经济学(classicaleconometrics)一般指20世纪70年代以前的计量经济学,非经典计量非经典计量经济学经济学(non-classicaleconometrics)或现代计现代计量经济学量经济学(moderneconometrics),主要包括微观计量经济学、非参数计量经济学、时间序列计量经济学和平行数据计量经济学。即经典方法和贝叶斯方法贝叶斯方法(Bayesian)。宏观计量经济学宏观计量经济学(Macroeconometrics)和微观微观计量经济学计量经济学(Microeconometrics)1.5 预备知识和计量经济学软件预备知识和计量经济学软件1.宏观经济学方面的基本知识。宏观经济学方面的基本知识。2.数学方面。需要基本的微积分和线性代数学方面。需要基本的微积分和线性代数方面的知识。数方面的知识。3.统计学和数理统计方面。个体、总体、统计学和数理统计方面。个体、总体、样本、随机变量、条件概率、数学期望、样本、随机变量、条件概率、数学期望、常见随机变量分布、平均值、方差、标准常见随机变量分布、平均值、方差、标准差、协方差、相关系数、统计估计量、点差、协方差、相关系数、统计估计量、点估计、区间估计、参数估计、中心极限定估计、区间估计、参数估计、中心极限定理、小概率事件、两类错误、假设检验等。理、小概率事件、两类错误、假设检验等。常用的计量经济学软件很多。诸如EViews(EconometricViews)、TSP(TimeSeriesProcessor)、PcGIVE(PersonalComputer,GeneralInstrumentalVariableEstimation)、FcFiml(PersonalComputer,FullInstrumentMaximumLikelihoodEstimation)、RATS、Microfit、Mathematica、S-plus、Ox、ET、LIMDEP、SHAZAM、MINITAB、BMD、GUASS、STATA、SPSS、SAS等。EViews是目前世界上最流行的计量经济学软件之一。1.6 进一步学习建议进一步学习建议古拉扎蒂.计量经济学基础.5版.费剑平译.北京:中国人民大学出版社,2011.威廉格林.计量经济学分析.6版.张成思译.北京:中国人民大学出版社,2011.本章结束了!准备好了吗?下节课我们开始学习新课程!第二章第二章 简单线性回归模型简单线性回归模型2.1 什么是什么是“回归回归”?“回归回归”这个词是由英国维多利亚时期博学科学家这个词是由英国维多利亚时期博学科学家法兰西斯法兰西斯高尔顿(高尔顿(Francis Galton)首先提出来)首先提出来的。的。法兰西斯法兰西斯高尔顿高尔顿在利用统计方法研究人类遗在利用统计方法研究人类遗传学中发现,父母高,儿女也高;父母矮,儿女传学中发现,父母高,儿女也高;父母矮,儿女也矮,但是给定父母的身高,儿女辈的平均身高也矮,但是给定父母的身高,儿女辈的平均身高却趋于或者却趋于或者“回归回归”到全体人口的平均身高,即到全体人口的平均身高,即“回归于平均值回归于平均值”(regression toward the mean)。)。另一位英国数理统计学家另一位英国数理统计学家卡尔卡尔皮尔逊皮尔逊(Karl Pearson)发现,对于父亲高的群体,发现,对于父亲高的群体,儿子辈的平均身高低于父辈的身高,而对儿子辈的平均身高低于父辈的身高,而对于父亲矮的群体,儿子辈的平均身高则高于父亲矮的群体,儿子辈的平均身高则高于父辈的身高。于父辈的身高。儿子辈的身高儿子辈的身高“回归回归”到男子的平均身高到男子的平均身高。表表2.1 模仿模仿70对父子身高的调查结果对父子身高的调查结果(纯假设构造数据,单位:厘米)父亲儿子父亲儿子父亲儿子父亲儿子父亲儿子父亲儿子父亲儿子153150153166165160165173178166178180190171153152153168165162165175178167178181190172153154153171165163165177178168178183190173153156153172165165165180178170190160190175153158153173165166178156178172190162190177153159153175165167178158178173190164190178153160165155165168178160178174190165190180153162165156165170178161178175190167190182153163165157165171178163178176190169190184153165165158165172178165178178190170190186图图2.1 给定父亲身高后儿子辈身高的假设分布给定父亲身高后儿子辈身高的假设分布(Y代表儿子辈身高,X代表给定的父亲身高,单位:厘米)表表2.2 2.2 按照给定父亲身高对儿子辈身高重新编排按照给定父亲身高对儿子辈身高重新编排(单位:厘米)项目给定父亲身高153165178190儿子辈身高150163155167156172160172152165156168158173162173154166157170160174164175156168158171161175165177158171160172163176167178159172162173165178169180160173163175166180170182162175165177167181171184166180168183186170平均值162.7166.4169.8172.6图图2.2 儿子辈身高的平均值连接成一条直线,这条直儿子辈身高的平均值连接成一条直线,这条直线就叫做回归线线就叫做回归线对回归的现代理解已经有了很大的不同,在计量经济学上所讲的回归,实际上,与所说的回归分析回归分析(regressionanalysis)是一个意思。从狭义上讲,回归分析是指:一个变量对另一个变量的依赖关系,在计量经济学上,就是指被解释变量被解释变量对解释解释变量变量(一个或多个)的依赖关系(也可以说成统计依赖关系)。其用意在于通过后者的已知或设定值,去估计估计或预测预测前者的(总体)均值;或者,利用回归分析得到的样本模型中的(总体)参数的估计值来解释被解释变量的经济意义,即经济结构经济结构分析分析。例如第1章我们谈到的凯恩斯消费函数的计量经济模型,人均国内生产总和居民消费水平数据作为样本得到的样本回归模型实际上是一个随机变量随机变量,而也是随机变量,但是在经典计量经济学中,我们假定不是随机变量不是随机变量,也就是说,在不同的多个样本抽取中取同样一组数值。所谓的被解释变量与解释变量的依赖关系,往往含有因果关系因果关系的意思,也就是说,在经济理论假设(因果关系)的前提下,作为检验经济理论的计量经济模型自然就存在着因果关系因果关系,这种因果方向是从到,而不存在从到的因果关系。但是,这并不能说明被解释变量与解释变量本来就存在因果关系。依赖关系的另一层含义:用样本模型中得到的对总体参数的估计值来解释被解释变量的经济意义,即经济结经济结构分析构分析。广义的回归分析包括:根据样本数据对计量经济模型参数进行估计,得到样本回归方程;对回归方程、参数估计值进行显著性假设检验;利用回归方程进行分析、评价及预测。2.2 总体回归函数与样本回归函数总体回归函数与样本回归函数一、随机变量与统计学中一些基本概念一、随机变量与统计学中一些基本概念回归分析中,我们所谈的统计依赖关系,是不确定的关系,即变量是随机变量(randomvariable,stochasticvariable)。农作物收成对气温、降雨量、阳光、土壤质量以及施肥量的关系。影响农作物收成的因素是复杂的、多样的(不可辨认的)。确定的关系确定的关系-万有引力定律万有引力定律其中,为两个物体的质量,F为引力,G为比例常数,r为距离。如何处理随机变量问题?建立与随机变量如何处理随机变量问题?建立与随机变量相关的模型呢?相关的模型呢?经济学家建立纯数学模型:Q代表商品需求量,P代表商品价格,Ps代表替代品价格,Y代表可支配收入。数理经济学家建立线性模型:计量经济学家随机模型:通过样本估计得到具体的方程:在概率论与数理统计中,随机变量的含义是指定义在样本空间上具有一定概率分布在样本空间上具有一定概率分布的变量的变量。也就是说,随机变量是具有一定概率的不确定的变量。统计学中一些基本概念:总体总体(population)是指包含所研究的全部个体(数据)的集合;样本或样本空间样本或样本空间(samplespace)是指从总体中抽取的一部分元素的集合,构成样本的元素的个数叫做样本量样本量(samplesize)或样本容量样本容量(samplecapacity)平均数平均数也称为均值均值(mean),是指变量值相加后除以变量个数得到的结果,记作,离差离差(deviation),是指变量值与均值之差,记作,方差方差(variance),是指各变量值与均值之差(离差)的平方的平均数,记作,标准差标准差(standarderror),是指方差的平方根,记作,,数学期望数学期望(mathematicalexpectation)或期望期望(expectation),是指随机变量平均取值大小,记作,,协方差协方差(covariance),是指两个变量的离差乘积的数学期望,记作;相关系数相关系数(correlationcoefficient),是指两个变量之间线性关系的一个度量,定义为:(2.2.1)样本相关系数可以写成如下形式:(2.2.2)二、总体回归函数(重新回到回归的概念)二、总体回归函数(重新回到回归的概念)例例2.1 假想一个社区是由60户家庭组成的总体总体(population),现在来研究该社区整体家庭每月家庭消费与每月可支配收入之间的关系。把60个家庭按照可支配收入水平不同分成10组(子总体),每组有不同个数的家庭组成,这样,就有了10个固定的值以及每个值对应着不同个数的值。项目项目每月家庭可支配收入每月家庭可支配收入X X3200320040004000480048005600560064006400720072008000800088008800960096001040010400每月家庭每月家庭消费支出消费支出Y Y220022002600260031603160320032004080408044004400480048005400540054805480600060002400240028002800336033603720372042804280460046005440544054805480580058006080608026002600296029603600360038003800440044004800480056005600560056006200620070007000280028003200320037603760412041204640464052005200576057606080608066006600712071203000300034003400392039204320432047204720540054005800580062806280700070007200720035203520452045205000500056005600640064007560756074007400460046006480648076407640共计共计1300013000184801848017800178002828028280271202712030000300002740027400417204172038640386404844048440E(YE(YX)X)260026003080308035603560404040404520452050005000548054805960 5960 6440644069206920表表2.3 每月家庭可支配收入与消费支出每月家庭可支配收入与消费支出(单位:元)平均值或均值,也称为条件均值条件均值或条件期条件期望值望值(conditionalexpectedvalues),用符号表示为,读作“给定值条件下的期望值”。根据表2.4中的数据可以计算出,其中=1,2,10,表示给定的第组家庭月可支配收入。项目项目每月家庭可支配收入每月家庭可支配收入X X3200320040004000480048005600560064006400720072008000800088008800960096001040010400条件概率条件概率P(P(Y YXiXi)1/51/5 1/61/6 1/51/5 1/71/7 1/61/6 1/61/6 1/51/5 1/71/7 1/61/6 1/71/7 1/51/5 1/61/6 1/51/5 1/71/7 1/61/6 1/61/6 1/51/5 1/71/7 1/61/6 1/71/7 1/51/5 1/61/6 1/51/5 1/71/7 1/61/6 1/61/6 1/51/5 1/71/7 1/61/6 1/71/7 1/51/5 1/61/6 1/51/5 1/71/7 1/61/6 1/61/6 1/51/5 1/71/7 1/61/6 1/71/7 1/51/5 1/61/6 1/51/5 1/71/7 1/61/6 1/61/6 1/51/5 1/71/7 1/61/6 1/71/7 1/61/6 1/71/7 1/61/6 1/61/6 1/71/7 1/61/6 1/71/7 1/71/7 1/71/7 1/71/7E(YE(YX)X)260026003080308035603560404040404520452050005000548054805960 5960 6440644069206920表表2.4 与表与表2.3数据对应的条件概率分布数据对应的条件概率分布比如,=8000元,的概率分布为Y48005440560057605800P(Y|Xi)1/51/51/51/51/5需要指出的是:条件期望值与无条件期望需要指出的是:条件期望值与无条件期望值值 (unconditional expected value)是不同的。是不同的。现在把表现在把表2.3中的数据,以中的数据,以 为横轴,以为横轴,以 和和 为纵轴,做出散点图来,并将条为纵轴,做出散点图来,并将条件期望值件期望值 各点连接起来,就形成了各点连接起来,就形成了一条直线,见图一条直线,见图2.3。我们把这条直线称为总体回归线我们把这条直线称为总体回归线(population regression line,PRL)或)或一般地称为总体回归曲线(一般地称为总体回归曲线(population regression curve)。或者说,)。或者说,对对 的的回归(回归(regression of on )。)。图图2.3 家庭可支配收入与家庭消费支出的散点图家庭可支配收入与家庭消费支出的散点图(E代表条件期望值)图图2.3中的总体回归线是一条直线,这不说中的总体回归线是一条直线,这不说明所有的总体回归线都是直线,也可能是明所有的总体回归线都是直线,也可能是抛物线、指数曲线等其他曲线。抛物线、指数曲线等其他曲线。另外,我们假设对于每个另外,我们假设对于每个 ,都有,都有 值在值在其条件期望值左右的一定分布,而总体回其条件期望值左右的一定分布,而总体回归线恰好是穿过这些条件期望或均值的直归线恰好是穿过这些条件期望或均值的直线或曲线。线或曲线。对于每一个条件期望都是的函数,其中是的某个给定值,可以写成:(2.2.3)方程(2.2.3)称为条件期望函数条件期望函数(conditionalexpectationfunction,CEF)或总体回归函数总体回归函数(populationregressionfunction,PRF)或简称总体回归总体回归(populationregression,PR)。一般情况下,我们把总体回归函数设为线性形式,即(2.2.4)方程(2.2.4)称为线性总体回归函数线性总体回归函数(linearpopulationregressionfunction)或简称线性总体回归线性总体回归(linearpopulationregression)。和和 是未知但却固定的参数。是未知但却固定的参数。需要测算或估计出具体的数值需要测算或估计出具体的数值。在实际经济现象中,要全部掌握总体数据在实际经济现象中,要全部掌握总体数据往往是比较困难的或者是不可能的往往是比较困难的或者是不可能的。被看成常数被看成常数。回归系数回归系数(regressioncoefficients)模型参数模型参数三、随机误差项与总体回归函数随机设定形式离差(个别值)(2.2.5)是一个不可观测的可正可负的随机变量。称为随机误差项(stochasticerrorterm)或随机扰随机扰动项动项或随即干扰项随即干扰项(stochasticdisturbanceterm)。也可以写成(2.2.6)(2.2.8)等价表示(一般的):等价表示(线性的):四个函数(2.2.3)(2.2.5)(2.2.4)(2.2.6)(2.2.5)和(2.2.6)称为总体回归函数随总体回归函数随机设定形式机设定形式。(2.2.4)和(2.2.6)被称为线性回归模型线性回归模型(linearregressionmodel,LRM)。确定函数形式随机设定形式对于只有一个解释变量的线性回归模型也叫做一元线性回归模型一元线性回归模型或简单线性回归模简单线性回归模型型(Simplelinearregressionmodel)。简单线性回归模型图图2.4 给定给定 后后 的分布以及随机误差项的分布以及随机误差项 的的几何表示几何表示 0随机误差项产生的原因:1由于经济理论的不完备,作为未知因素的代表由于经济理论的不完备,作为未知因素的代表。比如,每月家庭可支配收入对消费支出的影响,还可以能存在众多未知因素对消费支出产生影响。2由于数据欠缺,作为无法取得数据的代表由于数据欠缺,作为无法取得数据的代表。比如,在收入对消费的影响中,我们很清楚家庭财富对消费支出有很大的影响,但不幸的是,一般很难得到家庭财富的信息。3由于忽略了一些影响微小的因素,作为众多微由于忽略了一些影响微小的因素,作为众多微小影响因素的代表小影响因素的代表。比如,在家庭收入与消费的例子中,除了收入之外,还有家庭的子女数、性别、宗教、教育和地区也是影响因素,但是这些影响因素很微小,如果一一收集数据并引入模型是划不来的,因此,只能把这些众多微小影响因素当作随机变量处理。4作为数据观测误差的代表。作为数据观测误差的代表。一是由于主客观的原因,在取得观测数据时往往存在测量误差和登记误差;二是有些数据难以直接观测,必须采取替代变量而产生误差。5作为模型设定错误的代表作为模型设定错误的代表。比如在研究家庭收入与消费之间的关系时,我们设定了简单线性模型,但是,实际上收入与消费的关系也许并非是线性的,并且影响消费的解释变量也不仅有收入,所以模型的正确性还有待进一步研究。6人类行为以及经济现象内在的随机性人类行为以及经济现象内在的随机性。即使把所有的因素全部纳入模型中,人的行为以及所从事的经济活动还是可能存在不可重复性和随机性,即所谓变量的“内在”随机性。四、样本回归函数表表2.5 2.5 表表2.32.3中的两组样本数据中的两组样本数据第一组样本数据第一组样本数据第二组样本数据第二组样本数据YXYX280032002200320026004000352040003600480036004800380056003200560044006400472064004600720048007200480080005800800056008800540088006200960058009600600010400700010400样本回归线Y1,Y2图图2.5 从表从表2.3中获取的两组样本数据(表中获取的两组样本数据(表2.5)的散点图)的散点图图图2.6 表表2.3中数据的总体回归线与样本回归线中数据的总体回归线与样本回归线一般地,(2.2.10)称为样本回归函数样本回归函数(sampleregressionfunction,SRF)。是的估计量;是的估计量;是的估计量。是回归线上与相对应的的条件均值的估计,与的个别值离差为(2.2.11)或(2.2.12)方程(2.2.12)称为样本回归函数的随机设定样本回归函数的随机设定形式形式,其中,称为剩余项剩余项或残差残差(residual),是随机误差项的估计量。因此,也可以说,回归分析就是用样因此,也可以说,回归分析就是用样本回归函数本回归函数SRF的方程来估计总体回的方程来估计总体回归函数归函数PRF的方的方程。程。注意,估计量估计量(estimator),又称样本样本统计量统计量(statistic)与估计值估计值的区别。由估计量算出的具体数值,称为估计估计值值(estimate,estimatedvalue)。估计量是一个随机变量,估计值是一个具体的数值。和和 即可看作估计值,也可看作估计量,即可看作估计值,也可看作估计量,当看作估计量时,是随机变量,样本函数当看作估计量时,是随机变量,样本函数也变成了随机关系。也变成了随机关系。为什么?为什么?估计量估计量 即可看作估计值,也可看成随机即可看作估计值,也可看成随机变量。变量。为什么?为什么?五、总体回归函数与样本回归函数的关系设定总体回归函数,再用样本回归函数来估计总体回归函数,这是计量经济学基本的思想方法。第一,怎么样建立样本回归函数呢?第二,由于样本的不同,得到的样本回归函数也不一样,那么,哪一个样本回归函数更好呢?也就是说,哪一个样本回归函数更“接近”真实的总体回归函数呢?4个方程(2.2.4)(2.2.9)(2.2.10)(2.2.12)前前两个方程是关于总体回归函数的,方程(2.2.9)是随机设定形式。后两个方程是关于样本回归函数的,方程(2.2.12)是随机设定形式。方程(2.2.4)与方程(2.2.10)对应;方程(2.2.9)与方程(2.2.12)对应。方程(2.2.10)是用来估计在给定后的条件均值,即所谓总体回归线;而方程(2.2.12)是用来估算的个别值。方程(2.2.12)的真正意义是:用来估计,即用样本估计总体所产生的误差,这是被称为残差的真实意义所在。方程(2.2.4)是总体回归函数的确定表示形式,方程(2.2.9)是总体回归函数的随机表示形式,也就是说,前者是确定的函数关系,后者是随机的函数关系。那么,显然是随机变量,从而也是随机变量。方程(2.2.10)是样本回归函数的确定表示形式,方程(2.2.12)是样本回归函