初级计量经济学课件.ppt
《初级计量经济学课件.ppt》由会员分享,可在线阅读,更多相关《初级计量经济学课件.ppt(167页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、课程名称:课程名称:计量经济学计量经济学主讲教师:主讲教师:赵坚毅赵坚毅联系地址:联系地址:中国青年政治学院经济系中国青年政治学院经济系 北京,北京,100089联系电话:联系电话:(010)68712337电子邮件:电子邮件:网址:网址:http:www.pinggu.orgbbsindex.asp1第一部分 绪论什么叫计量经济学(Econometrics)?19世纪20年代挪威经济学家R.Frish将它定义为“经济理论”、“统计学”、“数学”三者的结合。(计算机科学)2计量经济学家的荣耀1969年首届诺贝尔经济学奖获得者弗里斯(Frisch)1980年诺贝尔经济学奖获得者克莱因(Klein
2、)计量经济学鼻祖2000年诺贝尔经济学奖获得者:在微观计量经济学作出杰出贡献的赫克曼(Heckman)和麦克法登(Mc Fadden)3计量经济学家的荣耀最近一届(2003)诺贝尔经济学奖获得者:计量经济学家格兰杰(Granger)和恩格尔(Engle)半数以上的诺贝尔经济学奖授予了在计量模型上颇有建树的经济学家,诺贝尔经济学奖引领经济学发展潮流4计量经济学的内容体系广义计量经济学和狭义计量经济学广义是利用经济理论、数学以及统计学定量研究经济现象的方法统称。(回归分析、投入产出分析、时间序列分析等)狭义以揭示经济变量间的关系为目的,主要应用回归分析方法。单方程模型和联立方程模型对股票市场的研究
3、VS对金融市场的研究5计量经济学的内容体系线性模型、内在线性模型与非线性模型(均从参数进入模型的角度来定义)参数模型、半参数模型和非参数模型(均从模型的函数形式是否确定来定义)6计量经济学的内容体系因数据类型差异而导致模型的差异:a.横截面数据集(cross-sectional data set):即给定时点对个人、家庭、企业、城市、国家或一系列其他单位采集的样本所构成的数据集(应该忽略细小的时间差别)7计量经济学的内容体系b.时间序列数据集(time series data set):是由一个或几个变量在不同时间的观测值所构成的。c.混合横截面数据(pooled cross section)
4、:有些数据既有横截面数据的特点又有时间序列的特点,但每一时点的样本不同,通常是分析政府政策效果的有力数据8计量经济学的内容体系d.综列数据(panel data):由横截面数据集中每个数据的一个时间序列组成。(定点长期调查)其他专门数据类型:1、离散数据(discrete data):通常在考察个人或家庭或企业的决策行为时,通过问卷调查获得,由此发展出“离散选择模型”9计量经济学的内容体系 2、持续数据(survival data):用于考察变量从开始到结束或调查终止前所经过的时间长度,如失业持续时间、罢工持续时间、甚至怀孕间隔3、cohort(一代人)data-为持续收集特定社会群体在一段时
5、间内的变化的数据。如:调查七十年代出生的样本在10年间的汽车持有率数据或就业率数据等。10计量经济学的内容体系理论计量经济学和应用计量经济学:方法的证明VS方法的应用11怎样应用计量经济学企业竞争力评估的一个例子一、理论模型的设计1。确定模型所包含的变量2。确定模型的数学形式或解决方法12怎样应用计量经济学企业竞争力评估的一个例子二、样本数据的收集1。几类常用的样本数据2。样本数据的质量:(研究结果不能比数据的质量更好)三、模型参数的估计和检验13计量经济学模型成功的三要素理论方法数据14计量经济学模型的应用一、结构分析当一个变量或几个变量发生变化时对其他变量或经济系统的影响(弹性和乘数)二、
6、经济预测如通过回归分析总收入和总消费之间的关系,从而在知道一变量数据的情况下可以预测另一变量的走势。15计量经济学模型的应用三、政策评价建立模型对政策效果进行评估四、实证检验对经济理论的检验;对某一行业如医药卫生、农业新方法效果的检验。16课堂小测试对“回归”的认识你所应用过的计量经济学内容17回归“回归”一词的历史渊源加尔顿回归到中等(或平均)回归分析是关于研究一个叫做应变量的变量对另一个或多个叫做自变量的变量的依赖关系,其用意在于通过后者的已知或给定值,去估计和预测前者的(总体)均值18几个例子XY父亲身高与儿子平均身高年龄与平均身高个人可支配收入与平均消费支出垄断商的定价与产品平均需求1
7、9几个关系统计关系和确定性(函数)关系计量经济学主要处理的是随机(random或stochastic)的应变量,也就是有着概率分布的变量,这是一种统计关系。也可以从有无随机干扰项的角度来区分。回归与因果关系从逻辑上来说,回归关系式本身并不意味着任何因果关系,因果关系应该来自统计学之外。回归与相关关系变量是否是确定的;变量之间是否对称;相关系数度量VS估计或预测应变量的平均值20术语应变量(Dependent)与自变量(Independent)被解释变量(Explained)与解释变量(Explanatory)预测子(Predictand)与预测元(Predictor)回归子(Regressan
8、d)与回归元(Regressor)响应(Response)与刺激或控制变量(Stimulus or control variable)内生(Endogenous)与外生(Exogenous)21线性回归模型消费函数的一个例子随机干扰项的意义:1。理论的含糊性(其他因素)2。数据的欠缺(如财富)3。核心变量与周边变量(或上或下的随机影响)4。人类行为的内在随机性5。糟糕的替代变量(永久消费和永久收入)6。节省原则(多重共线性的影响)7。错误的函数形式22线性回归模型的假定1。函数形式:2。干扰项的零均值:3。同方差性:4。无自相关:5。回归量与干扰项的非相关:6。正态性:23各种假定的含义干扰项
9、的零均值的意思是凡是模型不显著含有的并因而归属u的因素,对y的均值都没有系统的影响;正的u值抵销了负的u值,以至于他们对y的平均值的影响为零。24各种假定的含义u的同方差性同时也意味着y的同方差性,即随着x的变动,y的取值的分布是一定的,是分布不变的。25各种假定的含义干扰项之间的无自相关意味着y的决定与其他期的u值无关,即不存在u(t-1)决定u(t)从而决定y的情况干扰项与自变量之间的非相关,干扰项本身是独立于自变量之外的,且如果干扰项与自变量存在相关,则不能独自说明其作用26普通最小二乘法总体回归函数(PRF)与样本回归函数(SRF)之差的平方和最小为最小二乘法的准则。27估计参数的特性
10、最小二乘估计量的线性和无偏性质所谓线性即估计量是y的一个线性函数所谓无偏即系数估计量的期望等于系数原值估计参数的方差、标准差,协方差(注意到x的变差越大,则估计参数的方差越小)(如果协方差为负,那么的过高估计意味着的过低估计。28高斯马尔科夫定理在给定经典线性回归模型的假定下,最小二乘估计量,在无偏线性估计量一类中,有最小方差,也即BLUE(best linear unbias estimator)最小方差的证明29估计参数的特性干扰项方差的一个无偏估计量30回归拟合的评价Y的总变差是离差的平方和:方差分解:总平方和回归平方和误差平方和SST=SSR+SSE决定系数SSR/SST对单个估计系数
11、的t检验31相关系数r相关系数相关系数是两个变量间的线性关联的一个度量相关系数落在-1,1间,如果两变量独立,则它们之间的相关系数为零,反之不成立32蒙特卡罗实验1。给定25个X值,给定 ,的真值,给定零均值的正态分布随机数25个,计算y的25个值2。利用上述X值和y值做回归,得出 ,的估计值3。给定同一分布的不同随机数取值,重复上述实验100次,求得100个估计值4。比较100个估计值的均值,看是否与 ,的真值接近,以此来求证估计值的无偏性33正态性假定我们不仅要用ols法做点估计,我们还要进行假设检验(hypothesis testing),即对系数的真值做出推断,而这需要干扰项的概率分布
12、。从干扰项的概率分布-估计量的概率分布-系数真值的统计推断34为何是正态分布而不是其他?原因1:中心极限定理证明,如果存在大量独立且相同分布的随机变量,那么,除了少数例外情形,随着这些变量的个数无限的增大,它们的总和将趋向于正态分布原因2:中心极限定理的另一解说是,即使变量个数并不是很大或这些变量还不是严格独立的,它们的总和仍可视为正态分布检验数据是否为正态分布:Kolmogorov D检验,零假设为数据是均值和方差未知的正态分布35由于正态性假定而新增的性质1。系数估计量也是服从正态分布的(根据系数估计量是y的线性函数,而y又是干扰项的线性函数)2。Ols的系数估计量在整个无偏估计量中,无论
13、是线性的还是非线性的估计,都有最小方差(参见Rao的证明),所以我们说最小二乘估计量是最优无偏估计量(BUE)36由于正态性假定而新增的性质3。遵循n-2个自由度的卡方分布4。随着样本容量无限地增大,系数估计量将收敛于它们的真值(一致性)37其他分布卡方分布F分布t分布38最大似然法(ML)原则:当从总体随机抽取n组样本观测值后,参数估计量应当使得从模型中抽取该n组样本观测值(y)的概率最大将样本观测值联合概率密度函数称为变量的或然函数(LF)。在已经取得样本观测值的情况下,使或然函数取极大值的总体分布参数所代表的总体具有最大的概率取得这些样本观测值(y),该总体参数即是所要求的参数,即ML估
14、计量。39一个回归实例用SPSS作体重与肺活量的回归(corr.sav注意预测值与残差)40课堂作业推导一般线性回归方程的系数的方差及协方差证明高斯马尔科夫定理推导干扰项的方差的一个无偏估计量41区间估计与假设检验估计与假设检验构成统计学的两个主要分支,估计理论又主要由点估计与区间估计组成。回顾一些概念:置信区间、置信系数、显著性水平、置信限、置信下限、置信上限42回归系数的置信区间回归估计量的置信区间置信区间的宽度与估计量的标准误成正比,即标准误越大,对未知参数的真值进行估计的不确定性愈大。43假设检验什么是假设检验:问某一给定的观测是否与某声称的假设相符,这个声称的假设叫做虚拟假设(nul
15、l hypothesis),即 ,与之相对的为对立假设(maintained hypothesis),即 假设检验就是要设计一个程序用来决定拒绝或不拒绝虚拟假设,通常采用两种互为补充的方法:置信区间和显著性检验44置信区间的方法检验方法:构造一个参数的 的置信区间。如果参数在假设 下落入此区间,就不拒绝零假设。但如果它落在此区间之外,则拒绝零假设。第一类错误(拒真):原假设正确,却拒绝了第二类错误(纳假):原假设不正确,却接受“统计上高度显著”指:当拒绝原假设时,犯第一类错误的概率是一个很小的数,通常小于1%45显著性检验方法构造一个检验统计量,利用该统计量的分布特征,来决定是否接受零假设。通
16、常一个大的t绝对值,便是与虚拟假设相抵触的迹象单尾检验46一些实际操作问题“接受”和“拒绝”假设的含义:正如一个法庭宣告某一判决为“无罪”(not guilty)而不为“清白”(innocent)统计检验的结论也应为“不拒绝”而不为接受。2-t屈指一算法则:如果自由度=20且显著水平定为0.05,则只要t统计量大于2,就可拒绝“零”假设(单尾)47一些实际操作问题在进行调查研究之前建立假设而不是相反,以免犯循环推理(circular reasoning)的错误P值被定义为一个虚拟假设可被拒绝的最低显著水平,或犯第一类错误的精确概率。由于选择显著性水平的武断性,直接选取p值并决定是否在给定的p值
17、水平上拒绝虚拟假设会较好48一些实际操作问题区分统计上的显著性和经济上的显著性。当样本非常大时,几乎任何虚拟假设都一定会被拒绝,点估计的大小成为唯一可研究的问题两种检验方法的选择,置信区间法优于显著性检验法(点与面之分)49一些实际操作问题一点建议:集中讨论系数的大小并报告其置信水平,而不去提显著性检验。如果全部或几乎全部虚拟假设都是错误的,讨论一个估计值是否无异于它在虚拟假设下的预测值,都是无意义的。我们更想探明的是什么模型可充当良好的逼近式,这就需要知道被经验估计所排斥的参数值域。50回归分析与方差分析对SST=SSR+SSE进行研究就叫做从回归的观点做方差分析(analysis of v
18、ariance ANOVA)F检验:F检验主要用在多元回归问题中,对全部系数为0做检验,其对立假设为非全部系数同时为051预测问题均值预测与个值预测置信带报告回归分析的结果52过原点回归考虑资产组合理论中的特征线方程:其中 为特定资产组合的收益率 为无风险收益率 为市场组合收益率 为特定资产组合的系统风险53课上作业练习题:资产组合理论的资本市场线(CML)在期望收益率与总风险(由标准差来衡量)之间所设的一个线性关系如下:其中 为资产组合的期望收益率 为资产组合的标准差。下表给出1954-1963年间美国34个共同基金的期望收益率与标准差数据,请检验这些数据是否支持该理论(5%的显著性水平)5
19、4回归模型的函数形式1。对数线性模型(斜率系数测度了Y对X的弹性)2。线性到对数模型(斜率系数测度了X的绝对改变量对应的Y的相对改变量,即增长模型)3。对数到线性模型(斜率系数测度了X的相对改变量对应的Y的绝对改变量)55回归模型的函数形式4.倒数模型(随着X无限地增大,(1/X)项趋于零,而Y趋于极限或渐近值 )在菲利普斯曲线中,工资变化对失业水平的反应中,存在有不对称性:当失业率低于经济学家所称的自然失业率时,由失业的单位变化引起的工资上升,要快于当失业率高于自然水平时,由失业的同样变化引起的工资下降。而常数项系数表示工资变化的渐近底限。56课上作业恩格尔支出曲线把一个消费者在某一商品上的
20、支出同他的总收入联系起来。令Y=对某一商品的消费支出,X=消费者收入,考虑上述5类所学模型,你会选择哪个(些)模型做恩格尔支出曲线,描绘其曲线图形,并作解释?(提示:解释各种斜率系数,常数项系数)57多变量回归模型三变量模型的符号与假定:干扰项零均值无序列相关同方差性干扰项与每一X变量之间都有零协方差无设定偏误无多重共线性58多变量回归模型多重共线性初探1、维恩Venn图2、不存在一组不全为零的数 和 ,使得59多变量回归模型OLS估计量和估计量的方差、标准误最小二乘拟合的一些性质:残差和为零,残差与解释变量X2和X3均不相关60多变量回归模型OLS估计量的性质:1。三变量回归线通过Y、X2、
21、X3的均值2。估计的Y的均值等于真实Y的均值3。残差和等于残差的均值4。残差与X2、X3,Y的估计值均不相关5。自变量X2和X3的相关系数朝着1增大,估计系数的方差越大(同样也随 的增大而增大)6。在经典线性模型的假定下,可以证明偏回归系数的OLS估计量是BLUE61多变量回归模型ML估计量:在总体干扰 遵循零均值和常数方差 的正态分布的假定下,ML估计量和OLS估计量是相等的,但 的ML估计量始终都是 而 的OLS估计量为62多变量回归模型复判定系数R-square:Y的变异由变量X2和X3联合解释的比例63多变量回归模型设定偏误初探:所用的回归模型是否是正确设定的?一个三变量回归的例子-期
22、望扩充的菲利普斯曲线a.假定三变量回归模型正确,检验错误设定的模型(原始菲利普斯曲线)b.错误模型的估计系数(X2对Y的总影响=X2对Y的直接影响+X2对Y的间接影响64多变量回归模型校正的 值原因:值随着X变量个数的增加而增加事实上,关于 的最重要的事情是,它在经典回归(CR)模型中是不重要的。CR模型是用来研究一个总体中的参数的,它不问在一个样本中拟合的好坏,如果人们坚持要有对预测成功有一个度量,那么有了标准误也许足够了,因为它对于适当取定的X值来说,对于参数估计来说,是富有信息的。65多变量回归模型简单相关系数:r12(Y与X2之间的相关),r13(Y与X3之间的相关),r23(X2与X
23、3之间的相关)偏相关系数:r12.3(X3保持不变下的Y和X2的偏相关系数),r13.2(X2保持不变下的Y和X3的偏相关系数),r23.1(Y保持不变下的X2和X3的偏相关系数)X3保持不变下的Y和X2的偏相关,就是从Y对X3回归和从X2对X3回归分别得到的残差之间的简单相关系数。66多变量回归模型偏相关系数的一个例子:令Y=农作物收成;X2=雨量;X3=气温假定r12=0,即农作物收成和雨量没有关联再假定r13是正的,r23是负的,这时r12.3将是正的;就是说,在气温保持不变的情况下,收成和雨量有正的关联。67多变量回归模型关于多项式回归模型:并不违反无多重共线性假定无需提出新的估计问题
24、68多变量模型之时间变量需要考虑有关时间变量的3种情况:1。发现应变量怎样在时间上变动.2。常常用来代替一个影响着因变量的基本变量。(如生产函数中的技术常用时间来代替)3。引进时间变量以避免谬误相关69课堂练习用回归模型研究过去几年的个人消费支出的行为,数据见EXCEL表格,要求去除时间因素对个人消费支出和个人可支配收入的影响70多变量回归的假设检验如果我们仅是对回归模型的参数作点估计,那么并不需要有关干扰项概率分布的任何假定,而如果涉及到假设检验,则要假定干扰项服从某个概率分布。71多变量回归的假设检验总论1。检验关于个别偏回归系数的假设(t检验)2。检验所估计的多变量回归模型的总显著性(F
25、检验)3。检验两个或多个系数是否相等(t检验)4。检验诸回归系数是否满足某种线性约束条件(t检验)5。检验所估计的回归模型在时间上或在不同横截面单元上的稳定性(邹检验)6。检验回归模型的函数形式72邹至庄检验的过程邹检验基本假定:第1、2个方程的干扰项独立同正态分布,即均值都为0,方差都为1。合并全部n1和n2次观测值,用以估计第3个方程并获得它的SSE,记作s1,其自由度为(n1+n2-k),其中k为所估参数的个数(包括截距项)2。分别估计第1、2个方程并获得它们的SSE,分别记作s2和s3,其自由度分别为(n1-k)和(n2-k)。记s4=s2+s3,其自由度为(n1+n2-2k)73邹至
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 初级 计量 经济学 课件
限制150内