2022经济计量学精要(第4版)_(美)古扎拉蒂.docx
《2022经济计量学精要(第4版)_(美)古扎拉蒂.docx》由会员分享,可在线阅读,更多相关《2022经济计量学精要(第4版)_(美)古扎拉蒂.docx(47页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2022经济计量学精要(第4版)_(美)古扎拉蒂经济计量学精要(第 4 版)/(美)古扎拉蒂 大佬点个赞支持一下呗(´)(´)(´) 经济计量学精要(第 4 版)/(美)古扎拉蒂 综述第 1 章 经济计量学的特征及探讨范围 1.1 什么是经济计量学 1.2 为什么要学习经济计量学 1.3 经济计量学方法论 经济计量分析步骤: (1)建立一个理论假说 (2)收集数据 (3)设定数学模型 线性回来模型为例 线性回来模型中,等式左边的变量称为应变量, 等式右边的变量称为自变量或说明变量。线性回来分析的主要目标就是说明一个变量(应变量)与其他一个或多个变量(说明变量
2、)之间的行为关系。 简洁数学模型 (4)设立统计或经济计量模型 误差项 u u 代表随机误差项,简称误差项。u包括了 X 以外其他全部影响 Y,但并未在模型中详细体现的因素以及纯随机影响。 (5)估计经济计量模型参数 线性回来模型常用最小二乘法估计模型中的参数 读做帽,表示某的估计值 (6)核查模型的适用性:模型设定检验 (7)检验源自模型的假设:假设检验 (8)利用模型进行预料 数据类型 时间序列数据:按时间跨度收集得到的 截面数据:一个或多个变量在某一时间点上的数据集合 合并数据:既包括时间序列数据又包括截面数据 面板数据:也称纵向数据、围观面板数据,即同一个横截面单位的跨期调查数据 模型
3、因果关系 统计关系无论有多强,有多紧密,也决不能建立起因果关系,假如两变量存在因果关系,则肯定建立在某个统计学之外的经济理论基础之上。 第一部分线性回来模型第 2 章线性回来的基本思想:双变量模型 2.1回来的含义 回来分析的主要目的:依据样本回来函数 SRF 估计总体回来函数 PRF 2.2总体回来函数(PRF):假想一例 总体回来线给出了对应于自变量的每个取值相应的应变量的 均值。(总体回来线表明白 Y的均值与每个 X 的变动关系)PRL E(Y|xi)表示与给定 x值相对应的 Y的均值。下标 i代表第 i个子总体。 B1、B2 称为参数,也称为回来系数。B1 称为截距,B2 称为斜率。斜
4、率系数度量了 X每变动一单位,Y( 条件)均值的改变率。 2.3总体回来函数的统计或随机设定 随机或统计回来总体函数 PRF ui随机误差项,其值无法先验确定,通常用概率分布描述随机变量。 2.4 随机误差项的性质 误差项代表了未纳入模型变量的影响; 即使模型中包括了确定数学分数的全部变量,其内在随机性也不行避开;人类行为并不是完全可预料的或完全理性的。因而,u 反映了人类行为的这种内在随机性。 u 还代表了度量误差,如数据的四舍五入; 奥卡姆剃刀原则:描述应当尽量简洁,只要不遗漏重要的信息。即使知道其他变量可能会对 Y有影响,但这些变量的综合影响是有限的、非确定性的,可以把这些次要因素归人随
5、机项 u。 2.5样本回来函数 样本回来函数 SRF 估计量或样本统计量是总体参数的估计公式,估计量的某一取值称为估计值。 随机样本回来函数 SRF ei残差,可作为 ui的估计量,表示 Y的实际值与样本回来得到的估计值的差。 回来分析的主要目的:依据样本回来函数 SRF 估计总体回来函数 PRF 真实 = 估计+残差 由于抽样的差异性,高估和低估是不行避开的 2.6线性回来的特别含义 变量线性 线性的第一种 ,也是最本质的含义是,应变量的条件均值是自变量的线性函数。 对于说明变量线性的回来模型,说明变量的单位变动引起的应变量的改变率为一常数,也就是说,斜率保持不变。 参数线性 应变量的条件均
6、值是参数 B的线性函数,而变量之间并不肯定是线性的。 与变量线性函数类似,假如参数 B,仅以一次方的形式出现,则称函数为参数线性的。 2.7从双变量回来到多元线性回来 多元线性回来 总体回来函数 PRF ui随机误差项,其值无法先验确定,通常用概率分布描述随机变量。 上两式都是 参数线性的,因此它们都是 线性回来模型。而进人模型的说明变量不须要是线性的。但本例的说明变量都是线性的。 2.8参数估计:一般最小二乘法(估计线性 PRF) 一般最小二乘法 OLS 双变量 PRF 随机样本回来函数 SRF 估计 PRF最好的方法是,选择 B1、B2的估计量 b1、b2,使得残差 ei尽可能小。 一般最
7、小二乘法就是要选择参数 b1、b2, 使得残差平方和∑ei2(RSS)最小。 一旦给出 Y和 X 的样本值,RSS就是估计量 b1、 b2 的函数。不同的 b1、b2,就能够得到不同的残差 e,进而得到不同的 RSS值。 通过求解下而的两个联立方程得到使 RSS最小化的 b1、b2值。 OLS 估计量:参数 b 是未知的,变量 Y 和 X 的和、平方和、交叉乘积和是已知的。求解联立方程,求得 b1、b2。 其中 一般最小二乘估计量的一些重要性质。 (1)用 OLS 法得出的样本回来线经过祥本均值点。即: (2)残差的均值∑ei/n 总为 0。可以利用这条性质检验计算是否精确。
8、(3)对残差与说明变量的积求和,其值为零;即这两个变量不相关。这特性质也可用来检查最小二乘法计算结果。 (4)对残差与 Yi(估计的 Yi)的积求和,其值为 0;即: 2.9小结 统计关系无论有多强,有多紧密,也决不能建立起因果关系,假如两变量存在因果关系,则肯定建立在某个统计学之外的经济理论基础之上。 线性回来指的是参数线性,而不考虑变量是否线性。 下一步工作是如何判定利用 OLS法得到的样本回来函数的优度。第 3 章双变量模型: 假设检验 3.1古典线性回来模型假定 CLRM: 假定 1:回来模型是参数线性的,但不肯定是变量线性的。回来模型形式如下: 假定 2:说明变量 X与扰动误差项 u
9、 不相关。 假如 X是非随机的(即为固定值),则该假定自动满意。即使 x 值是随机的,假如样本容量足够大,也不会对分析产生严峻影响。 假定 3:给定 Xi,扰动项 u的期望或均值为零。 假定 4:ui的方差为常数,或同方差。异方差指路第 9 章。 假定 5:无自相关假定,即两个误差项之间不相关,误差 ui是随机的。误差自相关指路第10 章。 假定 6:回来模型是正确设定的。 实证分析的模型不存在设定偏差或设定误差,模型中包括了全部影响变量。 3.2一般最小二乘估计量的方差与标准误 方差 σ 标准误 se σ2是扰动项 ui的方差。依据同方差假定,每一个 ui具有相同的方
10、差 σ2。 图为 σ2估计值计算公式。 (n-k)称为自由度,可以简洁地看做是独立视察值的个数。本例中 k=2。 σ的估计称为回来标准误,即 Y 值偏离估计回来线的标准差。值越小,Y 的实际值越接近依据回来模型得到的估计值。 3.3为什么运用 OLS?OLS 估计量的性质 高斯-马尔柯夫定理:OLS 估计是最优线性无偏估计量( BLUE) (1)b1和 b2是线性估计量; 即它们是随机变量 Y的线性函数。 (2)b1和 b2是无偏估计量; 即 E(b1)=B1, E(b2)=B2。因此,平均而言,b1和 b2 与其真实值 B1 和 B2 一样。 (3)误差方
11、差的 OLS估计量是无偏的; 平均而言,误差方差的估计值收敛于其真实值。 (4)b1和 b2是有效估计量。 即 var(b1)小于 B1 的随意一个线性无偏估计量的方差,var(b2)小于 B2 的随意一个线性无偏估计量的方差。 蒙特卡洛试验 假定已知真实的截距和斜率系数分别为 1.5和 2.0,随机误差听从均值为 0,方差为 4 的正态分布。现假定 X有 10个给定值:110。 利用统计软件,从 N(0, 4)正态分布中生或 10 个 ui值。依据给定的 B1 和 B2,以及 10个 X 值和生成的 10 个 ui 值,利用上面的方程可以得到 10 个 Y 值,记为试验或样本 1。再依据正态
12、分布表,生成另外 10 个 ui值,得到另外 10个 Y 值记为样本 2。 按此方式,得到 21 个样本。对每个样本进行回来,得到 21 个不同的 b1、b2和 σ2估计值。计算出平均的 b1、b2 和 σ2估计值分别为 1.4526.1. 9665和 4.4743,而相应的真实值分别为 1.5、2.0和 4。 从这个试验可以得出假如反复运用最小二乘法,则平均地看,估计值将等于(总体参数)真实值。即 OLS估计量是无偏的。 3.4 一般最小二乘法(OLS) 估计量的抽样分布或概率分布 为了推导 OLS估计量 b,和 b,的抽样分布,须要在 CLMR基本假定上再增加一条假
13、定。 假定 7:在总体回来函数 Yi=B1 +B2Xi+ui中,误差项 ui听从均值为 0,方差为 σ2的正态分布。即 这个假定的理论基础是中心极限定理:随着变量个数的无限增加,独立问分布随机变量近似听从正态分布。 正态变量的线性函数仍听从正态分布。假如证明白 b1和 b2 是正态变量的线性函数,那么b1和 b2 就听从正态分布。 3.5假设检验 建立原假设 H0、备择假设 H1 可选择两种方法对 B2和 B1 的参数进行假设检验 置信区间和显著性检验方法的区分在于: 置信区间检验不知道真实的 B2 值,因此建立一个区间。 而显著性检检方法中,假设一个真实的 B2 假,检验 b2
14、是否接近假设值 B2。 置信区间法 (1)建立原假设 H0、备择假设 H1 H0:B2=0 零假设(稻草人假设),为了确认 Y是否与 X 有关 H1:B2≠0 (2)设定显著水平 α,常见设定 5%。 (3)推断单边检验/双边检验。 (4)t值查表。 自由度=n-k,k 为变量个数(包括 Y)。 (5)计算 se(b2)、se(b1) 计算 ei 计算 2 计算 se (6)计算置信区间常因不知真实 而以其估计值代替运用其次个 t分布检验 双侧 单侧 (7)如置信区间包含原假设值,则不能拒绝原假设;如置信区间不包含原假设值,则拒绝原假设,选择备择假设。 显著性检验法 核心思想
15、:依据从样本数据求得的检验统计量的值确定接受或拒绝原假设。 (1)建立原假设 H0、备择假设 H1 H0:B2=B2* B2*是 B2 的某个给定数值(如 B2*=0) H1:B2≠0 (2)计算出 t值 (3)t值显著范围(拒绝域)查表 α一般取 1%、5%或 10% 自由度=n-k,k 为变量个数(包括 Y)。 双侧 单侧 (4)如 t值落在任何一个拒绝域内,则拒绝原假设,选择备择假设;否则不能拒绝原假设。 p 值 p 值定义为拒绝原假设最低的显著水平。 P 值就是当原假设为真时,比所得到的样本视察结果更极端的结果出现的概率。 P值越小,表明结果越显著,越能拒绝原假设。
16、反查 t值表得 P 值:P(tgt;(2)中已求 t值)≈P值 3.6拟合回来直线的优度:判定系数 r2 估计回来线拟合真实 Y 值的优劣程度 TSS = ESS + RSS 总平方和 TSS:真实 Y 值围绕其均值 Y 的总变异。 说明平方和 ESS:估计的 Y 值围绕其均值的变异。也称为回来平方和。 残差平方和 RSS:即 Y 变异未被说明的部分。 假如选择的 SRF很好地拟合了样本数据,则 ESS远大于 RSS。 定义 r方 两个重要性质 非负性 0 ≤ r2 ≤ 1 :若=1,表示完全拟合;=0,表示 Y与 X之间无任何关系 计算公式 (1-r2)表示了未被 X
17、说明的 Y 的变异比例,称之为余相关系数。 样本相关系数 r 度量了两个变量 X与 Y 之间的线性相关程度。 一般而言,r与斜率同号。 一般而言,估计的 Y值越接近真实 Y值,r值就越高。 3.9正态性检验 残差直方图 PDF 正态概率图 NPP 雅克贝拉检验 建立在 OLS残差基础上的一种渐近(或大样本)检验方法。 首先计算出随机变量(例如 OLS 残差)的偏度系数 S(PDF对称性的度量)和峰度系数K(PDF胖瘦的度量)。对于正态分布变量:偏度为 0,峰度为 3。 雅克和贝拉建立了如下检验统计量: n 为样本容量,S为偏度,K 为峰度。 假如变量听从正态分布,则 S为 0, (K-3)为
18、0,因而 JB统计量为零。但是假如变量不听从正态分布,则 JB统计量为一个渐渐增大值。 在正态性假设下,上式给出的 JB统计量渐近听从自由度为 2的卡方分布 asy表示渐近地。 依据卡方分布表计算出 JB统计量的值。假如在选定的显著水平下,计算的卡方值超过临界的卡方值,则拒绝正态分布的零(原)假设;否则不能拒绝零(原)假设。假如能够计算出 x值的 p值,则可以得知获此卡方值的精确概率。第 4 章多元回来:估计与假设检验(1 )如何估计多元回来模型?多元回来模型的估计过程与双变量模型有何不同? (2)多元回来模型的假设检验与双变量模型有何不同? (3)多元回来模型有没有一-些在双变量模型中未曾遇
19、到的特性? (4)既然一个多元回来模型能够包括随意多个说明变量,那么如何确定说明变量的个数? 4.1三变量线性回来模型 三变量总体回来函数 PRF 随机三变量总体回来函数 PRF Y应变量;X2、X3说明变量;u随机扰动项;i第 i个视察值。 模型是参数线性的,变量之间可能是线性的,也可能不是。 B1 是截距,表示了当 X2、X3为零时得 Y 的平均值。 B2、B3 称为偏回来系数。 B2 度量了在 X4 保持不变的状况下,X2 单位变动引起 Y 均值 E(Y)的改变量。 B3 度量了在 X2 保持不变的状况下,X3 单位变动引起 Y 均值 E(Y)的改变量。 多元回来模型的随机形式表明,任何
20、一个 Y 值可以表示成为两部分之和: (1)系统成分或确定性成分(B1 +B2X2i + B3X3i),也就是 Y 的均值 E(Yi)。 (2)非系统成分或随机成分 ui,由除 X2、X3 以外其他因素确定。 4.2多元线性回来模型的若干假定 假定 1:回来模型是参数线性的。 是参数线性的,但不肯定是变量线性的。 假定 2:X2、X3 与扰动项 u 不相关。 假如 X2、X3是非随机的(即 X2、X3在重复抽样中取简定值),则这个假定将自动满意。 假如变量 X是随机的,那么它们必需独立分布于误差项 u,否则无法得到回来系数的无偏估计值。 假定 3:误差项均值为零: 假定 4:同方差假定,即 u
21、的方差为一常量: 假定 3、4:随机误差 u 听从均值为零, (同)方差为 σ2的正态分布,即: 假定 5:误差 ui是随机的,误差项 ui和 uj 无自相关: 假定 6:回来模型是正确设定的。 实证分析的模型不存在设定偏差或设定误差,模型中包括了全部影响变量。 假定 7:说明变量 X2和 X3 之间不存在完全共线性。 即两个说明变量之间无严格的线性关系。无完全共线性通俗的说明是,变量 X2不能表示为另一变量 X3 的线性函数。(违反指路第 8 章) 4.3多元回来参数的估计 一般最小二乘 OLS 估计量 随机三变量样本回来函数 SRF 三变量样本回来函数 SRF OLS 原则是选
22、择未知参数值使得残差平方和(RSS)∑ei2尽可能小。 最小化过程须要用到偏微分技术。 求和符号表示是从第 1 个样本到第 n 个样本。 三个方程求解三个未知数。 小写字母表示与其样本均值的离差: OLS 估计量的方差与标准误 须要标准误主要有两个目的: 建立真实参数的置信区间 检验统计假设 计算公式 σ2表示总体误差项 ui的(同)方差,这个未知方差的 OLS估计量是: 自由度=n-k(k=变量数) 残差 ei的两个计算公式 多元回来 OLS 估计量的性质 在古典线性回来模型的基本假定下,双变量模型的 OIS估计量是最优线性无偏估计量。这特性质对于多元回来同样成立。因此,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022 经济 计量学 精要 古扎拉蒂
限制150内