一元线性回归模型ppt课件.ppt
《一元线性回归模型ppt课件.ppt》由会员分享,可在线阅读,更多相关《一元线性回归模型ppt课件.ppt(67页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Econometrics第三章第三章 一元线性回归模型一元线性回归模型(教材第二、三章)(教材第二、三章)第三章第三章 一元线性回归模型一元线性回归模型3.1 3.1 回归的涵义回归的涵义3.2 3.2 随机扰动项的来源随机扰动项的来源3.3 3.3 参数的最小二乘估计参数的最小二乘估计3.4 3.4 参数估计的性质参数估计的性质3.5 3.5 显著性检验显著性检验3.6 3.6 拟合优度拟合优度3.7 3.7 预测预测学习要点学习要点 回归模型的涵义,参数的回归模型的涵义,参数的OLS估计估计及其性质,显著性检验及其性质,显著性检验3.1 3.1 回归的涵义回归的涵义回归分析(回归分析(re
2、gression analysis)用于研究一个变量(称为被解释变量被解释变量或应变量应变量)与另一个或多个变量(称为解释变量解释变量或自变量自变量)之间的关系。Y代表被解释变量,X代表解释变量;解释变量有多个时,用X1,X2,X3等表示。例:商品的需求量与该商品价格、消费者收入以及其他竞争性商品价格之间的关系。总体回归函数(总体回归函数(population regression function,PRF)例:学生的家庭收入与数学分数有怎样的关系?3.1 3.1 回归的涵义回归的涵义3.1 3.1 回归的涵义回归的涵义总体回归函数(总体回归函数(population regression f
3、unction,PRF)根据上面数据做散点图3.1 3.1 回归的涵义回归的涵义总体回归函数(总体回归函数(population regression function,PRF)上图中,圆圈点称为条件均值;条件均值的连线称为总体回归线。总体回归线表明了Y的均值与每个X的变动关系。上图近似线性的总体回归线可以表示成: 表示给定的X值所对应的Y的均值; 、 称为参数(parameters),也称回归系数(regression coefficients); 称为截距(intercept), 称为斜率(slope)。斜率系数度量了X每变动一单位,Y(条件)均值的变化率。举例: ,含义?12iiE Y
4、XBB XiE Y X1B2B1B2B20.001B 3.1 3.1 回归的涵义回归的涵义样本回归函数(样本回归函数(sample regression function, SRF)实际中往往无法获得整个总体的数据,怎么估计总体回归函数?即如何求参数B1、B2?通常,我们仅仅有来自总体的一个样本。我们的任务就是根据样本信息估计总体回归函数。怎么实现?3.1 3.1 回归的涵义回归的涵义样本回归函数(样本回归函数(sample regression function, SRF)表2-2、2-3的数据都是从表2-1中随机抽取得到的。3.1 3.1 回归的涵义回归的涵义样本回归函数(样本回归函数(s
5、ample regression function, SRF)通过散点得到两条“拟合”样本数据的样本回归线。3.1 3.1 回归的涵义回归的涵义样本回归函数(样本回归函数(sample regression function, SRF)可用样本回归函数(SRF)表示样本回归线: 其中, 总体条件均值 的估计量;并非所有样本数据都准确地落在样本回归线上,因此建立随机样本回归函数: 其中, 是 的估计量,称 为残差(residual)。 表示了Y的实际值与样本回归估计值的差。 iY iE Y X12iiYbb X1122bBbB的估计量;的估计量12iiiYbb Xeieiuieie3.1 3.1
6、 回归的涵义回归的涵义样本回归函数(样本回归函数(sample regression function, SRF)回归分析:根据样本回归函数估计总体回归函数。3.1 3.1 回归的涵义回归的涵义“线性线性”回归的特殊含义回归的特殊含义对“线性”有两种解释:变量线性和参数线性。变量线性:例如前面的总体(或样本)回归函数;下面的函数不是变量线性的:参数线性:参数B1、B2仅以一次方的形式出现。下面的模型是参数非线性的:本书主要关注参数线性模型。从现在起,线性回归(linear regression)是指参数线性的回归,而解释变量并不一定是线性的。 212121, iiE YBB XE YBBX 2
7、12iE YBB X3.2 3.2 随机扰动项的来源随机扰动项的来源总体回归函数说明在给定的家庭收入下,美国学生 平均的平均的数学分数。但对于某一个学生,他的数学分数可能与该平均水平有偏差。可以解释为,个人数学分数等于这一组的平均值加上或减去某个值。用数学公式表示为: 其中, 表示随机扰动项,简称扰动项。扰动项是一个随机变量,通常用概率分布来描述。12iiiYBB Xuiu3.2 3.2 随机扰动项的来源随机扰动项的来源对于回归模型 称为 被解释变量(explained variable) 也称 应变量或因变量(dependent variable) 称为 解释变量(explanatory v
8、ariable) 也称 自变量(independent variable) 称为 参数(parameter) 称为 随机扰动项(random error term)12iiiYBB XuiuiYiX12,B B3.2 3.2 随机扰动项的来源随机扰动项的来源上式如何解释?可以认为,在给定家庭收入水平 上,第i个学生的数学分数可以表达为两部分之和:一是 ,即 ,是该收入水平上的平均数学分数。这一部分称为系统或确定性部分。二是 ,称为非系统或随机成本,由收入以外的因素决定。此时,称 为随机总体回归函数(stochastic PRF)。 12iBB XiE Y XiuiX12iiiiiYE Y Xu
9、BB Xu3.2 3.2 随机扰动项的来源随机扰动项的来源 3.2 3.2 随机扰动项的来源随机扰动项的来源性质1:扰动项代表了未纳入模型变量的影响。例如个人健康状况、居住区域等等。性质2:反映了人类行为的内在随机性。即使模型中包括了决定数学分数的所有变量,其内在随机性也不可避免,这是做任何努力都无法解释的。性质3:还代表了度量误差,例如收入的数据可能不等于真实值。性质4:“奥卡姆剃刀原则”即描述应该尽可能简单,只要不遗漏重要的信息,此时可以把影响Y的次要因素归入随机扰动项。3.3 3.3 参数的最小二乘估计参数的最小二乘估计参数估计:普通最小二乘法(参数估计:普通最小二乘法(OLS)根据样本
10、回归函数估计总体回归函数,要回答两个问题:如何估计PRF?如何验证估计的PRF是真实的PRF的一个“好”的估计值?这里先回答第一个问题。回归分析中使用最广泛的是普通最小二乘法(method of ordinary least squares, OLS)3.3 3.3 参数的最小二乘估计参数的最小二乘估计参数估计:普通最小二乘法(参数估计:普通最小二乘法(OLS)最小二乘原理:由于不能直接观察PRF: 所以用SRF 来估计它,因而最好的估计方法是,选择 使得残差 尽可能小。12iiiYBB Xu12iiiYbb Xe12 iiiiiiieYYYYYbb X实际的估计的12bb、ie3.3 3.3
11、 参数的最小二乘估计参数的最小二乘估计参数估计:普通最小二乘法(参数估计:普通最小二乘法(OLS)普通最小二乘法就是要选择参数 ,使得残差平残差平方和方和(residual sum of squares, RSS) 最小。即12bb、2ie22212 miniiiiiQeYYYbb X3.3 3.3 参数的最小二乘估计参数的最小二乘估计参数估计:普通最小二乘法(参数估计:普通最小二乘法(OLS)如何确定 的值?根据微积分,当 对 的一阶偏导数为0时,Q达到最小。即12bb、12bb、1200QbQb212iiQYbb X121200iiiiiYbb XYbb X X12212iiiiiiYnb
12、bXY XbXbX或3.3 3.3 参数的最小二乘估计参数的最小二乘估计参数估计:普通最小二乘法(参数估计:普通最小二乘法(OLS)以上联立方程组称为正规方程组(normal equations)。求解 ,得注意: ,即小写字母代表了变量与其均值的离差。上面给出的估计量称为OLS估计量(OLS estimator)。12bb、1222222iiiiiiiiibYb XXXYYX YnXYx ybXnXxXX,iiiixXXyYY3.3 3.3 参数的最小二乘估计参数的最小二乘估计参数估计:普通最小二乘法(参数估计:普通最小二乘法(OLS)OLS估计量的一些重要性质用OLS法得出的样本回归线经过
13、样本均值点,即残差的均值 总为0。对残差和解释变量的积求和,其值为零,即对残差与 (估计的 )的积求和,其值为零,即12Ybb Xeie n0iie x 0iieY iYiY3.3 3.3 参数的最小二乘估计参数的最小二乘估计例子:数学例子:数学S.A.T分数分数3.3 3.3 参数的最小二乘估计参数的最小二乘估计例子:数学例子:数学S.A.T分数分数根据公式可以得到回归结果:432.41380.0013iiYX3.3 3.3 参数的最小二乘估计参数的最小二乘估计例子:数学例子:数学S.A.T分数分数根据公式可以得到回归结果:对估计结果的解释:斜率系数0.0013表示在其他条件保持不变的情况下
14、,家庭年收入每增加1美元,数学S.A.T.分数平均提高0.0013分截距432.4138表示,当家庭年收入为0时,数学平均分大约为432.4138。(这样的解释没有什么经济意义)对截距最好的解释是,它代表了回归模型中所有省略变量对Y的平均影响。432.41380.0013iiYX3.3 3.3 参数的最小二乘估计参数的最小二乘估计例子:受教育年限与平均小时工资例子:受教育年限与平均小时工资预期平均工资随受教育年限的增加而增加回归结果:0.01440.7241iiYX 3.3 3.3 参数的最小二乘估计参数的最小二乘估计例子:股票价格与利率例子:股票价格与利率经济理论表明,股票价格和利率之间存在
15、反向关系。3.3 3.3 参数的最小二乘估计参数的最小二乘估计例子:股票价格与利率例子:股票价格与利率看起来两个变量之间的关系不是线性的(即不是直线),因此,假设实际关系如下:回归结果为:作为比较,线性回归结果为:引发的一个重要问题:哪一个模型更好?如何进行判断?在模型选择中使用那些检验?后面将逐一回答。404.4067996.866 1iiYX121iiiYBBXu1229.341499.401iiYX3.4 3.4 参数估计的性质参数估计的性质古典线性回归模型(古典线性回归模型(CLRM)的假定)的假定前面我们回答了“如何估计PRF”的问题OLS。下面我们要回答“怎样判别它是真实PRF的一
16、个好的估计”的问题。只有假定了随机扰动项u的生成过程,才能判定SRF对PRF拟合得是好是坏。OLS估计量的推导与随机扰动项的生成过程无关;但根据SRF进行假设检验时,就必须对随机扰动项的生成做一些特殊的假定,否则无法进行假设检验。下面仍然沿用一元线性回归模型来讨论。3.4 3.4 参数估计的性质参数估计的性质古典线性回归模型(古典线性回归模型(CLRM)的假定)的假定假定1. 回归模型是参数线性的,但不一定是变量线性的。回归模型形式如下(可扩展到多个解释变量):假定2. 解释变量 与随机扰动项 不相关。如果X是非随机的,该假定自动满足;即使X是随机的,如果样本容量足够大,也不会对分析产生严重影
17、响。12iiiYBB XuXu3.4 3.4 参数估计的性质参数估计的性质古典线性回归模型(古典线性回归模型(CLRM)的假定)的假定假定3. 给定 ,扰动项的均值为零。即iX0iE u X3.4 3.4 参数估计的性质参数估计的性质古典线性回归模型(古典线性回归模型(CLRM)的假定)的假定假定4. 同方差(homoscedastic),即iu 2variu3.4 3.4 参数估计的性质参数估计的性质古典线性回归模型(古典线性回归模型(CLRM)的假定)的假定假定5. 无自相关(no autocorrelation),即两个扰动项之间不相关:cov,0, iju uij3.4 3.4 参数估
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一元 线性 回归 模型 ppt 课件
限制150内