一元线性回归方程修订.pptx
《一元线性回归方程修订.pptx》由会员分享,可在线阅读,更多相关《一元线性回归方程修订.pptx(75页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 回归的现代释义回归的现代释义回归分析用于研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论。l商品需求函数:l生产函数:l菲利普斯曲线:l拉弗曲线:第2页/共75页第1页/共75页l 等式左边的变量被称为被解释变量(Explained Variable)或应 变量(Dependeni Variable)。l等式右边的变量被称为解释变量(Explanaiory Variable)或自 变量(Independeni Variable)。回归的现代释义回归的现代释义 回归分析的目的回归分析的目的l 根据自变量的值,估计因变量的均值。l检验(基于经济理论的)假设。l根据样本外自变量的值,
2、预测因变量的均值。第3页/共75页第2页/共75页 回归与因果关系回归与因果关系从逻辑上说,统计关系式本身不可能意味着任何从逻辑上说,统计关系式本身不可能意味着任何因果关系。因果关系。“一个统计关系式,不管多强也不管多么有启发性,却永远不能确立因果方面的联系:对因果关系的理念,必须来自统计学以外,最终来自这种或那种理论。”Kendall 和Stuart前面四个例子都是基于经济理论设定的,包括身高和体重的关系。第4页/共75页第3页/共75页总体回归函数 假想案例 总体回归函数的随机设定 随机误差项的意义第5页/共75页第4页/共75页 XY801001201401601802002202402
3、6055657980102110120135137150607084931071151361371451526574909511012014014015517570809410311613014415216517875859810811813514515717518088113125140160189185115162191户数户数5657665765总支出总支出32546244570767875068510439661211 假设一个国家只有假设一个国家只有60户居民,他们的可支配收户居民,他们的可支配收入和消费支出数据如下(单位:美元):入和消费支出数据如下(单位:美元):假想案例第6页/
4、共75页第5页/共75页(1)由于不确定因素的影响,对同一收入水平X,不同家庭的消费支出不完全相同;(2)但由于调查的完备性,给定收入水平X的消费支出Y的分布是确定的,即以X的给定值为条件的Y的条件分布条件分布(Conditional distribution)是已知的,如:P(Y=55|X=80)=1/5。因此,给定收入因此,给定收入X的值的值Xi,可得消费支出,可得消费支出Y的的条件均值条件均值(conditional mean)或或条件期望条件期望(conditional expectation):E(Y|X=Xi)该例中:该例中:E(Y|X=80)=65分析:分析:第7页/共75页第6
5、页/共75页 描出散点图发现:随着收入的增加,消费描出散点图发现:随着收入的增加,消费“平均地说平均地说”也在增加,且也在增加,且Y的条件均值均落在一根正斜率的直线上。这条直线称为的条件均值均落在一根正斜率的直线上。这条直线称为总体回归线总体回归线。E(Y|Xi)=0+1Xi=17.00+0.6Xi第8页/共75页第7页/共75页“天行有常,不为尧存,不为桀亡。应之以治则吉,应之以乱则凶。”-荀子天论E(Y|Xi)=0+1Xil 总体回归函数总体回归函数其中:Y被解释变量;X解释变量;0,1回归系数(待定系数或待估参数)第9页/共75页第8页/共75页 总体回归函数的随机设定l 对于某一个家庭
6、,如何描述可支配收入和消费支出的关系?XiYi.E(Y|Xi)=0+1 XiY1Y2Y3u1u2u3总体回归直线uiYi-E(Y|Xi)随机误差项某个家庭的消费支出分为两部分:一是E(Y|Xi)=0+1 Xi,称为系统成分或确定性成分;二是ui,称为非系统或随机性成分。Yi=E(Y|Xi)+ui=0+1 Xi+ui第10页/共75页第9页/共75页Yi=0+1 Xi+uiE(Y|Xi)=0+1 Xi,随机性总体回归函数随机性总体回归函数确定性总体回归函数确定性总体回归函数第11页/共75页第10页/共75页 随机误差项u的意义l 反映被忽略掉的因素对被解释变量的影响。或者理论不够完善,或者数据
7、缺失;或者影 响轻微。l模型设定误差l度量误差l 人类行为内在的随机性第12页/共75页第11页/共75页 XY8010012014016018020022024026055135137609310711565749511012014017594103144178759810813517588113125189115162191户数户数4226331333总支出总支出255162192627342370144337501544样本回归函数 为研究总体,我们需要抽取一定的样本。第第一一个个样样本本第13页/共75页第12页/共75页样本回归线样本回归线样本均值连线样本均值连线第14页/共75页第
8、13页/共75页 XY801001201401601802002202402606579102120135607084931151451527490155801161441521657585118145180140160189185115户数户数2532323343总支出总支出135374253208336255409447654517样本回归函数 第二个样本第二个样本第15页/共75页第14页/共75页样本回归线样本回归线样本均值连线样本均值连线第16页/共75页第15页/共75页 总体回归模型和样本回归模型的比较总体回归模型和样本回归模型的比较第17页/共75页第16页/共75页XiYiY
9、1Y2Y3u1u2u3e2e3e1E(Y|Xi)=0+1 Xi注意:分清几个关系式和表示符号(2)样本(估计的)回归直线:(3)总体(真实的)回归函数:(4)样本(估计的)回归函数:(1)总体(真实的)回归直线:ui随机误差项随机误差项ei残差项残差项第18页/共75页第17页/共75页对于所研究的经济问题,通常总体回归直线 E(Yi|Xi)=0+1Xi 是观测不到的。可以通过收集样本来对总体(真实的)回归直线做出估计。样本回归模型:样本回归模型:其中:为Yi的估计值(拟合值);为 0,1 的估计值;ei为残差,可视为ui的估计值。普通最小二乘法或:第19页/共75页第18页/共75页如何得到
10、一条能够较好地反映这些点变化规律的直线呢?第20页/共75页第19页/共75页对于参数的估计采用最小二乘估计法、最小二乘法的原则是以“残差平方和最小残差平方和最小”确定直线位置(即估计参数)。(Q为残差平方和)Q=则通过Q最小确定这条直线,即确定 ,以 为变量,把它们看作是Q的函数,就变成了一个求极值的问题,可以通过求导数得到。样本回归模型:样本回归模型:第21页/共75页第20页/共75页则通过Q最小确定这条直线,即确定 ,以 为变量,把它们看作是Q的函数,就变成了一个求极值的问题,可以通过求导数得到。求求QQ对对 两个待估参数两个待估参数 的偏导数:的偏导数:=0=0正规方程组即第22页/
11、共75页第21页/共75页根据以上两个偏导方程得以下正规方程正规方程(Normal equation):第23页/共75页第22页/共75页OLS回归直线的性质回归直线的性质(1)残差和等于零(2)估计的回归直线 过点 .(3)Yi 的拟合值的平均数等于其样本观测值的平均数 .=由正规方程 可得。=第24页/共75页第23页/共75页=(4)Cov(ei,Xi)=0=(5)Cov(ei,)=0第25页/共75页第24页/共75页线性与非线性l生产函数:l菲利普斯曲线:l拉弗曲线:第26页/共75页第25页/共75页受教育年限与平均小时工资奥肯定律股票价格与利率古董钟与拍卖价格 一些例子第27页
12、/共75页第26页/共75页u利用OLS方法得到一个样本回归模型(一条样本回归线)后,问题结束了吗?u为什么要用普通最小二乘法?u样本回归模型有无穷多个,我们仅仅得到其中一个,它能反映真实的总体回归模型吗?u样本回归模型对数据的拟合程度可以接受吗?u如何用样本回归模型进行预测?问题结束了吗?问题结束了吗?第28页/共75页第27页/共75页1密度函数密度函数第29页/共75页第28页/共75页假定1:解释变量是非随机的。解释变量是非随机的。假定2:零期望假定零期望假定:E(ui)=0。E(ui|Xi)=0。古典线性回归模型的基本假定E(Y|Xi)=0+1 XiXY0第30页/共75页第29页/
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一元 线性 回归 方程 修订
限制150内