计量经济学-第2章一元线性回归模型1资料讲解.ppt
《计量经济学-第2章一元线性回归模型1资料讲解.ppt》由会员分享,可在线阅读,更多相关《计量经济学-第2章一元线性回归模型1资料讲解.ppt(181页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、计量经济学-第2章一元线性回归模型1一、变量间的关系及回归分析的基本概念一、变量间的关系及回归分析的基本概念1.变量间的关系变量间的关系(1)确定性关系确定性关系或或函数关系函数关系:研究的是:研究的是确定现象非随机变量间的关系。确定现象非随机变量间的关系。(2 2)统计依赖统计依赖或或相关关系相关关系:研究的是非确:研究的是非确定现象随机变量间的关系。定现象随机变量间的关系。2函数关系函数关系1.是一一对应的确定关系是一一对应的确定关系2.设设有有两两个个变变量量 x 和和 y,变变量量 y 随随变变量量 x 一一起起变变化化,并并完完全全依依赖赖于于 x,当当变变量量 x 取取某某个个数数
2、值值时时,y 依依确确定定的的关关系系取取相相应应的的值值,则则称称 y 是是 x 的的函函数数,记记为为 y=f(x),其其中中 x 称称为自变量,为自变量,y 称为因变量称为因变量3.各观测点落在一条线上各观测点落在一条线上 x xy y3函数关系函数关系(几个例子几个例子)函数关系的例子函数关系的例子某某种种商商品品的的销销售售额额(y y)与与销销售售量量(x x)之之间间的的关关系系可表示为可表示为 y y=pxpx (p p 为单价为单价)圆的面积圆的面积(S)(S)与半径之间的关系可表示为与半径之间的关系可表示为S S=R R2 2 企企业业的的原原材材料料消消耗耗额额(y y)
3、与与产产量量(x x1 1)、单单位位产产量量消消耗耗(x x2 2)、原原材材料料价价格格(x x3 3)之之间间的的关关系系可可表表示为示为y y=x x1 1 x x2 2 x x3 3 4相关关系相关关系(correlation)1.变变量量间间关关系系不不能能用用函函数关系精确表达数关系精确表达2.一一个个变变量量的的取取值值不不能能由由另另一一个个变变量量唯唯一一确确定定3.当当变变量量 x 取取某某个个值值时时,变变量量 y 的的取取值值可可能能有有几个几个4.各各观观测测点点分分布布在在直直线线周围周围 x xy y5对变量间对变量间统计依赖关系统计依赖关系的考察主要是通的考察
4、主要是通过过相关分析相关分析(correlation analysis)或或回归回归分析分析(regression analysis)来完成的来完成的6相关关系相关关系(几个例子几个例子)相关关系的例子相关关系的例子父亲身高父亲身高(y y)与子女身高与子女身高(x x)之间的关系之间的关系收入水平收入水平(y y)与受教育程度与受教育程度(x x)之间的关系之间的关系粮粮食食亩亩产产量量(y y)与与施施肥肥量量(x x1 1)、降降雨雨量量(x x2 2)、温度、温度(x x3 3)之间的关系之间的关系商品的消费量商品的消费量(y y)与居民收入与居民收入(x x)之间的关系之间的关系商品
5、销售额商品销售额(y y)与广告费支出与广告费支出(x x)之间的关系之间的关系7相关关系相关关系(类型类型)8相关关系的描述与测度相关关系的描述与测度(散点图散点图)9散点图散点图(scatter diagram)不相关不相关不相关不相关不相关不相关 负线性相关负线性相关负线性相关负线性相关负线性相关负线性相关 正线性相关正线性相关正线性相关正线性相关正线性相关正线性相关 非线性相关非线性相关非线性相关非线性相关非线性相关非线性相关 完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关完全正
6、线性相关 10散点图散点图(例题分析例题分析)【例】一一家家大大型型商商业业银银行行在在多多个个地地区区设设有有分分行行,其其业业务务主主要要是是进进行行基基础础设设施施建建设设、国国家家重重点点项项目目建建设设、固固定定资资产产投投资资等等项项目目的的贷贷款款。近近年年来来,该该银银行行的的贷贷款款额额平平稳稳增增长长,但但不不良良贷贷款款额额也也有有较较大大比比例例的的提提高高,这这给给银银行行业业务务的的发发展展带带来来较较大大压压力力。为为弄弄清清楚楚不不良良贷贷款款形形成成的的原原因因,希希望望利利用用银银行行业业务务的的有有关关数数据据做做些些定定量量分分析析,以以便便找找出出控控
7、制制不不良良贷贷款款的的办办法法。下下面面是是该该银银行行所所属属的的2525家家分分行行20022002年年的的有关业务数据有关业务数据 11散点图散点图(例题分析例题分析)12散点图散点图(例题分析例题分析)13相关系数相关系数(correlation coefficient)1.对变量之间关系密切程度的度量对变量之间关系密切程度的度量2.对对两两个个变变量量(xi,yi),i=1,2,n 之之间间线线性性相相关关程程度度及及方方向向的的度度量量称称为为简简单单相相关关系系数数3.若若相相关关系系数数是是根根据据总总体体全全部部数数据据计计算算的的,称为总体相关系数,记为称为总体相关系数,
8、记为 4.若若是是根根据据样样本本数数据据计计算算的的,则则称称为为样样本本相相关系数,记为关系数,记为 r14相关系数相关系数(计算公式计算公式)样本相关系数的计算公式样本相关系数的计算公式或化简为15(xi,yi),i=1,2,n其平均数与标准差分别为其平均数与标准差分别为sX,sY则样本相关系数则样本相关系数r定义为:定义为:相关系数相关系数(计算公式计算公式)16相关系数相关系数(取值及其意义取值及其意义)1.r 的取值范围是的取值范围是-1,12.r=1,为完全正相关,为完全正相关r=-1,为完全负相关,为完全负相关 r=0,不存在不存在线性线性相关关系相关关系3.|r|越越趋趋于于
9、1表表示示关关系系越越密密切切;|r|越越趋趋于于0表表示关系越不密切示关系越不密切完全负相关完全负相关完全负相关完全负相关-1.0-1.0+1.0+1.00 0-0.5-0.5+0.5+0.5无线性相关无线性相关无线性相关无线性相关完全正相关完全正相关完全正相关完全正相关负相关程度增加负相关程度增加负相关程度增加负相关程度增加r r正相关程度增加正相关程度增加正相关程度增加正相关程度增加17相关系数的特性相关系数的特性相关系数中,两变量并不区分解释相关系数中,两变量并不区分解释变量或被解释变量。变量或被解释变量。相关系数的计算以数值型变量为主,相关系数的计算以数值型变量为主,此公式不适用于类
10、别变量。此公式不适用于类别变量。相关系数的计算使用标准化值,与相关系数的计算使用标准化值,与各数值型变量的度量单位无关。各数值型变量的度量单位无关。18相关系数相关系数(例题分析例题分析)19线性关系的不同强度之线性关系的不同强度之rr=0r=0.6r=0.97r=-0.3r=-0.5r=-0.820练习练习1下表中的数据列出了某市下表中的数据列出了某市2005年年18月的月的月平均气温月平均气温X和每户平均啤酒消费量和每户平均啤酒消费量Y。(1)画出散点图)画出散点图(2)计算相关系数)计算相关系数R月月份份12345678X5.56.68.115.8 19.5 22.4 28.3 28.9
11、Y2.38 3.85 4.41 5.67 5.44 6.03 8.15 6.8721练习练习将某年将某年21家企业的广告预算与这些企业家企业的广告预算与这些企业产品的观看者每周保留的印象次数相联产品的观看者每周保留的印象次数相联系。系。以印象数为纵轴、以广告支出为横轴画以印象数为纵轴、以广告支出为横轴画散点图。散点图。你认为这两个变量之间的关系具有什么你认为这两个变量之间的关系具有什么样的性质?样的性质?看一下你的图,你认为值得作广告吗?看一下你的图,你认为值得作广告吗?22序序号号企业企业印象印象(百万(百万次)次)支出(百支出(百万美元)万美元)序号序号企业企业印象印象(百万(百万次)次)
12、支出(百支出(百万美元)万美元)1美乐美乐32.150.112百威百威10.445.62百事百事99.674.113贝尔贝尔88.9154.93联邦快递联邦快递21.922.914CK12.05.04金鹰金鹰11.719.315温迪快温迪快餐餐29.249.75汉堡王汉堡王60.882.416宝丽莱宝丽莱38.026.96可口可乐可口可乐78.640.117Shasta 10.05.77麦当劳麦当劳92.4185.918Meow Mix12.37.68前世通公前世通公司司50.726.919卡夫食卡夫食品品23.49.29健贻可乐健贻可乐21.420.420佳洁士佳洁士71.132.410福特
13、福特40.1166.221KibblesN Bits4.46.111利维利维40.827.02324验证:配第验证:配第克拉克法则克拉克法则随着人均随着人均GDP的增加,或者说随着的增加,或者说随着一个国家经济的发展,就业结构也一个国家经济的发展,就业结构也会发生相应的变化,第一产业中就会发生相应的变化,第一产业中就业人数的比例会下降,而第二和第业人数的比例会下降,而第二和第三产业的就业比例会上升。三产业的就业比例会上升。以我国改革开放后某一年为例,计算人以我国改革开放后某一年为例,计算人均均GDP与第一产业中就业者比例的相关与第一产业中就业者比例的相关系数,并解释其意义。(提示:利用不系数,
14、并解释其意义。(提示:利用不同的城市的数据)同的城市的数据)25回归分析回归分析26“回归回归”一次的历史渊源一次的历史渊源回归这个术语是由英国著名统计学家回归这个术语是由英国著名统计学家Francis Galton在在19世纪末期研究孩子及世纪末期研究孩子及他们的父母的身高时提出来的。他们的父母的身高时提出来的。孩子的身高会趋向平均发展。孩子的身高会趋向平均发展。当双亲的身高都很高(矮)时,他们的当双亲的身高都很高(矮)时,他们的孩子身高虽然会高(矮)于一般人,却孩子身高虽然会高(矮)于一般人,却往往比父母亲矮(高)。往往比父母亲矮(高)。高尔顿的普遍回归定律。(高尔顿的普遍回归定律。(la
15、w of universal regression)相关文献27回归的现代释义回归的现代释义回归分析是关于研究一个叫做回归分析是关于研究一个叫做因变量因变量的的变量对另一个或多个叫做变量对另一个或多个叫做解释变量解释变量的变的变量的依赖关系,其用意在于通过后者量的依赖关系,其用意在于通过后者(在重复抽样中)的已知或设定值,取(在重复抽样中)的已知或设定值,取估计或预测前者的(总体)均值。估计或预测前者的(总体)均值。28举例举例高尔顿的普遍回归定律。高尔顿的兴趣在于发现高尔顿的普遍回归定律。高尔顿的兴趣在于发现为什么人口的身高分布有一种稳定性。但现代观为什么人口的身高分布有一种稳定性。但现代观
16、点关心的则是给定父辈身高的情形下找出儿辈平点关心的则是给定父辈身高的情形下找出儿辈平均身高的变化。即关心一旦知道了父辈的身高,均身高的变化。即关心一旦知道了父辈的身高,怎样预测儿辈的平均身高。怎样预测儿辈的平均身高。60607070656575756060656570707575父辈身高,英寸父辈身高,英寸儿儿辈辈身身高高,英英寸寸对应于给定父亲身高的儿子身高的假想分布对应于给定父亲身高的儿子身高的假想分布29什么是回归分析?什么是回归分析?(Regression)1.从从一一组组样样本本数数据据出出发发,确确定定变变量量之之间间的的数学关系式数学关系式2.对对这这些些关关系系式式的的可可信信
17、程程度度进进行行各各种种统统计计检检验验,并并从从影影响响某某一一特特定定变变量量的的诸诸多多变变量量中中找找出出哪哪些些变变量量的的影影响响显显著著,哪哪些些不不显著显著(即确定因果关系及影响大小即确定因果关系及影响大小)3.利利用用所所求求的的关关系系式式,根根据据一一个个或或几几个个变变量量的的取取值值来来预预测测或或控控制制另另一一个个特特定定变变量量的的取取值值,并并给给出出这这种种预预测测或或控控制制的的精精确确程度程度30回归与因果关系回归与因果关系肯德尔(肯德尔(Kendall)和斯图尔特)和斯图尔特(Stuart)说)说“一个统计关系式,不管一个统计关系式,不管多强也不管多么
18、有启发性,却永远多强也不管多么有启发性,却永远不能确立因果方面的联系;对因果不能确立因果方面的联系;对因果关系的理念,必须来自于统计学以关系的理念,必须来自于统计学以外,最终来自这种或那种理论。外,最终来自这种或那种理论。”虽然回归分析研究一个变量对另一虽然回归分析研究一个变量对另一(些)变量的依赖关系,但它并不(些)变量的依赖关系,但它并不一定意味着因果关系。一定意味着因果关系。31相关关系和回归分析相关关系和回归分析注意注意相关分析相关分析测度两个变量之间的线性关联力度。测度两个变量之间的线性关联力度。相关系数就是测度关联强度的。相关系数就是测度关联强度的。相关分析相关分析对称地对待任何(
19、两个)变量,两对称地对待任何(两个)变量,两个变量都被看作是随机的。个变量都被看作是随机的。回归分析回归分析对变量对变量的处理方法存在不对称性,即区分应变量的处理方法存在不对称性,即区分应变量(被解释变量)和自变量(解释变量):前(被解释变量)和自变量(解释变量):前者是随机变量,后者是固定的。者是随机变量,后者是固定的。相关关系相关关系关心两个变量间关系的紧密程度;关心两个变量间关系的紧密程度;回归分析回归分析感兴趣的则是试图根据其他变量的感兴趣的则是试图根据其他变量的设定值来估计或预测某一变量的平均值。设定值来估计或预测某一变量的平均值。32回归分析构成计量经济学的方法论基础,回归分析构成
20、计量经济学的方法论基础,其主要内容包括:其主要内容包括:(1)根据样本观察值对经济计量模型)根据样本观察值对经济计量模型参数进行估计,求得回归方程;参数进行估计,求得回归方程;(2)对回归方程、参数估计值进行显)对回归方程、参数估计值进行显著性检验;著性检验;(3)利用回归方程进行分析、评价及)利用回归方程进行分析、评价及预测。预测。33回归模型的类型回归模型的类型34二、总体回归函数二、总体回归函数回归分析回归分析关心的是根据解释变量的已关心的是根据解释变量的已知或给定值,估计或预测被解释变量知或给定值,估计或预测被解释变量的总体均值。的总体均值。回归分析的原理回归分析的原理目的在于找出一个
21、最能够代表所有观测资目的在于找出一个最能够代表所有观测资料的函数(回归估计式)料的函数(回归估计式)用此函数代表因变量和自变量之间的关系。用此函数代表因变量和自变量之间的关系。35例:例:一个假想的社区有一个假想的社区有100户家庭组成,户家庭组成,要研究该社区每月要研究该社区每月家庭消费支出家庭消费支出Y与每月与每月家庭可支配收入家庭可支配收入X的关系。的关系。即如果知道即如果知道了家庭的月收入,能否预测该社区家庭了家庭的月收入,能否预测该社区家庭的平均月消费支出水平。的平均月消费支出水平。为达到此目的,将该为达到此目的,将该100户家庭划分为组户家庭划分为组内收入差不多的内收入差不多的10
22、组,以分析每一收入组,以分析每一收入组的家庭消费支出组的家庭消费支出。36Y的条件的条件均值均值E(Y/X)605825104512651485170519252145236525853705001000150020002500300035005001000150020002500300035004000每月可支配收入每月可支配收入X(元)(元)每月消费支出Y(元)描出散点图发现:随着收入的增加,消费描出散点图发现:随着收入的增加,消费“平平均地说均地说”也在增加,且也在增加,且Y Y的条件均值均落在一的条件均值均落在一根正斜率的直线上。这条直线称为根正斜率的直线上。这条直线称为总体回归线总体
23、回归线。38在给定解释变量在给定解释变量Xi条件下被解释变量条件下被解释变量Yi的期望轨迹称为的期望轨迹称为总体总体回归线回归线。(。(population regression line),或更一般地称为),或更一般地称为总总体回归曲线体回归曲线(population regression curve),就是),就是Y对对X的回的回归。归。总体回归线总体回归线800800140014001100110060560582582510451045E E(Y YXiXi)39含义:含义:回归函数(回归函数(PRF)说明被解释变量)说明被解释变量Y的平均状态(总体条件期望)随解释变的平均状态(总体条
24、件期望)随解释变量量X变化的规律。变化的规律。称为(双变量)称为(双变量)总体回归函数总体回归函数(population population regression function,regression function,PRFPRF)或条件期望函)或条件期望函数(数(conditional expectation function,conditional expectation function,CEF CEF)。)。相应的函数:相应的函数:总体回归函数的概念总体回归函数的概念40 函数形式:函数形式:可以是线性或非线性的可以是线性或非线性的。例例2.12.1中,根据刚才的例子,一位经济学
25、中,根据刚才的例子,一位经济学家可能提出消除支出与收入有线性关系,家可能提出消除支出与收入有线性关系,作为一个暂行的假设,作为一个暂行的假设,:为一为一线性函数。线性函数。其中,其中,0 0,1 1是未知参数,是未知参数,称为称为回归系数回归系数(regression regression coefficientscoefficients)。)。41回归线的系数的图形表示回归线的系数的图形表示X X1 1X X2 2XXYY斜率斜率142线性的含义线性的含义对变量而言对变量而言对参数而言对参数而言“线性线性”一词的含义一词的含义指数指数二次方、立方等二次方、立方等本书中的本书中的“线性线性”是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 经济学 一元 线性 回归 模型 资料 讲解
限制150内