线性回归的基本思想:双变量模型.ppt
《线性回归的基本思想:双变量模型.ppt》由会员分享,可在线阅读,更多相关《线性回归的基本思想:双变量模型.ppt(54页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、线性回归的基本思想:线性回归的基本思想:双变量模型双变量模型 第二章第二章2-22.1回归的含义回归的含义u 回回归归一一词词最最先先由由F.加加尔尔顿顿(Francis Galton)引引入入,在在一一篇篇著著名名的的论论文文中中,加加尔尔顿顿指指出出,虽虽然然有有一一个个趋趋势势,父父母母高高,儿儿女女也也高高;父父母母矮矮,儿儿女女也也矮矮,但但给给定定父父母母的的身身高高,儿儿女女辈辈的的平平均均身身高高却却趋趋向向于于或或者者“回回归归”到到全全体体人人口口的的平平均均身身高。高。2-3uK皮皮尔尔逊逊(Karl Pearson)证证实实了了加加尔尔顿顿的的普普遍遍回归定律回归定律u
2、皮皮尔尔逊逊收收集集过过一一些些家家庭庭群群体体的的1千千多多名名成成员员的的身身高高记记录录。他他发发现现,对对于于一一个个父父亲亲高高的的群群体体,儿儿辈辈的的平平均均身身高高低低于于他他们们父父辈辈的的身身高高,而而对对于于一一个个父父亲亲矮矮的的群群体体,儿儿辈辈的的平平均均身身高高则则高高于于其其父父辈辈的的身身高高。这这样样就就把把高高的的和和矮矮的的儿儿辈辈一一同同“回回归归”到到所所有有男男子子的的平平均均身身高高。用用加加尔尔顿顿的的话话说说,这这是是“回回归到中等归到中等”。2.1回归的含义回归的含义2-4 (1)确确定定性性关关系系或或函函数数关关系系:研研究究的的是是确
3、定现象非随机变量间的关系。确定现象非随机变量间的关系。(2)统统计计依依赖赖或或相相关关关关系系:研研究究的的是是非非确确定现象随机变量间的关系。定现象随机变量间的关系。经济变量之间的关系,大体可分为两类:经济变量之间的关系,大体可分为两类:2.1回归的含义回归的含义2-5对对变变量量间间统统计计依依赖赖关关系系的的考考察察主主要要是是通通过过相相关关分分析析(correlation(correlation analysis)analysis)和和 回回 归归 分分 析析(regression(regression analysis)analysis)来完成的:来完成的:例如例如:函数关系:函
4、数关系:统计依赖关系统计依赖关系/统计相关关系:统计相关关系:2.1回归的含义回归的含义2-6 不线性相关并不意味着不相关;不线性相关并不意味着不相关;有相关关系并不意味着一定有因果关系;有相关关系并不意味着一定有因果关系;回回归归分分析析/相相关关分分析析研研究究一一个个变变量量对对另另一一个个(些些)变变量量的的统统计计依依赖赖关关系系,但但它它们们并并不不意意味味着着一一定定有因果关系。有因果关系。相相关关分分析析对对称称地地对对待待任任何何(两两个个)变变量量,两两个个变变量量都都被被看看作作是是随随机机的的。回回归归分分析析对对变变量量的的处处理理方方法法存存在在不不对对称称性性,即
5、即区区分分应应变变量量(被被解解释释变变量量)和和自自变变量(解释变量):前者是随机变量,后者不是。量(解释变量):前者是随机变量,后者不是。注意:注意:2.1回归的含义回归的含义2-7回归的现代解释回归的现代解释 u回回归归分分析析是是关关于于研研究究一一个个叫叫做做应应变变量量(被被解解释释变变量量)的的变变量量对对另另一一个个或或多多个个叫叫做做自自变变量量(解解释释变变量量)的的变变量量的的依依赖赖关关系系,其其用用意意在在于于通通过过后后者者的的已已知知或或设设定定值值,去去估估计计和和(或或)预预测测前者的前者的(总体总体)均值。均值。u统一符号统一符号:Y代表被解释变量(应变量或
6、因变量)代表被解释变量(应变量或因变量)X代表解释变量(自变量)代表解释变量(自变量)2.1回归的含义回归的含义2-8几个简单的例子阐述回归的基本思想几个简单的例子阐述回归的基本思想 1.1.加尔顿的兴趣在于发现为什么人口身高分加尔顿的兴趣在于发现为什么人口身高分布有一种稳定性。但从现代的观点考虑,布有一种稳定性。但从现代的观点考虑,我们并不关心这种解释。我们关心的,却我们并不关心这种解释。我们关心的,却是给定父辈身高的情形下找出儿辈平均身是给定父辈身高的情形下找出儿辈平均身高的变化。高的变化。2.1回归的含义回归的含义2-92.经经济济学学家家也也许许想想研研究究个个人人消消费费支支出出对对
7、税税后后或或可可支支配配实实际际个个人人收收入入的的依依赖赖关关系系。这这种种分分析析会会有有助助于于估估计计边边际际消消费费倾倾向向(MPC)(MPC),就就是是实实际际收收入入每每美美元元价价值值的的变变化所引起的消费支出的平均变化。化所引起的消费支出的平均变化。2.1回归的含义回归的含义2-103.3.一一位位劳劳工工经经济济学学家家也也许许要要研研究究货货币币工工资资变变化化率率对对失失业业率率的的关关系系。横横坐坐标标为为失失业业率率,纵纵坐坐标标为为货货币币工工资资变变化化率率建建立立著著名名的的菲菲利利普普斯斯曲曲线线。这这样样的的分分析析能能使使劳劳工工经经济济学学家家预预测测
8、在在给给定定某某个个失失业业率率下下货货币币工工资资的的平平均均变化。变化。2.1回归的含义回归的含义2-114.由由货货币币经经济济学学中中得得知知,其其他他条条件件不不变变,通通货货膨膨胀胀率率越越愈愈高高,人人们们愿愿意意以以货货币币形形式式保保存存的的收收入入比比例例愈愈低低,对对这这种种关关系系作作一一数数量量分分析析,将将使使货货币币经经济济学学家家能能够够对对各各种种通通货货膨膨胀胀率率预预测测人人们们愿愿意意以以货货币币形形式保存的收入比例。式保存的收入比例。2.1回归的含义回归的含义2-125.5.农农业业经经济济学学家家想想研研究究作作物物(比比方方说说小小麦麦)收收成成对
9、对气气温温、降降雨雨量量、阳阳光光量量和和施施肥肥量量的的依依赖赖关关系系。这这种种依依赖赖性性分分析析能能使使他他对对给给定定的的解解释释变变量量的的信信息息预预测测或或预预报报作作物物的平均收成。的平均收成。2.1回归的含义回归的含义2-13u回回归归分分析析的的基基本本思思想想技技巧巧,就就是是在在研研究究这这种种变变量量之之间间的的依依从从关关系系的的基基础础上上,分分析析一一个个叫叫做做应应变变量量的的变变量量,对对另另一一个个或或多多个个叫叫做做解解释释变变量量的的变变化化的的统统计计依依赖赖性性,这这种种分分析析的的目目的的,是是要要在在解解释释变变量量已已知知或或固固定定值的基
10、础上,估计和预测应变量的均值。值的基础上,估计和预测应变量的均值。2.1回归的含义回归的含义2-14 回归并不意味着存在因果关系!回归并不意味着存在因果关系!u 自变量并不意味是原因自变量并不意味是原因u应变量也并不见得是结果应变量也并不见得是结果u自变量与应变量的关系的判定或推断必自变量与应变量的关系的判定或推断必须经过实践检验的相关理论须经过实践检验的相关理论2.1回归的含义回归的含义2-152.1回归的含义回归的含义回归分析的目的:回归分析的目的:u根据自变量的取值,估计应变量的均值。根据自变量的取值,估计应变量的均值。u检验(建立在经济理论基础之上的)假设。检验(建立在经济理论基础之上
11、的)假设。u根据样本外自变量的取值,预测应变量的根据样本外自变量的取值,预测应变量的均值。均值。u可同时进行上述各项分析。可同时进行上述各项分析。2-162.2 总体归函数(总体归函数(PRF):假想一例):假想一例2-17图2-1 家庭年收入与数学家庭年收入与数学S.A.T分数分数 2-182.2 总体归函数(总体归函数(PRF):假想一例):假想一例 (1)由由于于不不确确定定因因素素的的影影响响,对对同同一一收收入入水水平平X,不同学生的成绩不完全相同;不同学生的成绩不完全相同;(2)但但由由于于调调查查的的完完备备性性,给给定定收收入入水水平平X的的分分数数Y的的分分布布是是确确定定的
12、的,即即以以X的的给给定定值值为为条条件件的的Y的的条条 件件 分分 布布(Conditional distribution)是是 已已 知知 的的,如:如:P(Y=460|X=5000)=1/5。因因此此,给给定定收收入入X的的值值Xi,可可得得分分数数Y的的条条件件均均值值(conditional mean)或或条条件件期期望望(conditional expectation):):E(Y|X=Xi)分析:分析:2-192.2 总体归函数(总体归函数(PRF):假想一例):假想一例n描出散点图发现:随着收入的增加,成绩描出散点图发现:随着收入的增加,成绩“平均地平均地说说”也在增加,且也在
13、增加,且Y的条件均值均落在一根正斜率的条件均值均落在一根正斜率的直线上。这条直线称为的直线上。这条直线称为总体回归线总体回归线。2-20总体回归直线总体回归直线可用函数可用函数(PRF)表示表示 和和 为为未未知知然然而而固固定定的的参参数数,称称为为回回归归系系数数;也也分分别别称称为为截截距距和和斜斜率率系系数数。方程本身则称线性总体回归函数。方程本身则称线性总体回归函数。(2-1)2.2 总体归函数(总体归函数(PRF):假想一例):假想一例2-212.2 总体归函数(总体归函数(PRF):假想一例):假想一例n由于变量间关系的随机性,由于变量间关系的随机性,回归分析回归分析关心的关心的
14、是根据解释变量的已知或给定值,考察被解是根据解释变量的已知或给定值,考察被解释变量的总体均值释变量的总体均值,即当解释变量取某个确,即当解释变量取某个确定值时,与之统计相关的被解释变量所有可定值时,与之统计相关的被解释变量所有可能出现的对应值的平均值。严格说,回归分能出现的对应值的平均值。严格说,回归分析是析是条件回归分析条件回归分析(conditional regression annlysis)2-222.2 总体归函数(总体归函数(PRF):假想一例):假想一例n在在给给定定解解释释变变量量Xi条条件件下下被被解解释释变变量量Yi的的期期望望轨轨迹迹称称为为总总体体回回归归线线(popu
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 线性 回归 基本 思想 变量 模型
限制150内