线性回归模型精选PPT.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《线性回归模型精选PPT.ppt》由会员分享,可在线阅读,更多相关《线性回归模型精选PPT.ppt(87页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于线性回归模型关于线性回归模型第1页,讲稿共87张,创作于星期二2022/9/162 2.1 模型的建立及其假定条件模型的建立及其假定条件1变量之间的关系变量之间的关系2回归分析的概念回归分析的概念3一元线性回归模型一元线性回归模型4随机误差项的假定随机误差项的假定第2页,讲稿共87张,创作于星期二2022/9/163 2.1 模型的建立及其假定条件模型的建立及其假定条件1变量之间的关系变量之间的关系经济变量之间的关系,大体可分为两类:经济变量之间的关系,大体可分为两类:确定性关系或函数关系:确定性关系或函数关系:变量之间存在确定的函数关系变量之间存在确定的函数关系例如:某企业的销售收入例如
2、:某企业的销售收入Y与其产品价格与其产品价格P和销售量和销售量X的关的关系为:系为:Y=PX第3页,讲稿共87张,创作于星期二2022/9/1642.1 模型的建立及其假定条件模型的建立及其假定条件统计依赖或相关关系:统计依赖或相关关系:变量之间存在非确定的依赖关变量之间存在非确定的依赖关系系.研究的是非确定现象随机变量间的关系。研究的是非确定现象随机变量间的关系。例如:某企业资金投入例如:某企业资金投入X与产出与产出Y的关系。的关系。Y=f(X)+u 对变量间统计依赖关系的考察主要是通过对变量间统计依赖关系的考察主要是通过相关分析相关分析(correlation analysis)或或回归分
3、析回归分析(regression analysis)来完成的来完成的第4页,讲稿共87张,创作于星期二2022/9/1652.1 模型的建立及其假定条件模型的建立及其假定条件2 回归分析的概念回归分析的概念 回归分析回归分析研究一个变量关于另一个(些)变量的研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论。具体依赖关系的计算方法和理论。其用意其用意:在于通过后者的已知或设定值,去估计在于通过后者的已知或设定值,去估计(或)预测前者的(总体)均值(或)预测前者的(总体)均值。第5页,讲稿共87张,创作于星期二2022/9/1662.1 模型的建立及其假定条件模型的建立及其假定条件
4、回归分析的基本思想和方法以及回归分析的基本思想和方法以及“回归回归”名称的由来名称的由来 英国统计学家高尔顿(英国统计学家高尔顿(F.alton,18221911)和他)和他的学生皮尔逊(的学生皮尔逊(.Pearson,18561936)在研究父母身高)在研究父母身高与其子女身高的遗传问题时,观察了与其子女身高的遗传问题时,观察了1078对夫妇,以每对对夫妇,以每对夫妇的平均身高作为自变量,而取他们的一个成年儿子的夫妇的平均身高作为自变量,而取他们的一个成年儿子的身高作为因变量,将结果在平面直角坐标系上绘成散点图身高作为因变量,将结果在平面直角坐标系上绘成散点图,发现趋势近乎一条直线,计算出的
5、回归直线方程为:,发现趋势近乎一条直线,计算出的回归直线方程为:y33.730.516 x 这一方程表明:父母平均身高每增减一个单位时,其年这一方程表明:父母平均身高每增减一个单位时,其年子女的身高仅平增减子女的身高仅平增减0.516个单位个单位第6页,讲稿共87张,创作于星期二2022/9/167 这项研究结果表明,虽然高个子父辈有生高个子儿子的这项研究结果表明,虽然高个子父辈有生高个子儿子的趋势,矮个子的父辈有生矮个子儿子的趋势,但父辈身高趋势,矮个子的父辈有生矮个子儿子的趋势,但父辈身高增减一个单位,儿子身高仅增减半个单位左右。通俗地说,增减一个单位,儿子身高仅增减半个单位左右。通俗地说
6、,一群特高个子父辈一群特高个子父辈 的儿子们在同龄人中平均仅为高个子,的儿子们在同龄人中平均仅为高个子,一群高个子父辈的儿子们在同龄人中平均仅为略高个子;一群高个子父辈的儿子们在同龄人中平均仅为略高个子;一群特矮个子父辈的儿子们在同龄人中平均仅为矮个子,一群特矮个子父辈的儿子们在同龄人中平均仅为矮个子,一群矮个子父辈的儿子们在同龄人中平均仅为略矮个子,一群矮个子父辈的儿子们在同龄人中平均仅为略矮个子,即子代的平均身高向中间回归了。所以高尔顿引用了即子代的平均身高向中间回归了。所以高尔顿引用了“回回归归”(regression)一词来描述父辈身高与子代身高之间的关)一词来描述父辈身高与子代身高之
7、间的关系。尽管系。尽管“回归回归”这个名称的由来具有特定的含义,但是,人这个名称的由来具有特定的含义,但是,人们在研究大量的经济变量间的统计关系时已远远超出了这一特们在研究大量的经济变量间的统计关系时已远远超出了这一特定的含义了,我们现在使用回归这一名称仅仅是接受了高尔顿定的含义了,我们现在使用回归这一名称仅仅是接受了高尔顿先生的回归分析基本思想和方法先生的回归分析基本思想和方法 第7页,讲稿共87张,创作于星期二2022/9/1682.1 模型的建立及其假定条件模型的建立及其假定条件3 一元线性回归模型一元线性回归模型 一元线性回归模型一元线性回归模型表示如下:表示如下:yi=01xi+ui
8、 yi 称为称为 被解释变量被解释变量(因变量)(因变量)xi 称为称为解释变量解释变量(自变量)(自变量)0、1 回归系数回归系数(待定系数或待定参数)(待定系数或待定参数)0称作常数项(截称作常数项(截距项),距项),1称作斜率系数。称作斜率系数。ui 是计量经济模型区别于数学模型的最关键的标志,称是计量经济模型区别于数学模型的最关键的标志,称之为之为随机扰动项随机扰动项或或误差项误差项。正是。正是u 的随机性使得我们可以采的随机性使得我们可以采用统计推断方法对模型的设定进行严格的检验。用统计推断方法对模型的设定进行严格的检验。第8页,讲稿共87张,创作于星期二2022/9/1692.1
9、模型的建立及其假定条件模型的建立及其假定条件 线性回归模型线性回归模型”中的中的“线性线性”一词在这里的含一词在这里的含义义:是指被解释变量是指被解释变量y与解释变量与解释变量x之间为线性关系,即之间为线性关系,即解释变量解释变量x仅以一次方的形式出现在模型之中。仅以一次方的形式出现在模型之中。第9页,讲稿共87张,创作于星期二2022/9/16102.1 模型的建立及其假定条件模型的建立及其假定条件一般来说,回归模型的随机误差项中可能包括如一般来说,回归模型的随机误差项中可能包括如下几项内容。下几项内容。(1)未在模型中列出的影响)未在模型中列出的影响y变化的非重要解变化的非重要解释变量。如
10、消费模型中家庭人口数、消费习惯、释变量。如消费模型中家庭人口数、消费习惯、物价水平差异等因素的影响都包括在随机误差项物价水平差异等因素的影响都包括在随机误差项中。中。(2)人的随机行为。经济活动都是人参与的。)人的随机行为。经济活动都是人参与的。人的经济行为的变化也会对随机误差项产生人的经济行为的变化也会对随机误差项产生影响。影响。第10页,讲稿共87张,创作于星期二2.1 模型的建立及其假定条件模型的建立及其假定条件(3)数学模型形式欠妥。对于同一组观测值,若)数学模型形式欠妥。对于同一组观测值,若拟合的数学模型形式不同,则相应的随机误差项拟合的数学模型形式不同,则相应的随机误差项的值也不同
11、。当模型形式欠妥时,会直接对随机的值也不同。当模型形式欠妥时,会直接对随机误差项的值带来影响。误差项的值带来影响。(4)归并误差。模型中被解释变量的值常常是归)归并误差。模型中被解释变量的值常常是归并而成的。当归并不合理时,会产生误差。如由并而成的。当归并不合理时,会产生误差。如由不同种类粮食合并构成的粮食产量的不合理归并不同种类粮食合并构成的粮食产量的不合理归并会带来归并误差。会带来归并误差。(5)测量误差。当对被解释变量的测量存在误)测量误差。当对被解释变量的测量存在误差时,这种误差将包括在随机误差项中差时,这种误差将包括在随机误差项中第11页,讲稿共87张,创作于星期二2022/9/16
12、122.1 模型的建立及其假定条件模型的建立及其假定条件4 随机误差项的假定条件随机误差项的假定条件(1)零均值假定)零均值假定 E(ui)=0 i=1,2,这表示对这表示对X的每个观测值来说的每个观测值来说,u可以取可以取不同的值不同的值,有些大于零有些大于零,有些小于零有些小于零,考虑考虑u的的所有可能取值所有可能取值,他们的总体平均值等于零他们的总体平均值等于零.第12页,讲稿共87张,创作于星期二2.1 模型的建立及其假定条件模型的建立及其假定条件(2)同方差性假定)同方差性假定 Var(ui)=u2 i=1,2,这表明在各次观测中这表明在各次观测中u具有相同的方差具有相同的方差,也也
13、就是各次观测所受的随机影响的程度相同就是各次观测所受的随机影响的程度相同.第13页,讲稿共87张,创作于星期二协方差的定义协方差的定义 E(X-E(X)(Y-E(Y)称为随机变量称为随机变量X和和Y的的协方差协方差,记作,记作COV(X,Y),即,即COV(X,Y)=E(X-E(X)(Y-E(Y).计算公式为计算公式为:Cov(X,Y)=E(XY)-E(X)E(Y)协方差可以度量两个变量之间的相关关系协方差可以度量两个变量之间的相关关系,如果如果两个变量的协方差为零两个变量的协方差为零,则表明这两个变量之间不则表明这两个变量之间不存在相关关系存在相关关系.第14页,讲稿共87张,创作于星期二2
14、.1 模型的建立及其假定条件模型的建立及其假定条件(3)无序列相关假定)无序列相关假定 Cov(ui,uj)=0 ij i,j=1,2,这表明这表明,在任意两次观测时在任意两次观测时,ui,uj是不相关的是不相关的,即即u在某次观测中取的值与任何其它次观测中取的值互在某次观测中取的值与任何其它次观测中取的值互不影响不影响.第15页,讲稿共87张,创作于星期二2.1 模型的建立及其假定条件模型的建立及其假定条件(4)解释变量与误差项不相关假定)解释变量与误差项不相关假定 Cov(Xi,ui)=0 i=1,2,这一假定表明随机项这一假定表明随机项u与自变量与自变量x不相关不相关.提出这提出这一假定
15、是因为在建立回归模型时一假定是因为在建立回归模型时,我们用随机项我们用随机项u综合了未包含在模型中的那些自变量以及其它因综合了未包含在模型中的那些自变量以及其它因素对因变量素对因变量Y的影响的影响.因此因此,应该把应该把X对对Y的影响和的影响和u对对Y的影响区分开来的影响区分开来.如果两者相关如果两者相关,就不可能把各就不可能把各自对自对Y的影响区分开来的影响区分开来第16页,讲稿共87张,创作于星期二2022/9/16172.1 模型的建立及其假定条件模型的建立及其假定条件(5)正态分布假定正态分布假定 uiN(0,u2)i=1,2,第17页,讲稿共87张,创作于星期二2022/9/1618
16、2.2 一元线性回归模型的参数估计一元线性回归模型的参数估计1 几个重要的概念几个重要的概念 对于一元线性回归模型对于一元线性回归模型 ,随机误差,随机误差项满足古典假设条件,这个线性回归模型称为项满足古典假设条件,这个线性回归模型称为X,Y之间的之间的总体回归模型。总体回归模型。两边取条件均值,得一元线性回归方程:两边取条件均值,得一元线性回归方程:简称简称总体回归方程总体回归方程(总体回归线总体回归线)。其中总体回归系数)。其中总体回归系数 和和 是是未知的,实际上总体回归线是无法求得的,它只是理论上的存在,未知的,实际上总体回归线是无法求得的,它只是理论上的存在,所以称为理论回归方程所以
17、称为理论回归方程第18页,讲稿共87张,创作于星期二2022/9/16192.2 一元线性回归模型的参数估计一元线性回归模型的参数估计如果变量如果变量 x 和和y之间存在线性相关关系之间存在线性相关关系,对于任意抽取的若干个观测对于任意抽取的若干个观测(样本)值(样本)值(xi,yi),有),有 (2.2.1)我们称(我们称(2.2.1)为样本回归模型)为样本回归模型,、为为 、的的估计估计值值或或估计量估计量。样本回归模型由两部分组成。样本回归模型由两部分组成:称为称为系统分量,是可以被系统分量,是可以被x解释的部分,也称为可解释分量;解释的部分,也称为可解释分量;是不能被解释的部分,称为是
18、不能被解释的部分,称为残差残差(Residual),它是随机项它是随机项 ui 的代表值,也称为不可解释分量。将系统分量表示为的代表值,也称为不可解释分量。将系统分量表示为 (2.2.2)第19页,讲稿共87张,创作于星期二2022/9/16202.2 一元线性回归模型的参数估计一元线性回归模型的参数估计 式(2.2.2)称为一元线性样本回归方程,简称样本回归方程。又因(2.2.2)式的建立依赖于样本观测值(xi,yi),所以我们又称其为经验回归方程。、为样本回归系数。其中 是估计的回归直线在y轴截距,是直线的斜率。的实际意义为x每变动一个单位时,y的平均变动值,即x的变动对y变动的边际贡献率
19、;是实际观测值 y 的拟合值或估计值我们用一个图来表示yi,E(yi,)、ui、ei第20页,讲稿共87张,创作于星期二2022/9/16212.2 一元线性回归模型的参数估计一元线性回归模型的参数估计 Y iY ie iY Xi X 第21页,讲稿共87张,创作于星期二2022/9/16222.2 一元线性回归模型的参数估计一元线性回归模型的参数估计2 普通最小二乘法普通最小二乘法 给定一组样本观测值(给定一组样本观测值(Xi,Yi)()(i=1,2,n)要求)要求样本回归函数尽可能好地拟合这组值样本回归函数尽可能好地拟合这组值.普通最小二乘法普通最小二乘法(Ordinary least s
20、quares,OLS)给出的判断标准是:)给出的判断标准是:二者之差的平方和最小二者之差的平方和最小即在给定样本观测值之下,选择出即在给定样本观测值之下,选择出 、能使能使 y yi i ,之之差的平方和最小(即为使残差平方和最小)差的平方和最小(即为使残差平方和最小)第22页,讲稿共87张,创作于星期二2022/9/16232.2 一元线性回归模型的参数估计一元线性回归模型的参数估计方程组(方程组(*)称为)称为正规方程组正规方程组(normal equations)。第23页,讲稿共87张,创作于星期二2022/9/16242.2 一元线性回归模型的参数估计一元线性回归模型的参数估计记记
21、上述参数估计量可以写成:上述参数估计量可以写成:上式称为上式称为OLSOLS估计量的估计量的离差形式离差形式。由于参数的估计结果是通过最小二乘法得到的,故由于参数的估计结果是通过最小二乘法得到的,故称为称为普通普通最小二乘估计量最小二乘估计量(ordinary least squares estimators)。第24页,讲稿共87张,创作于星期二2022/9/16252.2 一元线性回归模型的参数估计一元线性回归模型的参数估计3 最小二乘直线的性质最小二乘直线的性质(1)残差)残差ei的均值等于的均值等于0因为因为 ,所以,所以(2)残差)残差ei与解释变量与解释变量xi不相关不相关即即(3
22、)样本回归直线经过点()样本回归直线经过点()(4)被解释变量的样本平均值等于其估计值的平均值)被解释变量的样本平均值等于其估计值的平均值第25页,讲稿共87张,创作于星期二2022/9/16262.2 一元线性回归模型的参数估计一元线性回归模型的参数估计4 截距为零的一元线性回归模型的参数估计截距为零的一元线性回归模型的参数估计 截距为零的一元线性回归模型的一般形式为:截距为零的一元线性回归模型的一般形式为:这个模型只有一个参数这个模型只有一个参数 需要估计,其最小二乘估计量需要估计,其最小二乘估计量的表达式为的表达式为 第26页,讲稿共87张,创作于星期二2022/9/16272.2 一元
23、线性回归模型的参数估计一元线性回归模型的参数估计例例2.2.1题:一个假想的生活小区有题:一个假想的生活小区有100户家庭组成户家庭组成,要研究该小区每月,要研究该小区每月家庭消费支出家庭消费支出Y与每月与每月家庭可家庭可支配收入支配收入X的关系。的关系。首先得到这首先得到这100户家庭的每月家庭消费支出和每户家庭的每月家庭消费支出和每月家庭可支配收入的数据,并把月家庭可支配收入的数据,并把100户家庭划分为户家庭划分为组内收入差不多的组内收入差不多的10组,以分析每一收入组的家庭组,以分析每一收入组的家庭消费支出,分组如下:消费支出,分组如下:第27页,讲稿共87张,创作于星期二2022/9
24、/1628第28页,讲稿共87张,创作于星期二2022/9/1629建立变量建立变量X与与Y之间的样本回归模型:之间的样本回归模型:利用分组数据估计模型参数,参数估计的计算可通过下面的表进利用分组数据估计模型参数,参数估计的计算可通过下面的表进行行 iX iY ix iy iiyx 2ix 2iy 2iX 2iY 1 800 594-1350-973 1314090 1822500 947508 640000 352836 2 1100 638-1050-929 975870 1102500 863784 1210000 407044 3 1400 1122-750-445 334050 56
25、2500 198381 1960000 1258884 4 1700 1155-450-412 185580 202500 170074 2890000 1334025 5 2000 1408-150-159 23910 22500 25408 4000000 1982464 6 2300 1595 150 28 4140 22500 762 5290000 2544025 7 2600 1969 450 402 180720 202500 161283 6760000 3876961 8 2900 2078 750 511 382950 562500 260712 8410000 43180
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 线性 回归 模型 精选 PPT
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内