《计量经济学-第二章一元线性回归模型备课讲稿.ppt》由会员分享,可在线阅读,更多相关《计量经济学-第二章一元线性回归模型备课讲稿.ppt(47页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、计量经济学-第二章一元线性回归模型2.1 回归分析概述回归分析概述一一回归分析基本概念回归分析基本概念变量间的相互关系变量间的相互关系 计计量量经经济济学学的的主主要要问问题题之之一一就就是是探探寻寻各各种种经经济济变变量量之之间间的的相相互互联联系系程程度、联系方式以及运动规律。度、联系方式以及运动规律。各各种种经经济济变变量量间间的的关关系系可可以以分分为为两两类类:一一类类是是确确定定的的函函数数关关系系,另另一一类是不确定的统计关系类是不确定的统计关系。确定的函数关系例如:确定的函数关系例如:不不确确定定的的统统计计关关系系例例如如:农农作作物物产产量量Y与与施施肥肥量量X之之间间的的
2、关关系系。无无法法确确定定农农作作物物产产量量与与施施肥肥量量之之间间的的函函数数关关系系,因因为为农农作作物物产产量量还还会会受受到到阳阳光光、气气温温、降降雨雨等等因因素素影影响响,但但是是可可以以通通过过统统计计计计量量方方法法研研究究统统计计相相关关关系,农作物产量关系,农作物产量Y是非确定性变量,也称为是非确定性变量,也称为随机变量随机变量。2.1 回归分析概述回归分析概述一一回归分析基本概念回归分析基本概念变量间的相互关系变量间的相互关系 变变量量间间的的函函数数关关系系与与相相关关关关系系并并不不是是绝绝对对的的,一一定定条条件件下下,可可以以相相互互转转化化。确确定定性性现现象
3、象的的观观测测中中,往往往往存存在在测测量量误误差差,函函数数关关系系将将通通过过相相关关关关系系表表现现出出来来,反反之之,如如果果将将非非确确定定性性现现象象中中的的影影响响因因素素全全部部识识别别出出来来,并并将将此此全全部部纳纳入入到到变变量量间间的的依依存存关关系系中中,相相关关关关系系将将会会向向函函数数关关系系转转化化。相关分析和回归分析主要研究非确定性现象间的统计相关关系相关分析和回归分析主要研究非确定性现象间的统计相关关系。2.1 回归分析概述回归分析概述一一回归分析基本概念回归分析基本概念相关分析与回归分析相关分析与回归分析 相相关关分分析析(Correlation Ana
4、lysis)主主要要研研究究随随机机变变量量间间的的相相关关形形式式及及相相关程度。关程度。变量变量X与与Y的总体线性相关系数为:的总体线性相关系数为:样本相关系数为:样本相关系数为:2.1 回归分析概述回归分析概述一一回归分析基本概念回归分析基本概念相关分析与回归分析相关分析与回归分析 具具有有相相关关关关系系的的变变量量间间存存在在因因果果关关系系,则则可可以以通通过过回回归归分分析析(Regression Analysis)研研究究具具体体依依存存关关系系,比比如如考考察察可可支支配配收收入入每每1元元的变化引起的消费支出的的变化引起的消费支出的平均变化平均变化。回回归归分分析析是是研研
5、究究一一个个变变量量(被被解解释释变变量量,explained variable;因因变变量量,dependent variable)关关于于另另一一个个(几几个个)变变量量(解解释释变变量量,explanatory variable;自自变变量量,independent variable)的的依依赖赖关关系系的的计计算算方方法法和和理理论论。目的在于通过后者的已知或设定值,去估计或预测前者的均值。目的在于通过后者的已知或设定值,去估计或预测前者的均值。2.1 回归分析概述回归分析概述一一回归分析基本概念回归分析基本概念相关分析与回归分析相关分析与回归分析 相关分析与回归分析既有联系又有区别:
6、相关分析与回归分析既有联系又有区别:首首先先,都都是是研研究究非非确确定定性性变变量量间间的的统统计计依依赖赖关关系系,并并能能度度量量线线性性依依赖赖程程度度大大小小;其其次次,两两者者间间存存在在明明显显的的区区别别,相相关关分分析析仅仅仅仅测测量量变变量量相相关关程程度度,无无需需考考察察因因果果关关系系,因因此此变变量量地地位位是是对对称称的的,而而回回归归分分析析更更关关注注因因果果关关系系,地地位位是是不不对对称称的的,有有解解释释变变量量与与被被解解释释变变量量之之分分;再再次次,相相关关分分析析只只关关注注变变量量联联系系程程度度,不不关关注注具具体体依依赖赖关关系系,回回归归
7、分分析析更更关关注注依依赖关系,可以通过解释变量变化去估计或预测被解释变量的变化。赖关系,可以通过解释变量变化去估计或预测被解释变量的变化。回归分析主要包括以下内容:回归分析主要包括以下内容:根据样本观察值对计量经济学模型参数进行估计,求得回归方程;根据样本观察值对计量经济学模型参数进行估计,求得回归方程;对回归方程、参数估计值进行显著性检验;对回归方程、参数估计值进行显著性检验;利用回归方程进行分析、评价与预测。利用回归方程进行分析、评价与预测。2.1 回归分析概述回归分析概述二二总体回归函数总体回归函数例例2.1.1 以以X的给定值为条件的,的给定值为条件的,Y的的条件分布条件分布是已知的
8、,如是已知的,如P(Y=561X=800)=1/4。那么,给定那么,给定X的值,可以得到的值,可以得到Y的的条件均值或条件期望条件均值或条件期望,如,如E(YX=800)=605。2.1 回归分析概述回归分析概述二二总体回归函数总体回归函数例例2.1.1 从人均可支配收入与消费支出从人均可支配收入与消费支出的散点图看出,虽然消费支出存在的散点图看出,虽然消费支出存在差异,差异,平均来说平均来说,随着可支配收入,随着可支配收入增加,消费支出也在增加。增加,消费支出也在增加。Y的的条件均值正好落在一条斜率为正的条件均值正好落在一条斜率为正的直线上,称之为总体回归线。直线上,称之为总体回归线。总体回
9、归线2.1 回归分析概述回归分析概述二二总体回归函数总体回归函数总体回归线总体回归线 给定解释变量给定解释变量X条件下被解释变量条件下被解释变量Y的期望轨迹称为总体回归线的期望轨迹称为总体回归线(Population regression line),或总体回归曲线(),或总体回归曲线(Population regression curve),总体回归函数(),总体回归函数(Population Regression Function,PRF)为:)为:将消费支出看成可支配收入的线性函数,可进一步写成将消费支出看成可支配收入的线性函数,可进一步写成 其中,其中,和和 是未知参数,称之为回归系数
10、(是未知参数,称之为回归系数(Regression coefficients)。)。线性函数主要指回归系数是线性,解释变量可以不是线性的。线性函数主要指回归系数是线性,解释变量可以不是线性的。2.1 回归分析概述回归分析概述三三随机干扰项随机干扰项定义定义 总体回归函数描述了考察总体的家庭消费支出总体回归函数描述了考察总体的家庭消费支出平均来说平均来说随着可支配收随着可支配收入变化的规律,但是对具体一个家庭来说,消费支出不一定是平均值入变化的规律,但是对具体一个家庭来说,消费支出不一定是平均值E(YX),而是在平均支出的周围。,而是在平均支出的周围。对个别家庭而言,消费支出与平均消费支出的差对
11、个别家庭而言,消费支出与平均消费支出的差:是一个不可观测的随机变量,称为是一个不可观测的随机变量,称为随机误差项随机误差项(stochastic error)或)或随机干扰项(随机干扰项(stochastic disturbance)。)。于是,个别家庭消费支出:于是,个别家庭消费支出:(总体回归函数的随机设定形式总体回归函数的随机设定形式)当可支配收入当可支配收入X给定时,个别家庭消费支出由两个部分组成:给定时,个别家庭消费支出由两个部分组成:平均消费平均消费支出,系统性部分或确定性部分;支出,系统性部分或确定性部分;随机部分或非系统性部分随机部分或非系统性部分。2.1 回归分析概述回归分析
12、概述三三随机干扰项随机干扰项引入随机干扰项的原因引入随机干扰项的原因 代表未知的影响因素代表未知的影响因素,对考察总体认识不完备,未知的影响因素无,对考察总体认识不完备,未知的影响因素无法引入模型;法引入模型;代表残缺数据代表残缺数据,部分数据无法获得,例如财富拥有量对消费支出的,部分数据无法获得,例如财富拥有量对消费支出的影响;影响;代表众多细小影响因素代表众多细小影响因素,将众多细小变量的影响综合;,将众多细小变量的影响综合;代表数据观测误差代表数据观测误差,数据往往存在测量误差;,数据往往存在测量误差;代表模型设定误差代表模型设定误差,模型设定可能与真实的模型有偏差;,模型设定可能与真实
13、的模型有偏差;变量的内生随机性变量的内生随机性,变量所固有的内生随机性,也会对被解释变,变量所固有的内生随机性,也会对被解释变量产生随机性影响。量产生随机性影响。2.1 回归分析概述回归分析概述四四样本回归函数样本回归函数定义定义 由于总体的信息往往无法全部得到,通过抽样得到总体的样本,再由于总体的信息往往无法全部得到,通过抽样得到总体的样本,再通过样本信息来估计总体回归函数。通过样本信息来估计总体回归函数。样本回归线 样本回归线(样本回归线(Sample regression line),函数形式为),函数形式为:称之为样本回归函数称之为样本回归函数(Sample Regression Fu
14、nction,SRF)称之为样本回归模型。称之为样本回归模型。2.1 回归分析概述回归分析概述四四样本回归函数样本回归函数目的目的 用样本回归函数估计,即用样本回归函数估计,即 去估计总体回归函数去估计总体回归函数 使使SRF尽可能接近尽可能接近PRF,右图,右图显示了样本回归线与总体回归线的显示了样本回归线与总体回归线的基本关系。基本关系。样本回归线并不是唯一的。样本回归线并不是唯一的。2.2 一元线性回归模型的基本假设一元线性回归模型的基本假设模型介绍模型介绍一元线性回归模型是最简单的计量经济学模型一元线性回归模型是最简单的计量经济学模型 其中,其中,Y为被解释变量,为被解释变量,X为解释
15、变量,为解释变量,和和 为待估参数,为待估参数,为随为随机扰动项,在有机扰动项,在有n个样本观测点的情况下,得到:个样本观测点的情况下,得到:为了保证参数估计量具有良好性质,通过对模型提出若干基本假设:为了保证参数估计量具有良好性质,通过对模型提出若干基本假设:对模型设定的假设对模型设定的假设 对解释变量的假设对解释变量的假设 对随机干扰项的假设对随机干扰项的假设2.2 一元线性回归模型的基本假设一元线性回归模型的基本假设一一对模型设定的假设对模型设定的假设假设假设1:回归模型是正确设定的:回归模型是正确设定的 模型的正确设定主要包括模型的正确设定主要包括模型选择了正确的变量模型选择了正确的变
16、量和和模型选择了正确的模型选择了正确的函数形式。函数形式。选择了正确的变量指选择了正确的变量指设定总体回归函数时,既没有遗漏重要变量,也设定总体回归函数时,既没有遗漏重要变量,也没有多选无关的变量。没有多选无关的变量。选择了正确的函数形式是指选择了正确的函数形式是指设定的总体回归函数设定的总体回归函数与因变量与自变量呈现的函数形式正好相同。与因变量与自变量呈现的函数形式正好相同。(柯布道格拉斯的幂函数(柯布道格拉斯的幂函数形式)形式)假设假设1满足时,称为没有满足时,称为没有设定偏误设定偏误(specification error)。)。2.2 一元线性回归模型的基本假设一元线性回归模型的基本
17、假设二二对解释变量的假设对解释变量的假设假设假设2:解释变量:解释变量X在所抽取的样本中具有变异性,而且随在所抽取的样本中具有变异性,而且随着样本容量的无限增加,解释变量着样本容量的无限增加,解释变量X的样本方差趋于一个非的样本方差趋于一个非零的有限常数,即满足零的有限常数,即满足 通过解释变量的变化来解释被解释变量的变化,因此需要足够的变异通过解释变量的变化来解释被解释变量的变化,因此需要足够的变异性。方差非零假设旨在排除数值取值出现无界的变量作为解释变量,因性。方差非零假设旨在排除数值取值出现无界的变量作为解释变量,因为这类数据使大样本统计推断变得无效。为这类数据使大样本统计推断变得无效。
18、2.2 一元线性回归模型的基本假设一元线性回归模型的基本假设三三对随机扰动项的假设对随机扰动项的假设假设假设3:给定解释变量:给定解释变量X的任何值,随机扰动项的任何值,随机扰动项 的均值为的均值为零,即零,即 意味着意味着 的期望不依赖于的期望不依赖于X的任何观测点取值的变化而变化,且总为常的任何观测点取值的变化而变化,且总为常数数0,表明,表明 与与X不存在任何形式的相关性,称不存在任何形式的相关性,称X是外生解释变量是外生解释变量(exogenous explanatory variable),或),或X是严格外生的(是严格外生的(strictly exogenous),否则称),否则称
19、X是内生解释变量(是内生解释变量(endogenous explanatory variable)。)。同期外生(同期外生(contemporaneously exogenous)或同期不相关()或同期不相关(contemporaneously uncorrelated)。)。2.2 一元线性回归模型的基本假设一元线性回归模型的基本假设三三对随机扰动项的假设对随机扰动项的假设假设假设4:随机扰动项:随机扰动项 具有给定具有给定X任何值条件下的同方差性任何值条件下的同方差性及不序列相关性,即及不序列相关性,即 条件同方差意味着条件同方差意味着 的方差不依赖于的方差不依赖于X的变化而变化,且总为常
20、数的变化而变化,且总为常数 任意两个不同观测点的随机干扰项不相关任意两个不同观测点的随机干扰项不相关2.2 一元线性回归模型的基本假设一元线性回归模型的基本假设三三对随机扰动项的假设对随机扰动项的假设假设假设5:随机干扰项服从零均值、同方差的正态分布,即:随机干扰项服从零均值、同方差的正态分布,即 以上假设也称为以上假设也称为线性回归模型的经典假设线性回归模型的经典假设(classical assumption),),满足假设的模型称为满足假设的模型称为经典线性回归模型经典线性回归模型(Classical Linear Regression Model,CLRM),前四个假设称为高斯前四个假设
21、称为高斯-马尔科夫假设(马尔科夫假设(Gauss-Markov assumption)。)。被解释变量被解释变量Y具有如下分布特征具有如下分布特征2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计一一参数估计的普通最小二乘法(参数估计的普通最小二乘法(OLS)判断标准判断标准 不同的估计方法可得到不同的不同的估计方法可得到不同的 和和 ,所估计的,所估计的 也不同。被解释也不同。被解释变量的估计值与实际观测值差的平方和最小,即变量的估计值与实际观测值差的平方和最小,即 理想的方法是选择理想的方法是选择 ,使使 与与 之差的平方和最小。之差的平方和最小。为什么使用为什么使用平方和?平方
22、和?求解(正规方程组)求解(正规方程组)2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计一一参数估计的普通最小二乘法(参数估计的普通最小二乘法(OLS)求解(离差形式)求解(离差形式)其中,其中,有关估计量与估计值的区别,估计值是具体数值,估计量是一个函数有关估计量与估计值的区别,估计值是具体数值,估计量是一个函数2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计一一参数估计的普通最小二乘法(参数估计的普通最小二乘法(OLS)求解(离差形式)求解(离差形式)回归线通过样本均值回归线通过样本均值 估计值估计值 的均值等于实际观测值的均值等于实际观测值 的均值的均值2.3 一
23、元线性回归模型的参数估计一元线性回归模型的参数估计二二参数估计的最大似然法(参数估计的最大似然法(ML)基本思想基本思想 对于普通最小二乘法,当从模型总体随机抽取容量为对于普通最小二乘法,当从模型总体随机抽取容量为n的样本观测值的样本观测值后,最合理的参数估计量应该使得模型能最好地拟合样本数据;而对于后,最合理的参数估计量应该使得模型能最好地拟合样本数据;而对于最大似然法,当从模型总体随机抽取容量为最大似然法,当从模型总体随机抽取容量为n的样本观测值后,的样本观测值后,最合理最合理的参数估计量应该使得从模型中抽取该样本观测值的概率最大的参数估计量应该使得从模型中抽取该样本观测值的概率最大。要对
24、每个可能的正态总体取得容量为要对每个可能的正态总体取得容量为n的样本观测值的联合概率,然的样本观测值的联合概率,然后选择其参数能使观测值的联合概率为最大的那个总体,将样本观测值后选择其参数能使观测值的联合概率为最大的那个总体,将样本观测值联合概率函数称为联合概率函数称为变量的似然函数变量的似然函数。在已经取得样本观测值的情况下,。在已经取得样本观测值的情况下,使似然函数取极大值的总体分布参数所代表的总体具有最大的概率取得使似然函数取极大值的总体分布参数所代表的总体具有最大的概率取得这些样本观测值,该总体参数即是所要求的参数。这些样本观测值,该总体参数即是所要求的参数。2.3 一元线性回归模型的
25、参数估计一元线性回归模型的参数估计二二参数估计的最大似然法(参数估计的最大似然法(ML)求解求解 由于由于 服从正态分布服从正态分布于是,于是,的概率函数为:的概率函数为:联合概率(似然函数)为:联合概率(似然函数)为:在满足一系列基本假设的情况下,模型结构参数的最大似然估计量与在满足一系列基本假设的情况下,模型结构参数的最大似然估计量与普通最小二乘估计量是相同的。普通最小二乘估计量是相同的。2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计三三参数估计的矩估计法(参数估计的矩估计法(MM)基本思路基本思路 正规方程组可以通过矩估计的思想来导出,矩估计的基本原理是正规方程组可以通过矩
26、估计的思想来导出,矩估计的基本原理是用相用相应的样本矩来估计总体矩应的样本矩来估计总体矩。于是,相应的样本矩条件可写成于是,相应的样本矩条件可写成 解与普通最小二乘法和最大似然法的结果相同。解与普通最小二乘法和最大似然法的结果相同。2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计三三参数估计的矩估计法(参数估计的矩估计法(MM)例例2.3.1 2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计四四最小二乘估计量的统计性质最小二乘估计量的统计性质考察参数估计量的统计性质的原因考察参数估计量的统计性质的原因 由于抽样波动的存在,以及所选估计方法由于抽样波动的存在,以及所选估计
27、方法的不同,都会使估计的参数与总体参数的真值的不同,都会使估计的参数与总体参数的真值有差距,因此考察参数估计量的统计性质就有差距,因此考察参数估计量的统计性质就成了衡量该统计量成了衡量该统计量“好坏好坏”的主要准则。的主要准则。2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计四四最小二乘估计量的统计性质最小二乘估计量的统计性质线性性线性性 指估计量指估计量 ,是是 的线性组合。的线性组合。其中,其中,2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计四四最小二乘估计量的统计性质最小二乘估计量的统计性质无偏性无偏性 即以即以X的所有样本为条件,估计量的所有样本为条件,估计量
28、 ,的均值等于总体回归参数真的均值等于总体回归参数真实值实值 和和 。所以,所以,2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计四四最小二乘估计量的统计性质最小二乘估计量的统计性质有效性(最小方差性)有效性(最小方差性)即在所有线性无偏估计量中,普通最小二乘估计量即在所有线性无偏估计量中,普通最小二乘估计量 和和 具有最小具有最小方差。方差。2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计四四最小二乘估计量的统计性质最小二乘估计量的统计性质有效性(最小方差性)有效性(最小方差性)假设假设 是其他估计方法得到的关于是其他估计方法得到的关于 的线性无偏估计量:的线性无偏估
29、计量:其中,其中,得到:得到:普通最小二乘估计量具有线性性、无偏性和有效性,是最佳线性无偏普通最小二乘估计量具有线性性、无偏性和有效性,是最佳线性无偏估计量,也称高斯估计量,也称高斯-马尔科夫定理。马尔科夫定理。2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计四四最小二乘估计量的统计性质最小二乘估计量的统计性质大样本性质大样本性质 除了拥有好的小样本性质外,还拥有好的大样本性质除了拥有好的小样本性质外,还拥有好的大样本性质2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计五五 和和 的概率分布及的概率分布及 的方差估计的方差估计参数估计量的概率分布参数估计量的概率分布 为
30、了达到对所估计参数精度测定的目的,还需进一步确定参数估计量为了达到对所估计参数精度测定的目的,还需进一步确定参数估计量的概率分布。的概率分布。和和 概率分布取决于概率分布取决于2.3 一元线性回归模型的参数估计一元线性回归模型的参数估计五五 和和 的概率分布及的概率分布及 的方差估计的方差估计随机干扰项的方差估计随机干扰项的方差估计 在估计的参数在估计的参数 和和 的方差表达式中,都含有随机干扰项的方差的方差表达式中,都含有随机干扰项的方差 。由于由于 实际上是未知的,因此,实际上是未知的,因此,和和 的方差实际上无法计算,需要的方差实际上无法计算,需要对其估计。由于随机扰动项对其估计。由于随
31、机扰动项 无法观测,只能从残差无法观测,只能从残差 出发,对总体出发,对总体方差进行估计。方差进行估计。最小二乘估计量最小二乘估计量 最大似然估计量最大似然估计量 矩估计量矩估计量2.4 一元线性回归模型的统计检验一元线性回归模型的统计检验一一拟合优度检验拟合优度检验为什么需要进行统计检验?为什么需要进行统计检验?尽管从统计性质上已知,如果有足够多的重复抽样,参数估计值的均尽管从统计性质上已知,如果有足够多的重复抽样,参数估计值的均值就等于其总体的参数真值,但是在一次抽样中,估计值不一定就等于值就等于其总体的参数真值,但是在一次抽样中,估计值不一定就等于该真值。该真值。拟合优度检验:检验模型对
32、样本观测值得拟合程度拟合优度检验:检验模型对样本观测值得拟合程度 构造一个统计量并计算其数值,然后与某一个标准进行比较,得出检构造一个统计量并计算其数值,然后与某一个标准进行比较,得出检验结论。验结论。在一个特定的条件下做得最好的并不一定是高质量的,普通最小二乘在一个特定的条件下做得最好的并不一定是高质量的,普通最小二乘是同一个问题内部的比较,拟合优度检验是不同问题之间的比较。是同一个问题内部的比较,拟合优度检验是不同问题之间的比较。2.4 一元线性回归模型的统计检验一元线性回归模型的统计检验一一拟合优度检验拟合优度检验拟合优度检验:检验模型对样本观测值得拟合程度拟合优度检验:检验模型对样本观
33、测值得拟合程度 从左图可以看出,第二图从左图可以看出,第二图拟合效果更好,需要构造拟合效果更好,需要构造一个统计量去衡量。一个统计量去衡量。2.4 一元线性回归模型的统计检验一元线性回归模型的统计检验一一拟合优度检验拟合优度检验总离差平方和的分解总离差平方和的分解 样本回归线样本回归线 Y的第的第i个观测值与样本均值的个观测值与样本均值的 离差离差 可分解为两部分之和可分解为两部分之和 2.4 一元线性回归模型的统计检验一元线性回归模型的统计检验一一拟合优度检验拟合优度检验总离差平方和的分解总离差平方和的分解 Y的观测值围绕其均值的总离差平方和可以分解为两个部分:的观测值围绕其均值的总离差平方
34、和可以分解为两个部分:一部分一部分来自回归线,另一部分来自随机势力来自回归线,另一部分来自随机势力。因此,可用来自回归线的回归平。因此,可用来自回归线的回归平方和占方和占Y的总离差平方和的比例判断样本回归线与样本观测值的拟合优的总离差平方和的比例判断样本回归线与样本观测值的拟合优度。度。能否直接使用残差平方和作为拟合优度检验的统计量?作为检验统能否直接使用残差平方和作为拟合优度检验的统计量?作为检验统计量一般应该是相对量,而不能是绝对量。因为用绝对量无法设置标准。计量一般应该是相对量,而不能是绝对量。因为用绝对量无法设置标准。残差平方和与样本量残差平方和与样本量n密切相关。密切相关。2.4 一
35、元线性回归模型的统计检验一元线性回归模型的统计检验一一拟合优度检验拟合优度检验可决系数可决系数 在总离差平方和中,回归平方和所占的比重越大,残差平方和所占的在总离差平方和中,回归平方和所占的比重越大,残差平方和所占的比重越小,回归直线与样本点拟合得越好。如果模型与样本观测值完全比重越小,回归直线与样本点拟合得越好。如果模型与样本观测值完全拟合,拟合,越接近,越接近1,模型拟合优度越高。,模型拟合优度越高。非负统计量非负统计量2.4 一元线性回归模型的统计检验一元线性回归模型的统计检验二二变量的显著性检验变量的显著性检验 旨在对模型中被解释变量与解释变量之间的线性关系是否显著成立作旨在对模型中被
36、解释变量与解释变量之间的线性关系是否显著成立作出推断,或者所选解释变量是否对被解释变量有显著的线性影响。出推断,或者所选解释变量是否对被解释变量有显著的线性影响。假设检验假设检验 根据样本所提供的信息,对未知总体分布的某些方面的假设作出合根据样本所提供的信息,对未知总体分布的某些方面的假设作出合理的判断。理的判断。程序:程序:根据实际问题的要求提出一个假设,称为根据实际问题的要求提出一个假设,称为原假设原假设H0,然后根,然后根据样本信息,对据样本信息,对H0的真伪进行判断,作出拒绝的真伪进行判断,作出拒绝H0或接受或接受H0的决策。的决策。小概率事件原理:小概率事件原理:小概率事件在一次试验
37、中几乎不可能发生。在原小概率事件在一次试验中几乎不可能发生。在原假设假设H0下构造一个事件,这个事件在下构造一个事件,这个事件在“原假设原假设H0是正确是正确”的条件下是的条件下是一个小概率事件。随机抽取一组容量为一个小概率事件。随机抽取一组容量为n的样本观测值进行检验,如果的样本观测值进行检验,如果事件发生了,说明事件发生了,说明“假设假设H0正确正确”是错误的,因为不应该出现的小概是错误的,因为不应该出现的小概率事件出现了,因而拒绝率事件出现了,因而拒绝H0;反之,如果小概率事件没有出现,就没;反之,如果小概率事件没有出现,就没有理由拒绝有理由拒绝H0,应该接受,应该接受H0。2.4 一元
38、线性回归模型的统计检验一元线性回归模型的统计检验二二变量的显著性检验变量的显著性检验变量的显著性检验方法变量的显著性检验方法 对于对于 ,已经知道服从正态分布,已经知道服从正态分布 如果真实的如果真实的 未知,用其无偏估计量未知,用其无偏估计量 替代时,可构造以下替代时,可构造以下统计量:统计量:该统计量服从自由度为该统计量服从自由度为n-2的的t分布。分布。2.4 一元线性回归模型的统计检验一元线性回归模型的统计检验二二变量的显著性检验变量的显著性检验变量的显著性检验方法变量的显著性检验方法 原假设原假设H0:备择假设备择假设H1:给定一个显著性水平给定一个显著性水平 ,比如比如0.05,查
39、,查t分布表,得到临界值分布表,得到临界值 如果如果 ,则拒,则拒绝原假设,则通过显著性检验,绝原假设,则通过显著性检验,否则,未通过显著性检验。否则,未通过显著性检验。2.4 一元线性回归模型的统计检验一元线性回归模型的统计检验三三参数检验的置信区间估计参数检验的置信区间估计基本思想基本思想 判断样本参数的估计值在多大程度上可以判断样本参数的估计值在多大程度上可以“近似近似”地替代总体参数的地替代总体参数的真值,往往需要通过构造一个以样本参数的估计值为中心的区间,来考真值,往往需要通过构造一个以样本参数的估计值为中心的区间,来考察它以多大的可能性包含着真实的参数值。察它以多大的可能性包含着真
40、实的参数值。使得随机区间使得随机区间 包含参数真实值包含参数真实值 的概率为的概率为 称之为置信区间,称之为置信区间,置信系数,置信系数,显著性水平。显著性水平。2.4 一元线性回归模型的统计检验一元线性回归模型的统计检验三三参数检验的置信区间估计参数检验的置信区间估计如何缩小置信区间?如何缩小置信区间?增加样本量:参数估计量标准差越小,增加样本量:参数估计量标准差越小,t分布临界值越小分布临界值越小 提高拟合优度:残差平方和越小提高拟合优度:残差平方和越小2.5 一元线性回归分析的应用:预测问题一元线性回归分析的应用:预测问题一一是条件均值(个别值)一个无偏估计是条件均值(个别值)一个无偏估
41、计预测问题是区间估计问题预测问题是区间估计问题 严格地说,只是被解释变量的严格地说,只是被解释变量的估计值估计值,而不是,而不是预测值预测值,因为:一是参,因为:一是参数估计量是不确定的;二是随机干扰项的影响。我们得到的仅是预测值数估计量是不确定的;二是随机干扰项的影响。我们得到的仅是预测值的一个估计值,预测值仅以某一个置信度处于该估计值为中心的区间中。的一个估计值,预测值仅以某一个置信度处于该估计值为中心的区间中。无偏估计值无偏估计值 Y在在X=X0时的条件均值为时的条件均值为 Y在在X=X0时的拟合值为时的拟合值为 在在X=X0条件下,样本估计值条件下,样本估计值 是总体均值是总体均值 和个别值和个别值Y0的无偏估计。的无偏估计。2.5 一元线性回归分析的应用:预测问题一元线性回归分析的应用:预测问题二二总体条件均值与个别值预测值置信区间总体条件均值与个别值预测值置信区间总体条件均值预测值的置信区间总体条件均值预测值的置信区间 在在1-a的置信度下,总体均值的置信度下,总体均值 的置信区间为的置信区间为 总体个别值预测值的置信区间总体个别值预测值的置信区间此此课课件下件下载载可自行可自行编辑编辑修改,修改,仅仅供参考!供参考!感感谢谢您的支持,我您的支持,我们们努力做得更好!努力做得更好!谢谢谢谢
限制150内