总结线性回归分析的基本步骤.wps
《总结线性回归分析的基本步骤.wps》由会员分享,可在线阅读,更多相关《总结线性回归分析的基本步骤.wps(13页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、线性回归分析的基本步骤步骤一、建立模型步骤一、建立模型知识点:知识点:1、总体回归模型、总体回归方程、样本回归模型、样本回归方程、总体回归模型、总体回归方程、样本回归模型、样本回归方程总体回归模型:总体回归模型:研究总体之中自变量和因变量之间某种非确定依赖关系的计量模型。研究总体之中自变量和因变量之间某种非确定依赖关系的计量模型。YXU 特点:由于随机误差项特点:由于随机误差项 U 的存在,使得的存在,使得 Y 和和 X 不在一条直线不在一条直线/平面上。平面上。例例 1:某镇共有:某镇共有 60 个家庭,经普查,个家庭,经普查,60 个家庭的每周收入(个家庭的每周收入(X)与每周消费()与每
2、周消费(Y)数据如下:)数据如下:每周收入(每周收入(X)每周消费支出(每周消费支出(Y)8055606570751006570748085881207984909498140809395103108113115160102107110116118125180110115120130135140200120136140144145220135137140152157160162240137145155165175189260150152175178180185191作出其散点图如下:作出其散点图如下:4060801001201401601802004080120160200240280XY总体
3、回归方程(线):总体回归方程(线):由于假定由于假定0EU ,因此因变量的均值与自变量总处于一条直线上,这条直线,因此因变量的均值与自变量总处于一条直线上,这条直线|E Y XX 就称为总体回归线(方程)。就称为总体回归线(方程)。总体回归方程的求法:以例总体回归方程的求法:以例 1 的数据为例的数据为例1)对第一个)对第一个 Xi,求出,求出 E(Y|Xi)。每周收入(每周收入(X)每周消费支出(每周消费支出(Y)E(Y|Xi)80556065707565100657074808588771207984909498891408093951031081131151011601021071101
4、16118125113180110115120130135140125200120136140144145137220135137140152157160162149240137145155165175189161260150152175178180185191173由于,因此任意带入两个由于,因此任意带入两个 Xi和其对应的和其对应的 E(Y|Xi)值,即可求出,并进而得到总体回归方程。值,即可求出,并进而得到总体回归方程。如将如将 222777100,|77200,|137XE YXXE YX 和和代入可得:代入可得:以上求出反映了以上求出反映了 E(Y|Xi)和和 Xi之间的真实关系,即
5、所求的总体回归方程为:,其图形为:之间的真实关系,即所求的总体回归方程为:,其图形为:01|iiiE YXX 01 和和 01|iiiE YXX 01001177100171372000.6 01 和和|170.6iiiE YXX 4060801001201401601802004080120160200240280XYY vs.X样本回归模型:样本回归模型:总体通常难以得到,因此只能通过抽样得到样本数据。如在例总体通常难以得到,因此只能通过抽样得到样本数据。如在例 1 中,通过抽样考察,我们得到了中,通过抽样考察,我们得到了 20 个家庭的样本数据:个家庭的样本数据:每周收入(每周收入(X)
6、每周消费支出(每周消费支出(Y)8055100657012079841408093160102107110180110200120136220135137240137145260150152175那么描述样本数据中因变量那么描述样本数据中因变量 Y 和自变量和自变量 X 之间非确定依赖关系的模型就称为样本回归模型。之间非确定依赖关系的模型就称为样本回归模型。样本回归方程(线)样本回归方程(线):通过样本数据估计出:通过样本数据估计出,得到样本观测值的拟合值与解释变量之间的关系方程,得到样本观测值的拟合值与解释变量之间的关系方程YX 称为样本回归方程。如下图所示:称为样本回归方程。如下图所示:四
7、者之间的关系:四者之间的关系:总体回归模型建立在总体数据之上,它描述的是因变量:总体回归模型建立在总体数据之上,它描述的是因变量 Y 和自变量和自变量 X之间的真实的非确定型依赖关系;样本回归模型建立在抽样数据基础之上,之间的真实的非确定型依赖关系;样本回归模型建立在抽样数据基础之上,YXe 4060801001201401601804080120160200240280XYY vs.X它描述的是因变量它描述的是因变量 Y 和自变量和自变量 X 之间的近似于真实的非确定型依赖关系。这种近似表现在两个方面:一是结构参数是其真实值的一种近似估计;二是残差之间的近似于真实的非确定型依赖关系。这种近似
8、表现在两个方面:一是结构参数是其真实值的一种近似估计;二是残差e是随机误差项是随机误差项 U 的一个近似估计;的一个近似估计;:总体回归方程是根据总体数据得到的,它描述的是因变量的条件均值:总体回归方程是根据总体数据得到的,它描述的是因变量的条件均值E(Y|X)与自变量与自变量 X 之间的线性关系;样本回归方程是根据抽样数据得到的,它描述的是因变量之间的线性关系;样本回归方程是根据抽样数据得到的,它描述的是因变量 Y 样本预测值的拟合值样本预测值的拟合值Y与自变量与自变量 X 之间的线性关系。之间的线性关系。:回归分析的目的是试图通过样本数据得到真实结构参数的估计值,并要求估计结果足够接近真实
9、值。由于抽样数据有多种可能,每一次抽样所得到的估计值都不会相同,即:回归分析的目的是试图通过样本数据得到真实结构参数的估计值,并要求估计结果足够接近真实值。由于抽样数据有多种可能,每一次抽样所得到的估计值都不会相同,即 的估计量是一个随机变量。因此必须选择合适的参数估计方法,使其具有良好的统计性质。的估计量是一个随机变量。因此必须选择合适的参数估计方法,使其具有良好的统计性质。2、随机误差项、随机误差项 U 存在的原因:存在的原因:非重要解释变量的省略非重要解释变量的省略人的随机行为人的随机行为数学模型形式欠妥数学模型形式欠妥归并误差(如一国归并误差(如一国 GDP 的计算)的计算)测量误差等
10、测量误差等3、多元回归模型的基本假定、多元回归模型的基本假定随机误差项的期望值为零随机误差项的期望值为零()0iE U 随机误差项具有同方差性随机误差项具有同方差性随机误差项彼此之间不相关随机误差项彼此之间不相关(,)0 ;,1,2,ijCov u uiji jn L L解释就变量解释就变量 X1,X2,Xk为确定型变量,与随机误差项彼此不相关。为确定型变量,与随机误差项彼此不相关。(,)0 1,2,1,2,ijjCov Xuikjn L LL L 2()1,2,iVar uin L L解释就变量解释就变量 X1,X2,Xk之间不存在精确的(完全的)线性关系,即解释变量的样本观测值矩阵之间不存
11、在精确的(完全的)线性关系,即解释变量的样本观测值矩阵 X 为满秩矩阵:为满秩矩阵:rank(X)=k+1n随机误差项服从正态分布,即:随机误差项服从正态分布,即:uiN(0,2),i=1,2,n步骤二、参数估计步骤二、参数估计知识点:知识点:1、最小二乘估计的基本原理:残差平方和最小化。、最小二乘估计的基本原理:残差平方和最小化。2、参数估计量:、参数估计量:一元回归:一元回归:1201iiix yxYX 多元回归:多元回归:1TX XX Y 3、最小二乘估计量的性质(、最小二乘估计量的性质(Gauss-Markov 定理):定理):在满足基本假设的情况下,最小二乘估计量在满足基本假设的情况
12、下,最小二乘估计量 是是 的最优线性无偏估计量(的最优线性无偏估计量(BLUE 估计量)估计量)步骤三、模型检验步骤三、模型检验1、经济计量检验(后三章内容)、经济计量检验(后三章内容)2、统计检验、统计检验拟合优度检验拟合优度检验知识点:知识点:拟合优度检验的作用:检验回归方程对样本点的拟合程度:拟合优度检验的作用:检验回归方程对样本点的拟合程度:拟合优度的检验方法:计算(调整的)样本可决系数:拟合优度的检验方法:计算(调整的)样本可决系数22/RR,注意掌握离差平方和、回归平方和、残差平方和之间的关系以及它们注意掌握离差平方和、回归平方和、残差平方和之间的关系以及它们21RSSESSRTS
13、STSS 2/11/1ESS nkRTSS n 的自由度。的自由度。计算方法:通过方差分析表计算计算方法:通过方差分析表计算方差来源方差来源符号符号计算公式计算公式自由度自由度(d.f.)均方值均方值(MSS)离差平方和离差平方和TSS 2iiYY n-1 2iiYY /n-1回归平方和回归平方和RSS 2iiYY k 2iiYY /k残差平方和残差平方和ESS 2iiYY n-k-1 2iiYY /n-k-1例例 2:下表列出了三变量(二元)模型的回归结果:下表列出了三变量(二元)模型的回归结果:方差来源方差来源平方和(平方和(SS)自由度自由度均方值均方值离差平方和离差平方和 TSS660
14、4214回归平方和回归平方和 RSS65965残差平方和残差平方和 ESS1)样本容量为多少?)样本容量为多少?解:由于解:由于 TSS 的自由度为的自由度为 n-1,由上表知,由上表知 n-114,因此样本容量,因此样本容量 n=15。2)求)求 ESS解:由于解:由于 TSSESSRSS,故,故 ESSTSSRSS773)ESS 和和 RSS 的自由度各为多少?的自由度各为多少?解:对三变量模型而言,解:对三变量模型而言,k=2,故,故 ESS 的自由度为的自由度为 n-k-112RSS 的自由度为的自由度为 k24)求)求解:解:2659650.998866042RSSRTSS ,2/1
15、10.9986/1ESS nkRTSS n 22RR和和回归方程的显著性检验(回归方程的显著性检验(F 检验)检验)目的:检验模型中的因变量与自变量之间是否存在显著的线性关系目的:检验模型中的因变量与自变量之间是否存在显著的线性关系步骤:步骤:1、提出假设:、提出假设:0121:.0:0,1,2,.,kjHHjk 至至少少有有一一2、构造统计量:、构造统计量:3、给定显著性水平、给定显著性水平,确定拒绝域,确定拒绝域4、计算统计量值,并判断是否拒绝原假设、计算统计量值,并判断是否拒绝原假设例例 3:就例:就例 2 中的数据,给定显著性水平中的数据,给定显著性水平1%,对回归方程进行显著性检验。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 总结 线性 回归 分析 基本 步骤
限制150内