第四章多元回归分析精选文档.ppt
《第四章多元回归分析精选文档.ppt》由会员分享,可在线阅读,更多相关《第四章多元回归分析精选文档.ppt(66页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章多元回归分析本讲稿第一页,共六十六页第一节第一节 多元线性回归多元线性回归第二节第二节 可化为多元线性回归的问题可化为多元线性回归的问题第三节第三节 曲线回归曲线回归第四节第四节 逐步回归逐步回归第五节第五节 岭回归岭回归本讲稿第二页,共六十六页第一节第一节 多元线性回归多元线性回归 Yi=b0+b1x1i+b2x2i+bpxpi+i Y1=b0+b1x11+b2x21+bpxp1+1 Y2=b0+b1x12+b2x22+bpxp2+2 Yn=b0+b1x1n+b2x2n+bpxpn+n本讲稿第三页,共六十六页令令 y1 1 x11 x21 xp1Y=y2 x=1 x12 x22 xp2
2、 yn 1 x1n x2n xpn b0 1 b1 2B=e=bp n则则 Y=XB+e本讲稿第四页,共六十六页一、多元线性回归模型的基本假定一、多元线性回归模型的基本假定解释变量解释变量x1,x2,xp是确定性变量,不是随机变量,而且解是确定性变量,不是随机变量,而且解释变量之间互不相关释变量之间互不相关随机误差项具有零均值和同方差随机误差项具有零均值和同方差 E(i)=0 var(i)=E(i-E(i)2=E(i)2=2随机误差项在不同样本点之间是相互独立的,不存在序列随机误差项在不同样本点之间是相互独立的,不存在序列相关相关 cov(i,j)=0 ij i,j=1,2,n cov(i,j
3、)=E(i-E(i)(j-E(j)=E(i j)=E(i)E(j)=0 本讲稿第五页,共六十六页随机误差项与解释变量之间不相关随机误差项与解释变量之间不相关 cov(xi,i)=0随机误差项服从零均值,同方差的正态分布随机误差项服从零均值,同方差的正态分布 iN(0,2)本讲稿第六页,共六十六页二、建立回归方程二、建立回归方程设设令令 即即本讲稿第七页,共六十六页本讲稿第八页,共六十六页多元线性回归矩阵形式多元线性回归矩阵形式多元线性回归模型多元线性回归模型 Y=XB+其中,其中,Y=(y1,y2,ym)T,B=(b0,b1,bp)T,=(1,2,.,m)T,Nm(0,2 En)本讲稿第九页,
4、共六十六页最小二乘法最小二乘法选择选择B使使误差平方和误差平方和 Q(B)=T=(YXB)T(YXB)达到最小。利用微积分的极值求法得达到最小。利用微积分的极值求法得正规方程正规方程 XT XB=XT YB的的估计量估计量B=(XTX)-1 XTY.称称 y=b0+b1 x1+b2 x2+bp xp 为为经验回归方程经验回归方程.称称Y=X B 为为因变量的估计值因变量的估计值.残差向量残差向量e=YY=(En H)Y 其中其中 H=X(XTX)-1XT.残差平方和残差平方和(SSE)eTe=YTY(B)T XT Y 本讲稿第十页,共六十六页估计量性质估计量性质(1)B=(XTX)-1XTY是
5、是B的线性无偏估计,的线性无偏估计,D(B)=2(XTX)-1(2)E(e)=0,D(e)=2(EH).(3)Cov(e,B)=0.(4)E(SSE)=(mp1)2.(5)在假设在假设 E(Y)=X B、D(Y)=2 E时,B的任一线性函数的任一线性函数ATB 的最小方差线性无偏估计为的最小方差线性无偏估计为aTB,其中,其中 A 是任一是任一p+1维向量维向量.(6)当当 Y Nm(XB,2 E)时,有以下结论时,有以下结论B Nm(B,2(XTX)-1),SSE与与B相互独立,相互独立,SSE/2 2(mp1).本讲稿第十一页,共六十六页三、多元线性回归模型的建模方法三、多元线性回归模型的
6、建模方法1.打开文件或新建文件打开文件或新建文件2.Analyze regression liner 3.建模方法建模方法 (1)enter:强迫进入法强迫进入法 (2)stepwise:逐步选择法逐步选择法 (3)remove:强迫消除法强迫消除法 (4)backward:向后剔除法向后剔除法 (5)forward:向前引入法向前引入法本讲稿第十二页,共六十六页 回归统计量回归统计量 (1)estimates:显示回归系数及相关的指标显示回归系数及相关的指标 (2)confidence intervals:显示未标准化回显示未标准化回归系数的置信区间归系数的置信区间 (3)covarianc
7、e matrix:未标准化回归系数未标准化回归系数的方差的方差协方差矩阵协方差矩阵 (4)model fit:模型检验模型检验 (5)R squared change (6)descriptive:显示变量的均值、标准差等显示变量的均值、标准差等 (7)Part and partial correlations:(8)collinearity diagnostics:共线性诊断共线性诊断 (9)Durbon_waston:D.w.检验统计量检验统计量本讲稿第十三页,共六十六页举例(一)举例(一)根据我国某地区乡镇企业根据我国某地区乡镇企业总产值、从业劳动者人数总产值、从业劳动者人数和固定资产原
8、值的历年资和固定资产原值的历年资料,求回归方程。(总产料,求回归方程。(总产值值-y,从业劳动者人数从业劳动者人数-x1,固定资产原值固定资产原值-x2)yearyx1x21988490.62826.5229.601989543.42909.3280.201990649.92999.7326.301991722.32969.6375.501992840.43112.9429.301993999.03234.7475.7019941433.03848.1575.00本讲稿第十四页,共六十六页本讲稿第十五页,共六十六页本讲稿第十六页,共六十六页举例(二)卫生陶瓷是我国住宅建筑、卫生陶瓷是我国住宅建
9、筑、饭店、宾馆、医疗卫生、饭店、宾馆、医疗卫生、体育、办公设施等建筑必体育、办公设施等建筑必不可少的卫生设备。合理不可少的卫生设备。合理地发展卫生陶瓷生产是国地发展卫生陶瓷生产是国民经济的需要。卫生陶瓷民经济的需要。卫生陶瓷产量产量y与城镇住宅建筑面积与城镇住宅建筑面积x1,医疗卫生机构建筑面积医疗卫生机构建筑面积x2,办公室建筑面积办公室建筑面积x3有关。有关。试根据历史资料建立回归试根据历史资料建立回归方程。方程。yx1x2x34.009.001.402.906.009.001.102.804.0010.001.103.103.0017.001.004.105.0016.001.105.0
10、07.0018.001.404.5010.0010.000.801.804.009.000.400.605.009.000.500.807.0010.000.902.1011.0012.001.102.108.0014.002.204.009.0019.002.204.0010.0021.002.403.6014.0020.002.204.2018.0022.002.304.6020.0021.002.104.0024.0028.002.304.3022.0033.002.404.7026.0050.002.606.00本讲稿第十七页,共六十六页 Y=0.488+0.576x1+4.769x2
11、-2.145x3 (4.245)(2.404)(-2.111)本讲稿第十八页,共六十六页举例(三)举例(三)在研究国家财政收入时,我们把财政收入按收入形式分为在研究国家财政收入时,我们把财政收入按收入形式分为各项税收收入、企业收入、债务收入、国家能源交通重点各项税收收入、企业收入、债务收入、国家能源交通重点建设基金收入、基本建设贷款归还收入、国家预算调节基建设基金收入、基本建设贷款归还收入、国家预算调节基金收入、其他收入等。为了建立国家财政收入回归模型,金收入、其他收入等。为了建立国家财政收入回归模型,我们以财政收入我们以财政收入y为因变量。自变量如下:为因变量。自变量如下:x1工业总产值,工
12、业总产值,x2农业总产值,农业总产值,x3建筑业总产值,建筑业总产值,x4人口数,人口数,x5社会商品社会商品零售总额,零售总额,x6受灾面积受灾面积(数据见(数据见spssex/例子例子3)本讲稿第十九页,共六十六页yearyx1x2x3x4x5x619781121.1042371397569962591558.60507619791103.3046811698645975421800.00393719801085.2051541923767987052140.00445319811089.50540021817471000722350.00397919821124.005811248391
13、21016542570.00331319831249.006461275010351030082849.40347119841501.907617321412631043573376.40318919851866.409716361916561058514305.00443719862260.3011194401320381075074950.00471419872368.9013813417624311093005820.00420919882628.0018224586529671110267440.00508719892947.9022017653528341127048101.4046
14、9919903244.8023851766230351143338300.103847本讲稿第二十页,共六十六页 Y=-13534.1+0.209x1-0.06x2+0.763x3+0.141x4-0.855x5+0.227x6 (3.292)(-0.416)(2.341)(2.703)(-2.932)(2.595)本讲稿第二十一页,共六十六页五、回归方程的效果的检验五、回归方程的效果的检验方程显著性检验方程显著性检验参数显著性检验参数显著性检验拟合优度检验(复相关系数、偏相关系数)拟合优度检验(复相关系数、偏相关系数)对假设理论的检验对假设理论的检验本讲稿第二十二页,共六十六页例2中,方差分
15、析表为:y本讲稿第二十三页,共六十六页1.方程显著性检验方程显著性检验(F检验检验)F检验是以方差分析为基础检验是以方差分析为基础,对回归总体线性关系是否对回归总体线性关系是否显著的一种假设检验显著的一种假设检验,是解释模型中是解释模型中被解释变量与所有被解释变量与所有解释变量之间解释变量之间的线性关系在总体上是否显著的方法的线性关系在总体上是否显著的方法利用利用F统计量进行总体线性显著性检验的步骤如下统计量进行总体线性显著性检验的步骤如下:(1)提出关于提出关于P个总体参数的假设个总体参数的假设 H0:b0=b1=b2=bp=0,H1:至少有一个至少有一个bi非零非零本讲稿第二十四页,共六十
16、六页 (3)检验检验 给定显著性水平给定显著性水平,查查F分布表分布表 若若FF,拒绝拒绝H0,表明回归总体有显著性关系表明回归总体有显著性关系.若若Ft /2,说明拒绝原假设说明拒绝原假设若若tregression-linearPlot子对话框中选子对话框中选Histogram或或p-p图图本讲稿第三十七页,共六十六页残差序列的随机性分析:残差序列的随机性分析:可以绘制残差序列和对应的预测值序列的散可以绘制残差序列和对应的预测值序列的散点图。如果残差序列是随机的,那么残差序点图。如果残差序列是随机的,那么残差序列应与预测值序列无关,残差序列点将随机列应与预测值序列无关,残差序列点将随机地分布
17、在经过零的一条直线上下。地分布在经过零的一条直线上下。在线性回归在线性回归Plots对话框中的源变量表中,选对话框中的源变量表中,选择择SRESID(学生氏残差)做(学生氏残差)做Y轴,选轴,选ZPRED(标准化预测值)做(标准化预测值)做X轴轴本讲稿第三十八页,共六十六页残差序列的独立性分析:残差序列的独立性分析:如果回归模型中的误差项不是不相关,则称为自相关或序列相关。如果回归模型中的误差项不是不相关,则称为自相关或序列相关。Durbin-Watson检验是最常见的自相关检验方法,但它仅适用于检验是最常见的自相关检验方法,但它仅适用于一阶自相关,即形如一阶自相关,即形如i=i-1+ui。由
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 多元 回归 分析 精选 文档
限制150内