多重线性回归与相关.ppt
《多重线性回归与相关.ppt》由会员分享,可在线阅读,更多相关《多重线性回归与相关.ppt(43页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多重线性回归与相关现在学习的是第1页,共43页content第一节第一节多重线性回归的概念与统计推断多重线性回归的概念与统计推断第二节假设检验及其评价第三节第三节复相关系数与偏相关系数复相关系数与偏相关系数第四节自变量筛选第五节第五节多元线性回归的应用与注意事项多元线性回归的应用与注意事项现在学习的是第2页,共43页目的:作出以多个自变量估计应变量的多元线性回归方程。资料:应变量为定量指标;自变量全部或大部分为定量指标,若有少量定性或等级指标需作转换。用途:解释和预报。更精确意义:由于事物间的联系常常是多方面的,一个应变量的变化可能受到其它多个自变量的影响,如糖尿病人的血糖变化可能受胰岛素、糖
2、化血红蛋白、血清总胆固醇、甘油三脂等多种生化指标的影响。现在学习的是第3页,共43页第一节第一节多重线性回归的概念与多重线性回归的概念与统计推断统计推断现在学习的是第4页,共43页变量:变量:应变量应变量1个,自变量个,自变量k 个,共个,共k+1个。个。样本含量:样本含量:n数据格式见表数据格式见表13-1回归模型一般形式:回归模型一般形式:一、数据与多元线性回归模型一、数据与多元线性回归模型现在学习的是第5页,共43页多元回归分析数据格式条件条件现在学习的是第6页,共43页车流(X1)气温(X2)气湿(X3)风速(X4)一氧化氮(Y)车流(X1)气温(X2)气湿(X3)风速(X4)一氧化氮
3、(Y)130020.0800.450.06694822.5692.000.005144423.0570.500.076144021.5792.400.01178626.5641.500.001108428.5593.000.003165223.0840.400.170184426.0731.000.140175629.5720.900.156111635.0922.800.039175430.0760.800.120165620.0831.450.059120022.5691.800.040153623.0571.500.087150021.8770.600.12096024.8671.500
4、.039120027.0581.700.100178423.3830.900.222147627.0650.650.129149627.0650.650.145182022.0830.400.135106026.0581.830.029143628.0682.000.099143628.0682.000.099现在学习的是第7页,共43页一一般般步步骤骤建立回归方程(样本)(2)检验并评价回归方程检验并评价回归方程及各自变量的作用大小及各自变量的作用大小现在学习的是第8页,共43页二、多元线性回归方程的建立样本估计而得的多重线性回归方程bj为自变量Xj 的偏回归系数(partialregres
5、sioncoefficient),是j的估计值,表示当方程中其他自变量保持常量时,自变量Xj变化一个计量单位,反应变量Y的平均值变化的单位数。现在学习的是第9页,共43页求偏导数(一阶)原理最小二乘法统计软件包统计软件包现在学习的是第10页,共43页第二节假设检验及其评价1.方差分析法:方差分析法:(一)对回归方程现在学习的是第11页,共43页多元线性回归方差分析表现在学习的是第12页,共43页变异来源自由度SSMSFP回归模型4 40.063960.063960.015990.0159917.5917.59.0001.0001残差19190.017270.017270.000909030.0
6、0090903总变异23230.081230.08123表13-2显示,P 0.0001,拒绝H0。说明从整体上而言,用这四个自变量构成的回归方程解释空气中NO浓度的变化是有统计学意义的。现在学习的是第13页,共43页偏回归系数的偏回归系数的t检验检验偏回归系数的t检验是在回归方程具有统计学意义的情况下,检验某个总体偏回归系数等于零的假设,以判断是否相应的那个自变量对回归确有贡献现在学习的是第14页,共43页利用SAS对例13-1的四个偏回归系数进行t检验与标准化偏回归系数的结果如表13-3所示。变量自由度回归系数标准误t值P值标准化偏回归系数截距1-0.141660.06916-2.050.
7、05460X110.000116190.000027484.230.00050.59249X210.004490.001902.360.02890.27274X31-0.000006550.00069083-0.010.9925-0.00110X41-0.034680.01081-3.210.0046-0.44770现在学习的是第15页,共43页第三节第三节复相关系数与偏相关系数复相关系数与偏相关系数确定系数、复相关系数与调整确定系数复相关系数的平方称为确定系数(coefficientofdetermination),或决定系数,记为R2,用以反映线性回归模型能在多大程度上解释反应变量Y的变异
8、性。其定义为现在学习的是第16页,共43页复相关系数:复相关系数:确定系数的算术平方根确定系数的算术平方根对例13-1,由方差分析表可得:SSR=0.06396SSE=0.01727SST=0.08123表示变量Y与k个自变量(X1,X2,Xk)的线性相关的密切程度。说明,用包含气车流量、气温、气湿与风速这四个自变量的回归方程可解释交通点空气NO浓度变异性的78.74%。现在学习的是第17页,共43页表示交通点空气NO浓度与气车流量、气温、气湿与风速等四个变量的复相关系数为0.8703现在学习的是第18页,共43页调整的R2(AdjustedR-Square)当回归方程中包含有很多自变量,即使
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多重 线性 回归 相关
限制150内