多元线性回归分析的实例研究.doc
《多元线性回归分析的实例研究.doc》由会员分享,可在线阅读,更多相关《多元线性回归分析的实例研究.doc(4页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、科技信息 IT 论坛 SCIENCE & TECHNOLOGYINFORMATION 2009 年 第 9 期 【 摘 要 】 通过运用 多元线性回归分析的实例研究 张宇 山 ( 广东商 学院 数学 与计 算科 学系 广 东 广州 510320) SAS 统计软件 , 针对一实际例子 , 编程建立线性 回归模型 , 并通过 方差分析和共线性判断等对模型参数进行检 验 , 调整 模型形式 , 最后得到与原数据比较拟和的模型 。 【 关键词 】 SAS; 多元线性回归 ; 多重共线性 ; 方差膨胀因子 【 Abstract】 By making programmings in SAS, this
2、paper sets up three linear regression models based on real-world data. After analyzing their respective variance and estimating multicollinearity of variables, the models are adjusted to be more adaptive to the data. 【 Key words】 SAS; Linear analysis; Multicollinearity; Variance inflation factor 1 统
3、计 软件 SAS 简介 某成品的密度可作为衡量该产品的指标 它由生 产过程中的 个 SAS 是美国 SAS 软件研究所研制的一套大型集成应用软件系统 , 变量所决定 , 5 具有完备的数据存取、数据管理、数据分析和数据展现功能。 尤其是创 业产 品 统 计分析系统部 分,由于其具有 强大的数据分析 能力,在数 据处理和统计分析领域,被誉为国际上的标准软件和最权威的优秀统 计软件包, 广泛应用于政府行 政管理、科研 、教育、生产 和金融等不同 领域,发挥着重要的作用。 SAS 系统操作以编程为主,人机对话界面不 太友好,系统地学习和掌握 SAS,需要花费一定的时间和精力。 但无论 从速度或功能等
4、各个方面, SAS 作为专业统计软件中的巨无霸, 现在 还很难有什么统计软件足以与之抗衡 。 本文使用的是 SAS For Windows 6.12 。 2 实例背景 : X1 = 该成品所含水量 X2 = 该成品生产过程中所包含的重复使用材料数 3 4 5 现有 48 组数据如表 1。 3 回归分析 首先对 48 组数据进行简单的描述统计量的计算 , 3.1 模型( 1) 见表 2。 本文使 用的数据 来源于 料库。 中 Industry 的数据资 表 1 首先从最简单的线性回归模型入手,假设回归模型形式如下: y=0+1x1+2x2+3x3+4x4+5x5+ ( 1 ) 54 X1 X2
5、 X3 X4 X5 Y X1 X2 X3 X4 X5 Y 0 800 135 578 13.195 104 75 800 135 550 12.745 103 0 800 135 578 13.195 102 75 800 135 550 12.745 111 0 800 135 578 13.195 100 75 800 135 550 12.745 111 0 800 135 578 13.195 96 75 800 135 550 12.745 107 0 800 135 578 13.195 93 75 800 135 550 12.745 112 0 800 135 578 13.1
6、95 103 75 800 135 550 12.745 106 0 800 150 585 13.180 118 75 800 150 595 13.885 111 0 800 150 585 13.180 113 75 800 150 595 13.885 107 0 800 150 585 13.180 107 75 800 150 595 13.885 104 0 800 150 585 13.180 114 75 800 150 595 13.885 103 0 800 150 585 13.180 110 75 800 150 595 13.885 104 0 800 150 58
7、5 13.180 114 75 800 150 595 13.885 103 0 1000 135 590 13.440 97 75 1000 135 530 11.705 116 0 1000 135 590 13.440 87 75 1000 135 530 11.705 108 0 1000 135 590 13.440 92 75 1000 135 530 11.705 104 0 1000 135 590 13.440 85 75 1000 135 530 11.705 116 0 1000 135 590 13.440 94 75 1000 135 530 11.705 112 0
8、 1000 135 590 13.440 102 75 1000 135 530 11.705 111 0 1000 150 590 13.600 104 75 1000 150 590 13.835 110 0 1000 150 590 13.600 102 75 1000 150 590 13.835 115 0 1000 150 590 13.600 101 75 1000 150 590 13.835 114 0 1000 150 590 13.600 104 75 1000 150 590 13.835 114 0 1000 150 590 13.600 98 75 1000 150
9、 590 13.835 114 0 1000 150 590 13.600 101 75 1000 150 590 13.835 114 生产过程的平均温度 烘 干炉中的温度 原材料的质量指标 科技信息 IT 论坛 SCIENCE & TECHNOLOGYINFORMATION 2009 年 第 9 期 其中 x1, ,x5 表示数据中的自变量 , y 为表示产品密度的因变量 。 fii 就称为 2 Xi 的方差膨胀因子,它与 Ri2 有如下关系 : 2 进行方差分析和参数检验,得到结果见表 3 。 时, 当 Ri 0,即 Xi 与其 他自变量 不线性相关 时, VIFi=1; 当 0 Ri
10、1 ;当 2 ,即 与其他自变量完全线性相关时, 。 从图 2 结果可以看到 ,决定系数 R-Square = 0.6375, 表明方程模 VIFi 1 Ri 1 Xi VIFi= 拟得并不理 想,回归方程的显著性检验 p 值虽然较理想 (.0001),但回 所有自 变量中 最大的 VIFi 通常用 来作为 多重共 线性严 重程 度的 指 归系数的显著性检验表明除了常数项和 x3 的系数高度显著外 , 其余 标,如果 maxVIFi 10 ,说明共线性可能严重影响了最小二 乘估计值, 就要进行自变量的筛选等来调整原方程。 系数都不十分显著,特别是 看到: x4 和 x5 。 另外我们通过绘制残
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 线性 回归 分析 实例 研究
限制150内