应用回归分析-(spss软件的应用)论文材料.doc
《应用回归分析-(spss软件的应用)论文材料.doc》由会员分享,可在线阅读,更多相关《应用回归分析-(spss软件的应用)论文材料.doc(29页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、-+ 楚雄师范学院2012年应用回归分析期末论文 题 目 影响成品钢材需求量的回归分析 姓 名 韩 金 伟系 (院) 数学系09级01班专 业 数学与应用数学 学 号20091021135 2012 年 6 月 23日 题目:影响成品钢材需求量的回归分析摘要:随着社会经济的不断发展,科学技术的不断进步,统计方法越来越成为人们必不可收的工具盒手段。应用回归分析是其中的一个重要分支,本着国家经济水平的不断提高,我们采用回归分析的方法对我国成品钢材的需求量进行分析应用。为了使分析的模型具有社会实际意义,我们引用了19801998年的成品钢材、原油、生铁、原煤、发电量、铁路货运量、固定资产投资额、居民
2、消费、政府消费9个不同的量来进行回归分析。通过建立回归模型充分说明成品钢材需求量与其他8个变量的关系,以及我国社会经济的实际发展情况和意义。关键字:线性回归 回归分析 社会经济 回归模型 成品钢材 投资 多元回归 国家经济 社会发展 目 录第1章 题目叙述1第2章 问题假设1第3章 问题分析2第4章 数据的预处理34.1 曲线统计图34.2 散点统计图44.3 样本的相关系数4第5章 回归模型的建立5第6章 回归模型的检验66.1 F检验66.2 T检验及模型的T检验分析76.2.1 T检验76.2.2 T检验分析76.3 偏相关性10第7章 违背模型基本假设的情况117.1 异方差性的检验1
3、17.1.1 残差图检验117.1.2 怀特(White)检验127.2 自相关性的检验127.3 多元加权最小二乘估计127.3.1 权函数自变量的选取137.3.2 Weight Estimate估计幂指数m137.3.3 加权最小二乘估计拟合14第8章 自变量选择与逐步回归158.1 前进逐步回归158.2 后退逐步回归17第9章 多重共线性的情形及处理189.1 多重共线性的诊断189.2 多重共线性的消除20第10章 回归模型总结24参考文献25 第1章 题目叙述 理论上认为影响成品钢材的需求量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,
4、收集了我国成品钢材的需求量,选择与其相关的八个因素:原油产量、生铁产量、原煤产量、发电量、铁路货运量、固定资产投资额、居民消费、政府消费作为影响变量,19801998年的有关数据如下表。本题旨在通过建立这些经济变量的线性模型来说明影响成品钢材需求量的原因。 数据来源:易丹辉.数据分析与EViews应用.中国人民大学出版社.2008(教材第85页) 原始数据(中国统计年鉴):年份成品钢材(万吨)原油(万吨)生铁(万吨)原煤(亿吨)发电量(亿千瓦时)铁路货运量(万吨)固定资产投资额(亿元)居民消费(亿元)19802716.2105953802.46.23006.2111279910.92317.1
5、19812670.1101223416.66.23092.71076739612604.1198229021021235516.6632771134951230.42867.9198330721060737387.1535141187841430.13182.51984337211461.340017.8937701240741832.93674.51985369312489.543848.7241071307092543.245891986405813068.850648.9444951356353120.65175198743561341455039.2849731406533791.75
6、961.21988468913704.657049.854521449484753.87633.11989485913764.1582010.5458481514894410.48523.51990515313830.6623810.8621215068145179113.21991563814009.2676510.8767751528935594.510315.91992669714209.7758911.1675391576278080.112459.81993771614523.7873911.51839516266313072.315682.41994848214608.297411
7、2.4928116309317042.120809.819958979.815004.9410529.2713.6110070.316588520019.326944.519969338.0215733.3910722.513.9710813.11688032297432152.319979978.9316074.1411511.4113.7311355.5316973422913.534854.6第2章 问题假设 为了问题的简洁明了,现对题目中的变量给出以下假设:中国成品钢材的需求量为(万吨)、原油产量(万吨)、生铁产量(万吨)、原煤产量(亿吨)、发电量(亿千瓦时)、铁路货运量(万吨)、固定
8、资产投资额(亿元)、居民消费(亿元)、政府消费(亿元)作为影响变量,而且本题收集的数据均为定量变量,其符号和经济意义如下表:变量符号代表意义中国成品钢材的需求量为(万吨)成品钢材需求总量原油产量(万吨)原油工业发展水平生铁产量(万吨)生铁工业发展水平原煤产量(亿吨)原煤工业发展水平发电量(亿千瓦时)发电技术水平铁路货运量(万吨)运输产业水平固定资产投资额(亿元)固定资产支出水平居民消费(亿元)居民支出水平政府消费(亿元)政府支出水平第3章 问题分析 在上述问题中,中国成品钢材的需求量(万吨)的影响因素不只是原油产量(万吨),还有生铁产量(万吨)、原煤产量(亿吨)、发电量(亿千瓦时)、铁路货运量
9、(万吨)、固定资产投资额(亿元)、居民消费(亿元)、政府消费(亿元)等,这样因变量就与多个自变量有关。因此,我们就可以采用多元线性回归进行问题的分析。 多元线性回归模型的基本形式:设随机变量与一般变量的理论线性回归模型为: 其中,是个未知参数,称为回归常数,称为回归系数。称为被解释变量(因变量),而是个可以精确测量并可控制的一般变量,称为解释变量(自变量)。是随机误差,与一元线性回归一样,对随机误差项我们常假定 称 为理论回归方程。第4章 数据的预处理4.1 曲线统计图 分析:从曲线统计图上我们可以大致的来看,变量和因变量在1980年到1986年的增长速度都相对平稳没有明显的增势;从1986年
10、到1993年,个变量开始缓慢增长;从1993年到1998年,增长的幅度开始加大了。的曲线近似为一条水平的直线,这两个变量分别表示原油和原煤的量,可能受到资源和政策的限制,因而增长的速度非常缓慢。从图中可以明显看到随着年限的增加,我国的各种产业和支出水平都随之逐渐增长。 分析:从散点统计图上我们可以细致的来看,变量(铁路运货量)的变化最为明显,还可以清楚的看到1981年,1991年,1998年,因为一些特殊事件而导致的铁路运输量降低。与在1980年到1986年的增长速度都相对平稳没有明显的增势,从1986年到1993年,个变量开始缓慢增长;从1993年到1998年,增长的幅度开始加大了。但是(原
11、油)与(原煤)的产量却始终保持相对平稳的增长趋势,而却增长速度非常的缓慢,这可能是受到了资源的限制和国家政策的影响。从散点图中可以很明显的看到各年的真是数据,还可以看出随着年限的增加,我国的各种产业和支出水平都随之逐渐增长。4.3 样本的相关系数 分析:从样本的相关系数表来看,各变量的相关系数都在0.9以上,说明自变量与因变量有高度的线性相关性,适合做与8个自变量的多元线性回归。(说明:本表格是由EViews软件计算得出,但由于不能导出,所以通过保存成图片后经WPS截图工具截得。)第5章 回归模型的建立 将原始数据导入到spss19.0(简体中文版)的数据框中,然后用spss19.0软件回归线
12、性分析得到下列表:模型汇总模型RR 方调整 R 方标准 估计的误差11.000a.999.998113.19930a. 预测变量: (常量), x8, x5, x1, x3, x6, x2, x7, x4。 分析:从模型汇总表中可以看出,复相关系数,决定系数,由决定系数看回归方程高度显著。Anovab模型平方和df均方FSig.1回归1.291E8816139672.5601259.526.000a残差128140.8061012814.081总计1.292E818a. 预测变量: (常量), x8, x5, x1, x3, x6, x2, x7, x4。b. 因变量: y 分析:从方差分析表
13、,P值=0.000,表明回归方程高度显著,说明整体上对有高度显著的线性影响。系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-381.485912.146-.418.685x1.122.107.0881.134.283x2.125.187.135.668.519x3-149.154121.354-.141-1.229.247x4.653.277.7232.359.040x5.003.023.024.131.898x6.081.042.2601.932.082x7-.120.047-.522-2.570.028x8.394.239.4341.646.131a. 因变量: y
14、分析:从系数表中可以得到对8个自变量的线性回归方程为 从回归方程中可以看到,对成品钢材需求量起正影响,对成品钢材需求量起负影响。从实际社会生活来看,原煤生产水平和居民的消费水平提高,都会促进成品钢材的需求量,应该和成品钢材的需求量成正相关,这与定性分析的结果不一致。为此,我们对它进行更深层次的分析。第6章 回归模型的检验6.1 F检验 Anovab模型平方和df均方FSig.1回归1.291E8816139672.5601259.526.000a残差128140.8061012814.081总计1.292E818a. 预测变量: (常量), x8, x5, x1, x3, x6, x2, x7
15、, x4。b. 因变量: y 分析:从表中输出结果可以看出,Sig即显著性P值,由,P值=0.000,可知此回归方程高度显著,即做出8个自变量整体对因变量y产生显著线性影响的判断所犯错误的概率仅为0.000。6.2 T检验及模型的T检验分析6.2.1 T检验系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间B标准 误差试用版下限上限1(常量)-381.485912.146-.418.685-2413.8741650.904x1.122.107.0881.134.283-.118.361x2.125.187.135.668.519-.292.542x3-149.154121.3
16、54-.141-1.229.247-419.547121.239x4.653.277.7232.359.040.0361.270x5.003.023.024.131.898-.049.055x6.081.042.2601.932.082-.012.175x7-.120.047-.522-2.570.028-.224-.016x8.394.239.4341.646.131-.139.927a. 因变量: y 分析:通过看上面的T检验表可以发现,在显著性水平时,只有的Sig(收尾概率)小于0.05,通过了显著性检验。回归方程B的95.0%置信区间上下限给定如表中所示。6.2.2 T检验分析 为了尽
17、可能的保留合理变量,我们就针对逐个变量给以T检验分析,逐步剔除不合理的变量,使回归模型更完善。因此我们首先剔除Sig最大的变量,再做回归分析的T检验如下:系数a模型非标准化系数标准系数B标准 误差试用版tSig.1(常量)-274.526387.581-.708.493x1.133.066.0962.014.069x2.121.176.130.686.507x3-137.53479.000-.130-1.741.110x4.678.197.7503.443.005x6.082.040.2632.082.061x7-.124.037-.537-3.348.007x8.388.224.4271.7
18、31.111a. 因变量: y分析:剔除后,在显著性水平时,有的Sig(收尾概率)小于0.05,通过了显著性检验。此时我们发现,剔除了后,通过T检验的变量增多了,这是一个很好的结果。因此我们再剔除Sig最大的变量,再用其他通过了T检验的变量做回归分析的T检验如下:系数a模型非标准化系数标准系数B标准 误差试用版tSig.1(常量)-279.142378.881-.737.475x1.154.057.1122.714.019x3-151.03474.804-.143-2.019.066x4.772.137.8555.625.000x6.100.030.3183.320.006x7-.135.03
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 利用 运用 回归 分析 spss 软件 论文 材料
限制150内