欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    应用回归分析-(spss软件的应用)论文材料.doc

    • 资源ID:2878528       资源大小:1.02MB        全文页数:29页
    • 资源格式: DOC        下载积分:8金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要8金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    应用回归分析-(spss软件的应用)论文材料.doc

    -+ 楚雄师范学院2012年应用回归分析期末论文 题 目 影响成品钢材需求量的回归分析 姓 名 韩 金 伟系 (院) 数学系09级01班专 业 数学与应用数学 学 号20091021135 2012 年 6 月 23日 题目:影响成品钢材需求量的回归分析摘要:随着社会经济的不断发展,科学技术的不断进步,统计方法越来越成为人们必不可收的工具盒手段。应用回归分析是其中的一个重要分支,本着国家经济水平的不断提高,我们采用回归分析的方法对我国成品钢材的需求量进行分析应用。为了使分析的模型具有社会实际意义,我们引用了19801998年的成品钢材、原油、生铁、原煤、发电量、铁路货运量、固定资产投资额、居民消费、政府消费9个不同的量来进行回归分析。通过建立回归模型充分说明成品钢材需求量与其他8个变量的关系,以及我国社会经济的实际发展情况和意义。关键字:线性回归 回归分析 社会经济 回归模型 成品钢材 投资 多元回归 国家经济 社会发展 目 录第1章 题目叙述1第2章 问题假设1第3章 问题分析2第4章 数据的预处理34.1 曲线统计图34.2 散点统计图44.3 样本的相关系数4第5章 回归模型的建立5第6章 回归模型的检验66.1 F检验66.2 T检验及模型的T检验分析76.2.1 T检验76.2.2 T检验分析76.3 偏相关性10第7章 违背模型基本假设的情况117.1 异方差性的检验117.1.1 残差图检验117.1.2 怀特(White)检验127.2 自相关性的检验127.3 多元加权最小二乘估计127.3.1 权函数自变量的选取137.3.2 Weight Estimate估计幂指数m137.3.3 加权最小二乘估计拟合14第8章 自变量选择与逐步回归158.1 前进逐步回归158.2 后退逐步回归17第9章 多重共线性的情形及处理189.1 多重共线性的诊断189.2 多重共线性的消除20第10章 回归模型总结24参考文献25 第1章 题目叙述 理论上认为影响成品钢材的需求量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了我国成品钢材的需求量,选择与其相关的八个因素:原油产量、生铁产量、原煤产量、发电量、铁路货运量、固定资产投资额、居民消费、政府消费作为影响变量,19801998年的有关数据如下表。本题旨在通过建立这些经济变量的线性模型来说明影响成品钢材需求量的原因。 数据来源:易丹辉.数据分析与EViews应用.中国人民大学出版社.2008(教材第85页) 原始数据(中国统计年鉴):年份成品钢材(万吨)原油(万吨)生铁(万吨)原煤(亿吨)发电量(亿千瓦时)铁路货运量(万吨)固定资产投资额(亿元)居民消费(亿元)19802716.2105953802.46.23006.2111279910.92317.119812670.1101223416.66.23092.71076739612604.1198229021021235516.6632771134951230.42867.9198330721060737387.1535141187841430.13182.51984337211461.340017.8937701240741832.93674.51985369312489.543848.7241071307092543.245891986405813068.850648.9444951356353120.65175198743561341455039.2849731406533791.75961.21988468913704.657049.854521449484753.87633.11989485913764.1582010.5458481514894410.48523.51990515313830.6623810.8621215068145179113.21991563814009.2676510.8767751528935594.510315.91992669714209.7758911.1675391576278080.112459.81993771614523.7873911.51839516266313072.315682.41994848214608.2974112.4928116309317042.120809.819958979.815004.9410529.2713.6110070.316588520019.326944.519969338.0215733.3910722.513.9710813.11688032297432152.319979978.9316074.1411511.4113.7311355.5316973422913.534854.6第2章 问题假设 为了问题的简洁明了,现对题目中的变量给出以下假设:中国成品钢材的需求量为(万吨)、原油产量(万吨)、生铁产量(万吨)、原煤产量(亿吨)、发电量(亿千瓦时)、铁路货运量(万吨)、固定资产投资额(亿元)、居民消费(亿元)、政府消费(亿元)作为影响变量,而且本题收集的数据均为定量变量,其符号和经济意义如下表:变量符号代表意义中国成品钢材的需求量为(万吨)成品钢材需求总量原油产量(万吨)原油工业发展水平生铁产量(万吨)生铁工业发展水平原煤产量(亿吨)原煤工业发展水平发电量(亿千瓦时)发电技术水平铁路货运量(万吨)运输产业水平固定资产投资额(亿元)固定资产支出水平居民消费(亿元)居民支出水平政府消费(亿元)政府支出水平第3章 问题分析 在上述问题中,中国成品钢材的需求量(万吨)的影响因素不只是原油产量(万吨),还有生铁产量(万吨)、原煤产量(亿吨)、发电量(亿千瓦时)、铁路货运量(万吨)、固定资产投资额(亿元)、居民消费(亿元)、政府消费(亿元)等,这样因变量就与多个自变量有关。因此,我们就可以采用多元线性回归进行问题的分析。 多元线性回归模型的基本形式:设随机变量与一般变量的理论线性回归模型为: 其中,是个未知参数,称为回归常数,称为回归系数。称为被解释变量(因变量),而是个可以精确测量并可控制的一般变量,称为解释变量(自变量)。是随机误差,与一元线性回归一样,对随机误差项我们常假定 称 为理论回归方程。第4章 数据的预处理4.1 曲线统计图 分析:从曲线统计图上我们可以大致的来看,变量和因变量在1980年到1986年的增长速度都相对平稳没有明显的增势;从1986年到1993年,个变量开始缓慢增长;从1993年到1998年,增长的幅度开始加大了。的曲线近似为一条水平的直线,这两个变量分别表示原油和原煤的量,可能受到资源和政策的限制,因而增长的速度非常缓慢。从图中可以明显看到随着年限的增加,我国的各种产业和支出水平都随之逐渐增长。 分析:从散点统计图上我们可以细致的来看,变量(铁路运货量)的变化最为明显,还可以清楚的看到1981年,1991年,1998年,因为一些特殊事件而导致的铁路运输量降低。与在1980年到1986年的增长速度都相对平稳没有明显的增势,从1986年到1993年,个变量开始缓慢增长;从1993年到1998年,增长的幅度开始加大了。但是(原油)与(原煤)的产量却始终保持相对平稳的增长趋势,而却增长速度非常的缓慢,这可能是受到了资源的限制和国家政策的影响。从散点图中可以很明显的看到各年的真是数据,还可以看出随着年限的增加,我国的各种产业和支出水平都随之逐渐增长。4.3 样本的相关系数 分析:从样本的相关系数表来看,各变量的相关系数都在0.9以上,说明自变量与因变量有高度的线性相关性,适合做与8个自变量的多元线性回归。(说明:本表格是由EViews软件计算得出,但由于不能导出,所以通过保存成图片后经WPS截图工具截得。)第5章 回归模型的建立 将原始数据导入到spss19.0(简体中文版)的数据框中,然后用spss19.0软件回归线性分析得到下列表:模型汇总模型RR 方调整 R 方标准 估计的误差11.000a.999.998113.19930a. 预测变量: (常量), x8, x5, x1, x3, x6, x2, x7, x4。 分析:从模型汇总表中可以看出,复相关系数,决定系数,由决定系数看回归方程高度显著。Anovab模型平方和df均方FSig.1回归1.291E8816139672.5601259.526.000a残差128140.8061012814.081总计1.292E818a. 预测变量: (常量), x8, x5, x1, x3, x6, x2, x7, x4。b. 因变量: y 分析:从方差分析表,P值=0.000,表明回归方程高度显著,说明整体上对有高度显著的线性影响。系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-381.485912.146-.418.685x1.122.107.0881.134.283x2.125.187.135.668.519x3-149.154121.354-.141-1.229.247x4.653.277.7232.359.040x5.003.023.024.131.898x6.081.042.2601.932.082x7-.120.047-.522-2.570.028x8.394.239.4341.646.131a. 因变量: y 分析:从系数表中可以得到对8个自变量的线性回归方程为 从回归方程中可以看到,对成品钢材需求量起正影响,对成品钢材需求量起负影响。从实际社会生活来看,原煤生产水平和居民的消费水平提高,都会促进成品钢材的需求量,应该和成品钢材的需求量成正相关,这与定性分析的结果不一致。为此,我们对它进行更深层次的分析。第6章 回归模型的检验6.1 F检验 Anovab模型平方和df均方FSig.1回归1.291E8816139672.5601259.526.000a残差128140.8061012814.081总计1.292E818a. 预测变量: (常量), x8, x5, x1, x3, x6, x2, x7, x4。b. 因变量: y 分析:从表中输出结果可以看出,Sig即显著性P值,由,P值=0.000,可知此回归方程高度显著,即做出8个自变量整体对因变量y产生显著线性影响的判断所犯错误的概率仅为0.000。6.2 T检验及模型的T检验分析6.2.1 T检验系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间B标准 误差试用版下限上限1(常量)-381.485912.146-.418.685-2413.8741650.904x1.122.107.0881.134.283-.118.361x2.125.187.135.668.519-.292.542x3-149.154121.354-.141-1.229.247-419.547121.239x4.653.277.7232.359.040.0361.270x5.003.023.024.131.898-.049.055x6.081.042.2601.932.082-.012.175x7-.120.047-.522-2.570.028-.224-.016x8.394.239.4341.646.131-.139.927a. 因变量: y 分析:通过看上面的T检验表可以发现,在显著性水平时,只有的Sig(收尾概率)小于0.05,通过了显著性检验。回归方程B的95.0%置信区间上下限给定如表中所示。6.2.2 T检验分析 为了尽可能的保留合理变量,我们就针对逐个变量给以T检验分析,逐步剔除不合理的变量,使回归模型更完善。因此我们首先剔除Sig最大的变量,再做回归分析的T检验如下:系数a模型非标准化系数标准系数B标准 误差试用版tSig.1(常量)-274.526387.581-.708.493x1.133.066.0962.014.069x2.121.176.130.686.507x3-137.53479.000-.130-1.741.110x4.678.197.7503.443.005x6.082.040.2632.082.061x7-.124.037-.537-3.348.007x8.388.224.4271.731.111a. 因变量: y分析:剔除后,在显著性水平时,有的Sig(收尾概率)小于0.05,通过了显著性检验。此时我们发现,剔除了后,通过T检验的变量增多了,这是一个很好的结果。因此我们再剔除Sig最大的变量,再用其他通过了T检验的变量做回归分析的T检验如下:系数a模型非标准化系数标准系数B标准 误差试用版tSig.1(常量)-279.142378.881-.737.475x1.154.057.1122.714.019x3-151.03474.804-.143-2.019.066x4.772.137.8555.625.000x6.100.030.3183.320.006x7-.135.032-.585-4.143.001x8.403.218.4441.849.089a. 因变量: y 分析:剔除后,在显著性水平时,有的Sig(收尾概率)小于0.05,通过了显著性检验。此时我们发现,剔除了后,通过T检验的变量又增多了一个。因此我们再剔除Sig最大的变量,再做回归分析的T检验如下:系数a模型非标准化系数标准系数B标准 误差试用版tSig.1(常量)-108.818400.265-.272.790x1.150.062.1082.423.031x3-248.80057.640-.235-4.316.001x4.978.0881.08211.120.000x6.127.028.4054.462.001x7-.084.019-.365-4.391.001a. 因变量: y 分析:剔除后,在显著性水平时,剩余变量的Sig(收尾概率)都小于0.05,全部通过了显著性T检验。模型汇总模型RR 方调整 R 方标准 估计的误差1.999a.999.998115.02599a. 预测变量: (常量), x7, x1, x3, x6, x4。分析:以做回归分析的输出表来看,决定系数,由决定系数看回归模型仍然具有高度的显著性。Anovab模型平方和df均方FSig.1回归1.291E852.581E71951.080.000a残差172002.7331313230.979总计1.292E818a. 预测变量: (常量), x7, x1, x3, x6, x4。b. 因变量: y 分析:由,P值=0.000,回归模型通过了F检验,表明8个自变量整体对因变量y产生显著线性影响的判断所犯错误的概率仅为0.000。说明整体上对有高度显著的线性影响。表中第二列是我们的回归方程参数估计值,由此可以得到对5个自变量的线性回归方程为: 从回归方程中可以看到,对成品钢材需求量起正影响,对成品钢材需求量起负影响。此时回归方程虽然通过了F,T检验,但是增加了不合理变量所占回归方程的比重,这也是不合社会实际的6.3 偏相关性系数a模型非标准化系数标准系数tSig.相关性B标准 误差试用版零阶偏部分1(常量)-381.485912.146-.418.685x1.122.107.0881.134.283.916.338.011x2.125.187.135.668.519.998.207.007x3-149.154121.354-.141-1.229.247.938-.362-.012x4.653.277.7232.359.040.997.598.023x5.003.023.024.131.898.902.041.001x6.081.042.2601.932.082.979.521.019x7-.120.047-.522-2.570.028.972-.631-.026x8.394.239.4341.646.131.982.462.016a. 因变量: y 分析:从表中可以看出,8个偏相关系数分别为0.338,0.207,-0.362,0.598,0.041,0.521,-0.631,0.462进一步可计算出偏决定系数。表中相关系数栏的“零阶”为y与的简单相关系数。因为简单相关系数只是两变量的局部相关性质,而非整体的性质。所以在多元线性回归中分析中我门看重的是偏相关系数,从数值上看的偏相关系数较大因此他们对因变量y的影响较大些。第7章 违背模型基本假设的情况7.1 异方差性的检验7.1.1 残差图检验我们分别以回归标准化残差和因变量y来绘制残差图分析模型是否存在异方差。分析:从残差的散点图上我们可以看出,回归的标准化残差随因变量y的表变化并没有明显的规律性分布,残差图上的点都是随机散布的,无任何规律,因此我们可以初步判定回归模型不存在异方差。7.1.2 怀特(White)检验 我们用Eviews软件做怀特检验,是把作为因变量,原先的自变量和自变量的平方项作为新自变量建立线性回归模型,通过这个模型的拟合情况来检验是否有异方差性,检验的零假设是残差不存在异方差性。怀特检验的统计量是,是样本观测量,是辅助回归的拟合优度。本题的怀特检验如下:Heteroskedasticity Test: WhiteF-statistic1.958884 Prob. F(8,10)0.1579Obs*R-squared11.59867 Prob. Chi-Square(8)0.1700Scaled explained SS1.445422 Prob. Chi-Square(8)0.9936分析:上表中Obs*R-squared即为,检验结果中由于收尾概率远大于显著性水平0.1,0.05或0.01,接收原假设,残差不存在异方差。7.2 自相关性的检验 对于自相关性我们用DW检验来判断,已知回归估计式的残差来定义DW统计量,假设有,通过化简后DW值与的关系式为,在SPSS19.0中运行结果如下表:模型汇总b模型RR 方调整 R 方标准 估计的误差Durbin-Watson11.000a.999.998113.199302.245a. 预测变量: (常量), x8, x5, x1, x3, x6, x2, x7, x4。b. 因变量: y分析:从表中的数据我们可以看到,=2.245,因而可以近似的计算出,通过查表可以判断出误差项的自相关性成轻微的负自相关。由于自相关性不是很明显,所以在这里就不做处理了。7.3 多元加权最小二乘估计7.3.1 权函数自变量的选取 我们先通过SPSS19.0计算出普通残差的绝对值与的等级相关系数,输出结果见下表所示: 分析:由于输出结果太多,表格数据太过于繁杂,为了限制篇幅这里采用了WPS文字校园版的截图工具进行了处理,处理结果如上图所示。从上图的表中数据可以看出,残差绝对值与自变量的相关系数为,比其他自变量的相关系数都要大,因此我们选构造权函数。7.3.2 Weight Estimate估计幂指数m 对数似然值b扩大对数似然值b幂-2.000-112.5102.500-107.397-1.500-112.8553.000-106.406-1.000-112.9623.500-105.546-.500-112.7854.000-104.851.000-112.3144.500-104.339.500-111.5785.000-104.0191.000-110.6415.500-103.8851.500-109.5796.000-103.567a2.000-108.475a6.500-103.9897.000-104.729a. 选择对应幂以用于进一步分析,因为它可以使对数似然函数最大化。b. 因变量: y,源变量: x2 分析:我们直接用软件默认的的范围-2,2估计得m的最优值为m=2,从表中“对数似然值b ”栏可以看出,于2是在边界上,以此我们将估计范围扩大到-2,7,得到m的最优解为m=6(为了直观,表格做过调整)。7.3.3 加权最小二乘估计拟合模型摘要复相关系数.999R 方.999调整 R 方.998估计的标准误.000对数似然函数值-103.567ANOVA平方和df均方FSig.回归.0007.0001516.244.000残差.00011.000总计.00018 分析:从表中输出结果来看,加权最小二乘的,F值=1516.244;而普通最小二乘的,F值=1259.526。这可以说明加权最小二乘估计的拟合效果略好于普通二乘的效果。系数未标准化系数标准化系数tSig.B标准误试用版标准误(常数)-575.962146.560-3.930.002x1.006.028.010.046.220.830x2.023.046.025.051.498.628x4.439.086.508.1005.081.000x5.015.004.260.0634.134.002x6.146.036.287.0704.109.002x7-.165.041-.452.112-4.029.002x8.568.142.389.0974.002.002 分析:从加权最小二乘估计的系数表表中我们可以惊奇的发现,在前面我们认为不合实际的变量(原煤产量),在这里被剔除了。结合前表中加权最小二乘的,F值=1516.244,说明模型仍然具有高度的显著性。具体回归方程为: 加权最小二乘的回归方程为 标准化的加权最小二乘回归方程为 总体上来说加权最小二乘估计不光显著性高,而且还剔除了不合理的变量,因此选用加权最小二乘估计是非常正确合理的。第8章 自变量选择与逐步回归8.1 前进逐步回归 取显著性水平进行逐步回归检验选变量。模型汇总d模型RR 方调整 R 方标准 估计的误差1.998a.996.996168.773752.998b.997.996159.368813.999c.998.997139.34486a. 预测变量: (常量), x2。b. 预测变量: (常量), x2, x4。c. 预测变量: (常量), x2, x4, x3。d. 因变量: y 分析:从逐步回归模型的汇总表中我们可以看出,在逐步选取变量x2,x2,x4,x2,x4,x3三步过程中,它们的复相关系数R分别为0.998,0.998,0.999,决定系数分别为0.996,0.997,0.998。整个过程都保持着回归方程高度的显著性,并且显著性是逐渐增大的。Anovad模型平方和df均方FSig.1回归1.288E811.288E84520.386.000a残差484237.8521728484.580总计1.292E8182回归1.288E8264419573.3002536.362.000b残差406374.6881625398.418总计1.292E8183回归1.290E8342984755.4782213.770.000c残差291254.8541519416.990总计1.292E818 分析:从表中我们可以看到,F的检验值分别为4520.386,2536.362,2213.770在逐渐减小,P值始终是0.000不变,由此可见虽然F值在减小,但是模型犯错的概率始终为0.000不变,故逐步回归后得回归方程更加具有高度的显著性。系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-504.229100.656-5.009.000x2.922.014.99867.234.0002(常量)-384.871116.966-3.290.005x2.619.174.6703.562.003x4.297.170.3291.751.0993(常量)196.098259.593.755.462x2.500.160.5413.133.007x4.504.171.5572.946.010x3-110.54345.399-.105-2.435.028a. 因变量: y 分析:从上述表中结果可以看到,逐步回归的最优子集为模型3,回归方程为 由回归方程可以看出,生铁的产量和发电量的系数都是正数,对因变量y起正相关作用,原煤量的系数为负值,对因变量y起负相关作用,而却从数值上看是-11.0543,对y的影响很大,这与实际情况不符,这可能是因变量与之间有较强的相关性。同时从表中还可以看出,用逐步回归法的选元过程为第一步引入,第二步引入,第三步引入再形成一个符合要求的线性回归方程。8.2 后退逐步回归 取显著性水平进行逐步回归检验选变量。模型汇总模型RR 方调整 R 方标准 估计的误差11.000a.999.998113.1993021.000b.999.998108.023813.999c.999.998105.61488a. 预测变量: (常量), x8, x5, x1, x3, x6, x2, x7, x4。b. 预测变量: (常量), x8, x1, x3, x6, x2, x7, x4。c. 预测变量: (常量), x8, x1, x3, x6, x7, x4。分析:从后退逐步回归模型的汇总表中我们可以看出,复相关系数R分别为1.000,1.000,0.999,决定系数分别为0.999,0.998,0.998。整个过程都保持着回归方程高度的显著性,而却相比起前进逐步回归要更为好一些。变量与因变量的线性回归分析系数为:已排除的变量c模型共线性统计量Beta IntSig.偏相关容差2x5.024a.131.898.041.0033x5.002b.013.990.004.003x2.130b.686.507.203.002a. 模型中的预测变量: (常量), x8, x1, x3, x6, x2, x7, x4。b. 模型中的预测变量: (常量), x8, x1, x3, x6, x7, x4。c. 因变量: y 分析:根据表中的数据我们可以写出关于的线性回归方程为: 此回归方程剔除一些变量后反而变得更加显著,并且更有实际的社会意义,它消除了不合理的变量和。在回归方程中又新出现了负变量(铁路运货量),虽然也是不合实际的,但是它占回归方程的比重很小因此可以保留。第9章 多重共线性的情形及处理9.1 多重共线性的诊断系数a模型非标准化系数标准系数tSig.共线性统计量B标准 误差试用版容差VIF1(常量)-381.485912.146-.418.685x1.122.107.0881.134.283.01661.091x2.125.187.135.668.519.002413.326x3-149.154121.354-.141-1.229

    注意事项

    本文(应用回归分析-(spss软件的应用)论文材料.doc)为本站会员(小**)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开