北航数理统计回归分析大作业.pdf
《北航数理统计回归分析大作业.pdf》由会员分享,可在线阅读,更多相关《北航数理统计回归分析大作业.pdf(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数理统计(课程大作业 1)逐步回归分析学学院:院:机械工程学院机械工程学院专专业:业:材料加工工程材料加工工程日期:日期:20142014 年年 1212 月月 7 7 日日摘要:摘要:本文介绍多元线性回归分析方法以及逐步回归法,然后结合实际,以我国1995-2012 年的财政收入为因变量,选取了8 个可能的影响因素,选用逐步回归法对各影响因素进行了筛选分析,最终确定了其“最优”回归方程。关键字:关键字:多元线性回归逐步回归法财政收入SPSS1 1 引言引言自然界中任何事物都是普遍联系的,客观事物之间往往都存在着某种程度的关联关系。为了研究变量之间的相关关系,人们常用回归分析的方法,而回归分析
2、是数理统计中一种常用方法。数理统计作为一种实用有效的工具,广泛应用于国民经济的各个方面,在解决实际问题中发挥了巨大的作用,是一种理论联系实践、指导实践的科学方法。财政收入,是指政府为履行其职能、实施公共政策和提供公共物品与服务需要而筹集的一切资金的总和。财政收入表现为政府部门在一定时期内(一般为一个财政年度)所取得的货币收入。财政收入是衡量一国政府财力的重要指标,政府在社会经济活动中提供公共物品和服务的范围和数量,在很大程度上决定于财政收入的充裕状况。本文将以回归分析为方法,运用数理统计工具探求财政收入与各种统计指标之间的关系,总结主要影响因素,并对其作用、前景进行分析和展望。2 2多元线性回
3、归多元线性回归2.12.1 多元线性回归简介多元线性回归简介在实际问题中,某一因素的变化往往受到许多因素的影响,多元回归分析的任务就是要找出这些因素之间的某种联系。由于许多非线性的情形都可以通过变换转化为线性回归来处理,因此,一般的实际问题都是基于多元线性回归问题进行处理的。对多元线性回归模型简要介绍如下:如果随机变量 y 与 m(m 2)个普通变量x1,x2xm有关,且满足关系式:y 01x12x2mxmE 0,D2(2.1)其中,0,1,2m,2是与x1,x2xm无关的未知参数,是不可观测的随机变量,N(0,2IN)。1式(2.1)为 m 元理论线性回归模型,其中0,1,2m为回归系数,x
4、1,x2xm为 回 归 因 子 或 设 计 因 子。i(i 1,2,m)实 际 上 反 映 了 因 子xi(i 1,2,m)对 观 测 值 y 的 作 用,因 此 也 称i(i 1,2,m)为 因 子xi(i 1,2,m)的效应。通过对回归系数i(i 1,2,m)进行最小二乘估计后,可以得到 m 元经验回归方程为:x x x y01122mm(2.2)为回归常数,,称也称式(2.2)为 m 元线性回归方程。也称回归系数,012m为回归系数。2.22.2 逐步回归法逐步回归法在多元线性回归分析中,由于有多个自变量,回归自变量的选择成为建立回归模型的重要问题。通常,一方面,为获取全面信息总希望模型
5、中包括的自变量尽可能多;另一方面,考虑到获取很多自变量的观测值的费用和实际困难,则希望模型中包含尽可能少而且重要的变量。因此,人们常根据某种规则对自变量进行筛选。本次选用的方法是逐步回归法。1 1)回归效果的显著性检验)回归效果的显著性检验y与变量x1,x2xm线性相关的密切程度可以用回归平方和U在总平方和Lyy中所占的比例来衡量。称 R U为 y 关于x1,x2xm的样本复相关系数,LyyR2U为样本决定系数。在多元线性回归的实际应用中,用复相关系数来表示Lyy回归方程对原有数据拟合程度的好坏。显然0 R21,其越接近 1,回归方程拟合程度越高。2 2)偏)偏 F F 检验检验检验某个自变量
6、对 y 的影响是否显著的正规方法是偏 F 检验。设原回归方程(全模型)为:x x xx xx y01122i1i1iii1i1mm2去掉变量xi后的新回归方程(减模型)为:x x xxx y01122i1i1i1i1mm全模型的复相关系数的平方为R2,减模型的复相关系数的平方为Ri,定义2Ri2 R2 Ri2。若Ri几乎为零,则说明 x 对 y 没有显著影响,反之则表示 x对 y 有其它变量不可替代的显著影响。检验假设:2H0:Ri2 0;当H0为真时,检验统计量为H1:Ri2 02Ri2iFi F(1,n m 1)22(1 R)/(n m 1)S cii对于给定显著性水平,由样本计算出Fi的
7、值,若Fi F1(1,n m1),则拒绝H0,说明 x 对 y 有显著影响,应在减模型中引入自变量 x;反之则应剔除 x,使之成为减模型。偏 F 检验通常被用作变量筛选的依据。逐步回归法中就是对各变量采用偏 F法进行检验的。3)3)逐步回归法的步骤逐步回归法的步骤逐步回归法的基本思想是:将变量逐个引入,引入条件是该变量的偏 F 检验是显著的。同时,每引入一个新变量后又对老变量逐个检验,将变得不显著的变量从回归模型中剔除。具体步骤如下:(0)(0)x,对它们分别计算 1、对 m 个自变量分别与 y 建立回归模型yi0iiFi,得Fi中最大的那个值,比如FL1。()如果FL1 F进,则计算结束,即
8、 y 与所有自变量均线性无关;()如果FL1 F进,则引入xL1,建立回归方程(1)(1)x y01L1(2.3)32、建立 y 与自变量子集xL1,xi(i L1)的二元回归模型(0)(0)x(0)x yi0i1L1ii(2.4)以式(2.4)为全模型,式(2.3)为减模型求Fi值,并取得Fi中最大的那个值,比如说FL2。如果FL2 F进,则计算结束,这时建立的模型为式(2.3);如果FL2 F进,则引入xL2,建立回归方程(2)(2)x(2)x y01L12L2(2.5)3、当引入xL2后,对xL1做偏 F 检验,看xL1是否需要剔除;如果FL1 F出,则不剔除xL1,并继续引入下一个变量
9、;如果FL1 F出,则从式 2.4 中剔除xL1,再继续引入下一个变量。重复上述步骤,直到所有模型外的变量都不能引入,模型内的变量都不能被剔除为止。3 3财政收入回归分析实例财政收入回归分析实例本次作业利用 SPSS 软件和逐步回归法,对原始数据进行了回归分析,并最终获得了“最优”回归方程,解决这个问题。3.13.1数据收集及处理数据收集及处理首先进行参考数据的选择,根据查阅书籍以及中国统计局网站得到的数据资料,归纳出可能影响国家财政收入的一些主要因素,包括国内生产总值(亿元),人口数(万人)等。本文从中选取了国内生产总值(亿元),人口数(万人),能源生产总量(标准煤)(万吨),农作物总播种面
10、积(千公顷),货运量(万吨),出口总额(亿元),进口总额(亿元),建筑业总产值(亿元)8 个因素作为本次考查的重点,并对其与财政收入的相关关系进行分析。表 1 所示为所选取的自 1995 年至 2012 年 18 年间财政收入与所选变量的数据汇总。4能源生国内生人口数产总值年份(亿人)元)吨)煤)(万(万(标准产总量农作物出口总播种货运量面积(万吨)(亿(千公元)顷)元)(亿元)元)总额总额产值(亿入(亿进口建筑业总财政收199560793.7121121129034149879123493812452110485793.756242.2199671176.612238913303215238
11、1129842112576115578282.257407.99199778973123626133460153969127821815161118079126.488651.14199884402.31247611298341557061267427152241162610061.999875.9511444.0813395.2316386.0418903.6421715.2526396.4731649.2938760.2199989677.11257861319351563731293008161601373611152.86200099214.6109655.2120332.713582
12、2.8159878.3184937.4216314.41267431350481563001358682206341863912497.620011276271438751557081401786220242015915361.5620021284531506561546361483447269482443018527.1820031292271719061524151564492362883419623083.8720041299881966481535531706412491034643629021.452005130756216219155488186206662648542743455
13、2.120061314482321671521492037060775976337741557.1652007265810.3314045.4340902.8401202473104.0518942.11321292472791534642275822935647330010039551043.7151321.7861330.3568518.383101.51103874.43117253.52200813280226055215626625859377952762036.81200913345027461915861428252228203068618107023123240.6129359
14、.376807.742010134091296916160675324180794699113161.4114801.096031.1320111347353179871622833696961115734.1920121354043318481634164099400137217.863.23.2 建立回归模型过程建立回归模型过程为了研究财政收入与各种影响因素的关系,必须要建立二者之间的数学模型。数学模型可以有多种形式,比如线性模型,二次模型,指数模型,对数模型等等。而实际生活中,影响财政收入的因素很多,并且这些因素的影响不能简单的用某一种模型来描述,所以要建立财政收入的数学模型往往是很难的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 北航 数理统计 回归 分析 作业
限制150内