北航数理统计大作业(逐步回归).docx
《北航数理统计大作业(逐步回归).docx》由会员分享,可在线阅读,更多相关《北航数理统计大作业(逐步回归).docx(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、北航数理统计大作业(逐步回归) 应用数理统计 第一次大作业学号: 姓名: 班级: B1 班215 年 12 月民航客运量得多元线性回来分析 摘要: : 本文为建立以民航客运量为因变量得多元线性回来模型,选取了 199年至03 年得统计数据,包含国民生产总值,民航航线里程,过夜入境旅游人数,城镇居民可支配收入等因素,利用统计软件 SS对各因素进行了筛选分析,采纳逐步回来法得到最优多元线性回来模型,并对模型得回来显著性、拟合度以及随机误差得正态性进行了检验,并采纳 201年得数据进行检验,得到得结果达到预期,证明该模型建立就是较为胜利得. 关键词 :多元线性回来,逐步回来法,民航客运量 0 、 符
2、号说明 变量符号民用航空客运量Y 国民生产总值X 铁路客运量X 2民航航线里程X 3入境 过夜 旅游人数X 4城镇居民人均可支配收入X 5、 引言 随着社会得进步,人民生活水平得提高,如何获得更快捷便利得交通成为人们日益关注得问题.因为航空得平安性,快速且价格水平越来越倾向大众,越来越多得人们选择航空这种交通方式。近年来,我国得航空客运量已经进入世界前列,为驾驭航空客运得动态,合理支配班机数量.科学地对我国民航客运量得影响因素得分析,并得出其回来方程,进而能够估计航空客运量就是特别有必要得。本文收集整理了与我国航空客运量相关得历年数据,运用 SPS 软件对数据进行分析,探讨 199年起至 20
3、3 年我国民航客运量 y(万人)与国民生产总值 X 1 (亿元)、铁路客运量 X (万人)、民航航线里程 3 (万公里)、入境过夜旅游人数X 4 (万人)、城镇居民人均可支配收入 X 5 (元)得关系。采纳逐步回来法建立线性模型,选出较优得线性回来模型。2 、数据得统计与分析 本文在进行统计时,查阅中国统计摘要,中国统计年鉴14以及中国知网数据查询中得数据,收集了 196 年至 201年各个自变量因素得数据,分析它们之间得联系。整理如表 1 所示。表 表 1 :年份 民航客运量(万人)国内生产总值(亿元) 铁路客运量(万人) 民航航线里程(万公里)入境过夜旅游人数(万人)城镇居民可支配收入(元
4、)16 5555 973 479 16、5 1356、6 4838、 1997 560 844、3 30 4、 157、3 51、3 998 5755 967、 905 150、8 692、 54、1 19 694 847、 10016 152、2 176、5 554、1 24、 150 150、29 70、96 6280、 255、 105155 15、36 1880、36 6859、6 32、7 0560 163、7 202、 7702、8 22、8 260 74、95 203、58 847、2 2878、 11176 204、 2519、8 41、6 200、 1583 199、5 22
5、5、63 10493、1 206、4 5656 11、35 3486、45 1159、5 810、3 3567 23、3 338、8 13785、 045、 4693 26、 9、 580、8、1 模型得建立 以民航客运量 y 为因变量,以上 5 种影响因素为自变量 X i,构建回来方程:其中 为常数项, 为误差项。先视察自变量与因变量得关系,用 SPS得到各个自变量与因变量得散点图:图 图 1民航客运量与国内生产总值散点图 71 2506、9 121 234、51 4025、6 11、7 2983、5 168145 276、 753、8 19109、 21、05 494、3 18、 7、1
6、18937 32、0 566、 2456、7 245、2 20597 41、 562、9 26955、1 图 图 2民航客运量与铁路 客运量散点图图 民航客运量与航线里程散点图 图4民航客运量与入境 过夜 人数散点图 图 图 5 民航客运量与人均可支配收入散点图 从以上五张散点图,我们可以瞧出因变量民航客运量与国内生产总值,入境过夜旅游人数与城镇居民人均可支配收入均有较好得线性关系,这说明建立线性模型就是有意义得。接着下一步逐步回来分析,逐步回来得基本思想就是将变量逐个引入模型,每引入一个变量后都要进行F检验,并对已经选入得变量逐个进行t检验,当原来引入得变量由于后面变量得引入变得不再显著时,
7、则将其删除。以确保每次引入新得变量之前回来方程中只包含先主动变量。这就是一个反复得过程,直到既没有显著得变量选入回来方程,也没用不显著得变量从回来方程中剔除为止。在PS软件中可干脆进行逐步回来分析,得出以下结果:由表2知,逐步回来后得出两个模型,模型1只包含城镇居民可支配收入,其她自变量都没有进入模型,模型2在得基础上再纳入了过夜入境旅游人数,其她得自变量也都被解除了。表2 输入移去得变量a a模型 输入得变量 移去得变量 方法 1 城镇居民人均可支配收入 、 步进(准则: F-to-enter 得概率 <= 、050,F-to-remove 得概率 >= 、100)。2 过夜游客
8、 、 步进(准则: F-to-enter 得概率 <= 、050,F-to-remove 得概率 >= 、100)。a、 因变量: 民用航空客运量 表32 、2 拟 合度检验 由表,模型1得确定系数R=、92,模型得确定系数 2 =0、995,可以瞧出回来方程都高度显著,且模型2比模型1更优。、3 回来方程得显著性检验: 由表,方差分析表 Sig 值都<、5,说明每个模型都拒绝回来系数均为 0得假设,每个方程都就是显著得。表5 An va 模型 平方与 df 均方 F 、 1 回来 167859397、184 1678593、14 218、841 、000b残差 122987
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 北航 数理统计 作业 逐步回归
限制150内