《输运统计与分析课程设计我国汽车保有量发展趋势分析--毕业设计.doc》由会员分享,可在线阅读,更多相关《输运统计与分析课程设计我国汽车保有量发展趋势分析--毕业设计.doc(40页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 课程设计设计题目: 我国汽车保有量的发展趋势分析 课程名称: 运输统计与分析 学 院: 交通运输工程学院 专 业: 交通运输 指导教师: 周和平 柳伍生 李利华 朱灿 = 2012 /2013学年第二学期= 36课程设计(学年论文)任务书课程名称:运输统计与分析适用对象:交通运输工程一、 课程设计(论文)目的运输统计与分析课程设计作为独立的教学环节,是交通运输本科专业的必修课。其目的是,通过本课程设计实践,培养学生理论联系实际思想,加深统计分析基本理论与基本知识的理解,学会收集或调查行业统计数据,切实掌握各种统计分析方法,并能灵活运用统计软件在计算机上实现,正确解释和分析运行结果,培养运用各
2、种统计分析方法解决交通运输领域内实际问题的能力。二、 课程设计(论文)题目与内容本课程设计(论文)主要任务为:针对交通运输领域内某一主题,设计调查表调查或查询相关统计数据,根据本课程讲授内容选择一种或多种合适的统计分析方法,运用SPSS建立模型分析问题。题目自拟,但题名一般要包含主题与统计方法。且必须与交通运输相关,选题主题主要包括:1. 运输市场定位研究2. 运输需求分析与预测3. 政策或技术方法实施效果评价4. 交通行为选择5. 影响因素分析6. 聚类分析7. 服务质量评价8. 自选三、 课程设计(论文)基本要求报告内容原则上不少于8000字,其正文至少包括如下几个方面的内容:1. 问题背
3、景(问题的提出、必要性与意义,该问题目前常用的分析手段与方法,本设计采用的方法)2. 数据采集(含数据采集方式、描述性分析、统计图表)说明:调查分析则必须包含调查方案,其它数据原则上必须说明出处。3. 统计模型与分析(包含模型原理、SPSS操作步骤、输出结果及分析)4. 总结5. 附录 数据清单四、 课程设计(论文)时间及进度安排1. 时间:两周:2011-2012学年第二学期第十九、二十周2. 进度安排:确定主题;调查、收集数据:2天数据分析与预处理、描述性统计分析:2天分析方法原理及选择:3天SPSS操作及结果分析:4天解决实际问题或建议:2天撰写报告、总结:1天(此部分同学们可以按照自己
4、设计具体内容,详细安排)3. 成果提交:要求独立完成,每人需提交1份打印的设计报告(A4)、word电子文档、数据文件(sav格式)。电子文档文件名为:学号后四位+姓名+题目,先发电子文档给指导老师,经许可后方可打印。最终成果(打印稿1份、电子文档1份)统一交班长汇总并转交指导老师;最终成果提交截止时间为第20周周五。五、 成绩评定平时考勤20%,报告撰写规范20%,内容(选题合理、方案可行、分析正确、有创新)60%。成绩评定实行优秀、良好、中等、及格和不及格五个等级。优秀者人数一般不得超过总人数的20%。六、 报告格式课程设计报告装订顺序依次为:封面、课程设计(学年论文)任务书、目录、正文、
5、参考文献、成绩评定表。报告中所有图表应按“章号-图表序号-图表名”(例:图1-1-*频数图)进行编号。具体格式参看实验报告样本。七、 主要参考资料1.罗应婷等主编.SPSS统计分析从基础到实践.北京:电子工业出版社,2007年6月;2.章文波 陈红艳编著.实用数据统计分析及SPSS12.0应用.人民出版社,2006年;3.张文彤.SPSS.11.0统计分析教程.(高级篇).北京希望电子出版社.2002年6月;4.郝黎仁等.SPSS实用统计分析.中国水利水电出版社.2003年1月。目 录1 概述11.1研究背景11.2常用分析方法31.3本设计采用的分析方法32 数据采集42.1 数据来源42.
6、2 数据处理42.3 我国汽车保有量发展现状分析53 统计模型与分析83.1 相关性分析83.1.1 相关性分析原理83.1.2 SPSS的操作步骤93.1.3 输出结果分析113.2 主成分分析113.2.1 主成分分析的基本理论113.2.2 SPSS操作步骤:143.2.3输出结果分析163.3 曲线拟合模型:183.3.1曲线拟合模型原理183.3.2 SPSS操作步骤193.3.3 输出结果分析223.4 一元线性回归预测模型233.4.1 一元线性回归预测原理233.4.2 SPSS操作步骤243.4.3 输出结果分析264 总结294.1 本设计的主要工作294.2 存在的不足3
7、04.3下阶段研究需解决的问题304.4个人感悟31附录 数据清单311 概述1.1 研究背景汽车作为运输的主要方式之一,是我国交通运输体系的主体,对我国经济的发展有着举足轻重的作用。汽车作为一种高效的运载工具,给人们带来了方便、快捷、舒适的出行环境,同时也带来一系列严重问题:道路交通环境污染加剧、道路交通安全形势严峻、交通需求与供给矛盾突出。同国外发达国家相比,我国城市交通事业起步较晚,交通基础设施建设相对滞后,随着经济的快速发展,交通问题日益凸显,对城市交通体系建设也提出了更高的要求。总体来说,我国交通系统主要有如下几个特点:1.城市机动化进程加快城市机动化与城市发展是同步行进的。城市经济
8、的繁荣发展促进了机动车的普及,而机动车的普及反过来也推动了城市经济的进一步发展。回顾过去,我国城市机动化增长速度迅猛,1980年至2011年,全国机动车保有量以年均16.1%的速度增长。根据国外相关研究,机动车保有量的发展一般需要经历四个时期:缓慢增长期、高速发展期、缓慢增长期、平稳变化期。这四个发展时期分别对应着不同的社会经济发展水平。根据发达国家小汽车发展的轨迹,在人均GDP达到 1000美元时,小汽车将进入高速发展阶段。我国从2002年开始人均GDP超过 1000美元,标志着我国已经进入汽车的高速发展时代。可以预见,我国汽车保有量将继续保持高速增长,机动化水平将进一步提高。2. 道路交通
9、环境污染加剧道路交通系统环境污染主要包括大气污染、噪声污染及震动等,其中大气污染、噪声污染是影响城市环境质量的主要污染源。汽车排放的尾气含有一氧化碳(CO)、氮氧化物(NOx)、非甲烷碳氢化物(THC)及粉尘等有害物质,损害了人类的居住环境和生态环境。相关资料表明,汽车尾气污染占大气污染的总的比重在增大,因此机动车尾气成为最不可忍受的污染物。随着我国机动车保有量的增长,汽车尾气对环境的污染程度还会加剧。尽管我国汽车保有量远低于发达国家水平,但道路交通对环境的影响程度己经接近、甚至超过发达国家道路交通对环境的影响程度,我国城市的环境质量也远低于发达国家。通过对道路交通与环境质量关系的研究,制订符
10、合可持续发展的交通政策与规划,对城市环境保护有着重大意义。3. 道路需求与供给矛盾突出汽车交通的发展对城市交通提出严峻的考验。机动车保有量的剧增导致交通需求增大,使得道路变得拥堵、停车设施紧张,己有的交通基础设施难以满足快速增长的交通需求,导致交通需求与供给不平衡。由于历史和经济发展原因,目前我国多数城市都存在停车设施建设滞后、停车泊位紧张的问题。历史经验证明,尽管是由于交通供给与需求不平衡而导致了各种交通问题,但是仅仅通过不断增加供给来满足需求的方式是不能从根本上解决城市交通问题的。制定合理的城市交通规划,走可持续交通发展道路,是解决城市交通的根本途径。4. 可持续交通发展交通污染严重、交通
11、能耗高、交通安全形势严峻等问题成为我国经济发展的主要制约因素。国家“十一五”规划指出,2010年人均GDP将比2000年翻一番,同时单位GDP能耗要比“十五”期末降低20%左右。这就要求交通运输必须提高资源利用效率,走可持续发展道路,建设节约型行业。当前,我国交通系统的建设正处于繁荣发展时期,基础设施建设日趋完善。这为我国城市交通体系的可持续发展奠定了基础,也是我国走可持续交通的重要机遇期。政府应从经济可持续、社会可持续和环境可持续角度审视现有的城市交通政策,汲取发达国家的经验和教训,结合我国实际情况,牢牢把握机动车快速发展、普及这一阶段,采取有效措施,实施可持续交通发展战略,建立起符合经济社
12、会可持续发展要求的高效、经济、协调、环保、安全的交通运输体系,不仅要为社会提供安全优质的运输服务,而且要使资源占用、对环境的破坏及交通安全控制在国家允许的范围内。城市交通需求的不断增长给城市交通系统带来严峻考验,各种交通问题日益加剧:交通拥挤、停车设施紧张、交通污染严重、交通安全形势严峻等。满足当前交通需求的发展,要求建设更多的基础设施,而交通基础设施的建设,会进一步刺激交通需求的增长。研究表明,仅仅通过无休止的交通设施建设以满足交通需求,是不能从根本上解决城市交通问题的。城市交通的发展必须在合理的交通规划和管理基础上,有效的引导城市交通需求,针对性地、适度超前的进行交通基础设施建设。汽车保有
13、量的研究是城市道路交通规划的一项基础性工作,合理、准确的预测未来汽车保有量对城市交通战略规划、交通可持续发展具有重要意义。1.2 常用分析方法对汽车保有量的研究主要从两个方面着手,一是集中在汽车保有量影响因素的分析;二是集中在汽车保有量预测的研究上。对于汽车保有量影响因素的分析上主要采用的是主成分分析、因子分析等方法;对于汽车保有的预测的研究主要是采用的是神经网络预测法、组合预测法、灰色关联等方法。1.3 本设计采用的分析方法本设计运用相关性分析和主成分分析法对影响汽车保有量的相关因素进行约简。寻找对汽车保有量有可能有影响的各种因素,在可量化和数据可取性的基础上选择了人均GDP、工业生产总值、
14、居民消费水平、公路客运量、公路货运量、人口数量、能源消耗总量、公路总里程等对汽车保有量有影响的数据。先利用相关分析方法,得出汽车保有量与各个相关因素之间以及各影响因素之间都具有很好的相关性。然后,利用主成分分析的方法,从众多的影响因素中提取出第一主成分,将第一主成分作为综合指标进行归一化处理,得出相关方程。在得出综合指标方程的基础上运用曲线拟合找出最好的拟合函数模型,得出相应的函数关系,即得出综合指标的预测模型。最后运用一元线性回归的方法得出汽车保有量的预测模型,最后带入相关数据得出2015到2025年的汽车保有量预测值。本设计在影响汽车保有量的众多的影响因素中运用主成分分析和相关性分析找出最
15、主要的因素,简化了相关的方程式,简化了操作过程,并且使分析结果简单明确。2 数据采集2.1 数据来源本设计所需的数据:工业生产总值、公路货运量、公路客运量、公路总里程、国内生产总值、能源消耗总量、人口数量、人均可支配收入、汽车保有量。数据来源:中华人民共和国国家统计局中国统计年鉴2010到2012年度数据。2.2 数据处理在中国统计年鉴中分别找出相关的数据依次录入到Excle数据汇总总表中然后导入到SPSS中进行相关数据处理。依次进行相关性分析,主成分分析,曲线拟合,一元线性回归分析等数据处理方法。2.3 我国汽车保有量发展现状分析汽车保有量受诸多因素影响,人均GDP是其中一个重要的影响因素,
16、同时人均GDP也是衡量一个国家富裕程度的重要指标。一般来说,根据世界汽车行业的发展规律,当一个国家的人均国内生产总值达到1000美元以后,国民的消费结构就会发生改变,就会进入以住房、汽车为代表的改善生活质量的消费时代。改革开放以来,我国创造了经济增长的神话,特别是近几年来,我国的人均GDP增长也是很迅速的,从2001年的8621.71元/人,增加到2011年的35181.24元/人。具体各年份人均GDP数据见图2-1。也就是说从2001年开始,当我国的人均国内生产总值达到8621.71元时,人们的消费结构就开始发生转变了,人们的消费开始从满足生活需要向重视生活质量转变,从追求物质消费到追求精神
17、消费和服务消费转变。这种变化的直接影响就是消费结构的升级,消费结构的升级带动了汽车的消费,从而使汽车保有量增长的速度逐年加快。图2-1 1990年到2011年人均GDP加入世界贸易组织以后,中国又相继出台了一系列相关的政策来推动我国汽车业的发展,鼓励小汽车走入家庭,使得小汽车的消费成为了当今消费市场的主流。由于我国经济发展的不平衡,东西部经济的差距,各地区居民消费水平的不同,使得汽车保有量绝大部分集中在一线、二线城市,并且城市的汽车保有量明显高于农村。由此可见汽车保有量在一定程度上与居民消费水平和人均国内生产总值有具有相关性。图2-2为1990一2011年居民消费水平与汽车保有量的发展情况图2
18、-3为人均GDP与汽车保有量的发展状况。图2-2 汽车保有量与居民消费水平图2-3 人均GDP与汽车保有量由此可以看出,人均GDP的增加,年末储蓄幅度的增加以及人们的消费结构的转变,使得中国发展成为一个极具潜力的消费市场。由上图可以看出近几年的各项经济指标增长的幅度明显大于往年,这也带动我国汽车保有量增长迅猛。表2-1 20052011年汽车保有量年份汽车保有量(万辆)20053159.6620063697.3520074358.3620085099.6120096280.6120107801.8320119356.32据国家统计局统计,1990年全国民用汽车保有量仅有554万辆,其中私车保有
19、量为82万辆,占14.8%。这82万辆私人汽车中,58万辆是载货车,只有24万辆是载客汽车。私人客车中,相当数量是微型面包车,真正的私人轿车寥寥无几。此后,私人汽车比例一路走高,私人轿车也逐步增加。同时有数据显示,在1993年年底,我国的各类汽车的保有量数据810万辆,这个数据只相当于日本的1/10,美国的1/28,德国的1/6左右。但是随着我国经济的迅速发展,人们消费水平的提高,汽车消费也是逐年增加,汽车行业发展很飞速。自上世纪80年代中国开始出现私人汽车以来,到2003年社会保有量达到1219万辆,私人汽车突破千万辆用了近20年,而突破2000万辆仅仅用了3年时间。从表2-1,我们可以看出
20、我国的汽车保有量从2005年3159万辆增长到了2011年的9356.32万辆。随着社会的和技术的进步,生活水平的进一步提高,我国的汽车保有量将会继续增长,在现实生活中,人们越来越多的重视汽车的消费,把汽车消费纳入生活中的一样必需品,汽车进入普通家庭己经成为一个人所共知的事实,也是整个社会经济发展的趋势。将来的社会汽车就会像手机一样普遍,汽车保有量的迅速增长可是可想而知的,对汽车保有量进行相关方面的研究也是很有意义的。3 统计模型与分析3.1 相关性分析3.1.1 相关性分析原理任何事物的存在都不是孤立的,而是相互联系、相互制约的。说明客观事物相互间关系的密切程度并用适当的统计指标表示出来,这
21、个过程就是相关分析。通常用相关系数来描述线性关系的强弱和方向。如果两个样本观测值序列之间相关关系数的绝对值为1,则两者之间具有完全的相关性,相关系数的绝对值越大,越接近于1的话,两者之间的相关性就越强,反之,相关系数越小,绝对值为0或者接近0的话,两者之间不具有相关性。两个变量之间的相关性用相关系数来衡量,要是一个变量与多个变量之间的相关性,一般用偏相关系数来衡量。运用相关分析法进行因子筛选,相关系数用r表示,常用的相关系数主要有Pearson简单相关系数、Spearman等级相关系数和Kendall相关系数。这里介绍下Pearson简单相关系数-用来度量定居型变量之间的线性相关关系。计算公式
22、为:其中,n为样本数,xi和yi分别为两变量的变量值,代为变量xi和yi的协方差,分别为变量x和y的标准差。rO为正相关;rO为负相关;r=0为零相关或无相关.|r|越接近于1,说明相关性越好;|r|越接近于0,说明相关性越差。r=l时表示两变量之间存在完全的正相关。r=-1时,表示两变量存在完全负相关。3.1.2 SPSS的操作步骤运用相关性分析法,通过判断各个因素与汽车保有量之间的线性相关程度的强弱,刷选出对汽车保有量有影响的重要因素。设汽车保有量为Y,设汽车保有量影响因素:人均GDP、工业生产总值、公路货运量、公路客运量、公路总里程、能源消耗总量、人口数量、居民消费水平分别为X1、X2、
23、X3、X4、X5、X6、X7、X8。SPSS操作步骤如下: 按分析相关性双变量相关,打开对话框,完成相关操作,如图所示:图 3-1 相关分析操作界面 结果输出: 表3-1 相关分析输出结果相关性民用汽车人均国内生产总值工业总产值货 运 量客运量民用汽车Pearson 相关性1.991*.995*.998*.980*显著性(双侧).000.000.000.000N2222222222人均国内生产总值Pearson 相关性.991*1.990*.996*.994*显著性(双侧).000.000.000.000N2222222222工业总产值Pearson 相关性.995*.990*1.997*.9
24、77*显著性(双侧).000.000.000.000N2222222222货 运 量Pearson 相关性.998*.996*.997*1.988*显著性(双侧).000.000.000.000N2222222222客运量Pearson 相关性.980*.994*.977*.988*1显著性(双侧).000.000.000.000N2222222222公 路Pearson 相关性.923*.948*.932*.933*.933*显著性(双侧).000.000.000.000.000N2222222222能源消耗Pearson 相关性.971*.987*.976*.980*.976*显著性(双侧
25、).000.000.000.000.000N2222222222人口数量Pearson 相关性.818*.872*.796*.832*.886*显著性(双侧).000.000.000.000.000N2222222222居民消费Pearson 相关性.983*.997*.977*.988*.995*显著性(双侧).000.000.000.000.000N2222222222相关性公 路能源消耗人口数量居民消费民用汽车Pearson 相关性.923.971*.818*.983*显著性(双侧).000.000.000.000N22222222人均国内生产总值Pearson 相关性.948*.987
26、.872*.997*显著性(双侧).000.000.000.000N22222222工业总产值Pearson 相关性.932*.976*.796.977*显著性(双侧).000.000.000.000N22222222货 运 量Pearson 相关性.933*.980*.832*.988显著性(双侧).000.000.000.000N22222222客运量Pearson 相关性.933*.976*.886*.995*显著性(双侧).000.000.000.000N22222222公 路Pearson 相关性1*.974*.861*.943*显著性(双侧).000.000.000N2222222
27、2能源消耗Pearson 相关性.974*1*.875*.983*显著性(双侧).000.000.000N22222222人口数量Pearson 相关性.861*.875*1*.904*显著性(双侧).000.000.000N22222222居民消费Pearson 相关性.943*.983*.904*1*显著性(双侧).000.000.000N22222222*. 在 .01 水平(双侧)上显著相关。3.1.3 输出结果分析从表3-1的输出结果我们可以看出,汽车保有量与人均GDP、工业总产值、公路货运量、公路客运量、公路总里程、能源消耗总量、人口数量、居民消费水平的相关系数分别是0.991、0
28、.995、0.998、0.980、0.923、0.971、0.818、0.983。因此,我们可以得出汽车保有量与各个影响因素之间具有很好的相关性。同时,从表中也可以看出汽车保有量的各个影响因素之间也存在很好的相关性,他们之间可能存在相互影响。3.2 主成分分析3.2.1 主成分分析的基本理论1. 主成分的概念 主成分分析(PCA),是由Hotelling于1933年首先提出的。在社会经济的研究中,为了全面系统的分析和研究问题,必须考虑许多经济指标,这些指标能从不同的侧面反映所研究对象的特征,在某种程度上存在信息的重叠,具有一定的相关性。主成分分析就是力求数据信息丢失最少的原则下,在高维的变量空
29、间降维,即研究指标体系的少数几个线性组合,并且这几个线性组合所构成的综合指标将尽可能多的保留原来指标变异方面的信息的一种分析方法。假设我们所讨论的实际问题中,有p个指标,我们把这p个指标看作p个随机变量,记为Xl,XZ,XP,主成分分析就是要把这p个指标的问题,转变为讨论p个指标的线性组合的问题,而这些新的指标Fl,FZ,Fk(kP),按照保留主要信息量的原则充分反映原指标的信息,并且相互独立。第一个线性组合即为第一个综合指标记作Yl,为了使得该线性组合具有唯一性,要求在所有的线性组合中Yl的方差最大,它所包含的信息最多。如果要是第一主成分不足以代表原来的P个指标的所有信息量的话,考虑选择第二
30、个主成分,第二主成分是与第一主成分不相关的原线性组合方差最大者,以此类推。2. 主成分的性质方差为所有特征根之和即一说明主成分分析把p个随机变量的总方差分解成为p个不相关的随机变量的方差之和。贡献率:第i个主成分的方差在全部方差中所占比重,称为贡献率,反映了原来p个指标多大比例的信息,有多大程度的综合能力。累积贡献率:前k个主成分共有多大的综合能力,用这k个主成分的方差和在全部方差中所占比重来描述,称为积累贡献率。我们进行主成分分析的目的之一是希望用尽可能少的主成分Fl,F2,Fk(kP)代替原来的p个指标。到底应该选择多少个主成分,在实际工作中,主成分个数的多少取决于能够反映原来变量85%以
31、上的信息量为依据,即当累积贡献率85%时的主成分的个数就足够了。最常见的情况是主成分为2到3个3. 主成分分析的步骤(1) 把待评定的对象作为样本,根据评定的目的选取各个样本的P个指标,收集的这些样本指标值,构成一个N*P的矩阵。(2)由于这些指标的量纲不统一,数量级也不同。要对上一步得到的原始数据进行标准化处理。数据处理公式为:其中Xij是第i个样本的第j个指标的原始数据,是所有样本的第j个指标的原始数据的平均值,了而面)是所有样本的第j个指标原始数据的标准差。由此,就可以得到原始数据矩阵的标准化数据矩阵。(3)计算标准化矩阵的相关系数矩阵R。(4)求出相关系数矩阵R的特征值和特征向量,然后
32、把特征值由小到大排列,最大的特征值所对应的主成分就叫第一主成分,排在第二位的那个特征向量对应的主成分就叫第二主成分,以此类推。每个主成分的值都是经过标准化后的原始数值逐个加权和为:,其中权数向量:(5)根据特征值贡献率选前面的M(MP)个主成分作为综合评价函数的主成分。选取标准是前面的M个主成分的累积方差贡献率大于或者等于85%。(6) 主成分实际上是各个变量的线性组合,也就是各个变量的加权平均。为了使得各个权重系数之和等于1.我们可以对第i个主成分通过下面的式子进行归一化处理:得到归一化的各个变量权重。3.2.2 SPSS操作步骤: 按分析降维因子分析,打开对话框并转移分析变量操作如图3-2
33、和图3-3所示: 图3-2 因子分析对话框 3-3 因子分析次级对话框 点击“继续”然后点击“确定”输出结果如表3-2:表3-2 主成分分析输出结果KMO 和 Bartlett 的检验取样足够度的 Kaiser-Meyer-Olkin 度量。.863Bartlett 的球形度检验近似卡方702.286df36Sig.000公因子方差初始提取民用汽车1.000.972人均国内生产总值1.000.997工业总产值1.000.968货 运 量1.000.983客运量1.000.986公 路1.000.923能源消耗1.000.984人口数量1.000.792居民消费1.000.995提取方法:主成份
34、分析。解释的总方差成份初始特征值提取平方和载入合计方差的 %累积 %合计方差的 %累积 %18.59895.53395.5338.59895.53395.5332.2753.05398.5863.1041.15299.7384.011.11899.8555.010.10699.9616.002.02199.9827.001.01199.9938.001.00699.99996.688E-005.001100.000提取方法:主成份分析。成份矩阵a成份1民用汽车.986人均国内生产总值.998工业总产值.984货 运 量.991客运量.993公 路.960能源消耗.992人口数量.890居民消费
35、.997提取方法 :主成份。a. 已提取了 1 个成份。3.2.3输出结果分析表3-3 KMO与巴特勒特检验KMO 和 Bartlett 的检验取样足够度的 Kaiser-Meyer-Olkin 度量。.863Bartlett 的球形度检验近似卡方702.286df36Sig.000从表3-3检验变量的相关性的KMO统计量来看,其取值是0.863,因此各变量之间的相关性程度无太大的差异,数据非常适合做主成分分析,近似卡方为702.286,Sig.(即相伴概率)=0.000,球形假设检验被拒绝,这8个指标间存在着相关性,与之前的相关性检验也是很好吻合的。表3-4 方差贡献率图解释的总方差成份初始
36、特征值提取平方和载入合计方差的 %累积 %合计方差的 %累积 %18.59895.53395.5338.59895.53395.5332.2753.05398.5863.1041.15299.7384.011.11899.8555.010.10699.9616.002.02199.9827.001.01199.9938.001.00699.99996.688E-005.001100.000提取方法:主成份分析。从方差贡献率表3-4可以看出,第一主成分的特征根是8.598,它解释了总变异的95.533%。主成分的提取条件是要求特征根值大于1和累计方差贡献率大于或者等于85%。从这两个判断条件来看
37、,这8个变量只萃取第一主成分即可,第一主成分对各个变量的信息提取已经非常充分了。表3-5 初始因子载荷矩阵成份矩阵a成份1民用汽车.986人均国内生产总值.998工业总产值.984货 运 量.991客运量.993公 路.960能源消耗.992人口数量.890居民消费.997提取方法 :主成份。a. 已提取了 1 个成份。表3-5呈现的是是初始因子载荷矩阵表示的是主成分与对应变量间的相关系数。第一主成分对几个变量做了充分的解释。对初始载荷矩阵进行变换。可得到主成分表达式。再进行归一化得出因子得分系数矩阵。如图表3-6 表3-6 主成分的分析结果标准化的变量因子载荷矩阵中的数据计算出的特征向量归一
38、化各指标权重Zx10.9860.3360.163Zx20.9980.3040.116Zx30.9840.3350.128Zx40.9910.3380.129Zx50.9930.3390.129Zx60.9600.3270.125Zx70.9920.3380.129Zx80.8900.3030.116所以,主成分的表达式:Y1=0.336*Zx1+0.304*Zx2+0.335 Zx3+0.338 Zx4+0.339 Zx5+0.327 Zx6+0.338 Zx7+0.303 Zx8 (Zx1、Zx2、Zx3Zx8是经过预处理过的数据)3.3 曲线拟合模型:3.3.1曲线拟合模型原理用连续曲线近
39、似地刻画或比拟平面上离散点组所表示的坐标之间的函数关系的一种数据处理方法。用解析表达式逼近离散数据的一种方法。在科学实验或社会活动中,通过实验或观测得到量x与y的一组数据对(xi,yi)(i=1,2,m),其中各xi是彼此不同的 。人们希望用一类与数据的背景材料规律相适应的解析表达式,y=f(x,c)来反映量x与y之间的依赖关系,即在一定意义下“最佳”地逼近或拟合已知数据。f(x,c)常称作拟合模型 ,式中c=(c1,c2,cn)是一些待定参数。当c在f中线性出现时,称为线性模型,否则称为非线性模型。有许多衡量拟合优度的标准,最常用的一种做法是选择参数c使得拟合模型与实际观测值在各点的残差(或
40、离差)ek=ykf(xk,c)的加权平方和达到最小,此时所求曲线称作在加权最小二乘意义下对数据的拟合曲线。有许多求解拟合曲线的成功方法,对于线性模型一般通过建立和求解方程组来确定参数,从而求得拟合曲线。至于非线性模型,则要借助求解非线性方程组或用最优化方法求得所需参数才能得到拟合曲线,有时称之为非线性最小二乘拟合。曲线拟合:贝塞尔曲线与路径转化时的误差。值越大,误差越大;值越小,越精确。3.3.2 SPSS操作步骤由于本阶段选用的数据是1990年到2011年的汽车保有量和经过主成分分析得到的归一化加权后的综合指标的数据,所以,令汽车保有量用Y表示,综合指标用FACTOR简写为F表示。历来对于综
41、合指标的预测采用的是定量分析方法,定量分析就是从历史数据出发选择出适合的预测模型得出相关数据,先对综合指标的历史数据整理绘制出点状图,如图3-4图3-4 综合指标F的展点图 SPSS关于曲线拟合的操作步骤: 按分析回归曲线估计,打开对话框; 点击确定,输出结果变量处理摘要变量因变量综合指标K正值数22零的个数0负值数0缺失值数用户自定义缺失0系统缺失37 模型汇总和参数估计值因变量: 综合指标K方程模型汇总参数估计值R 方Fdf1df2Sig.常数b1b2线性.838103.155120.000312823.99288210.572二次.967276.512219.000876222.098-52638.9546123.892幂.74357.901120.000453633.061.446S.38712.650120.00214.212-1.2243.3.3 输出结果分析F综合指标 T时间 图3-5 综合指标F预测模型的拟合曲线表3-7 模型概要与参数估计模型汇总和参数估计值因变量: 综合指标K方程模型汇总参数估计值R 方Fdf1df2Sig.常数b1b2线性.838103.155120.000312823.99288210.572二次.967276.512219.000876222.098-52638.9546123.892幂.74357.901120.000453633.0
限制150内