2015年全国数学建模竞赛B题国家一等奖论文材料2.doc
+-基于供求匹配率的出租车资源配置模型摘 要 本文针对城市出租车资源配置问题,采用定性与定量相结合的研究方法,建立衡量出租车供求匹配程度的指标,分析打车软件各种补贴方案对所建指标的影响,在充分考虑各方利益的前提下,得到打车软件的最优补贴方案,对城市出租 车行业资源优化配置、持续良性发展具有一定的参考意义。为分析不同时空出租车资源的供求匹配程度,引入出租车资源供求匹配率这 一指标,指标的定义为城市中实际运行的出租车辆数与居民出行需要的出租车辆数之比,反映城市中实际运行的出租车辆数与居民出行需要的出租车辆数之间的 差异。计算得出成都 2013 年出租车供求匹配率为 0.7766,表示供不应求。居民出行需要的出租车辆数与居民人均日出行次数、城市总人口数量、居民 出行选择乘坐出租车的比例有关,也与每辆出租车日均载客次数、每单载客人数和车辆满载率有关。对于居民人均日出行次数,利用十五个国内大中城市的数据, 将十二个城市经济指标聚类分析选出每类指标中典型的经济指标,建立居民人均 日出行次数与这些典型经济指标间的多元线性回归方程,而与居民出行需要的出 租车辆数相关的其他指标可查阅文献或年鉴获得。分析成都市每天 6:00-8:30,11:00-12:30,13:30-14:30,17:00-18:30 四 个 时 间 段 得 供 求 匹 配 率 分 别 为0.4111,0.5678,0.6062,0.5631,结果显示供不应求。得到大连、北京、广州、 武汉、南京、成都、杭州、深圳八座城市的出租车资源供求匹配率分别为 1.0936、 0.8827、0.9430、0.7040、0.7049、0.7666、0.6583、0.5252,表明只有大连的出租车资 源是供大于求,而其余七座城市为供小于求。 为了分析各公司的出租车补贴方案对缓解打车难是否有帮助,定性分析出租车日均载客次数、出租车满载率随打车软件对出租车司机每单补贴金额的变化趋势,分别建立阻滞增长模型,进而分析打车软件对出租车司机每单补贴金额的变化对所建指标的影响。得到的结论为:对于使用打车软件的乘客来说,出租车补贴方案能够缓解打车难的问题;而对于不使用打车软件的乘客来说,出租车补贴方案则不能缓解打车难的问题。 针对打车软件服务平台的最优补贴问题,综合考虑乘客、出租车司机和打车软件公司三方的满意度,利用熵值法确定这三方各自满意度的权重,将三方满意度加权之和作为综合满意度,进而以综合满意度为目标函数,以打车软件对出租车司机每单补贴金额为控制变量,以补贴金额设置的范围为约束条件建立优化模型。遍历所有可能的方案得到最优补贴方案为对出租车司机每单补贴 9 元,综合满意度为 0.5710。关键词:聚类分析;回归分析;灰色预测;阻滞增长模型;熵值法;最优化1一、 问题重述 随着经济的发展,近年来,人们对出行的要求不断提高,城市出租车以其方便、快捷、舒适和私密性的特点成为越来越多人的出行选择。但是,国内各大城 市交通问题日趋严重,“打车难”也是人们关注的一个社会热点问题。数据显示,包括上海、杭州等众多大城市,出租车非高峰期的空驶率始终在 30%上下徘徊, 而高峰期却打不到车。这与众多市民反映的打车难背后所隐藏的强烈需求看似形成了一个矛盾。究其原因,最主要的莫过于司机与乘客需求信息不对称,缺乏及 时沟通交流的平台。随着“互联网+”时代的到来,有多家公司依托移动互联网建立了打车软件服务平台,实现了乘客与出租车司机之间的信息互通,同时推出了多种出租车的 补贴方案,吸引了越来越多的司机和乘客使用打车软件。然而,打车软件同时也导致出租车行业乱象丛生,存在马路扬招成功率降低、乘客怕司机接到大单拒载、 司机分心忙于抢单影响行车安全等问题。请你们搜集相关数据,建立数学模型研究如下问题:问题一:试建立合理的指标,并分析不同时空出租车资源的“供求匹配”程度。问题二:分析各公司的出租车补贴方案是否对“缓解打车难”有帮助?问题三:如果要创建一个新的打车软件服务平台,你们将设计什么样的补贴方案,并论证其合理性。二、 问题分析 “打车难”是人们关注的一个社会热点问题。但是,在北京也不是无论何时何地都难打到车。打车难往往出现在特殊时间和地点:上班高峰的住宅区,下班高峰的商务区,凌晨和深夜的郊区或偏僻地点,遇到雨雪天气 “互联网+”时代的出租车资源配置是一个十分复杂的社会问题。要想准确得出合理的资源配置方案难以实现,同时也难以准确收集大量出租车的各项数据如出租车的每天跑单数,收费,拒载情况等,以及不同城市不同城区不同时间居民的出行行为特征数据。 为了建立合理的指标,分析不同时空出租车资源的供求匹配程度,首先从城市居民出行对出租车的需求量入手,分析与需求量有关的主要指标,如城市居民出行量。为分析城市居民出行量与城市经济指标的相关性,先将这些指标进行聚类分析,继而得出每类最具代表性的经济指标,再将最具代表性的经济指标与居民出行总量进行回归分析,得到多元线性回归模型,从而预测居民的出行总量。通过查阅文献可以确定居民出行选择出租车作为出行方式的比例从而,计算得出城市的出租车运输量的需求量。然后根据供需平衡法预测出城市出租车需求量。将城市实际出租车数量与城市出租车需求数量作比,得到衡量出租车资源的供求匹配程度的指标即供求匹配率。对未来城市的出租需求量进行灰色关联预测,得到未来城市的出租需求量,通过计算不同城市的出租车需求量,进行不同时空的出租车资源供求匹配的分析。 对于各公司的出租车补贴方案是否对“缓解打车难”有帮助问题,由于难以得到各公司不同时间的补贴方案对居民打车难度的实际影响效果数据,我们从公司对每单的补贴金额入手,分析每单补贴金额范围为 015 元,认为补贴金额再高对公司利益有较大损失。司机的每日跑单数为平均每台出租车每天接单数,有效载客率等效为里程利用率。以每单补贴金额为自变量,司机的每日跑单数和有效载客率为因变量,建立阻滞增长模型,基于前面的供求匹配率关系式算出不同每单补贴金额对应的供求匹配率这一指标。2为一个新的打车软件服务平台设计合理的补贴方案,我们基于已建立的模型计算出租车单车日均载客次数、有效载客率与打车软件平台对每单补贴金额的关系式。综合考虑每单补贴金额对出租车司机、乘客、打车软件平台三方各自的满意度,利用熵值法求出三方满意度的权重,继而将三方的标准化数据乘以权重得 出综合满意度,比较得出最优的补贴方案。三、 模型假设1假设城市中的黑车现象对居民出行没有造成影响; 2假设所研究的城市没有发生严重的自然灾害和社会动荡;3假设所研究的城市政府对出租车行业的政策基本不变;4假设司机和乘客都是为自身利益考虑,即经济人假设; 5假设参考文献中的数据来源可靠,真实可信。四、 符号说明符号 含义,单位P 出租车供求匹配率M 市民出行需要的出租车辆数,辆 N 城市实际运行的出租车辆数,辆 Y 市民日均出行次数,次/日W 城市总人口数量,人 市民选择打车出行的比例 s 出租车单车日均载客次数,次/车日 出租车单车日均每次载客人数,人/车次 出租车满载率vi 城市的第 i 个经济指标 R Pearson 相关系数w 打车软件每单对司机的补贴钱数,元 x 每辆出租车每天接单的数量,单 y 出租车每天的满载率五、 模型建立与求解5.1 建模前的准备由参考文献2可得到现有指标体系见表 1。表 1 衡量出租车供求的三大指标指标里程利用率意 指营业里程与行驶里程之比,一般以一辆车为单位,公式为:义 里程利用率=营业里程(公里)/行驶里程(公里)100% 这一指标反映车辆载客效率,如果比例高,说明车辆行驶中载客比例高,空驶比较低,对与要车的乘客来说可供租用的车辆不多,乘客等待时间增加,评价说明供求关系比例紧张。如果比例低,则车辆空驶比例高,乘客租用比较方便,但经营者的经济效益下降。国外一些城市把这一指标作为出租汽车发展规划的主要数据。如日本的东京、横滨等城市,把出租汽车里程利用率控制在 52%左右,以方便乘客租车,如果里程利用率高于 52%,则发展出租汽车,使之降到 52%左右。指 车辆满载率3标意义通过在客流集散较为集中的地点选取几个长期观测点,对单位时间通过道路的载有乘客的出租汽车数量占总通过出租汽车数量的比,公式为:车辆满载率=载客车数(辆)/总通过车辆(辆)100%评 经验认为,车辆满载率应达 70%。在实际操作过程中,通过控制出租车价 的满载率实现运力与运量的适当平衡。在中心城市,当出租车汽车载客率低于 70%时,限制出租汽车运力增加;高于 70%,增加出租汽车运力,这样对于提高服务质量,满足高峰时运力需求具有重要作用。指标万人拥有量意 是人均设备普指标,用来描述一定城市规模内车辆的占有量。公式为:义 万人拥有量=车辆(辆)/人口规模(万人)评 目前对城市出租车拥有量的控制标准中并没有上限规定,现行的城市价 道路交通规划设计规范(GB50220-95)仅给出了出租车拥有量的下限,即大城市不少于每万人 20 辆,小城市不少于每千人 5 辆,中等城市可在其间取值。5.2 问题一:建立评价出租车资源供求匹配程度的指标为评价出租车资源的“供求匹配”程度,引入出租车资源的供求匹配率这一 指标,指标的定义为城市中实际运行的出租车辆数与市民出行需要的出租车辆数之比,即NP = (1)M其中,引入 P 表示出租车资源的供求匹配率,M 表示市民出行需要的出租车辆数,N 表示城市中实际运行的出租车辆数。市民出行需要的出租车辆 M 的意义是指这些出租车辆能够恰好满足市民打车出行的需求,即城市出租车资源供求平 衡时的车辆数。 供求匹配率P反映了城市中实际运行的出租车辆数与市民出行需要的出租车辆数之间的差异。供求匹配率 P1 为出租车资源供求平衡状态,供求匹配率 P越接近 1,则说明城市出租车资源供求匹配程度越高,出租车数量配置越合理;当供求匹配率 P 大于 1 时,表明城市中现有的出租车数量超过市民出行需要的数量,会增加出租车的空驶率,造成出租车司机的收益降低;当供求匹配率 P 小于1 时,表明城市中现有的出租车数量少于市民出行需要的数量,需要增加出租车 的数量来缓解打车难的情况。5.2.1 建立市民出行需要的出租车辆数 M 的预测模型市民出行需要的出租车辆数 M 与市民人均日出行次数、城市总人口数量、市 民出行选择乘坐出租车的比例有关,也与每辆出租车日均载客次数、每单载客人 数和车辆满载率有关,具体关系式为:市民人均日出行次数 城市总人口 打车出行的比例 市民出行需要出租车辆数=日均每车载客次数 日均每车每次载客人数 车辆满载率 符号表达式为:M =Y W h sl m(2)其中,M 表示市民出行需要的出租车辆数(辆),Y 表示市民人均日出行次数(单4位:次/人日),W 为城市总人口数量(人),表示市民选择打车出行的比例,s表示出租车单车日均载客次数(单位:次/车日),表示出租车单车日均每次载客人数(人/车次),为出租车满载率。 根据参考文献3,选取出租车单车日均载客次数 s=35(次/车日),出租车单车日均每次载客人数=2.0(人/车次),出租车满载率=65%,居民选择打车出行的比例为 6%。接下来建立市民人均日出行次数与城市经济指标关联的量化模型市民人均日出行次数是居民出行强度的最直接反映,其与城市人口总数量的 乘积即为市民的出行总量,而市民人均日出行次数与城市经济指标有着极大联系。通常情况下,市民人均日出行次数的多少与出行目的、城市布局、交通设施、 城市环境质量等因素有关。对于某一城市来说,影响居民人均出行次数的因素又间接地反映在该城市的相关经济指标上。因此,多种因素与市民人均日出行次数 的内在关联可以转化为多种经济指标与市民人均日出行次数的内在关联。STEP1:各经济指标的聚类分析; STEP2:典型指标的选取;STEP3:回归模型的建立 STEP4:模型的检验。 聚类分析是根据事物本身的特性来定量研究分类问题的一种多元统计分析。其基本思想是按照距离的远近将数据分为若干个类别,以使类别内数据的“差异”尽可能小,类别间“差异”尽可能大。所用的变量可以被大致分成两类:对样本个体进行聚类通常称为 Q 型聚类,对研究变量进行聚类称为 R 型聚类。 选用欧几里得距离(欧式距离)来度量指标之间接近的程度。欧式距离就是空间中两点之间的直线距离,其中各特征参数是等权的,记 dij 表示指标 vi 和 vj之间的距离,则有计算公式如下:p = - 1 i, j =1, 2,L, pd (2) ( | v v |2 ) 2ij ik jkk=1聚类分析具体过程如下:(1) 首先将各聚类单位各自作为一类(这时有 p 类),按照所选取的距离计算各数据点之间的距离,形成一个距离阵。(2) 将距离最近的两个单位并为一个类别,形成 n-1 个类别,计算新产生的类别与其他各类别之间的距离,形成新的距离阵。(3) 按照和第二步相同的原则,再将距离最接近的两个类别合并,这时如果类 别个数仍然大于 1,则继续重复这一步骤,直到所有的数据都被合并为成为一个类别为止。STEP1:选取北京、上海、天津、广州、深圳、成都、南京、杭州、武汉、长春、珠海、大连、福州、苏州、常州十五个大中城市为研究对象,分析各城市 人均日出行次数和十二个经济指标之间的关联。十五个大中城市 2001 年人均日出行次数和各经济指标见表 2。5表 2 大中城市居民人均出行次数和经济指标城市 居民人均 市区土地 市区总人 第三产业 人均 工业产品 社会消费出行次数/(次/人面积/(km2)口/(万人) 值/亿元 GDP/元销售收入/(亿元)品零售总额/(亿天) 元)经济指标符号 v1 v2 v3 v4 v5 v6 苏州 2.43 1650 209.5 669 30384 2643.7 391.54南京 2.44 2599 371.9 544.5 20597 1672.5 465.83常州 2.86 280 89.5 39.1 19704 944.7 222.61上海 1.95 5300 1262.4 2509.8 37382 7213 1861.3北京 2.64 1041 676.8 1660.9 25300 3006.9 1593.4天津 2.44 7417 748 856.6 19986 2983.3 832.7杭州 2.07 3068 379.5 613 25074 1828.3 458.82福州 2.72 1043 153.8 436 18034 699.7 386.28广州 1.86 3719 577 1452.6 38000 2811.3 1248.28深圳 1.59 392 83.2 879.6 43344 2971.6 609.26珠海 3.04 1633 75.9 148.6 48931 634.2 128.44大连 1.88 2415 270.7 550 22348 1077.7 534.2长春 2.54 3583 298 423.5 14274 920.9 358.3武汉 2.84 8494 758.2 667.9 17882 980.4 685.82成都 2.56 1418 341.5 682.2 14665 726.4 627.52 城市 居民人均 房地产 城乡居民 居民消费 在岗+职 市区居民 农民纯收出行次数 开发资/ 储蓄存款 价格总指 工平均工 人均可支 入/元 (次/人. (亿元) /(亿元) 数/(%) 资/元 配收入/ 天) 元 经济指标符号 v7 v8 v9 v10 v11 v12苏州 2.43 68.6 936.9 99.5 13670 10512.00 5790南京 2.44 111.0 716.1 99.9 16575 8848.00 4311常州 2.86 32.2 412.7 100.1 13108 9406.00 4719上海 1.95 630.7 3001.9 100.0 21781 12883.00 5850北京 2.64 783.8 3536.3 103.1 19155 11578.00 5099天津 2.44 161.3 1285.0 101.2 14308 8959.00 4825杭州 2.07 140.9 941.8 99.5 18319 10896.00 4896福州 2.72 89.5 550.1 98.7 12760 9053.00 4020广州 1.86 387.0 2600.4 98.9 22772 14694.00 6446深圳 1.59 302.6 1373.4 97.8 25941 23544.00 9869珠海 3.04 34.1 248.9 98.6 17040 15870.00 4800大连 1.88 115.5 839.0 99.5 13493 7418.00 3900长春 2.54 48.5 608.1 102.3 11090 6339.00 2875武汉 2.84 115.3 802.0 99.5 11314 7305.00 3100成都 2.56 170.8 995.5 100.8 12493 8128.00 3111注:数据来源:参考文献1。以 12 个经济指标为聚类单位,指标与指标间的距离选用欧式距离,采用组 间平均联接法,进行聚类分析。利用 SPSS19.0 软件进行聚类分析,得到各经济指标间的相关系数矩阵如表 3,聚类过程中的运算结果参数见表 4 所示,聚类分析的谱系图如图 1。6表 3 相关系数矩阵 R v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v11 v12 v1 1.00 .711 .281 -.186 .262 .307 .027 .112 .137 -.173 -.326 -.281 v2 .711 1.00 .830 -.014 .743 .850 .651 .693 .345 .208 -.144 -.064 v3 .281 .830 1.00 .305 .900 .972 .899 .924 .207 .591 .254 .342 v4 -.186 -.014 .305 1.00 .420 .198 .291 .279 -.537 .766 .861 .734 v5 .262 .743 .900 .420 1.00 .815 .729 .753 .062 .624 .356 .502 v6 .307 .850 .972 .198 .815 1.00 .935 .959 .329 .519 .164 .247 v7 .027 .651 .899 .291 .729 .935 1.00 .973 .343 .625 .329 .370 v8 .112 .693 .924 .279 .753 .959 .973 1.00 .346 .611 .281 .365 v9 .137 .345 .207 -.537 .062 .329 .343 .346 1.00 -.332 -.527 -.469v10 -.173 .208 .591 .766 .624 .519 .625 .611 -.332 1.00 .866 .864 v11 -.326 -.144 .254 .861 .356 .164 .329 .281 -.527 .866 1.00 .918v12 -.281 -.064 .342 .734 .502 .247 .370 .365 -.469 .864 .918 1.00 表 4 聚类分析参数聚类表阶群集组合 首次出现阶群集 系数群集 1 群集 2 群集 1 群集 2下一阶1 3 6 831.753 0 0 42 7 9 945.251 0 0 33 2 7 1490.730 0 2 44 2 3 2535.570 3 1 55 2 8 4117.334 4 0 66 2 5 7813.490 5 0 77 1 2 12482.022 0 6 88 1 12 16855.223 7 0 109 10 11 22008.992 0 0 1010 1 10 49884.879 8 9 1111 1 4 95789.811 10 0 0图 1 聚类分析的谱系图7根据聚类分析的谱系图可以看出,这十二个经济指标可分为三大类:第一大类包括人均 GDP(v4);第二大类包括在岗职工平均工资(v10)和市区居民人均可 支配收入(v11);第三大类包括市区面积(v1)、市区总人口数(v2)、第三产业值 (v3)、工业产品销售收入(v5)、社会消费品零售总额(v6)、房地产开发投资(v7)、 城乡居民储蓄存款(v8)、居民消费价格总指数(v9)、农民人均纯收入(v12)。聚 类分析的结果见表 5表 5 聚类分析结果指标代码v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v11 v12分类类别 3 3 3 1 3 3 3 3 3 2 2 3STEP2:将十二个指标进行聚类分析得到三类指标后,出来第一类指标外, 其他两类都包含多个指标,为了选取各类指标中的典型指标,分别计算类中每一变量与其余变量的 Pearson 相关系数,继而求得类中每一变量与其余变量的Pearson 相关系数的平方和的平均值,最后把该值最大的变量作为典型指标。Pearson 相关系数的定义为R1 y y x x cov(Y, X )n - -= = (3)( i )( i )n = s s s si 1 y x y x相关系数 R 的数值范围是介于-1 与+1 之间:如果|R|0,表明两个变量没有线性相关关系。 如果|R|1,则表示两个变量完全直线相关。线性相关的方向通过相关系数的符号来表示,“+”号表示正相关,“-”表示负相关。R2vi=mR2v vi jj=1m -1j = Lm j i (4)1, 2, ,式中,R2 表示变量v 与其余变量v (i j) 的 Pearson 相关系数 R 的平方和的v i ji平均值,m 为变量的个数。将表 3 中的值代入公式(3)、(4),计算得到第二类和第三类指标中的各变量的R ,具体见表 6 所示。2 vi表 6 同一类中每一变量与其余变量的相关系数平方和的均值指 第二类指标 第三类指标标v10 v11 v1 v2 v3 v5 v6 v7 v8 v9 v12R2vi0.458 0.376 0.185 0.415 0.532 0.467 0.520 0.493 0.506 0.221 0.376 从表 6 中可以看出,第二类指标中 v10 对应的值最大,第三类指标 v3 中对应的值最大。所以,选择 v10、v3 为典型数据。而第一类指标只有一个指标,故可选取 v4、v10、 v3 分别作为第一、二、三类指标的典型指标。 STEP3:根据聚类分析得到的典型变量,利用表 2 中的数据,建立 2001 年人均日出行次数 Y 与第三产业值(v3)、人均 GDP(v4)、在岗+职工平均工资(v10)的多元线性回归方程。 多元线性回归原理: 多元线性回归模型为8每个因变量的实测值y y e b b x b e= + = + +L+ + (5)i i i 0 1 i1 p iy 由两部分组成:估计值,用 y 表示,即给定各自变量i i取值时因变量 y 的估计值,它代表的是能与自变量决定的部分;ei 为残差,是因变量实测值y 与估计值iy 之差,表示不由自变量决定的部分。i应用多个个回归模型对每一条记录求其因变量预测值与实测值之差的平方 和(y )2 i - y )2i y (y ,- ,并将其累加,那么每个回归模型都会得到一个累加值i i而该数值的最小的那个回归模型就是需要的模型,这就是最小二乘法。n nQ (y y ) y (b b x b x b x )= - = - + + +L+ (6)2i i i 0 1 1i 2 2i p pi i=1 i=1利用 SPSS19.0 软件计算得 = + - + - -5Y v v v3.464 ( 2.275 1.650 9.169 ) 103 4 10 2 =R 0.678(7)R2=0.678 表明因变量 Y(人均出行次数)的 67.8%可由回归方程确定,回归 方程视为可用的。STEP4:模型检验: 将表 2 中的第三产业值、人均 GDP、在岗+职工平均工资代入得到的多元线性回归方程(7)中,得到人均日出行次数的模型模拟值,作出模型值与调查值的折线图如图 2 所示。图 2 大中城市居民平均出行次数调查值与模型值比较由图 2 可以看出所得到的 2001 年人均日出行次数的回归方程具有较好的回归效果。由于市民每天出行次数的多少与出行目的、城市布局、生活方式、工作 方式、家庭经济状况、交通设施、通讯设施、城市环境质量等因素有关,随着社会经济的迅猛发展,人民生活水平也日渐提高,私家车数量大幅增加,城市的交通更加发达,人们之间的联系加强,越来越多的人选择逛街、旅游等休闲方式, 综合考虑社会经济的发展带来的影响,修正 2001 年人均日出行次数的回归方程,得到 2013 年人均日出行次数的回归方程:Y = + - v - v + v -5 (8)2.526 ( 5.452 2.395 4.616 ) 103 4 10 根据从参考文献5各城市 2013 年年鉴上收集到的数据(见表 7),利用 2013年人均日出行次数的回归方程8,计算得到相应城市的人均日出行次数,结果9如表 7 所示。表 7 国内主要城市相关的经济指标城市 第三产业值(亿元) 人均 GDP(元)在岗+职工平均工资(元)主城区人口(万人)出 租 车 数量(辆)大连 3281.20 111268 59061 360 12929北京 14986.50 93213 69521 1972 66646广州 9964.30 120105 68594 625.33 20300 武汉 4319.70 89000 53745 660 15637 南京 4356.56 125030 64811 451.49 10732 成都 4574.23 71715 47644 533.96 14898杭州 3661.98 94781 46831 455.426 8923 深圳 8198.10 137477 62626 1052.76 11433利用表 7 中的数据计算八座城市的出租车资源的供求匹配率,结果如表 8 所示。表 8 国内主要城市出行相关信息城市 大连 北京 广州 武汉 南京 成都 杭州 深圳人均日出行次数 2.41 2.68 2.27 2.64 2.29 2.76 2.22 1.68打车出行比例,% 6.2 65 6.9 5.8 6.7 6.6 6.1 5.6供求匹配率 P 1.0936 0.8827 0.9430 0.7040 0.7049 0.7666 0.6583 0.5252从表 8 可以看出,在所研究的八个国内主要城市中,只有大连这一座城市的 供求匹配率略大于 1,而其余主要城市的供求匹配率均小于,并且深圳和杭州两地的供求匹配率与 1 相距最远。因此,城市出租车资源供求达到近似平衡的城市为大连,而城市出租车资源供小于求的城市为北京、广州、武汉、南京、成都, 严重供小于求的城市为杭州和深圳。 5.2.2 不同时间的出租车资源的供求匹配由参考文献4得到的在不同时刻蚌埠市居民出行的平均比例,将此比例作 为成都市居民不同时刻的出行比例(见表 9),计算得到各时段的出租车供求匹配率,结果见表 9。表 9 成都市不同时刻出租车资源供求情况 时间段 6:00-8:30 11:00-12:30 13:30-14:30 17:00-18:30 出行比例% 31.97 15.43 10.84 15.56单车载客次数 6 4 3 4 供求匹配率 0.4111 0.5678 0.6062 0.5631 由表 9 可以看出,在上班早高峰、下班晚高峰和中午时段成都市出租车资源的供求匹配率均小于 1,并且与 1 相距较远。所以这在四个时间段内,成都市出租车资源都是严重供小于求。5.2.3 利用灰色模型预测 2018 年成都市区人口数量和出租车需求量利用灰色模型预测 2018 年成都市区人口数量和出租车需求量,接下来介绍灰色预测方法原理。1设已知参考数据列为 x(0)=(x(0)(1),x(0)(2),x(0)(n),做 1 次累加(AGO),生成数列x 1 = = + - +( x (1), x (2),., x (n) (x (1), x (1) x (2),., x (n 1) x (n) ( (1) (1) (1) (1) (1) (0) (1) (0)k其中 x(1) (k) x(0) (i)(k =1, 2,n)= 。求均值数列i=110z ) ( ) 0.5 (1) ( ) 0.5 (1) ( 1)( k = x k + x k -1则 z(1)=(z(1)(2),z(1)(3),z(1)(n)。于是建立灰微分方程为x(0) (k) + az(1) (k) = b相应的白化微分方程为dx + ( ) =(1)ax t(1)dtb记m =(a,b)T ,Y = (x(0) (2), x(0) (3),., x(0) (n)TB =- z(1) (2) 1- z (3) 1(1) M M - (1)z (n) 1 由最小二乘法,求得使 J(m) = (Y - B m)T (Y - B m)达到最小值的m=(a,b)T = ( T )-1 TB B B Y于是求解方程得b bx + = - ak + = K(1) ( (1) - k nk 1) (x (1) )e , 1,2, ,a a-12灰色预测的步骤(1)数据的检验与处理首先,为了保证建模方法的可行性,需要对已知数据列做必要的检验处理。 设参数据为 x(0)=(x(0)(1),x(0)(2),x(0)(n),计算数列的级比l = (0) - , k = 2,3,n (k)x (k 1)x (k)(0)2 2-如果所有的级比(k)都落在可容覆盖( , )e 1 n+2 内,则数列 xn+ e(0)可以作为模型GM(1,1)的数据进行灰色预测。否则,需要对数列 x(0)做必要的变换处理,使其落入可容覆盖内。即取适当的常数 c ,作平移变换y(0) ( ) = (0) ( ) + , = 1,2,K, ,k x k c k n则使数列 y( = (y (1), y (2),., y (n) 的级比为0) (0) (0) (0)y (k -1)(0)l(k) = X ,k = 2,3, ,n ,Ky (k)(0)(2)建立模型按 1 节中的方法建立模型 GM(1,1),则可以得到预测值 b b (1)x + = - ak + = K(k 1) (x(0) (1) )e ,k 1,2, ,n-a a-1,。(3)建立模型预测值残差检验:令残差为(k),计算11x (k) - x (k)(0) (0)e(k) = ,k = 1,2, ,n ,Kx (k)(0)如果(k)0.2,则可认为达到一般要求;如果(k)0.1,则认为达到较高的要 求。 级比偏差值检验:首先由参考数据 x(0)(k-1),x(0)(k),计算出级比(k),再用发展系数 a 求出相应的级比偏差1- 0.5ar(k) =1- ( )l(k) 1+ 0.5a如果(k)0.2,则可认为达到一般要求;如果(k)0.1,则认为达到较高的要求。 利用灰色预测模型和成都市 2002 年至 2013 年的人口数量,对成都市 2014年至 2021 年的人口数量进行预测,结果见表 10 和表 11。 表 10 成都市人口灰色预测年份 市区人口(万人) 模型值 残差 相对误差 级比误差 2002 439.8 439.8 0 02003 451.2 458.624 -7.424 0.0165 0.00422004 464.54 468.546 -4.006 0.0086 0.00772005 482.07 478.69 3.38 0.007 0.01552006 497.15 489.04 8.11 0.0163 0.00942007 502.71 499.62 3.09 0.0061 -0.01032008 510.16 510.44 -0.28 0.0005 -0.00672009 520.86 521.47 -0.61 0.0012 -0.00062010 535.15 532.76 2.39 0.0045 0.0056 2011 544.78 544.29 0.49 0.0009 -0.00362012 554.18 556.07 -1.89 0.0034 -0.00432013 564.94 568.09 -3.15 0.0056 -0.0022表 11 成都市区人口预测 年份 2014 2015 2016 2017 2018 2019 2020 2021人口(万人) 580.39 592.94 605.78 618.88 632.27 645.95 659.95 674.2预测 2018 年成都市区人口 632.27 万,选取人均日出行次数为 2.8 次,将以 上数据代入公式1,得到在出租车供求平衡即供求匹配率 P1 的情况下,成都市 2018 年需要出租车 23345 辆。5.3 问题二:分析
收藏
- 资源描述:
-
+-
基于供求匹配率的出租车资源配置模型
摘 要
本文针对城市出租车资源配置问题,采用定性与定量相结合的研究方法,建
立衡量出租车供求匹配程度的指标,分析打车软件各种补贴方案对所建指标的影
响,在充分考虑各方利益的前提下,得到打车软件的最优补贴方案,对城市出租 车行业资源优化配置、持续良性发展具有一定的参考意义。
为分析不同时空出租车资源的供求匹配程度,引入出租车资源供求匹配率这 一指标,指标的定义为城市中实际运行的出租车辆数与居民出行需要的出租车辆
数之比,反映城市中实际运行的出租车辆数与居民出行需要的出租车辆数之间的 差异。计算得出成都 2013 年出租车供求匹配率为 0.7766,表示供不应求。
居民出行需要的出租车辆数与居民人均日出行次数、城市总人口数量、居民 出行选择乘坐出租车的比例有关,也与每辆出租车日均载客次数、每单载客人数
和车辆满载率有关。对于居民人均日出行次数,利用十五个国内大中城市的数据, 将十二个城市经济指标聚类分析选出每类指标中典型的经济指标,建立居民人均 日出行次数与这些典型经济指标间的多元线性回归方程,而与居民出行需要的出 租车辆数相关的其他指标可查阅文献或年鉴获得。分析成都市每天 6:00-8:30,
11:00-12:30,13:30-14:30,17:00-18:30 四 个 时 间 段 得 供 求 匹 配 率 分 别 为
0.4111,0.5678,0.6062,0.5631,结果显示供不应求。得到大连、北京、广州、 武汉、南京、成都、杭州、深圳八座城市的出租车资源供求匹配率分别为 1.0936、 0.8827、0.9430、0.7040、0.7049、0.7666、0.6583、0.5252,表明只有大连的出租车资 源是供大于求,而其余七座城市为供小于求。
为了分析各公司的出租车补贴方案对缓解打车难是否有帮助,定性分析出租
车日均载客次数、出租车满载率随打车软件对出租车司机每单补贴金额的变化趋
势,分别建立阻滞增长模型,进而分析打车软件对出租车司机每单补贴金额的变
化对所建指标的影响。得到的结论为:对于使用打车软件的乘客来说,出租车补
贴方案能够缓解打车难的问题;而对于不使用打车软件的乘客来说,出租车补贴
方案则不能缓解打车难的问题。
针对打车软件服务平台的最优补贴问题,综合考虑乘客、出租车司机和打车
软件公司三方的满意度,利用熵值法确定这三方各自满意度的权重,将三方满意
度加权之和作为综合满意度,进而以综合满意度为目标函数,以打车软件对出租
车司机每单补贴金额为控制变量,以补贴金额设置的范围为约束条件建立优化模
型。遍历所有可能的方案得到最优补贴方案为对出租车司机每单补贴 9 元,综合
满意度为 0.5710。
关键词:聚类分析;回归分析;灰色预测;阻滞增长模型;熵值法;最优化
1
一、 问题重述
随着经济的发展,近年来,人们对出行的要求不断提高,城市出租车以其方
便、快捷、舒适和私密性的特点成为越来越多人的出行选择。但是,国内各大城 市交通问题日趋严重,“打车难”也是人们关注的一个社会热点问题。数据显示,
包括上海、杭州等众多大城市,出租车非高峰期的空驶率始终在 30%上下徘徊, 而高峰期却打不到车。这与众多市民反映的打车难背后所隐藏的强烈需求看似形
成了一个矛盾。究其原因,最主要的莫过于司机与乘客需求信息不对称,缺乏及 时沟通交流的平台。
随着“互联网+”时代的到来,有多家公司依托移动互联网建立了打车软件
服务平台,实现了乘客与出租车司机之间的信息互通,同时推出了多种出租车的 补贴方案,吸引了越来越多的司机和乘客使用打车软件。然而,打车软件同时也
导致出租车行业乱象丛生,存在马路扬招成功率降低、乘客怕司机接到大单拒载、 司机分心忙于抢单影响行车安全等问题。
请你们搜集相关数据,建立数学模型研究如下问题:
问题一:试建立合理的指标,并分析不同时空出租车资源的“供求匹配”程度。
问题二:分析各公司的出租车补贴方案是否对“缓解打车难”有帮助?
问题三:如果要创建一个新的打车软件服务平台,你们将设计什么样的补贴方
案,并论证其合理性。
二、 问题分析
“打车难”是人们关注的一个社会热点问题。但是,在北京也不是无论何时
何地都难打到车。打车难往往出现在特殊时间和地点:上班高峰的住宅区,下班
高峰的商务区,凌晨和深夜的郊区或偏僻地点,遇到雨雪天气……
“互联网+”时代的出租车资源配置是一个十分复杂的社会问题。要想准确
得出合理的资源配置方案难以实现,同时也难以准确收集大量出租车的各项数据
如出租车的每天跑单数,收费,拒载情况等,以及不同城市不同城区不同时间居
民的出行行为特征数据。
为了建立合理的指标,分析不同时空出租车资源的供求匹配程度,首先从城
市居民出行对出租车的需求量入手,分析与需求量有关的主要指标,如城市居民
出行量。为分析城市居民出行量与城市经济指标的相关性,先将这些指标进行聚
类分析,继而得出每类最具代表性的经济指标,再将最具代表性的经济指标与居
民出行总量进行回归分析,得到多元线性回归模型,从而预测居民的出行总量。
通过查阅文献可以确定居民出行选择出租车作为出行方式的比例从而,计算得出
城市的出租车运输量的需求量。然后根据供需平衡法预测出城市出租车需求量。
将城市实际出租车数量与城市出租车需求数量作比,得到衡量出租车资源的供求
匹配程度的指标即供求匹配率。对未来城市的出租需求量进行灰色关联预测,得
到未来城市的出租需求量,通过计算不同城市的出租车需求量,进行不同时空的
出租车资源供求匹配的分析。
对于各公司的出租车补贴方案是否对“缓解打车难”有帮助问题,由于难以
得到各公司不同时间的补贴方案对居民打车难度的实际影响效果数据,我们从公
司对每单的补贴金额入手,分析每单补贴金额范围为 0~15 元,认为补贴金额再
高对公司利益有较大损失。司机的每日跑单数为平均每台出租车每天接单数,有
效载客率等效为里程利用率。以每单补贴金额为自变量,司机的每日跑单数和有
效载客率为因变量,建立阻滞增长模型,基于前面的供求匹配率关系式算出不同
每单补贴金额对应的供求匹配率这一指标。
2
为一个新的打车软件服务平台设计合理的补贴方案,我们基于已建立的模型
计算出租车单车日均载客次数、有效载客率与打车软件平台对每单补贴金额的关
系式。综合考虑每单补贴金额对出租车司机、乘客、打车软件平台三方各自的满
意度,利用熵值法求出三方满意度的权重,继而将三方的标准化数据乘以权重得 出综合满意度,比较得出最优的补贴方案。
三、 模型假设
1.假设城市中的黑车现象对居民出行没有造成影响; 2.假设所研究的城市没有发生严重的自然灾害和社会动荡;
3.假设所研究的城市政府对出租车行业的政策基本不变;
4.假设司机和乘客都是为自身利益考虑,即经济人假设; 5.假设参考文献中的数据来源可靠,真实可信。
四、 符号说明
符号 含义,单位
P 出租车供求匹配率
M 市民出行需要的出租车辆数,辆
N 城市实际运行的出租车辆数,辆
Y 市民日均出行次数,次/日
W 城市总人口数量,人
η 市民选择打车出行的比例
s 出租车单车日均载客次数,次/车日
λ 出租车单车日均每次载客人数,人/车次
μ 出租车满载率
vi 城市的第 i 个经济指标
R Pearson 相关系数
w 打车软件每单对司机的补贴钱数,元
x 每辆出租车每天接单的数量,单
y 出租车每天的满载率
五、 模型建立与求解
5.1 建模前的准备
由参考文献[2]可得到现有指标体系见表 1。
表 1 衡量出租车供求的三大指标
指
标
里程利用率
意 指营业里程与行驶里程之比,一般以一辆车为单位,公式为:
义 里程利用率=营业里程(公里)/行驶里程(公里)100%
这一指标反映车辆载客效率,如果比例高,说明车辆行驶中载客比例高,
空驶比较低,对与要车的乘客来说可供租用的车辆不多,乘客等待时间增加,
评
价
说明供求关系比例紧张。如果比例低,则车辆空驶比例高,乘客租用比较方
便,但经营者的经济效益下降。国外一些城市把这一指标作为出租汽车发展
规划的主要数据。如日本的东京、横滨等城市,把出租汽车里程利用率控制
在 52%左右,以方便乘客租车,如果里程利用率高于 52%,则发展出租汽车,
使之降到 52%左右。
指 车辆满载率
3
标
意
义
通过在客流集散较为集中的地点选取几个长期观测点,对单位时间通过
道路的载有乘客的出租汽车数量占总通过出租汽车数量的比,公式为:
车辆满载率=载客车数(辆)/总通过车辆(辆)100%
评 经验认为,车辆满载率应达 70%。在实际操作过程中,通过控制出租车
价 的满载率实现运力与运量的适当平衡。在中心城市,当出租车汽车载客率低
于 70%时,限制出租汽车运力增加;高于 70%,增加出租汽车运力,这样对于
提高服务质量,满足高峰时运力需求具有重要作用。
指
标
万人拥有量
意 是人均设备普指标,用来描述一定城市规模内车辆的占有量。公式为:
义 万人拥有量=车辆(辆)/人口规模(万人)
评 目前对城市出租车拥有量的控制标准中并没有上限规定,现行的《城市
价 道路交通规划设计规范(GB50220-95)》仅给出了出租车拥有量的下限,即
大城市不少于每万人 20 辆,小城市不少于每千人 5 辆,中等城市可在其间
取值。
5.2 问题一:建立评价出租车资源供求匹配程度的指标
为评价出租车资源的“供求匹配”程度,引入出租车资源的供求匹配率这一 指标,指标的定义为城市中实际运行的出租车辆数与市民出行需要的出租车辆数
之比,即
N
P = (1)
M
其中,引入 P 表示出租车资源的供求匹配率,M 表示市民出行需要的出租车辆
数,N 表示城市中实际运行的出租车辆数。市民出行需要的出租车辆 M 的意义
是指这些出租车辆能够恰好满足市民打车出行的需求,即城市出租车资源供求平 衡时的车辆数。
供求匹配率P反映了城市中实际运行的出租车辆数与市民出行需要的出租车
辆数之间的差异。供求匹配率 P=1 为出租车资源供求平衡状态,供求匹配率 P
越接近 1,则说明城市出租车资源供求匹配程度越高,出租车数量配置越合理;
当供求匹配率 P 大于 1 时,表明城市中现有的出租车数量超过市民出行需要的数
量,会增加出租车的空驶率,造成出租车司机的收益降低;当供求匹配率 P 小于
1 时,表明城市中现有的出租车数量少于市民出行需要的数量,需要增加出租车 的数量来缓解打车难的情况。
5.2.1 建立市民出行需要的出租车辆数 M 的预测模型
市民出行需要的出租车辆数 M 与市民人均日出行次数、城市总人口数量、市 民出行选择乘坐出租车的比例有关,也与每辆出租车日均载客次数、每单载客人 数和车辆满载率有关,具体关系式为:
市民人均日出行次数 城市总人口 打车出行的比例
市民出行需要出租车辆数=
日均每车载客次数 日均每车每次载客人数 车辆满载率
符号表达式为:
M =
Y W h
sl m
(2)
其中,M 表示市民出行需要的出租车辆数(辆),Y 表示市民人均日出行次数(单
4
位:次/人日),W 为城市总人口数量(人),η表示市民选择打车出行的比例,s
表示出租车单车日均载客次数(单位:次/车日),λ表示出租车单车日均每次载
客人数(人/车次),μ为出租车满载率。
根据参考文献[3],选取出租车单车日均载客次数 s=35(次/车日),出租车
单车日均每次载客人数λ=2.0(人/车次),出租车满载率μ=65%,居民选择打车出
行的比例为 6%。
接下来建立市民人均日出行次数与城市经济指标关联的量化模型
市民人均日出行次数是居民出行强度的最直接反映,其与城市人口总数量的 乘积即为市民的出行总量,而市民人均日出行次数与城市经济指标有着极大联
系。通常情况下,市民人均日出行次数的多少与出行目的、城市布局、交通设施、 城市环境质量等因素有关。对于某一城市来说,影响居民人均出行次数的因素又
间接地反映在该城市的相关经济指标上。因此,多种因素与市民人均日出行次数 的内在关联可以转化为多种经济指标与市民人均日出行次数的内在关联。
STEP1:各经济指标的聚类分析; STEP2:典型指标的选取;
STEP3:回归模型的建立 STEP4:模型的检验。 聚类分析是根据事物本身的特性来定量研究分类问题的一种多元统计分析。
其基本思想是按照距离的远近将数据分为若干个类别,以使类别内数据的“差异”
尽可能小,类别间“差异”尽可能大。所用的变量可以被大致分成两类:对样本
个体进行聚类通常称为 Q 型聚类,对研究变量进行聚类称为 R 型聚类。
选用欧几里得距离(欧式距离)来度量指标之间接近的程度。欧式距离就是
空间中两点之间的直线距离,其中各特征参数是等权的,记 dij 表示指标 vi 和 vj
之间的距离,则有计算公式如下:
p
= - 1 i, j =1, 2,L, p
d (2) ( | v v |2 ) 2
ij ik jk
k=1
聚类分析具体过程如下:
(1) 首先将各聚类单位各自作为一类(这时有 p 类),按照所选取的距离计算
各数据点之间的距离,形成一个距离阵。
(2) 将距离最近的两个单位并为一个类别,形成 n-1 个类别,计算新产生的类
别与其他各类别之间的距离,形成新的距离阵。
(3) 按照和第二步相同的原则,再将距离最接近的两个类别合并,这时如果类
别个数仍然大于 1,则继续重复这一步骤,直到所有的数据都被合并为成
为一个类别为止。
STEP1:选取北京、上海、天津、广州、深圳、成都、南京、杭州、武汉、
长春、珠海、大连、福州、苏州、常州十五个大中城市为研究对象,分析各城市 人均日出行次数和十二个经济指标之间的关联。十五个大中城市 2001 年人均日
出行次数和各经济指标见表 2。
5
表 2 大中城市居民人均出行次数和经济指标
城市 居民人均 市区土地 市区总人 第三产业 人均 工业产品 社会消费
出行次数
/(次/人
面积
/(km2)
口/(万人) 值/亿元 GDP/元
销售收入
/(亿元)
品零售总
额/(亿
天) 元)
经济指标符号 v1 v2 v3 v4 v5 v6 苏州 2.43 1650 209.5 669 30384 2643.7 391.54
南京 2.44 2599 371.9 544.5 20597 1672.5 465.83
常州 2.86 280 89.5 39.1 19704 944.7 222.61
上海 1.95 5300 1262.4 2509.8 37382 7213 1861.3
北京 2.64 1041 676.8 1660.9 25300 3006.9 1593.4
天津 2.44 7417 748 856.6 19986 2983.3 832.7
杭州 2.07 3068 379.5 613 25074 1828.3 458.82
福州 2.72 1043 153.8 436 18034 699.7 386.28
广州 1.86 3719 577 1452.6 38000 2811.3 1248.28
深圳 1.59 392 83.2 879.6 43344 2971.6 609.26
珠海 3.04 1633 75.9 148.6 48931 634.2 128.44
大连 1.88 2415 270.7 550 22348 1077.7 534.2
长春 2.54 3583 298 423.5 14274 920.9 358.3
武汉 2.84 8494 758.2 667.9 17882 980.4 685.82
成都 2.56 1418 341.5 682.2 14665 726.4 627.52 城市 居民人均 房地产 城乡居民 居民消费 在岗+职 市区居民 农民纯收
出行次数 开发资/ 储蓄存款 价格总指 工平均工 人均可支 入/元
(次/人. (亿元) /(亿元) 数/(%) 资/元 配收入/
天) 元
经济指标符号 v7 v8 v9 v10 v11 v12
苏州 2.43 68.6 936.9 99.5 13670 10512.00 5790
南京 2.44 111.0 716.1 99.9 16575 8848.00 4311
常州 2.86 32.2 412.7 100.1 13108 9406.00 4719
上海 1.95 630.7 3001.9 100.0 21781 12883.00 5850
北京 2.64 783.8 3536.3 103.1 19155 11578.00 5099
天津 2.44 161.3 1285.0 101.2 14308 8959.00 4825
杭州 2.07 140.9 941.8 99.5 18319 10896.00 4896
福州 2.72 89.5 550.1 98.7 12760 9053.00 4020
广州 1.86 387.0 2600.4 98.9 22772 14694.00 6446
深圳 1.59 302.6 1373.4 97.8 25941 23544.00 9869
珠海 3.04 34.1 248.9 98.6 17040 15870.00 4800
大连 1.88 115.5 839.0 99.5 13493 7418.00 3900
长春 2.54 48.5 608.1 102.3 11090 6339.00 2875
武汉 2.84 115.3 802.0 99.5 11314 7305.00 3100
成都 2.56 170.8 995.5 100.8 12493 8128.00 3111
注:数据来源:参考文献[1]。
以 12 个经济指标为聚类单位,指标与指标间的距离选用欧式距离,采用组 间平均联接法,进行聚类分析。利用 SPSS19.0 软件进行聚类分析,得到各经济
指标间的相关系数矩阵如表 3,聚类过程中的运算结果参数见表 4 所示,聚类分
析的谱系图如图 1。
6
表 3 相关系数矩阵 R
v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v11 v12
v1 1.00 .711 .281 -.186 .262 .307 .027 .112 .137 -.173 -.326 -.281
v2 .711 1.00 .830 -.014 .743 .850 .651 .693 .345 .208 -.144 -.064
v3 .281 .830 1.00 .305 .900 .972 .899 .924 .207 .591 .254 .342
v4 -.186 -.014 .305 1.00 .420 .198 .291 .279 -.537 .766 .861 .734
v5 .262 .743 .900 .420 1.00 .815 .729 .753 .062 .624 .356 .502
v6 .307 .850 .972 .198 .815 1.00 .935 .959 .329 .519 .164 .247
v7 .027 .651 .899 .291 .729 .935 1.00 .973 .343 .625 .329 .370
v8 .112 .693 .924 .279 .753 .959 .973 1.00 .346 .611 .281 .365
v9 .137 .345 .207 -.537 .062 .329 .343 .346 1.00 -.332 -.527 -.469
v10 -.173 .208 .591 .766 .624 .519 .625 .611 -.332 1.00 .866 .864
v11 -.326 -.144 .254 .861 .356 .164 .329 .281 -.527 .866 1.00 .918
v12 -.281 -.064 .342 .734 .502 .247 .370 .365 -.469 .864 .918 1.00
表 4 聚类分析参数
聚类表
阶
群集组合 首次出现阶群集
系数
群集 1 群集 2 群集 1 群集 2
下一阶
1 3 6 831.753 0 0 4
2 7 9 945.251 0 0 3
3 2 7 1490.730 0 2 4
4 2 3 2535.570 3 1 5
5 2 8 4117.334 4 0 6
6 2 5 7813.490 5 0 7
7 1 2 12482.022 0 6 8
8 1 12 16855.223 7 0 10
9 10 11 22008.992 0 0 10
10 1 10 49884.879 8 9 11
11 1 4 95789.811 10 0 0
图 1 聚类分析的谱系图
7
根据聚类分析的谱系图可以看出,这十二个经济指标可分为三大类:第一大
类包括人均 GDP(v4);第二大类包括在岗职工平均工资(v10)和市区居民人均可 支配收入(v11);第三大类包括市区面积(v1)、市区总人口数(v2)、第三产业值 (v3)、工业产品销售收入(v5)、社会消费品零售总额(v6)、房地产开发投资(v7)、 城乡居民储蓄存款(v8)、居民消费价格总指数(v9)、农民人均纯收入(v12)。聚 类分析的结果见表 5
表 5 聚类分析结果
指标代
码
v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v11 v12
分类类别 3 3 3 1 3 3 3 3 3 2 2 3
STEP2:将十二个指标进行聚类分析得到三类指标后,出来第一类指标外, 其他两类都包含多个指标,为了选取各类指标中的典型指标,分别计算类中每一
变量与其余变量的 Pearson 相关系数,继而求得类中每一变量与其余变量的
Pearson 相关系数的平方和的平均值,最后把该值最大的变量作为典型指标。
Pearson 相关系数的定义为
R
1 y y x x cov(Y, X )
n - -
= = (3)
( i )( i )
n = s s s s
i 1 y x y x
相关系数 R 的数值范围是介于-1 与+1 之间:
如果|R|≈0,表明两个变量没有线性相关关系。
如果|R|=1,则表示两个变量完全直线相关。线性相关的方向通过相关系数
的符号来表示,“+”号表示正相关,“-”表示负相关。
R
2
v
i
=
m
R
2
v v
i j
j=1
m -1
j = Lm j i (4)
1, 2, ,
式中,R2 表示变量v 与其余变量v (i j) 的 Pearson 相关系数 R 的平方和的
v i j
i
平均值,m 为变量的个数。
将表 3 中的值代入公式(3)、(4),计算得到第二类和第三类指标中的各变量的
R ,具体见表 6 所示。
2 v
i
表 6 同一类中每一变量与其余变量的相关系数平方和的均值
指 第二类指标 第三类指标
标
v10 v11 v1 v2 v3 v5 v6 v7 v8 v9 v12
R
2
v
i
0.458 0.376 0.185 0.415 0.532 0.467 0.520 0.493 0.506 0.221 0.376
从表 6 中可以看出,第二类指标中 v10 对应的值最大,第三类指标 v3 中对应
的值最大。所以,选择 v10、v3 为典型数据。而第一类指标只有一个指标,故可
选取 v4、v10、 v3 分别作为第一、二、三类指标的典型指标。
STEP3:根据聚类分析得到的典型变量,利用表 2 中的数据,建立 2001 年人
均日出行次数 Y 与第三产业值(v3)、人均 GDP(v4)、在岗+职工平均工资(v10)
的多元线性回归方程。 多元线性回归原理:
多元线性回归模型为
8
每个因变量的实测值
y y e b b x b e
= + = + +L+ + (5)
i i i 0 1 i1 p i
y 由两部分组成:估计值,用 y 表示,即给定各自变量
i i
取值时因变量 y 的估计值,它代表的是能与自变量决定的部分;ei 为残差,是因
变量实测值
y 与估计值
i
y 之差,表示不由自变量决定的部分。
i
应用多个个回归模型对每一条记录求其因变量预测值与实测值之差的平方
和(y )2 i - y )2
i y (y ,
- ,并将其累加,那么每个回归模型都会得到一个累加值
i i
而该数值的最小的那个回归模型就是需要的模型,这就是最小二乘法。
n n
Q (y y ) [y (b b x b x b x )]
= - = - + + +L+ (6)
2
i i i 0 1 1i 2 2i p pi i=1 i=1
利用 SPSS19.0 软件计算得
= + - + -
-5
Y v v v
3.464 ( 2.275 1.650 9.169 ) 10
3 4 10
2 =
R 0.678
(7)
R2=0.678 表明因变量 Y(人均出行次数)的 67.8%可由回归方程确定,回归 方程视为可用的。
STEP4:模型检验:
将表 2 中的第三产业值、人均 GDP、在岗+职工平均工资代入得到的多元线
性回归方程(7)中,得到人均日出行次数的模型模拟值,作出模型值与调查值
的折线图如图 2 所示。
图 2 大中城市居民平均出行次数调查值与模型值比较
由图 2 可以看出所得到的 2001 年人均日出行次数的回归方程具有较好的回
归效果。由于市民每天出行次数的多少与出行目的、城市布局、生活方式、工作 方式、家庭经济状况、交通设施、通讯设施、城市环境质量等因素有关,随着社
会经济的迅猛发展,人民生活水平也日渐提高,私家车数量大幅增加,城市的交
通更加发达,人们之间的联系加强,越来越多的人选择逛街、旅游等休闲方式, 综合考虑社会经济的发展带来的影响,修正 2001 年人均日出行次数的回归方程,
得到 2013 年人均日出行次数的回归方程:
Y = + - v - v + v -5 (8)
2.526 ( 5.452 2.395 4.616 ) 10
3 4 10
根据从参考文献[5]各城市 2013 年年鉴上收集到的数据(见表 7),利用 2013
年人均日出行次数的回归方程[8],计算得到相应城市的人均日出行次数,结果
9
如表 7 所示。
表 7 国内主要城市相关的经济指标
城市 第三产业值(亿元) 人均 GDP(元)
在岗+职工平
均工资(元)
主城区人口
(万人)
出 租 车 数
量(辆)
大连 3281.20 111268 59061 360 12929
北京 14986.50 93213 69521 1972 66646
广州 9964.30 120105 68594 625.33 20300 武汉 4319.70 89000 53745 660 15637 南京 4356.56 125030 64811 451.49 10732 成都 4574.23 71715 47644 533.96 14898
杭州 3661.98 94781 46831 455.426 8923 深圳 8198.10 137477 62626 1052.76 11433
利用表 7 中的数据计算八座城市的出租车资源的供求匹配率,结果如表 8 所
示。
表 8 国内主要城市出行相关信息
城市 大连 北京 广州 武汉 南京 成都 杭州 深圳
人均日出行次数 2.41 2.68 2.27 2.64 2.29 2.76 2.22 1.68
打车出行比例,% 6.2 6.5 6.9 5.8 6.7 6.6 6.1 5.6
供求匹配率 P 1.0936 0.8827 0.9430 0.7040 0.7049 0.7666 0.6583 0.5252
从表 8 可以看出,在所研究的八个国内主要城市中,只有大连这一座城市的 供求匹配率略大于 1,而其余主要城市的供求匹配率均小于1,并且深圳和杭州
两地的供求匹配率与 1 相距最远。因此,城市出租车资源供求达到近似平衡的城
市为大连,而城市出租车资源供小于求的城市为北京、广州、武汉、南京、成都, 严重供小于求的城市为杭州和深圳。 5.2.2 不同时间的出租车资源的供求匹配
由参考文献[4]得到的在不同时刻蚌埠市居民出行的平均比例,将此比例作 为成都市居民不同时刻的出行比例(见表 9),计算得到各时段的出租车供求匹
配率,结果见表 9。
表 9 成都市不同时刻出租车资源供求情况
时间段 6:00-8:30 11:00-12:30 13:30-14:30 17:00-18:30
出行比例% 31.97 15.43 10.84 15.56
单车载客次数 6 4 3 4
供求匹配率 0.4111 0.5678 0.6062 0.5631
由表 9 可以看出,在上班早高峰、下班晚高峰和中午时段成都市出租车资源
的供求匹配率均小于 1,并且与 1 相距较远。所以这在四个时间段内,成都市出
租车资源都是严重供小于求。
5.2.3 利用灰色模型预测 2018 年成都市区人口数量和出租车需求量
利用灰色模型预测 2018 年成都市区人口数量和出租车需求量,接下来介绍
灰色预测方法原理。
1.设已知参考数据列为 x(0)=(x(0)(1),x(0)(2),…,x(0)(n)),做 1 次累加
(AGO),生成数列
x 1 = = + - +
( x (1), x (2),..., x (n)) (x (1), x (1) x (2),..., x (n 1) x (n))
) ( (1) (1) (1) (1) (1) (0) (1) (0)
k
其中 x(1) (k) x(0) (i)(k =1, 2,,n)
= 。求均值数列
i=1
10
z ) ( ) 0.5 (1) ( ) 0.5 (1) ( 1)
( k = x k + x k -
1
则 z(1)=(z(1)(2),z(1)(3),…,z(1)(n))。于是建立灰微分方程为
x(0) (k) + az(1) (k) = b
相应的白化微分方程为
dx + ( ) =
(1)
ax t
(1)
dt
b
记
m =
(a,b)T ,Y = (x(0) (2), x(0) (3),..., x(0) (n))
T
B =
-
z(1) (2) 1
-
z (3) 1
(1)
M M
- (1)
z (n) 1
由最小二乘法,求得使
J(m) = (Y - B m)T (Y - B m)
达到最小值的
m
=
(a,b)T = ( T )-1 T
B B B Y
于是求解方程得
b b
x + = - ak + = K
(1) ( (1) - k n
k 1) (x (1) )e , 1,2, ,
a a
-1
2.灰色预测的步骤
(1)数据的检验与处理
首先,为了保证建模方法的可行性,需要对已知数据列做必要的检验处理。 设参数据为 x(0)=(x(0)(1),x(0)(2),…,x(0)(n)),计算数列的级比
l = (0) - , k = 2,3,,n
(k)
x (k 1)
x (k)
(0)
2 2
-
如果所有的级比λ(k)都落在可容覆盖( , )
e 1 n+2 内,则数列 x
n+ e
(0)可以作为模型
GM(1,1)的数据进行灰色预测。否则,需要对数列 x(0)做必要的变换处理,使其
落入可容覆盖内。即取适当的常数 c ,作平移变换
y(0) ( ) = (0) ( ) + , = 1,2,K, ,
k x k c k n
则使数列 y( = (y (1), y (2),..., y (n) 的级比为
0) (0) (0) (0)
y (k -1)
(0)
l(k) = X ,k = 2,3, ,n ,
K
y (k)
(0)
(2)建立模型
按 1 节中的方法建立模型 GM(1,1),则可以得到预测值
b b (1)
x + = - ak + = K
(k 1) (x(0) (1) )e ,k 1,2, ,n
-
a a
-1,。
(3)建立模型预测值
残差检验:令残差为ε(k),计算
11
x (k) - x (k)
(0) (0)
e(k) = ,k = 1,2, ,n ,
K
x (k)
(0)
如果ε(k)<0.2,则可认为达到一般要求;如果ε(k)<0.1,则认为达到较高的要 求。
级比偏差值检验:首先由参考数据 x(0)(k-1),x(0)(k),计算出级比λ(k),
再用发展系数 a 求出相应的级比偏差
1- 0.5a
r(k) =1- ( )l(k)
1+ 0.5a
如果ρ(k)<0.2,则可认为达到一般要求;如果ρ(k)<0.1,则认为达到较高
的要求。
利用灰色预测模型和成都市 2002 年至 2013 年的人口数量,对成都市 2014
年至 2021 年的人口数量进行预测,结果见表 10 和表 11。
表 10 成都市人口灰色预测
年份 市区人口(万人) 模型值 残差 相对误差 级比误差 2002 439.8 439.8 0 0
2003 451.2 458.624 -7.424 0.0165 0.0042
2004 464.54 468.546 -4.006 0.0086 0.0077
2005 482.07 478.69 3.38 0.007 0.0155
2006 497.15 489.04 8.11 0.0163 0.0094
2007 502.71 499.62 3.09 0.0061 -0.0103
2008 510.16 510.44 -0.28 0.0005 -0.0067
2009 520.86 521.47 -0.61 0.0012 -0.0006
2010 535.15 532.76 2.39 0.0045 0.0056
2011 544.78 544.29 0.49 0.0009 -0.0036
2012 554.18 556.07 -1.89 0.0034 -0.0043
2013 564.94 568.09 -3.15 0.0056 -0.0022
表 11 成都市区人口预测
年份 2014 2015 2016 2017 2018 2019 2020 2021
人口(万人) 580.39 592.94 605.78 618.88 632.27 645.95 659.95 674.2
预测 2018 年成都市区人口 632.27 万,选取人均日出行次数为 2.8 次,将以 上数据代入公式[1],得到在出租车供求平衡即供求匹配率 P=1 的情况下,成都
市 2018 年需要出租车 23345 辆。
5.3 问题二:分析
展开阅读全文