奥运会临时超市网点设计__数学建模论文(22页).doc
《奥运会临时超市网点设计__数学建模论文(22页).doc》由会员分享,可在线阅读,更多相关《奥运会临时超市网点设计__数学建模论文(22页).doc(22页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、-奥运会临时超市网点设计_数学建模论文-第 20 页奥运会临时超市网点设计高教社杯全国大学生数学建模竞赛承 诺 书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们参赛的题目是: 我们的参
2、赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期: 年 月 日赛区评阅编号(由赛区组委会评阅前进行编号):高教社杯全国大学生数学建模竞赛编 号 专 用 页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):摘要本文针对奥运会临时超市网点设计问题,给出了一个满足观众购物需求、分布基本均衡和商业上赢利的方案。对于问题一,利用SPSS对收回的问卷调查表进
3、行描述性统计,得出了不同性别、不同年龄的观众在出行、餐饮和购物方面的规律。然后对调查表进行数据挖掘,采用Apriori算法对数据进行关联性分析,得到了观众在性别、年龄与出行、就餐、购物方面所反应出的关联规则。对于问题二,定义了某商区的人流量为一天内经过该商区的总人次,找出了每个商区到各个交通餐饮点的最短路。然后选定某个商区为研究对象,根据问题一中所挖掘出的规律,计算两次从每个看台途经该商区的观众数。再推广得出了20个商区的结果。对于问题三,由于到各个交通餐饮点的人群存在一定的性别、年龄结构,在每人的购物需求上也反应出一定的差异,故我们利用问题一中挖掘出的关联规则,选择出了影响购物需求较大的年龄
4、因素,并通过统计得出了各个年龄段人群在各个购物需求等级上的偏好。在此基础上,建立了描述人群途径的商区对人群的吸引力的模型,得出了各个商区的人均期望购物需求,再同人流量相结合,得出了各个商区的总购物需求值。三个基本要求中,满足购物需求用商区日供应力大于等于该商区的期望总购买需求来描述,分布基本均衡用人均消费空间和人流分散度两方面的均衡来反应。对于商业上赢利,我们先根据大小网点的规模不同,对大小网点赋权来消除大小网点的差异,然后利用各个商区的总购物需求值得出了平均每个网点的期望盈利。最后,以满足购物需求为约束,分布尽量均衡和商区平均期望盈利最大为多目标,建立了非线性优化模型,并采用启发式禁忌搜索算
5、法在MATLAB中进行求解,给出了C区的网点设计方案:商区1、2、3、4的大网点数分别为:6,6,10,10;小网点数分别为:14,13,15,17。最后,我们对设计方法的科学性和结果的切实性进行了阐述。一、 问题重述2008年北京奥运会的建设工作已进入全面设计和实施阶段。为满足观众、游客、工作人员等在奥运会期间的购物需求,在比赛主场馆的周边地区需要对临时超市网点进行设计。在给出比赛主场馆的规划图和通过对观众的问卷调查采集到相关的数据的基础上,我们需完成如下工作:1. 根据问卷调查数据,找出观众在出行、用餐和购物等方面所反映的规律。2. 假定奥运会期间(指某一天)每位观众平均出行两次,一次为进
6、出场馆,一次为餐饮,并且出行均采用最短路径。根据1中结果,测算出图2中20个商区的人流量分布(用百分比表示)。3. 在满足奥运会期间的购物需求、分布均衡和商业上盈利的三个要求下,确定出20个商区内MS网点的设计方案(每个商区的不同类型MS个数)。4. 阐明方法的科学性,并说明你的结果是贴近事实的。二、问题分析问题一要求我们根据给出的问卷调查,找出观众在出行、用餐和购物方面所反映的规律。我们可以将每张调查表看作是对观众总体的的一次抽样,它们构成了来自总体的三个样本,相互独立并且与总体同分布,利用SPSS分别在性别、年龄段方面对出行(公交,地铁,出租,私车)、餐饮(中餐,西餐,商场餐饮)、非餐饮消
7、费额(六个档次)进行频数统计,计算出相应各项占总人数的百分比,画出直方图图。再对性别、年龄同出行、就餐、消费进行关联性分析,得出其关联规律和相应的关联程度。问题二中,假定奥运会期间(指某一天)每位观众平均出行两次,一次为进出场馆,一次为餐饮,并且出行均采取最短路径。在该假定下测算出20个商区的人流量分布。我们可以定义商区人流量为一天内经过该商区的人次。由上述假设,对某一顾客而言,一天内有两条路线:出行路线和就餐路线。因此:商区人流量=(出行经过该商区的人数+就餐经过该商区的人数)*2该式中“*2”表示对任一观众而言,进出场馆为同一路线,就餐来回为同一路线。我们可以先找出每个商区在各个交通餐饮点
8、的最短路。然后由上述假设,三个样本在出行,购物,餐饮方面的规律与总体同分布,利用各个统计项的百分比,计算出各个看台到某个商区的人数。最后测算一天经过该商区的人次即人流量。按同样方法,得到20个商区的人流量分布。 问题三是一个均衡布点问题,要求设计出每个商区大小两种网点的数量,且满足购物需求、分布均衡和商业上盈利。我们的思路是在明确网点规模衡量指标和规模大小的分类原则后,围绕三个基本要求,对每个商区的网点总量及不同类型的个数进行决策。 假定网点商贩每天早晨补足当日的商品,并将该时刻该网点的商品总价值定义为该网点的日供应力。我们将日供应力的大小作为网点规模大小的分类指标。因为这些网点均是由小型商亭
9、构建的,主要经营食品,奥运会纪念品,旅游用品和小日用品。因此,大小网点在商品种类和价格方面基本无差异,只存在地理位置和营业规模的不同。故用日供应力的大小来划分大小网点具有一定的合理性。在此基础上,对大小网点数的决策工作,以三个基本要求为核心展开,分析如下:在购物需求方面,我们提出商区供应力和观众购买力的概念。其中,商区供应力是指某商区所有大小网点的日供应力总和,表示该商区一天中能够提供给观众的最大消费额度。观众购买力是指一天内经过某商区的观众在该商区的消费额,该消费额可以通过得到的观众消费等级的统计规律进行计算,是一个平均意义上的值。该值应该考虑到问题一中提出的各个性别、年龄段人群对消费等级的
10、差异,这与人群到各个交通餐饮点的性别、年龄结构有关。最后,满足购物需求就转化为某商区供应力大于等于观众在该商区的购买力。这可以作为网点设计的一个约束。在分布基本均衡方面,我们只考虑A、B、C三个区域各自内部的均衡。综合网点数和人流量两方面的因素,我们对均衡的理解是A、B、C区中各个商区能为每位顾客提供的消费空间基本均等。此处,我们定义人均消费空间为:商区日供应力/该商区的人流量(单位:元/人)。要使人均消费空间基本均等,各个消费空间值偏离某一水平的幅度不大,即使得各商区的人均消费空间的方差尽可能小。它可作为网点设计的目标之一。商业盈利方面,我们主要从使每个网点的盈利最大的角度来考虑。首先,对于
11、某个区域内相对固定的观众,假定观众的购物需求基本不变,即观众对消费额的等级的选择仍然服从由三次问卷调查得出的统计规律。因此,观众在某个商区的总消费额是一定的,盈利最大对应了分摊到每个网点的销售额最大。若用该商区的总销售额除以该区内大小网点的总数作为平均每个网点的销售额,并作为最大化指标,显然对大网点是不公平的,因为对于大网点,销售额要相应较大才能保证盈利。因此,大小网点不能一概而论,我们引入加权来消除大小网点的差异。由此得出网点设计的目标之二。通过对三个基本要求的等价转化,我们可以解决商区网点的设计问题。问题四我们将结合模型的建立特点来阐明我们方法的科学性,对所得的结果进行分析,说明该结果是贴
12、近实际的。三、变量说明:各出行和就餐方式的人数百分比。其中分别表示六个交通点,分别表示三种餐饮方式。():商区的人流量,表示每天经过该商区的人次。单位:人次。():一天内观众在某区域的商区的总消费额。单位:元。、:第个看台的观众在商区的总消费额。单位:元。:商区的大网点数。单位:个。():商区的小网点数。单位:个。、:大、小网点的日供应力,表示大网点每日的最大库存商品价值。单位:元。四、基本假设1. 为简化起见,假定国家体育场(鸟巢)容量为10万人,国家体育馆为6万人,国家游泳中心(水立方)容量为4万人。三个场馆的每个看台容量均为1万人,出口对准一个商区,各商区面积相同。2. 奥运会期间,体育
13、场(后称A区),体育馆(后称B区),游泳中心(后称C区)均座无虚席。3. 假设问卷调查的数据无错误,我们得出的规律全部是基于所给的数据。4. 观众的购物欲望在进出场馆,餐饮来回期间无差别。各消费额等级的百分比服从样本得出规律。5. 大小网点商品的种类和数量基本符合观众的需求。五、模型建立与求解5.1观众在出行、用餐和购物方面的规律研究假定三次问卷调查的对象是对观众总体的三次抽样,形成相互独立且与观众总体同分布的三个样本。我们的思路是利用三个样本对总体进行估计,得出观众在出行,餐饮和购物方面的单项规律;在此基础上,做关联性分析。5.1.1观众在出行方面的规律1) 利用统计软件SPSS对三张调查表
14、以出行的四种方式:公交,出租,私车,地铁为统计项,对观众不加区分的进行频数统计,得到出行规律统计表1,如下:表1 出行规律统计表方式公交私车出租地铁频数360295820104030百分比(%)33.999.0418.9638.022) 在表1的基础上,对观众众进行性别区分,得到出行规律统计表2,如下:表2 出行规律统计表百分比(%)方式性别公交私车出租地铁男21.732.996.4021.23女12.256.0512.5616.793) 对观众进行年龄段的区分,得出出行规律统计表3,如下:表3 出行规律统计表百分比(%)方式年龄段公交私车出租地铁14.211.071.853.95218.52
15、5.3611.1722.9736.791.854.047.58416.990.761.913.59结合上述三张表,我们得出观众在出行方面有如下规律:1. 无论是按何种方式划分观众,公交和地铁都是该人群交通的主要方式。2. 从表2看出,女性比男性更偏向于私车、出租这类较为舒适的交通方式。3. 从表3看出,老年人更偏向于公交。5.1.2观众在用餐方面的规律按照5.1.1中的统计步骤,我们同样可以得到观众用餐规律统计表4,5,6,如下:表4 餐饮规律统计表方式中餐西餐商场餐饮频数238255672651百分比(%)22.552.525表5 餐饮规律统计表百分比(%)方式性别中餐西餐商场餐饮男11.9
16、827.3513.02女10.4925.1711.99表6 餐饮规律统计表百分比(%)方式年龄段中餐西餐商场餐饮11.165.214.7129.3635.9312.7337.618.434.1344.342.940.03.44结合上述三张表,我们得出观众在用餐方面有如下规律:1. 无论是按何种方式划分观众,西餐都是该人群餐饮的主要方式(除了老年人)。2. 男女在饮食选择方面基本相同。3. 年轻人更加偏向于西餐,而老年人则更多的选择中餐。5.1.3观众在购物方面的规律同理,我们得到观众购物规律统计表7,8,9,如下:表7 购物规律统计表消费档次123456频数206026294668983157
17、103百分比(%)19.424.844.09.31.51.0表8 购物规律统计表百分比(%)档次性别123456男12.4215.3322.111.320.710.45女7.019.4721.927.950.770.52表9 购物规律统计表百分比(%)档次年龄段12345613.854.681.770.450.210.1126.5110.0132.417.770.750.5733.465.699.420.930.430.2445.614.420.430.110.080.06结合上述三张表,我们得出观众在购物方面有如下规律:1. 男女在消费方面都以第三档次居多,但比起男性,女的有更多的偏向于低消
18、费。2. 老年人更多的偏向于低消费。5.1.4 基于Apriori算法的关联规则挖掘为了找到数据中隐藏的各个事件对应的关联规则,我们采用Apriori算法。Apriori算法是一种最有影响的挖掘关联规则的算法,他使用一种称作逐层搜集迭代的策略,能充分挖掘出数据中包含的关联规则。首先,为了更好的对数据进行处理,我们重新对消费额进行概念分层。通过对附表中的数据进行频数统计,我们将消费等级自然划分为3个等级:0200为低消费,200300为中消费,300以上为高消费。那么,调查对象的分段划分如表10所示:表10 消费额的三级制频数统计金额0200200300300以上人数468946681243比例
19、44.2%44.0%11.8%其次,我们对附表中包含的各个事务进行编号,如表11所示。其中,事务指观众特有的和在行为上表现出来的属性。表11 事务编号表、男、女4档年龄4种出行3种餐饮3种消费档次在做好了以上的数据准备工作后,便可以运用Apriori算法来进行关联规则的挖掘:1) 步骤1:产生频繁1项集C1,并扫描所有对象,对每个项出现次数进行频数统计,得出其支持度。其中,频繁k项集指包含k个事物组合的集合,支持度即为具有该事务属性的观众的人数占总人数的百分比。1项集支持度2) 步骤2:设置最小事务支持度为15%:min_sup=0.15。即若k项集是频繁k项集,那么其每个k项事务组合的支持度
20、都必须大于min_sup。3) 步骤3:生成候选2项集C2,然后统计每个2项集的支持度。这里,候选2项集表示两个事务的各种可能组合构成的集合,即C2是由个2项集组成的。4) 步骤4:将每个2项集的支持度与min_sup比较,选出大于min_sup的支持度所对应的的候选2项集,同时对此2项集中包含的两个事务所对应的1项集的支持度,也需大于min_sup。其中,2项集的支持度表示同时包含这两个事务属性的观众数占总人数的百分比。2项集支持度5) 步骤5:计算每个2项集的置信度,其中置信度的数学定义如下:以上是一个条件概率,表示在已知A事务的条件下,B事务与A事务相关联的程度。在满足支持度大于一定准则
21、的条件下,置信度可以作为衡量此关联规则的强度。我们设置最小置信度为0.15,即若置信度大于0.15,则输出该关联规则。鉴于附表中事务数较少,我们只需对兴趣度较高的事务(性别和年龄)与其他事务的关联关系进行挖掘,则挖掘只需深入到2项集即可。以上的算法步骤能很好的挖掘出强关联规则,通过在MTALAB上编程实现(见附件1),输出如下表12的结果:(表中的数值为强关联规则所对应的置信度)表12 强关联规则和其置信度关联事件公交地铁西餐低消费中消费高消费男0.41520.40550.52240.53020.42240.0474女-0.35240.52820.34590.46010.19420-30岁0.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 奥运会 临时 超市 网点 设计 _ 数学 建模 论文 22
限制150内