运用Hadoop并行技术解决多个经济市场并行模拟问题,计算机应用技术论文.docx
《运用Hadoop并行技术解决多个经济市场并行模拟问题,计算机应用技术论文.docx》由会员分享,可在线阅读,更多相关《运用Hadoop并行技术解决多个经济市场并行模拟问题,计算机应用技术论文.docx(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、运用Hadoop并行技术解决多个经济市场并行模拟问题,计算机应用技术论文0 引言经济周期,又称商业周期 business cycles 是国家总体经济活动中反映出的起伏波动,其表现为很多经济活动同时发生,包括扩张、全面衰退和收缩,以及作为下一个经济扩张周期循环开场的复兴经过1.对国家经济形势周期性变化进行分析和预测一直以来都是各国制定金融策略和应对金融危机的重要根据,对国家政治经济系统的安全和稳定运行具有重要意义。对于经济周期的模拟自 20 世纪 80 年代在全世界范围内已经开场,学者们开展了大量的研究,获得了宏大的成绩。传统模拟方式方法中,以 Swarm 模型作为系统的整体模型,利用多主体
2、Agent 进行模拟仿真2-3,但不能处理大规模数据,假如屡次模拟会消耗损费大量的时间,并且占用资源太多。将并行技术用到经济模拟系统中,能够到达提高模拟系统效率的目的,在一定程度上降低硬件成本。并行计算技术至今为止已经经历了 3 代模型,第 1 代主要是以处理器计算为中心的 PRAM4-5和APRAM6等模型; 第 2 代主要是以网络通信为中心的 BSP7,NHBL8等模型; 第 3 代主要以存储访问为中心的 UMH9和 HPM10等模型。模型更新主要以减少运算经过中的通信开销,避免读写及调度时的冲突为主线,在整体方面提高计算速度和人机交互的速度11.通过模型的比照分析,在分布式环境中,第 3
3、 代模型固然能协调各进程的执行和节点之间的数据的传输,但无法解决系统中进程失效以及合并进程的中间结果等问题。使用 Hadoop 并行技术能有效解决上述问题。由 Apache 基金会开发的 Hadoop 是一个分布式系统的基础架构,实现了分布式文件系统 HadoopDistributed File System,HDFS ,能运行 MapReduce.MapReduce 是 Google 开发的一种简洁抽象的分布式计算模型12,因其高易用性和可扩展性而得到了广泛应用。基于第 3 代并行计算模型的 MapReduce能够解决系统中部分进程失效的问题,能自动检测到失败的 map 和 reduce 任
4、务,并让正常的处理机处理这些失败的任务。以上功能都基于其无分享框架实现13.本文在研究仿真模拟和并行计算技术的基础上提出了运用 Hadoop 并行技术解决多个经济市场并行模拟问题,实现了多市场同时模拟,实时显示模拟结果,提高了系统资源的利用率,缩短了仿真模拟的时间。1 并行计算在系统模拟中的应用并行计算在系统模拟中的应用,主要针对多处理器的并行进行算法的改良,将 CPU 的利用率问题作为考虑的最主要方面,每个线程对应一个 CPU,多 个 CPU 在 处 理 时 的 加 速 比 为 S n =单 CPU 串行处理的最优时间/多 CPU 的并行处理时间, CPU 的 效 率 =S n/CPU 数量
5、,如 何 提 高 CPU 的 效 率 成 为 重 中 之重14.运用多线程同步机制、调度算法和通信机制,进行并行计算程序的设计,构造一个多线程的应用,主要是对线程的调用和线程状态的转换进行研究,在线程同步的经过中对线程进行监视和加锁,以到达对线程的同步控制并增加系统的安全性和整体利用率。多个线程之间的通信机制也对系统整体状况起到非常关键的作用15.图 1 为 Hadoop 并行计算体系构造,集群系统首先将求解问题分解到多个节点中,每个节点都有自个 的 处 理 模 块 MapReduce 和 存 储 模 块 DataNode ,完成本节点的计算和存储任务,然后通过各个节点之间的通信 RPC ,最
6、终完成问题的求解经过,得到结果。节点间的通信机制是处理经过中一个重要的任务,通信量的大小直接影响系统的性能,为权衡通信机制占用的开销,为通信机制设置一个阈值,表示通信次数和通信量的大小。阈值的设定要符合系统的现在状况,阈值偏高会增加节点间的通信,降低系统的效率,阈值偏低,造成节点间不能很好地通信。对于一个系统来讲,首先保证的是在不影响节点通信的同时尽可能提高系统的效率,而不是为了提高系统的效率而影响节点间的通信。2 仿真模拟方式方法设计与实现在 Swarm 环境的支持下,首先模拟一个市场。市场中有多类智能体 Agent ,包括消费者、生产者、和银行等,通过为每个个体设置初始值 此值能够是确定的
7、,可以以在一定范围内随机选取 来设定个体的初始状态和初始资本。Agent 有一定的自主能力,来决定自个的行为,可以以根据周围环境和本身如今的状态进行决策,最终通过个体与个体之间的交互影响市场的总体趋势。由此产生了一个问题: 怎样定义市场的大小? 对于较大市场的模拟,能够得到较好的模拟结果,但数据量的增长和个体复杂度的提升会对系统造成一定影响; 对于较小市场的模拟,得出的结果和实际相差较大。现实社会中有多个市场,市场之间有一定联络。用传统的模拟方式方法对所有市场在单机中进行模拟,然后再汇总计算模拟的结果,并且每台计算机只能处理本地的数据。这样的模拟不仅浪费大量的时间,而且得出的模拟结果并不一定准
8、确。假如使用多台处理器进行模拟,这样固然能节省时间,但是消耗损费了大量的资源,工作量也比拟大。本文提出使用 Hadoop 并行计算技术解决经济周期模拟的方式方法,将多个市场看作是一个完好系统进行模拟。在 Hadoop 集群环境中,每个市场都分配在一个节点中。实际上市场之间是存在交互的,本研究主要是为了具体表现出并行方式方法对模拟性能的提高,因而不考虑模拟时市场之间的交互,只将各市场的模拟结果进行实时整合,将整合结果展现,得出最终的模拟结果。在使用 Hadoop 并行计算技术解决经济周期模拟问题时,文件系统 HDFS 将需要模拟的市场环境和个体属性存储到 DataNode 节点,模拟结果以块的形
9、式存储到节点中。Hadoop 中节点间数据块是内容分享的,节点的数据传递到服务器端进行整合,计算出结果。如此图 2 所示,HDFS 通过客户端对整个系统进行控制,在每个 DataNode 节点中进行模拟,存储在数据块中,以便对 和 Gini 系数进行整合, 系数能够用多个市场总和来计算,Gini 系数代表收入差距,用多个市场的的平均值计算。本次模拟的经济市场没有货品交换,但对 和 Gini系数进行了汇总计算。MapReduce 中分为 Mapper 法和 Reducer 方式方法,使用 MapReduce 处理经济模拟仿真数据问题时,Map 和 Reduce 的操作并不困难,关键是对于数据的组
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 文化交流
限制150内