并行与分布式计算前沿.pptx
《并行与分布式计算前沿.pptx》由会员分享,可在线阅读,更多相关《并行与分布式计算前沿.pptx(64页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、并行与分布式计算2017-10-23计算机前沿讲座主要内容一、概念辨析一、概念辨析二、并行计算二、并行计算三、分布式计算三、分布式计算四、基于四、基于GPU的高性能计算的高性能计算五、分布式应用框架五、分布式应用框架Hadoop1一、概念辨析并行计算并行计算分布式计算分布式计算并行计算并行计算vs分布式计算分布式计算网格计算网格计算云计算云计算云计算云计算vs网格计算网格计算普适计算普适计算普适计算普适计算vs云计算云计算2并行计算:并行计算:并行计算或称平行计算是相对于串行计算来说的;并行计算或称平行计算是相对于串行计算来说的;所谓并行计算可分为时间上的并行和空间上的并行。所谓并行计算可分为
2、时间上的并行和空间上的并行。时间上的并行就是指流水线技术,而空间上的并行时间上的并行就是指流水线技术,而空间上的并行则是指用多个处理器并发的执行计算。并行计算科则是指用多个处理器并发的执行计算。并行计算科学中主要研究的是空间上的并行问题。学中主要研究的是空间上的并行问题。并行计算通常是针对计算量的科学计算问题。并行计算通常是针对计算量的科学计算问题。分为:单机的多核多处理器的并行分为:单机的多核多处理器的并行&多机(集群)的并行多机(集群)的并行集群计算集群计算&集群服务集群服务高性能计算,超级计算高性能计算,超级计算3分布式计算:分布式计算:是计算机科学的一个重要分支,它主要研究如何是计算机
3、科学的一个重要分支,它主要研究如何把一个需要巨大的计算能力才能解决的问题分解把一个需要巨大的计算能力才能解决的问题分解成许多小的部分,然后把这些部分再分配给许多成许多小的部分,然后把这些部分再分配给许多志愿者计算机进行处理,最后把这些计算结果综志愿者计算机进行处理,最后把这些计算结果综合起来得到最终的结果。合起来得到最终的结果。目前常见的分布式计算项目通常使用世界各地目前常见的分布式计算项目通常使用世界各地上千万志愿者计算机的闲置计算能力,通过互上千万志愿者计算机的闲置计算能力,通过互联网进行数据传输。联网进行数据传输。可以帮助一些缺乏研究资金的、公益性质的科可以帮助一些缺乏研究资金的、公益性
4、质的科学研究,加速人类的科学进程。有效利用全世学研究,加速人类的科学进程。有效利用全世界联网机器的闲置处理能力,向大众普及科学界联网机器的闲置处理能力,向大众普及科学意识。意识。4并行计算vs分布式计算(1)并行计算借助并行算法和并行编程语言能够实)并行计算借助并行算法和并行编程语言能够实现进程级并行(如现进程级并行(如MPI)和线程级并行(如)和线程级并行(如openMP)。而分布式计算只是将任务分成小块到)。而分布式计算只是将任务分成小块到各个计算机分别计算各自执行。各个计算机分别计算各自执行。(2)粒度方面,并行计算中,处理器间的交互一般)粒度方面,并行计算中,处理器间的交互一般很频繁,
5、往往具有细粒度和低开销的特征,并且被很频繁,往往具有细粒度和低开销的特征,并且被认为是可靠的。而在分布式计算中,处理器间的交认为是可靠的。而在分布式计算中,处理器间的交互不频繁,交互特征是粗粒度,并且被认为是不可互不频繁,交互特征是粗粒度,并且被认为是不可靠的。并行计算注重短的执行时间,分布式计算则靠的。并行计算注重短的执行时间,分布式计算则注重长的正常运行时间。注重长的正常运行时间。5网格计算网格计算网格计算是分布式计算的一种;网格计算是分布式计算的一种;网格计算的实质就是组合与共享资源并确保网格计算的实质就是组合与共享资源并确保系统安全。网格计算通过利用大量异构计算系统安全。网格计算通过利
6、用大量异构计算机的未用资源(机的未用资源(CPU周周期和磁盘存储),将期和磁盘存储),将其作为嵌入在分布式电信基础设施中的一个其作为嵌入在分布式电信基础设施中的一个虚拟的计算机集群,为解决大规模的计算问虚拟的计算机集群,为解决大规模的计算问题提供一个模型。网格计算的焦点放在支持题提供一个模型。网格计算的焦点放在支持跨管理域计算跨管理域计算的能力,这使它与传统的计算的能力,这使它与传统的计算机集群或传统的分布式计算相区别。机集群或传统的分布式计算相区别。6云计算云计算是最新开始的新概念,它不只是计算云计算是最新开始的新概念,它不只是计算等计算机概念,还有运营服务等概念了。它等计算机概念,还有运营
7、服务等概念了。它是分布式计算、并行计算和网格计算的发展,是分布式计算、并行计算和网格计算的发展,或者说是这些概念的商业实现。云计算不但或者说是这些概念的商业实现。云计算不但包括分布式计算还包括分布式存储和分布式包括分布式计算还包括分布式存储和分布式缓存。分布式存储又包括分布式文件存储和缓存。分布式存储又包括分布式文件存储和分布式数据存储分布式数据存储。7云计算vs网格计算网格计算强调资源共享,任何人都可以作为网格计算强调资源共享,任何人都可以作为请求者使用其它节点的资源,任何人都需要请求者使用其它节点的资源,任何人都需要贡献一定资源给其他节点。网格计算强调将贡献一定资源给其他节点。网格计算强调
8、将工作量转移到远程的可用计算资源上。云计工作量转移到远程的可用计算资源上。云计算强调专有,任何人都可以获取自己的专有算强调专有,任何人都可以获取自己的专有资源,并且这些资源是由少数团体提供的,资源,并且这些资源是由少数团体提供的,使用者不需要贡献自己的资源。使用者不需要贡献自己的资源。网格计算侧重并行的计算集中性需求,并且网格计算侧重并行的计算集中性需求,并且难以自动扩展。云计算侧重事务性应用,有难以自动扩展。云计算侧重事务性应用,有大量的单独的请求,可以实现自动扩展。大量的单独的请求,可以实现自动扩展。8普适计算普适计算(普适计算(Pervasive/UbiquitousComputing)
9、是指,无所不在的、随时随)是指,无所不在的、随时随地可以进行计算的一种方式;无论何时何地可以进行计算的一种方式;无论何时何地,只要需要,就可以通过某种设备访问地,只要需要,就可以通过某种设备访问到所需的信息。到所需的信息。普适计算最重要的两个特征:普适计算最重要的两个特征:间断连接;轻量计算(即计算资源有限)间断连接;轻量计算(即计算资源有限)普适计算的软件技术就是要实现在这种环普适计算的软件技术就是要实现在这种环境下的事务和数据处理。境下的事务和数据处理。9普适计算vs云计算概念不同普适计算是学术概念云计算是商业概念高度不同普适计算是一种思想:融合云计算是一种手段研究的重心不同普适计算强调终
10、端与服务云计算更关注集合与协同应该成为未来并存的计算模式10二、并行计算1并行计算概述并行计算概述2并行计算理论基础并行计算理论基础3多线程编程多线程编程4OpenMP编程编程5MPI编程编程111并行计算概述并行计算概述1.1并行计算定义并行计算定义1.2为什么需要并行计算为什么需要并行计算1.3超级计算机的世界格局超级计算机的世界格局1.4并行计算机系统结构并行计算机系统结构1.5并行平台的通信模型并行平台的通信模型1.6 设计并行算法的四个阶段设计并行算法的四个阶段1.7并行算法并行算法求和求和12并行计算是并行计算是相对于串行计算来说的相对于串行计算来说的;所谓所谓并行计算可分为时间上
11、的并行和空间上的并行。并行计算可分为时间上的并行和空间上的并行。时间上的并行就是指流水线技术,而空间上的并行时间上的并行就是指流水线技术,而空间上的并行则是指用多个处理器并发的执行计算。并行计算科则是指用多个处理器并发的执行计算。并行计算科学中主要研究的是空间上的并行问题。学中主要研究的是空间上的并行问题。并行计算通常是针对计算量的科学计算问题。并行计算通常是针对计算量的科学计算问题。分为:单机的多核多处理器的并行分为:单机的多核多处理器的并行&多机(集群)的并行多机(集群)的并行集群计算集群计算&集群服务集群服务高性能计算,超级计算高性能计算,超级计算1.1并行计算定义并行计算定义131.2
12、为什么需要并行计算为什么需要并行计算1)特殊行业的需求:)特殊行业的需求:2)现代科学方法)现代科学方法3)多核处理器)多核处理器“从某种程度上说,对于软件开发者而言,从某种程度上说,对于软件开发者而言,CPU主频提升就像是免费的午餐,此前所有的程序主频提升就像是免费的午餐,此前所有的程序很自然地会从主频的提升中受益,而如今多核很自然地会从主频的提升中受益,而如今多核出现了,这种免费的午餐没有了。我们必须针出现了,这种免费的午餐没有了。我们必须针对多核重新进行软件设计对多核重新进行软件设计”。多核技术是处理器发展的必然趋势。多核技术是处理器发展的必然趋势。141.3超级计算机的世界格局超级计算
13、机的世界格局超级计算是解决国家经济超级计算是解决国家经济建设建设、社会社会发展、科学发展、科学进步、国家进步、国家安全安全和国防建设等领域一系列重大挑和国防建设等领域一系列重大挑战性问题的重要手段,是国家综合国力、科技竞战性问题的重要手段,是国家综合国力、科技竞争力和信息化建设能力的重要体现,已经成为世争力和信息化建设能力的重要体现,已经成为世界各国争夺的战略制高点。界各国争夺的战略制高点。1993年,德国曼海姆大学汉斯、埃里克等人发起年,德国曼海姆大学汉斯、埃里克等人发起创建了全球超级计算机创建了全球超级计算机TOP500排名榜。排名榜。TOP500目前由德国曼海姆大学、美国田纳西大学、美国
14、目前由德国曼海姆大学、美国田纳西大学、美国能源研究科学计算中心以及劳伦斯伯克利国家实能源研究科学计算中心以及劳伦斯伯克利国家实验室联合举办,每年排名两次,已发展成为全世验室联合举办,每年排名两次,已发展成为全世界最具权威的超级计算机排名榜,是衡量各国超界最具权威的超级计算机排名榜,是衡量各国超级计算水平的最重要的参考依据。级计算水平的最重要的参考依据。151.4并行体系结构-控制结构并行计算机的处理器可以在单一控制部件的集中控制下运行,也可以独立运行。如果单一控制部件向每个处理部件分派相同指令,该模型称为单指令多数据流(SIMD)。如果计算机中的每个处理器都能够独立于其他处理器对不同的数据执行
15、不同的指令,这样的模型被称为多指令流多数据流(MIMD)。16SIMD和MIMD处理机a)典型的SIMD体系结构 b)典型的MIMD体系结构171.4并行体系结构-PRAM模型基本概念由Fortune和Wyllie1978年提出,又称SIMD-SM模型。有一个集中的共享存储器和一个指令控制器,通过SM的R/W交换数据,隐式同步计算。结构图Control UnitInterconnection NetworkPLMPLMPLMPLMShared Memory18分类(1)PRAM-CRCW并发读并发写CPRAM-CRCW(CommonPRAM-CRCW):仅允许写入相同数据PPRAM-CRCW(
16、PriorityPRAM-CRCW):仅允许优先级最高的处理器写入APRAM-CRCW(ArbitraryPRAM-CRCW):允许任意处理器自由写入(2)PRAM-CREW并发读互斥写(3)PRAM-EREW互斥读互斥写计算能力比较PRAM-CRCW是最强的计算模型,PRAM-EREW可logp倍模拟PRAM-CREW和PRAM-CRCW1.4并行体系结构-PRAM模型191.4并行体系结构互联网络拓扑结构1(一维线性阵列)只与左右近邻节点相连N个节点用N-1条边节点度为2网络直径为N-1对剖度为1首尾连接时构成环(单向或双向)201.4并行体系结构互联网络拓扑结构2(四近邻连接)211.4
17、并行体系结构互联网络拓扑结构3(树形连接)221.4并行体系结构互联网络拓扑结构4(超立方连接)231.5并行平台的通信模型并行任务间有两种主要的数据交换方式访问共享数据空间以及交换消息。提供共享数据空间的平台称为共享地址空间平台或者称为多处理器。支持消息交换的平台称为消息传递平台或者称为多计算机。24共享地址空间平台所有处理器都能访问部分(或全部)内存。处理器通过修改存储在共享地址空间的数据来实现交互。如果处理器访问系统中任何内存字(全局或本地)的时间都相同,该平台就归类为统一内存访问(UMA)平台,其他的平台则称为非统一内存访问(NUMA)平台。25NUMA和UMA共享地址空间平台典型的共
18、享地址空间结构:a)统一内存访问共享地址空间计算机;b)带有高速缓存及内存的统一内存访问共享地址空间计算机;c)只带本地内存的非统一内存访问共享地址空间计算机。26存储转发(SF)路由存储转发(Store-and-Forward)路由消息被分成基本的传输单位-信包(Packet),每个信包都含有寻径信息;当一个信包到达中间节点A时,A把整个信包放入其通信缓冲器中,然后在选路算法的控制下选择下一个相邻节点B,当从A到B的通道空闲并且B的通信缓冲器可用时,把信包从A发向B;信包的传输时间:tcomm(SF)=ts+(mtw+th)l=O(ml)缺点:每个结点必须对整个消息和信包进行缓冲,缓冲器较大
19、;网络时延与发送消息所经历的节点数成正比27直通(Cut Through)路由直通(Cut Through)路由在传递一个消息之前,就为它建立一条从源结点到目的结点的物理通道。在传递的全部过程中,线路的每一段都被占用,当消息的尾部经过网络后,整条物理链路才被废弃。传输时间:tcomm(CT)=ts+mtw+lth=O(m+l)缺点:物理通道非共享传输过程中物理 通道一直被占用28一到多播送SF模式环步骤:先左右邻近传送;再左右二个方向同时播送示例:通讯时间:29一到多播送CT模式环步骤:(1)先发送至p/2远的处理器;(2)再同时发送至p/22远的处理器;(i)再同时发送至p/2i远的处理器;
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 并行 分布式 计算 前沿
限制150内