《并行计算概述》PPT课件.ppt
2023/1/19并行计算概述1并行计算概述并行计算概述安俊秀安俊秀 软件工程学院软件工程学院并行计算实验室并行计算实验室6412云计算云搜索中心(成都云计算云搜索中心(成都)如何满足不断增长的计算力需求?w用速度更快的硬件,也就是减少每一条指令所需时间w优化算法(或者优化编译)w用多个处理机用多个处理机(器器)同时解决一个问题同时解决一个问题n并行计算并行计算2并行计算概述并行计算概述3并行:古老的思想!“.并行计算并不是什么新的思想并行计算并不是什么新的思想,只只是将它扩展应用于计算机而已是将它扩展应用于计算机而已”.作者也不认为这种扩展应用会存在什么无法克服的困难.但也不要期待有效的并行编程方法与技术能够在一夜之间诞生.期间还需要有许多的工作和实验要做.毕竟,今天的编程技术(串行)是若干年来艰苦的探索才取得的.现在编程工作似乎成了一种令人单调乏味的工作,事实上,并行编程的出现将会使重新恢复编程工作者们的探索精神.”(Gill,S.(1958),“Parallel Programming”The Computer Journal,vol.1,April,pp.2-10.)Parallel Programming with MPIby Peter Pacheco(2000)并行计算-高性能计算并行计算并行计算(Parallel Computing)高端计算高端计算(High-end Parallel Computing)高性能计算高性能计算(High Performance Computing)超级计算超级计算(Super Computing)任何高性能计算和超级计算都离不开使用并行技术任何高性能计算和超级计算都离不开使用并行技术nThe simultaneous use of more than one computer to solve a problem.n由由运行在多个部件上的小任务合作来求解一个规模很大的计算问题的一种方法4什么是高性能并行计算机什么是高性能并行计算机由多个计算单元组成,运算速度快、存储容量大、可靠性高的计算机系统。也称为:巨型计算机、超级计算机目前任何高性能计算和超级计算都离不开使用并行技术,所以高性能计算机肯定是并行计算机。5并行计算的概念6串行计算与并行计算并行计算概述7为什么要做并行计算?应用需求89计算科学计算科学与传统的两种科学,即与传统的两种科学,即理论科学理论科学和和实验科学实验科学,并列被认为是人类认识自然,并列被认为是人类认识自然的三大支柱,他们彼此相辅相成地推动科的三大支柱,他们彼此相辅相成地推动科学发展与社会进步。在许多情况下,或者学发展与社会进步。在许多情况下,或者是理论模型复杂甚至理论尚未建立,或者是理论模型复杂甚至理论尚未建立,或者实验费用昂贵甚至无法进行时,计算就成实验费用昂贵甚至无法进行时,计算就成了求解问题的唯一或主要的手段。了求解问题的唯一或主要的手段。为什么要做并行计算?应用需求10为什么要做并行计算?人类对计算及性能的要求是无止境的从系统的角度:集成系统资源,以满足不断增长的对性能和功能的要求从应用的角度:适当分解应用,以实现更大规模或更细致的计算11为什么要做并行计算?问题:科学和工程问题的数值模拟与仿真计算密集数据密集网络密集三种混合要求:在合理的时限内完成计算任务秒级制造业分钟级短时天气预报(当天)小时级中期天气预报(310日)尽可能快长期天气预报(气候)可计算湍流模拟1213其发展历程可以简单的分为两个时代其发展历程可以简单的分为两个时代专用时代包括向量机,MPP系统,SGI NUMA 系统,SUN大型SMP系统,也包括我国的神威,银河,曙光1000等。之所以称为“专用”,并不是说它们只能运行某种应用,是指它们的组成部件是专门设计的,它们的CPU板,内存板,I/O板,甚至操作系统,都是不能在其它系统中使用的。由于技术上桌面系统与高端系统的巨大差异,和用户群窄小。普及时代高性能计算机价格下降,应用门槛降低,应用开始普及。两个技术趋势起到重要作用。商品化趋势使得大量生产的商品部件接近了高性能计算机专有部件标准化趋势使得这些部件之间能够集成一个系统中,其中X86处理器、以太网、内存部件、Linux都起到决定性作用。机群系统是高性能计算机的一种,它的技术基础和工业基础都是商品化和标准化。14Top500中的超级计算机w地球模拟器wASCI QwASCI White15Earth SimulatorEarth simulator centerNecRmax:35.86Tflops8*8*640Earth SimulatorEarth SimulatorASCI Q1024 nodes8cpu/node10240Gflops7727GflopsASCI whiteLLNL IBM SP power3 Rmax 7.22Tflops曙光曙光1000曙光1000有36个结点机;峰值计算速度为浮点25.6亿次/秒,实际达到15.8 亿次/秒;内存容量为1024兆字节;基于Wormhole机制的二维Mesh通讯网,结点与网络通讯总带宽为2.88GB/秒;采用基于UNIX的并行操作系统和并行文件系统;并行计算机并行计算机-CRAYSystem Name Jaguar 1059000 GFlopsSystem Family Cray XT Operating System CNLInterconnect XT4 Internal Interconnect Processor AMD Opteron Quad Core 2300 MHz(9.2 GFlops)并行计算机并行计算机-IBMSystem Name Roadrunner 1105000 GFlopsSystem Family IBM Cluster Operating System Linux Interconnect Infiniband Processor PowerXCell 8i 3200 MHz(12.8 GFlops)并行计算机并行计算机-DAWNINGSystem Name Dawning 5000A 180600 GFlopsSystem Family Dawning Cluster Operating System Windows HPC server 2008 and SUSEInterconnect Infiniband DDR Processor AMD Opteron Quad Core 1900 MHz(7.6 GFlops)并行计算机所用的处理器并行计算机所用的处理器wAMD OpteronwXeon NoconawIntel ItaniumwCompaq AlphawHP PA-RISCwSun UltraSPARCwIBM POWER5+,POWER6wIBM BlueGene processorwMIPS R10000w龙芯最新TOP500cpu分布并行机处理器并行机处理器-AMDPERFORMANCE 1-WAYPERFORMANCE 2-WAYPERFORMANCE 4-WAY AND 8-WAYAMD Opteron 200 Series&2000 Series ProcessorsDesigned for 2-way Server/Workstation solutionsFirst native x86 dual-core solution for 2-way computingAMD Opteron 100 Series&1000 Series ProcessorsDesigned for 1-way Server/Workstation solutionsFirst native x86 dual-core solution for 1-way computingAMD Opteron 800 Series&8000 Series ProcessorsDesigned for 4-way and 8-way Server solutionsFirst native x86 dual-core solution for 4-way/8-way computingAMD Opteron Processors for Servers and Workstations并行机处理器并行机处理器-Intel数据要求苛刻双核英特尔 至强 7000 系列处理器最大限度提高性能、可靠性和可扩展性双核英特尔 安腾 处理器9000 大型机级服务器,具有顶级的灵活性和可靠性RISC 与大型机现代化基本计算四核英特尔 至强 3000 系列处理器经济、可靠的单路服务器高密度基础设施四核英特尔 至强 5000 系列处理器利用四核处理最大限度提高性能密度RISC 与大型机现代化并行机处理器并行机处理器-龙芯龙芯Godson意思为“教子”,相对于此的另一个词叫教父(Godfather)