数学高性能计算学习教案.pptx
《数学高性能计算学习教案.pptx》由会员分享,可在线阅读,更多相关《数学高性能计算学习教案.pptx(46页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数学数学(shxu)高性能计算高性能计算第一页,共46页。啥叫粒度(l d)(非并行计算版)打个比方,100个学生要进行(jnxng)管理。细粒度:4个学生一个班25个班;粗粒度:50个学生一个班2个班。大学寝室八个人中午吃饭细粒度:每个人都要出寝室,去食堂打份饭回来。粗粒度:派个代表,或者(huzh)找个别的寝室的,把所有饭带回来。程序也是一样,事情定下来的功能就那么多细粒度细粒度:定义了100个类;粗粒度粗粒度:定义了2个类。第1页/共46页第二页,共46页。啥叫粒度(l d)(并行计算版)粒度(粒度(granularitygranularity)各个多处理机可独立各个多处理机可独立(dl
2、)(dl)并行执行的任务大小的度量。并行执行的任务大小的度量。粗粒度所含计算(j sun)任务有较大计算(j sun)量和较复杂计算(j sun)程序。任务级并行的粒度大于语句级的并行。细粒度所含计算任务有较小的计算量和较短的计算程序。向量机主要是对内层Do循环语句作向量化,所以向量化是一种小粒度(细粒度)并行。指令级并行等则是小粒度并行,亦称为细粒度。中粒度所含计算任务的大小和计算程序的长短在粗粒度和细粒度两种类型的算法之间第2页/共46页第三页,共46页。粒度(l d)细粒度的并行1)通信处理(chl)时只能完成很少量的可计算工作。2)低的计算通信率3)促进负载平衡意味着高通信开销,降低了
3、性能提升的可能性。如果粒度太小很可能任务间的通信和同步所须要的花费时间比用在计算上的还长。粗粒度并行1)在每次通信同步之间完成相当多的计算任务。2)高计算通信率意味着更加可能执行性能提升(tshng)。更难执行有效的负载平衡调度哪个更好?最高效的粒度是由算法和当前硬件平台决定的。通常情况下,通信和同步的开销很大程度上取决于执行速度,这样运用粗粒度较好。细粒度并行机制可以减少负载不平衡所带来的开销。第3页/共46页第四页,共46页。粒度(l d)(2)并行编程涉及不同的层次:指令层:非常细的粒度;数据层:细粒度;控制层:中粒度;任务(rn wu)层:大粒度。前两层大都由硬件和编译器负责处理,程序
4、员通常处理后两层的并行。第4页/共46页第五页,共46页。第七章 并行算法的一般设计(shj)过程 7.1 PCAM设计(shj)方法学 7.2 划分 7.3 通信 7.4 组合 7.5 映射 7.6 小结第5页/共46页第六页,共46页。设计(shj)目标从给定问题的描述出发(chf),通过一系列步骤,最终设计出一个能展示并发性可扩放性局部性和模块性的并行算法第6页/共46页第七页,共46页。设计(shj)原则PCAM设计方法学设计方法学首先尽量开拓算法的并发性和首先尽量开拓算法的并发性和满足算法的可扩放性满足算法的可扩放性(与算法相与算法相关的特性关的特性);然后着重优化算法的通信成本然后
5、着重优化算法的通信成本和全局执行时间和全局执行时间(与机器相关的与机器相关的特性特性);同时通过必要的整个过程的反同时通过必要的整个过程的反复回溯,以期望复回溯,以期望(qwng)达到达到一个满意的设计选择;一个满意的设计选择;第7页/共46页第八页,共46页。PCAM设计(shj)方法学设计设计(shj)(shj)并行算法并行算法(PCAM)(PCAM)的四个阶段的四个阶段划分划分(Partitioning)(Partitioning)通信通信(Communication)(Communication)组合组合(Agglomeration)(Agglomeration)映射映射(Mappin
6、g)(Mapping)设计的前期(第1,2步):考虑与机器特性无关的特性:并行性和可扩放性,寻求具有这些(zhxi)特性的算法;设计的后期(第3,4步):考虑与机器特性相关的特性:局部性等与性能有关的问题;第8页/共46页第九页,共46页。PCAM设计(shj)过程划分(hu fn)通信(tng xn)组合映射划分:分解成小的任务,开拓并发性;通信:确定诸任务间的数据交换,监测划分的合理性;组合:依据任务的局部性,组合成更大的任务;映射:将每个任务分配到处理器上,提高算法的性能。第9页/共46页第十页,共46页。第七章 并行算法的一般(ybn)设计过程 7.1 PCAM设计方法学 7.2 划分
7、 7.3 通信 7.4 组合 7.5 映射(yngsh)7.6 小结 第10页/共46页第十一页,共46页。划分方法(fngf)描述充分开拓算法的并发性和可扩放性;先进行数据分解(称域分解),再进行计算功能的分解(称功能分解);先集中(jzhng)数据的分解(域分解),然后是计算功能的分解(功能分解),两者互为补充使数据集和计算集互补相交,以避免数据和计算的复制;第11页/共46页第十二页,共46页。划分方法(fngf)描述划分阶段忽略处理器数目(shm)和目标机器的体系结构;能分为两类划分:域分解(domain decomposition)功能分解(functional decomposit
8、ion)第12页/共46页第十三页,共46页。域分解(fnji)划分的对象是数据,可以是算法的输入数据、中间处理数据和输出数据;将数据分解成大致相等的小数据片;划分时考虑数据上的相应(xingyng)操作;如果一个任务需要别的任务中的数据,则会产生任务间的通信;第13页/共46页第十四页,共46页。域分解(fnji)示例:三维网格的域分解(fnji),各格点上计算都是重复的。下图是三种分解(fnji)方法:第14页/共46页第十五页,共46页。域分解(fnji)不规则区域(qy)的分解示例:第15页/共46页第十六页,共46页。功能(gngnng)分解 划分的对象是计算,将计算划分为不同的任务
9、,其出发点不同于域分解;划分后,研究不同任务所需的数据。如果这些数据不相交的,则划分是成功(chnggng)的;如果数据有相当的重叠,意味着要重新进行域分解和功能分解;功能分解是一种更深层次的分解。第16页/共46页第十七页,共46页。示例1:搜索(su su)树示例2:气候模型功能(gngnng)分解 第17页/共46页第十八页,共46页。划分(hu fn)判据 划分是否具有灵活性?划分是否避免了冗余(rn y)计算和存储?划分任务尺寸是否大致相当?任务数与问题尺寸是否成比例?功能分解是一种更深层次的分解,是否合理?第18页/共46页第十九页,共46页。划分(hu fn)的标准划分的任务数,
10、是否至少高于目标机上处理器数的一个量级。划分的任务数,是否至少高于目标机上处理器数的一个量级。(灵活性)(灵活性)若否,则后继的设计步骤缺少灵活性若否,则后继的设计步骤缺少灵活性是否避免冗于的计算和存储要求。(可扩放性)是否避免冗于的计算和存储要求。(可扩放性)若否,则产生的算法对大型问题可能是不可扩放的若否,则产生的算法对大型问题可能是不可扩放的划分的任务尺寸是否大致相当。(均衡)划分的任务尺寸是否大致相当。(均衡)若否,分配处理器时很难做到工作量均衡若否,分配处理器时很难做到工作量均衡任务数是否与问题尺寸成比例。任务数是否与问题尺寸成比例。理想情况下,问题尺寸的增加应引起理想情况下,问题尺
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 性能 计算 学习 教案
限制150内