第3章-性能指标和基准程序-第1节-系统和应用的基准程序-并行处理与体系结构教学课件.ppt
《第3章-性能指标和基准程序-第1节-系统和应用的基准程序-并行处理与体系结构教学课件.ppt》由会员分享,可在线阅读,更多相关《第3章-性能指标和基准程序-第1节-系统和应用的基准程序-并行处理与体系结构教学课件.ppt(41页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、并行处理与体系结构并行处理与体系结构1第第3 3章章 性能指标和基准程序性能指标和基准程序n 1 1 系统和应用的基准程序系统和应用的基准程序n 2 2 性能和成本性能和成本n 3 3 基本性能指标基本性能指标n 4 4 并行计算机性能并行计算机性能n 5 5 并行程序性能并行程序性能n 6 6 可扩展性和加速比分析可扩展性和加速比分析2哈尔滨工业大学计算机科学与技术学院1.1.如何描述应用和系统的性能特征如何描述应用和系统的性能特征?2.2.什么是用户对性能和成本要求什么是用户对性能和成本要求?3.3.如何测量应用程序的性能如何测量应用程序的性能?使用何种使用何种类型的性能指标类型的性能指标
2、?4.4.当在并行计算机上执行并行程序时,当在并行计算机上执行并行程序时,如何描述系统性能的特征如何描述系统性能的特征?5.5.影响性能的参数有哪些影响性能的参数有哪些?典型的参数典型的参数值为多少值为多少?6.6.如何量化和分析系统可扩展性如何量化和分析系统可扩展性?7.7.如何确定执行给定应用问题的并行机如何确定执行给定应用问题的并行机的可扩展性的可扩展性?3哈尔滨工业大学计算机科学与技术学院n一、前言一、前言 n基准程序是性能测试程序,并假设它基准程序是性能测试程序,并假设它能刻划某一类应用问题的处理和数据能刻划某一类应用问题的处理和数据移动的特征。移动的特征。n基准程序用来测量和预测计
3、算机系统基准程序用来测量和预测计算机系统的性能,并能提示它们的体系结构的的性能,并能提示它们的体系结构的弱点和优点。弱点和优点。1 1 系统和应用的基准程序系统和应用的基准程序4哈尔滨工业大学计算机科学与技术学院6哈尔滨工业大学计算机科学与技术学院n二、微基准程序二、微基准程序 n包括:包括:3 3个微基准程序组。个微基准程序组。n1.LINPACK 1.LINPACK nLINPACKLINPACK基准程序由田纳西大学的基准程序由田纳西大学的Jack Dongarra Jack Dongarra 创作并加以维护。创作并加以维护。nLINPACKLINPACK简单实用,它定期公布有关简单实用,
4、它定期公布有关各种系统的各种系统的LINPACKLINPACK性能数值表。性能数值表。q包括包括Top 500Top 500表,它列出了世界上功能最表,它列出了世界上功能最强的强的500500台计算机。台计算机。7哈尔滨工业大学计算机科学与技术学院Return8哈尔滨工业大学计算机科学与技术学院属属 性性Intel Intel AlderAlderSun UltraSun UltraIBM 990IBM 990带宽带宽(MB(MBs)s)存储器复制存储器复制读文件读文件管道管道TCPTCP5252525238382020858585856161515124224218718784841010时
5、延时延(s)(s)读存储器读存储器创建文件创建文件管道管道TCPTCP0 0282823809238091011013053050 027271818,18118162621621620 0262613,33313,3339191332332系统开销系统开销(s)(s)无系统调用无系统调用创建进程创建进程现场切换现场切换7 74500450036365 53700370014141616120012001313 由由LMBENCHLMBENCH测得的带宽、时延和系统开销测得的带宽、时延和系统开销 10哈尔滨工业大学计算机科学与技术学院n3.STREAM3.STREAMn是一个简单的合成基准程序
6、;是一个简单的合成基准程序;n由由SGlSGl的的JohnMcCalpinJohnMcCalpin提出。提出。q测量持续的存储器带宽测量持续的存储器带宽(以以MBMBs s为为单位单位)和相应的计算速率。和相应的计算速率。q下表中的向量下表中的向量a a、b b和和c c均是有均是有二百二百万个元素万个元素的数组,其中每个元素是的数组,其中每个元素是一个一个8 8字节的字。字节的字。11哈尔滨工业大学计算机科学与技术学院nMcCalpinMcCalpin提出一个机器平衡指标,由提出一个机器平衡指标,由下式定义:下式定义:13哈尔滨工业大学计算机科学与技术学院15哈尔滨工业大学计算机科学与技术学
7、院n三、并行计算的基准程序三、并行计算的基准程序n测试分布共享存储器机器测试分布共享存储器机器n数值计算基准程序数值计算基准程序q斯坦福大学开发的斯坦福大学开发的SplashSplash和和Splash-2Splash-2;n并行化编译程序系统和技术:并行化编译程序系统和技术:q伊利诺斯大学开发的伊利诺斯大学开发的PerfectPerfect基准程序基准程序 n常用的常用的3 3个并行基准程序组:个并行基准程序组:qNPBNPB、PARKBENCHPARKBENCH和和STAPSTAP,它们代表了科,它们代表了科学计算中的主要应用组。学计算中的主要应用组。16哈尔滨工业大学计算机科学与技术学院
8、nNPBNPB组由组由5 5个核心个核心(EP(EP、MGMG、CGCG、FTFT和和IS)IS)和和3 3个模拟应用个模拟应用(LU(LU、SPSP和和BT)BT)程序组成。程序组成。nEP(Embarrassingly EP(Embarrassingly Parallel)Parallel)基准程序;基准程序;q能运行在任意个数的处理器而只需能运行在任意个数的处理器而只需很少通信。它能估计并行计算机可达很少通信。它能估计并行计算机可达到的浮点性能的上限。到的浮点性能的上限。18哈尔滨工业大学计算机科学与技术学院nMG(MultiGridmethodMG(MultiGridmethod,多栅
9、格方法,多栅格方法)基基准程序准程序q求解二维标量泊松求解二维标量泊松(Poisson)(Poisson)方程。要完方程。要完成具有高度结构化的短距离和远程通信。成具有高度结构化的短距离和远程通信。nCG(Conjugate Gradient methodCG(Conjugate Gradient method,共,共轭梯度方法轭梯度方法)基准程序基准程序q计算对称正定矩阵的最小本征值。它的计算对称正定矩阵的最小本征值。它的特点是进行非结构栅格计算,需要不规则特点是进行非结构栅格计算,需要不规则的远程通信。的远程通信。19哈尔滨工业大学计算机科学与技术学院n FTFT基准程序基准程序q使用基于
10、使用基于FFTFFT的光谱方法求解三维的光谱方法求解三维偏微分方程,也需要远程通信。偏微分方程,也需要远程通信。nIS(IS(整数排序,整数排序,Integer Sorting)Integer Sorting)基准程序基准程序q基于桶型排序的并行排序程序。它基于桶型排序的并行排序程序。它需要很多全体交换通信。需要很多全体交换通信。20哈尔滨工业大学计算机科学与技术学院n三种模拟应用三种模拟应用n三者通信不同三者通信不同nBT(BlockTri-diagonalBT(BlockTri-diagonal,块三对角,块三对角)nLU(block lower triangularLU(block lo
11、wer triangular,块下,块下三角,三角,block uppertriangularblock uppertriangular,块,块上三角上三角);nSP(ScalarPenta-diagonalSP(ScalarPenta-diagonal,标量五,标量五对角对角)基准程序基准程序21哈尔滨工业大学计算机科学与技术学院n2.PARKBENCH nPARKBENCH(PARKBENCH(并行核心和基准程序并行核心和基准程序)委员委员会会q在在19921992年超级计算会议上由一些对并行计年超级计算会议上由一些对并行计算机基准程序测试感兴趣的人们创立的。算机基准程序测试感兴趣的人们创
12、立的。该组织的一个贡献是建立了一致的性能指该组织的一个贡献是建立了一致的性能指标和记号集。标和记号集。n目前的基准程序用于分布存储多计算目前的基准程序用于分布存储多计算机机q用用Fortran 77Fortran 77编码,并用编码,并用PVMPVM或或MPIMPI做消息做消息传递。正在开发基准程序的传递。正在开发基准程序的Fortran 90Fortran 90和和HPFHPF版本以及适用于共享存储体系结构的版本以及适用于共享存储体系结构的基准程序。基准程序。22哈尔滨工业大学计算机科学与技术学院n3.3.并行并行STAPSTAP组组 n空一时自适应处理空一时自适应处理(Space-Time
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 性能指标 基准 程序 系统 应用 并行 处理 体系结构 教学 课件
限制150内