并行处理机PPT讲稿.ppt
《并行处理机PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《并行处理机PPT讲稿.ppt(28页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、并行处理机第1页,共28页,编辑于2022年,星期六M1M2MN-1M08.1 并行处理机模型并行处理机模型http:/ 五道口生活网 http:/ 五道论坛第2页,共28页,编辑于2022年,星期六并行处理机的定义:多多个个PU按按照照一一定定方方式式互互连连,在在同同一一个个CU控控制制下下,对对各各自自的的数数据据完完成成同同一条指令规定的操作。一条指令规定的操作。从从CU看,指令是串行执行的,从看,指令是串行执行的,从PU看,数据是并行处理的。看,数据是并行处理的。并行处理机也称为阵列处理机、SIMD处理机等并行处理机的应用领域:主要用于高速向量或矩阵运算并行处理机的操作模型可用五元组
2、来表示:并行处理机的操作模型可用五元组来表示:M M(N(N,C C,I I,M M,R),R),其中:N N为为PEPE个数个数。如IlliacIV有64个PE。C C为控制部件为控制部件CUCU执行的指令集执行的指令集,包括标量指令和程序控制指令。I I为所有为所有PEPE并行执行的指令集并行执行的指令集,包括ALU、数据传送等操作M M为屏蔽操作集为屏蔽操作集,将PE划分为允许操作和禁止操作两个子集R R是数据寻径集是数据寻径集,互连网络中PE间通信所需要的各种模式http:/ 五道口生活网 http:/ 五道论坛第3页,共28页,编辑于2022年,星期六http:/ 五道口生活网 ht
3、tp:/ 五道论坛第4页,共28页,编辑于2022年,星期六8.2 并行处理机的基本结构并行处理机有两种典型结构:分布存储器并行处理机、共享存储器并行处理机分布存储器并行处理机、共享存储器并行处理机一台并行处理机由五个部分组成:多个处理单元多个处理单元PEPE,多个存储器模块,多个存储器模块M M,一个控制器,一个控制器CUCU,一个互连网络一个互连网络ICNICN,一台输入输出处理机,一台输入输出处理机IOPIOP。8.2.1 8.2.1 分布存储器并行处理机分布存储器并行处理机 8.2.2 8.2.2 共享存储器并行处理机共享存储器并行处理机 8.2.3 8.2.3 并行处理机的特点并行处
4、理机的特点http:/ 五道口生活网 http:/ 五道论坛第5页,共28页,编辑于2022年,星期六8.2.1 分布存储器并行处理机分布存储器并行处理机http:/ 五道口生活网 http:/ 五道论坛第6页,共28页,编辑于2022年,星期六目前的大部分并行处理机是基于分布式存储器模型的目前的大部分并行处理机是基于分布式存储器模型的比比较较容容易易构构成成MPP(Massively Parallel Processor),几十万个PE。必须依靠并行算法来提高PE的利用率。因此,应用领域有限。CU是控制部件,执行标量指令,并把向量指令广播到各个PE中。在CU中通常有一个较大容量的存储器。IO
5、P是输入输出处理机,或称为主机。在IOP上安装操作系统,它除了负担输入输出工作外,还负责程序的编辑、编译和调试等工作。数据在局部存储器中的分布是一个很关键的问题。标量指令与向量指令可以并发执行。http:/ 五道口生活网 http:/ 五道论坛第7页,共28页,编辑于2022年,星期六8.2.2 8.2.2 共享存储器并行处理机共享存储器并行处理机共享多体并行存储器SM通过互连网络与各处理单元PE相连。存储模块的数目等于或略大于处理单元的数目。同时在存储模块之间合理分配数据,通过灵活、高速的互连网络,使存储器与处理单元之间的数据传送在大多数向量运算中都能以存储器的最高频率进行,而最少受存储器冲
6、突的影响。共享存储器模型的处理单元数目一般不多,几个至几十个。共享存储器模型的处理单元数目一般不多,几个至几十个。Burroughs Scientific Processor(BSP)采用了这种结构。16个PE通过一个1617的对准互连网络访问17个共享存储器模块。存储器模块数与存储器模块数与PEPE数互质可以实现无冲突并行访问存储器。数互质可以实现无冲突并行访问存储器。http:/ 五道口生活网 http:/ 五道论坛第8页,共28页,编辑于2022年,星期六第9页,共28页,编辑于2022年,星期六8.2.3 8.2.3 并行处理机的特点并行处理机的特点速速度度高高,依靠增加PE个数来提高
7、速度,与流水线处理机主要依靠缩短时钟周期相比,其提高速度的潜力要大得多。模块性好模块性好,生产和维护方便。可靠性高可靠性高,容易实现容错和重构。效效率率低低,通通常常作作为为专专用用计计算算机机,在很大程度上依赖于并行算法。它依靠的是资源重复,而不是时间重叠,它的每个处理单元要担负多种处理功能,其效率要低一些。依赖于互连网络依赖于互连网络。互连网络决定了PE之间的连接模式,也决定了并行处理机能够适应的算法。需需要要有有一一台台高高性性能能的的标标量量处处理理机机。如果一台机器的向量处理速度极高,但标量处理速度只是每秒一百万次,则对于标量运算占10的题目,总的有效速度就不超过每秒一千万次。htt
8、p:/ 五道口生活网 http:/ 五道论坛第10页,共28页,编辑于2022年,星期六8.3 并行处理机实例并行处理机的两种典型代表:采用阵列结构分布存储器的IlliacIV并行处理机共享存储器结构共享存储器结构BSP并行处理机。http:/ 五道口生活网 http:/ 五道论坛第11页,共28页,编辑于2022年,星期六8.3.1 IlliavIV 8.3.1 IlliavIV 并行处理机并行处理机1963年,美国西屋电器公司提出“Slotnick,The SOLOMON Computer,Simultaneous Operation linked Ordinal Modular Netw
9、ork”。1966年美国国防远景研究规划局ARPR与伊利诺依大学签定合同。原计划:256个PE,每个PE每240ns处理一个64位浮点数,每个局部存储器PEM为2K64位,总的原算速度为1GFLOPS。美国Burroughs公司和伊利诺依大学于1972年共同设计和生产,1975年实际投入运行。用用了了4倍倍的的经经费费,只只达达到到1/20的的速速度度。只只实实现现了了8 864个个PE,只达到,只达到50MFLOPS。IlliacIV系系统统的的影影响响非非常常大大。它它是是并并行行处处理理机机的的典典型型代代表表,也也是是分分布存储器并行处理机的典型代表。布存储器并行处理机的典型代表。Il
10、liacIV系统由三大部分组成。IlliacIV处理机阵列,阵列控制器,一台标准的Burroughs B6700计算机。http:/ 五道口生活网 http:/ 五道论坛第12页,共28页,编辑于2022年,星期六IlliacIVIlliacIV系统由三大部分组成系统由三大部分组成IlliacIV处理机阵列:8 X 8,包括PE、PEM和互连网络。阵列控制器CU,输入输出处理机:一台标准的Burroughs B6700计算机。http:/ 五道口生活网 http:/ 五道论坛第13页,共28页,编辑于2022年,星期六1 1、阵列控制器、阵列控制器阵列控制器CU实际上是一台小型控制计算机。对对
11、阵阵列列处处理理单单元元实实行行控控制制和和完完成成标标量量操操作作。标标量量操操作作与与各各PEPE的的数数组组操作可以重叠执行。操作可以重叠执行。控制器的功能有以下五个方面:(1)对指令进行译码,并执行标量指令;(2)向各处理单元发出执行数组操作指令所需的控制信号;(3)产生和向所有处理单元广播公共的地址;(4)产生和向所有处理单元广播公共的数据;(5)接收和处理PE、I/O操作以及B6700产生的陷阱中断信号。2 2、输入输出系统、输入输出系统IlliacIV的输入输出系统由磁盘文件系统DFS、I/O分系统和一台B6700处理机组成。I/O分系统又由输入输出开关IOS、控制描述字控制器C
12、DC和输入输出缓冲存储器BIOM三个部分组成。http:/ 五道口生活网 http:/ 五道论坛第14页,共28页,编辑于2022年,星期六3 3、IlliacIVIlliacIV处理阵列处理阵列IlliacIV处理阵列由64个PU组成。每个PU由处理部件PE和它的局部存储器PEM组成。每一个PUi只和它的东、西、南、北四个近邻PUi+1 mod 64、PUi-1 mod 64、PUi+8 mod 64、PUi-8 mod 64直接连接。南北方向同一列PU连成一个环,东西方向构成一个闭合螺线。闭合螺线最短距离不超过闭合螺线最短距离不超过7 7步。普通网格最短距离不超过步。普通网格最短距离不超过
13、8 8步。步。例如:从PU0到PU36的距离:采用普通网格必须8步:PU0PU1PU2PU3PU4PU12PU20PU28PU36 或 PU0PU8PU16PU24PU32PU33PU34PU35PU36 或 如果采用闭合螺旋线,只需要7步:PU0PU63PU62PU61PU60PU52PU44PU36或 PU0PU63PU55PU47PU39PU38PU37PU36 或 对于nn个单元的阵列,任意两个单元之间的最短距离不超过任意两个单元之间的最短距离不超过n-1n-1步步。http:/ 五道口生活网 http:/ 五道论坛第15页,共28页,编辑于2022年,星期六普通网格必须8步:PUPU
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 并行 处理机 PPT 讲稿
限制150内