流水线技术-向量处理机.ppt





《流水线技术-向量处理机.ppt》由会员分享,可在线阅读,更多相关《流水线技术-向量处理机.ppt(43页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1433.5向量处理机 向量处理方式和向量处理机 向量处理机:向量处理机:具有向量数据表示和相应向量具有向量数据表示和相应向量 指令的流水线处理机。指令的流水线处理机。标量处理机标量处理机:不具有向量数据表示和相应向不具有向量数据表示和相应向 量指令的处理机。量指令的处理机。D DA A(B BC C )A A、B B、C C、D D 长度为长度为 N N 的向量的向量1.向量处理方式第三章 流水线技术虚拟存储器的特点(1)(1)水平水平(横向横向)处理方式处理方式 K Ki ib bi ic ci i D Di iK Ki ia ai i 相关:相关:N N 次次 功能切换:功能切换:2 2
2、N N 次次虚拟存储器的特点343(2)(2)垂直垂直(纵向纵向)处理方式处理方式 K KB BC C D DK KA A 相关:相关:次次 功能切换:功能切换:次次对处理机结构的要求:对处理机结构的要求:存储器存储器-存储器型操作的运算流水线存储器型操作的运算流水线对存储器的带宽要求很高。对存储器的带宽要求很高。例如:例如:STAR-100STAR-100,CYBER-205CYBER-2053.5 向量处理机虚拟存储器的特点4433.5 向量处理机虚拟存储器的特点543(3)(3)分组分组(纵横纵横)处理方式处理方式 把向量分成长度为某个固定值的若干组,把向量分成长度为某个固定值的若干组,
3、组内按纵向方式处理,依次处理各组。组内按纵向方式处理,依次处理各组。每组内:每组内:相关:相关:次次 功能切换:功能切换:次次3.5 向量处理机虚拟存储器的特点6433.5 向量处理机虚拟存储器的特点对处理机结构的要求:对处理机结构的要求:寄存器寄存器-寄存器型操作的运算流水线。寄存器型操作的运算流水线。举例举例虚拟存储器的特点8432.向量处理机的速度评价方法 标量处理机:标量处理机:通常用每秒执行多少指令通常用每秒执行多少指令 MIPSMIPS(Million Instructions Per Second)(Million Instructions Per Second)来衡量机器的运算
4、速度来衡量机器的运算速度 。向量处理机:向量处理机:常用每秒取得多少个浮点运算常用每秒取得多少个浮点运算 结果表示机器速度,以结果表示机器速度,以MFLOPSMFLOPS(Million of(Million of Floating Point Per Second)Floating Point Per Second)作为测量单位。作为测量单位。另一种评定计算机速度的方法:另一种评定计算机速度的方法:比较法。比较法。(选择一台速度指标得到公认的机器作为标准机,(选择一台速度指标得到公认的机器作为标准机,给定一些典型的基准程序。)给定一些典型的基准程序。)3.5 向量处理机虚拟存储器的特点943
5、3.5.2 提高向量处理机性能的主要技术1 1.CRAY-I简介 美国美国CRAYCRAY公司公司 19761976年年 每秒亿次浮点运算每秒亿次浮点运算 主频:主频:80MHz 80MHz 字长:字长:6464位位2 2.CRAY-1CRAY-1的基本结构的基本结构 向量运算部件:个向量运算部件:个 整数加,逻辑运算,移位整数加,逻辑运算,移位 浮点加,浮点乘,求倒数浮点加,浮点乘,求倒数3.5 向量处理机虚拟存储器的特点1043 向量寄存器组:向量寄存器组:864 V864 V0 0 V V7 7 每个每个 V Vi i 每个向量运算部件每个向量运算部件 向量长度寄存器向量长度寄存器VLV
6、L 向量屏蔽寄存器向量屏蔽寄存器VMVM CRAY-1 CRAY-1向量处理的向量处理的显著特点:显著特点:只要不出现只要不出现V Vi i冲突冲突和和向量功能部件冲突向量功能部件冲突,各个,各个V Vi i之间和各个向之间和各个向量功能部件之间都能并行工作,大大加快了向量量功能部件之间都能并行工作,大大加快了向量指令的处理。指令的处理。3.5 向量处理机虚拟存储器的特点11433.CRAY-1CRAY-1向量指令类型向量指令类型 V Vk k V Vi i op V op Vj j V Vk k S Si i op V op Vj j V Vk k 主存主存 主存主存 V Vi iV Vi
7、i冲突:冲突:指的是并行工作的各向量指令的源向指的是并行工作的各向量指令的源向 量或结果向量的量或结果向量的V Vi i有相同的。有相同的。向量功能部件冲突:向量功能部件冲突:指同一个向量功能部件被指同一个向量功能部件被 一条以上的并行工作向一条以上的并行工作向 量指令所使用。量指令所使用。3.5 向量处理机虚拟存储器的特点12433.5 向量处理机虚拟存储器的特点13434.链接技术链接技术 当两条指令出现当两条指令出现“写后读写后读”相关时,若它们相关时,若它们 不存在功能部件冲突和向量寄存器不存在功能部件冲突和向量寄存器(源或目的源或目的)冲突,就有可能把它们所用的功能部件头尾相冲突,就
8、有可能把它们所用的功能部件头尾相 接,形成一个链接流水线,进行流水处理。接,形成一个链接流水线,进行流水处理。链接特性链接特性实质上是把流水线实质上是把流水线“定向定向”的思想的思想 引入到向量执行过程的结果。引入到向量执行过程的结果。3.5 向量处理机虚拟存储器的特点虚拟存储器的特点1543例例3.73.7 对对上上述述向向量量运运算算D=A*(B+C)D=A*(B+C),若若向向量量长长度度N64N64,向向量量元元素素为为浮浮点点数数,则则在在B B、C C取取到到V V0 0、V V1 1后,就可用以下三条向量指令求解:后,就可用以下三条向量指令求解:(1 1)V V3 3存储器存储器
9、(访存,载入访存,载入A)A)(2 2)V V2 2VV0 0V V1 1(浮点加浮点加)(3 3)V V4 4VV2 2*V*V3 3(浮点乘,存浮点乘,存D)D)解:解:链接过程链接过程如图如图3.443.44所示:所示:3.5 向量处理机虚拟存储器的特点1643 三条向量指令全部用三条向量指令全部用串行方法串行方法执行,则总执行,则总 的执行时间为:的执行时间为:(1+6+11+6+1)+N-1+N-1+(1+6+11+6+1)+N-1 +N-1 +(1+7+11+7+1)+N-1=3N+22 +N-1=3N+22 拍拍 3.5 向量处理机虚拟存储器的特点1743 前前两两条条向向量量指
10、指令令并并行行执执行行之之后后,再再执执行行第第 三条向量指令,则总的执行时间为:三条向量指令,则总的执行时间为:(1+6+11+6+1)+N-1+N-1+(1+7+11+7+1)+N-+N-1 1 =2N+15 =2N+15 拍拍 采用向量链接技术,所需拍数采用向量链接技术,所需拍数(亦称为亦称为链接链接 流水线的流水时间流水线的流水时间)为:为:(1+6+11+6+1)+(1+7+11+7+1)=17 =17 拍拍 则三条向量指令总执行时间为:则三条向量指令总执行时间为:(1+6+11+6+1)+(1+7+11+7+1)+(N-1N-1)=N+16=N+16 拍拍 3.5 向量处理机虚拟存
11、储器的特点18435.向量链接的一些主要要求:(除了要保证无向量寄存器使用冲突和无向除了要保证无向量寄存器使用冲突和无向 量功能部件使用冲突的条件之外量功能部件使用冲突的条件之外)在在进进行行链链接接的的时时候候,只只有有在在前前一一条条向向量量指指令令 的的第第一一个个结结果果元元素素送送入入结结果果向向量量寄寄存存器器的的那那 一一个个时时钟钟周周期期才才可可以以进进行行链链接接,若若错错过过该该时时 刻就不能进行链接。刻就不能进行链接。只有当前一条向量指令全部执行完毕,释放只有当前一条向量指令全部执行完毕,释放 相应的向量寄存器资源后才能执行后面的向相应的向量寄存器资源后才能执行后面的向
12、 量指令。量指令。3.5 向量处理机虚拟存储器的特点1943 当一条向量指令的两个源操作数分别是两条当一条向量指令的两个源操作数分别是两条 先行向量指令的结果寄存器时,要求先行的先行向量指令的结果寄存器时,要求先行的 两条向量指令产生运算结果的时间必须相等,两条向量指令产生运算结果的时间必须相等,即要求有关向量功能部件的延迟时间相等。即要求有关向量功能部件的延迟时间相等。只有所有可以链接执行的向量指令的向量长只有所有可以链接执行的向量指令的向量长 度相等时,它们之间才能链接执行,否则它度相等时,它们之间才能链接执行,否则它 们之间也不能链接执行。们之间也不能链接执行。3.5 向量处理机2043
13、6.向量循环或分段开采技术 如果如果向量的长度大于向量寄存器的长度,向量的长度大于向量寄存器的长度,该如何处理呢?该如何处理呢?向量循环向量循环 :长向量循环分段处理的程序结构长向量循环分段处理的程序结构 。把长向量分成固定长度的段,然后循环分把长向量分成固定长度的段,然后循环分 段处理,一次循环只处理一个向量段。段处理,一次循环只处理一个向量段。这种分段向量处理技术也称为这种分段向量处理技术也称为分段开采分段开采。将长向量循环分段处理是由系统硬件和软件控将长向量循环分段处理是由系统硬件和软件控 制完成的,对程序员透明。制完成的,对程序员透明。3.5 向量处理机虚拟存储器的特点2143 例例3
14、.83.8 设设A A和和B B是长度为是长度为N N的向量,考虑在的向量,考虑在Cray-1Cray-1向量处理器上实现如下的循环操作。向量处理器上实现如下的循环操作。DO 10 I=1DO 10 I=1,N N 10 A(I)=5.0*B(I)+1.0 10 A(I)=5.0*B(I)+1.0 当当N N 64 64时,可以用如下指令序列实现上时,可以用如下指令序列实现上 述循环操作:述循环操作:S S1 15.05.0 ;将常数;将常数5.05.0送入标量寄存器送入标量寄存器S S1 1S S2 21.01.0 ;将常数;将常数1.01.0送入标量寄存器送入标量寄存器S S2 2VLNV
15、LN ;在向量长度寄存器;在向量长度寄存器VLVL中设置向量长度中设置向量长度N N3.5 向量处理机虚拟存储器的特点2243V V0 0BB ;从存储器中将向量;从存储器中将向量B B读入向量寄存器读入向量寄存器V V0 0V1S1*V0V1S1*V0;向量;向量B B中的每个元素分别和常数中的每个元素分别和常数S1S1 相乘相乘V2S2+V1V2S2+V1;向量;向量V1V1中的每个元素分别和常数中的每个元素分别和常数 S2S2相加相加AV2AV2;将计算结果从向量寄存器;将计算结果从向量寄存器V2V2存入存存入存 储器的向量储器的向量A A3.5 向量处理机虚拟存储器的特点2343 当当
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 流水线 技术 向量 处理机

限制150内