流水线技术向量处理机.ppt





《流水线技术向量处理机.ppt》由会员分享,可在线阅读,更多相关《流水线技术向量处理机.ppt(43页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、流水线技术向量处理机现在学习的是第1页,共43页(1)水平(横向)处理方式 Kibici DiKiai 相关:N 次 功能切换:2N 次虚拟存储器的特点现在学习的是第2页,共43页(2)垂直(纵向)处理方式 KBC DKA 相关:次 功能切换:次对处理机结构的要求:存储器-存储器型操作的运算流水线对存储器的带宽要求很高。例如:STAR-100,CYBER-2053.5 向量处理机虚拟存储器的特点现在学习的是第3页,共43页3.5 向量处理机虚拟存储器的特点现在学习的是第4页,共43页(3)分组(纵横)处理方式 把向量分成长度为某个固定值的若干组,组内按纵向方式处理,依次处理各组。每组内:相关:
2、次 功能切换:次3.5 向量处理机虚拟存储器的特点现在学习的是第5页,共43页3.5 向量处理机虚拟存储器的特点现在学习的是第6页,共43页对处理机结构的要求:寄存器-寄存器型操作的运算流水线。举例虚拟存储器的特点现在学习的是第7页,共43页2.向量处理机的速度评价方法 标量处理机:通常用每秒执行多少指令 MIPS(Million Instructions Per Second)来衡量机器的运算速度。向量处理机:常用每秒取得多少个浮点运算 结果表示机器速度,以MFLOPS(Million of Floating Point Per Second)作为测量单位。另一种评定计算机速度的方法:比较法
3、。(选择一台速度指标得到公认的机器作为标准机,给定一些典型的基准程序。)3.5 向量处理机虚拟存储器的特点现在学习的是第8页,共43页3.5.2 提高向量处理机性能的主要技术1.CRAY-I简介 美国CRAY公司 1976年 每秒亿次浮点运算 主频:80MHz 字长:64位2.CRAY-1的基本结构 向量运算部件:个 整数加,逻辑运算,移位 浮点加,浮点乘,求倒数3.5 向量处理机虚拟存储器的特点现在学习的是第9页,共43页 向量寄存器组:864 V0 V7 每个 Vi 每个向量运算部件 向量长度寄存器VL 向量屏蔽寄存器VM CRAY-1向量处理的显著特点:只要不出现Vi冲突和向量功能部件冲
4、突,各个Vi之间和各个向量功能部件之间都能并行工作,大大加快了向量指令的处理。3.5 向量处理机虚拟存储器的特点现在学习的是第10页,共43页3.CRAY-1向量指令类型 Vk Vi op Vj Vk Si op Vj Vk 主存 主存 ViVi冲突:指的是并行工作的各向量指令的源向 量或结果向量的Vi有相同的。向量功能部件冲突:指同一个向量功能部件被 一条以上的并行工作向 量指令所使用。3.5 向量处理机虚拟存储器的特点现在学习的是第11页,共43页3.5 向量处理机虚拟存储器的特点现在学习的是第12页,共43页4.链接技术 当两条指令出现“写后读”相关时,若它们 不存在功能部件冲突和向量寄
5、存器(源或目的)冲突,就有可能把它们所用的功能部件头尾相 接,形成一个链接流水线,进行流水处理。链接特性实质上是把流水线“定向”的思想 引入到向量执行过程的结果。3.5 向量处理机虚拟存储器的特点现在学习的是第13页,共43页虚拟存储器的特点现在学习的是第14页,共43页例3.7 对 上 述 向 量 运 算 D=A*(B+C),若 向 量长度N64,向量元素为浮点数,则在B、C取到V0、V1后,就可用以下三条向量指令求解:(1)V3存储器(访存,载入A)(2)V2V0V1(浮点加)(3)V4V2*V3(浮点乘,存D)解:链接过程如图3.44所示:3.5 向量处理机虚拟存储器的特点现在学习的是第
6、15页,共43页 三条向量指令全部用串行方法执行,则总 的执行时间为:(1+6+1)+N-1+(1+6+1)+N-1 +(1+7+1)+N-1=3N+22 拍 3.5 向量处理机虚拟存储器的特点现在学习的是第16页,共43页 前 两 条 向 量 指 令 并 行 执 行 之 后,再 执 行 第 三条向量指令,则总的执行时间为:(1+6+1)+N-1+(1+7+1)+N-1 =2N+15 拍 采用向量链接技术,所需拍数(亦称为链接 流水线的流水时间)为:(1+6+1)+(1+7+1)=17 拍 则三条向量指令总执行时间为:(1+6+1)+(1+7+1)+(N-1)=N+16 拍 3.5 向量处理机
7、虚拟存储器的特点现在学习的是第17页,共43页5.向量链接的一些主要要求:(除了要保证无向量寄存器使用冲突和无向 量功能部件使用冲突的条件之外)在 进 行 链 接 的 时 候,只 有 在 前 一 条 向 量 指 令 的 第 一 个 结 果 元 素 送 入 结 果 向 量 寄 存 器 的 那 一 个 时 钟 周 期 才 可 以 进 行 链 接,若 错 过 该 时 刻就不能进行链接。只有当前一条向量指令全部执行完毕,释放 相应的向量寄存器资源后才能执行后面的向 量指令。3.5 向量处理机虚拟存储器的特点现在学习的是第18页,共43页 当一条向量指令的两个源操作数分别是两条 先行向量指令的结果寄存器
8、时,要求先行的 两条向量指令产生运算结果的时间必须相等,即要求有关向量功能部件的延迟时间相等。只有所有可以链接执行的向量指令的向量长 度相等时,它们之间才能链接执行,否则它 们之间也不能链接执行。3.5 向量处理机现在学习的是第19页,共43页6.向量循环或分段开采技术 如果向量的长度大于向量寄存器的长度,该如何处理呢?向量循环:长向量循环分段处理的程序结构。把长向量分成固定长度的段,然后循环分 段处理,一次循环只处理一个向量段。这种分段向量处理技术也称为分段开采。将长向量循环分段处理是由系统硬件和软件控 制完成的,对程序员透明。3.5 向量处理机虚拟存储器的特点现在学习的是第20页,共43页
9、 例3.8 设A和B是长度为N的向量,考虑在Cray-1向量处理器上实现如下的循环操作。DO 10 I=1,N 10 A(I)=5.0*B(I)+1.0 当N 64时,可以用如下指令序列实现上 述循环操作:S15.0 ;将常数5.0送入标量寄存器S1S21.0 ;将常数1.0送入标量寄存器S2VLN ;在向量长度寄存器VL中设置向量长度N3.5 向量处理机虚拟存储器的特点现在学习的是第21页,共43页V0B ;从存储器中将向量B读入向量寄存器V0V1S1*V0;向量B中的每个元素分别和常数S1 相乘V2S2+V1;向量V1中的每个元素分别和常数 S2相加AV2;将计算结果从向量寄存器V2存入存
10、 储器的向量A3.5 向量处理机虚拟存储器的特点现在学习的是第22页,共43页 当N 64时,就需要进行分段开采。在进 行分段开采时,首先必须根据向量长度计算 出循环次数K:一般来说,N并不一定总是64的倍数,所以如果N/64有余数,那么余数L为:3.5 向量处理机64K=NL=N 6464N虚拟存储器的特点现在学习的是第23页,共43页S15.0 ;将常数5.0送入标量寄存器S1S21.0 ;将常数1.0送入标量寄存器S2VLL ;在向量长度寄存器VL中设置向量长度LV0B ;从存储器中将向量B0.L-1读入向量 寄存器V0V1S1*V0;向量B中的每个元素分别和常数S1相乘;V2S2+V1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 流水线 技术 向量 处理机

限制150内