5.35.4向量机.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《5.35.4向量机.ppt》由会员分享,可在线阅读,更多相关《5.35.4向量机.ppt(76页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2.5 向量机向量机华中师范大学计算机科学系陈 利n标量:常量和数组中的每一个元素都为标量。n只能对一个或一对标量操作数进行运算或操作的指令为标量指令。n只有标量指令系统的处理机称为标量处理机。n三种高性能指令级并行处理机:n超标量处理机n超流水线处理机n超标量超流水线计算机主存D-cacheI-cache译码器21指令调度状态记录 部件存储器操作部件ALU部件转移控制部件RF超级标量机的典型结构超级标量机的典型结构超标量机的主要特点超标量机的主要特点n配置有多个性能不同的处理部件,采用多配置有多个性能不同的处理部件,采用多条流水线并行处理。条流水线并行处理。n能同时多若干条指令进行译码,将可
2、执行能同时多若干条指令进行译码,将可执行的指令送往不同的执行部件,从而达到在的指令送往不同的执行部件,从而达到在每个周期启动多条指令的目的。每个周期启动多条指令的目的。n在程序运行期间由硬件(通常是状态记录在程序运行期间由硬件(通常是状态记录部件和调度部件)完成指令的调度工作。部件和调度部件)完成指令的调度工作。VLIW机的工作原理机的工作原理nVLIW机的方法在机的方法在1983年由美国耶鲁大学的年由美国耶鲁大学的Fisher教授首先提出来的,它与超标量机教授首先提出来的,它与超标量机的不同之处在于:它用一条长指令来实现的不同之处在于:它用一条长指令来实现多条操作的并行执行,减少对存储器大访
3、多条操作的并行执行,减少对存储器大访问,指令字往往长达百位,甚至千位。问,指令字往往长达百位,甚至千位。VLIW机的主要特点机的主要特点n单一的控制流。只有一个控制器,每个周期单一的控制流。只有一个控制器,每个周期启动一个长指令。启动一个长指令。n超长指令字被分成多个控制字段,每个字段超长指令字被分成多个控制字段,每个字段直接独立地控制每个功能部件。直接独立地控制每个功能部件。n含有大量的数据通路和功能部件,由于编译含有大量的数据通路和功能部件,由于编译器在编译时间已考虑可能出现的数据相关和器在编译时间已考虑可能出现的数据相关和资源相关,故控制硬件比较简单。资源相关,故控制硬件比较简单。n在编
4、译阶段完成超长指令中多个可执行操作在编译阶段完成超长指令中多个可执行操作的调度。的调度。VLIW机的结构图机的结构图主存 RF(寄存器堆)LD/ST1LD/ST2FADDFMULVLIW中的操作码字段中的操作码字段:LD/ST1 LD/ST2 FADD FMUL例:例:n要完成如下指令:C=A+BK=I+JL=M-KQ=CK源代码源代码操作操作所需周期所需周期C=A+BLOAD ALOAD BC=A+BSTORE C1111K=I+JLOAD ILOAD JK=I+JSTORE K1111L=M-KLOAD ML=M-KSTORE L111Q=CKQ=CKSTORE Q2114周期周期经经VL
5、IW调度后的指令调度后的指令STORE QSTORE LQ=CKL=M-KSTORE KK=I+JSTORE CLOAD MC=A+BLOAD JLOAD ILOAD BLOAD A6个周期个周期(乘(乘2个周期)个周期)比较类型译码并行检验完成时间代码密度目标可移植性VLIW简单编译较差不可移植超级标量复杂运行较好可移植VLIW与超标量机的比较与超标量机的比较VLIW计算机曾经有过商品化的机计算机曾经有过商品化的机器,如美国的器,如美国的 Multiflow 公司生产公司生产的的TRACE型号机器,以及型号机器,以及Cydrome 公司生产的公司生产的Cydra5.但由但由于性能价格比不理想
6、等原因已停止于性能价格比不理想等原因已停止生产生产VLIW机器,但是计算机所采机器,但是计算机所采用的压缩技术已广泛使用。用的压缩技术已广泛使用。为了获取高的流水处理性能为了获取高的流水处理性能:1、设法增加流水线中的段数,即:、设法增加流水线中的段数,即:流水的深度。流水的深度。2、设法在每个时钟周期能启动多条、设法在每个时钟周期能启动多条指令。指令。标量流水机性能的提高受到下面两个因素影响:标量流水机性能的提高受到下面两个因素影响:1、流水线工作的时钟周期不可能取得很短。、流水线工作的时钟周期不可能取得很短。n 相关问题相关问题n 时钟周期短将加剧时钟在流水入口和出口时钟周期短将加剧时钟在
7、流水入口和出口处的扭斜错位程度,使级间锁定变得困难,处的扭斜错位程度,使级间锁定变得困难,导致不能可靠工作。导致不能可靠工作。2、取指及译码的速率受限。在一个时钟周、取指及译码的速率受限。在一个时钟周期中最多只能启动一条指令期中最多只能启动一条指令。向量流水处理在一定程度上不受以上两向量流水处理在一定程度上不受以上两各个因素影响。各个因素影响。一、向量流水机的基本系统结构1.向量流水的主要特点:向量流水的主要特点:n一个一个向量向量中各个元素是互不相关的,对当中各个元素是互不相关的,对当前每个向量的操作结果不影响到其他向量前每个向量的操作结果不影响到其他向量元素。这就允许向量流水流水线有较深的
8、元素。这就允许向量流水流水线有较深的深度。深度。n一条向量指令相当于一个标量循环,所以一条向量指令相当于一个标量循环,所以可以减少指令,从而可以降低对指令访问可以减少指令,从而可以降低对指令访问带宽的要求。并且消除了由循环引起的控带宽的要求。并且消除了由循环引起的控制相关。制相关。n若向量指令所要访问的向量元素均相邻,若向量指令所要访问的向量元素均相邻,则可以在交叉存储体中高速地依次访问它则可以在交叉存储体中高速地依次访问它们。这使得访存时间缩短。们。这使得访存时间缩短。向量操作要比一串标量指令操作更快。向量操作要比一串标量指令操作更快。2.向量机的系统结构按向量操作对象及结向量机的系统结构按
9、向量操作对象及结果主要存放在寄存器中还是存放在存储果主要存放在寄存器中还是存放在存储器中,可分为器中,可分为:存储器存储器-存储器工作方式向量机存储器工作方式向量机 寄存器寄存器-寄存器工作方式向量机寄存器工作方式向量机n现在的向量机大多采用寄存器现在的向量机大多采用寄存器-寄存器寄存器工作方式,如中国的工作方式,如中国的YH向量机等。向量机等。主存标量寄存器向量存取 部件 指令处理部件向量寄存器/向量缓冲器向量指令控制部件标量功能部件向量功能部件向量功能部件向量功能部件n 它主要由一个标量流水部件和一个向量流水部件组成,包含了向量功能部件、向量存取部件、向量寄存器或向量缓冲部件、标量量寄存器
10、、标量处理部件及向量控制器等部件。也就是说,向量机兼容标量处理功能。Y=aX+Y(a为标量,为标量,X、Y为向量)为向量)n标量机 LD F0,a ADDI R4,RX,#512LOOP:LD F2,0(RX)MULD F2,F0,F2 LD F4,0(RY)ADDD F4,F2,F4 SD 0(RY),F4 ADDI RX,RX,#8 ADDI RY,RY,#8 SUB R20,R4,RX BNZ R20,LOOP n向量机 LD F0,a LV V1,RX MULTV V2,F0,V1 LV V3,RY ADDV V4,V2,V3 SV RY,V4 比较比较n向量机执行指令向量机执行指令6
11、条。条。标量机执行指令(标量机执行指令(9*64+2=578)n标量机的连锁频率远高于向量机。标量机的连锁频率远高于向量机。3.向量启动时间和启动率向量启动时间和启动率 基本的向量流水操作就是在对一条基本的向量流水操作就是在对一条指令进行流水操作,也就是用流水的指令进行流水操作,也就是用流水的方法对向量元素进行操作。当一条向方法对向量元素进行操作。当一条向量指令开始执行时,就开启了一条向量指令开始执行时,就开启了一条向量流水线,从开始启动到流水运行结量流水线,从开始启动到流水运行结束的时间就是向量指令的束的时间就是向量指令的执行时间执行时间。nTvp=Tat+nIr 其中:其中:Tat是流水线
12、的启动时间(包括流水线固有的延迟是流水线的启动时间(包括流水线固有的延迟时间,以便设置为完成向量指令所需的相应参数)时间,以便设置为完成向量指令所需的相应参数)Ir为启动率,它表示一旦向量指令开始运行后,即为启动率,它表示一旦向量指令开始运行后,即向量流水线填满后,每流出一个结果所需时间。向量流水线填满后,每流出一个结果所需时间。n是向量的长度是向量的长度n对对RR型向量机而言型向量机而言 流水线的启动时间主要取决于功能部流水线的启动时间主要取决于功能部件流水线的深度,启动时间就是获得第一件流水线的深度,启动时间就是获得第一个流水结果的时间。个流水结果的时间。启动率取决于相应的向量功能不见能启
13、动率取决于相应的向量功能不见能以多快的频率来接收一个操作数,当处于以多快的频率来接收一个操作数,当处于充分流水时可使启动率为充分流水时可使启动率为1。二、向量操作长度控制和向量访问步长n 在寄存器在寄存器-寄存器工作方式执行过程中,寄存器工作方式执行过程中,如果向量的长度大于寄存器的长度时,要如果向量的长度大于寄存器的长度时,要把待计算的向量分成几段来计算,每次调把待计算的向量分成几段来计算,每次调入一段,放到寄存器中进行流水操作,完入一段,放到寄存器中进行流水操作,完了以后再取一段。这就是了以后再取一段。这就是分段技术分段技术。三、向量的处理方法 向量机对向量的各种运算可以采用不同的向量机对
14、向量的各种运算可以采用不同的加式方式,一种是横向加工,一种是纵向加式方式,一种是横向加工,一种是纵向(垂直垂直)加工,还有就是纵横向加工加工,还有就是纵横向加工(分组加分组加工工),这是分段技术在向量加工方式上的实,这是分段技术在向量加工方式上的实现。如现。如CRAY-1以及小巨型机基本都采用分以及小巨型机基本都采用分组加工的方式。组加工的方式。D=A(B+C)n横向加工法 di=a1(b1+c1)d2=a2(b2+c2)di=ai(bi+ci)D=A(B+C)n纵向加工法 K=B+CD=AKD=A(B+C)n纵横向加工法(每组有两条向量指令)K 1n=B 1n+C 1n D 1n=A 1n
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 5.3 5.4向量机 5.4 向量
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内