指令的动态调度.ppt
《指令的动态调度.ppt》由会员分享,可在线阅读,更多相关《指令的动态调度.ppt(59页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、161指令的动态调度 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望2614.2.1 动态调度的原理 到目前为止我们所使用流水线的最大的到目前为止我们所使用流水线的最大的局限性局限性:指令必须顺序流出指令必须顺序流出看下面一段代码:看下面一段代码:DIVD F0,F2,F4;S1S1 ADDD F10,F0,F8;S2S2:S2S2对对S1S1数据相关数据相关,S2 S2被阻塞被阻塞 SUBD F12,F8 ,F14;S3S3:S3S3与与S1S1、S2S2都没都
2、没 有相关有相关,但也被阻塞但也被阻塞4.2 指令的动态调度361为了允许乱序执行,我们将基本流水线的译码阶段为了允许乱序执行,我们将基本流水线的译码阶段 再分为两个阶段:再分为两个阶段:(1)(1)流流出出(IssueIssue,ISIS):指指令令译译码码,检检查查是是否否存存 在结构阻塞。在结构阻塞。(2)(2)读读操操作作数数(Read Read OperandsOperands,RORO):当当没没有有数数 据相关引发的阻塞时就读操作数。据相关引发的阻塞时就读操作数。指令乱序结束带来的指令乱序结束带来的最大问题最大问题:异常处理比较复杂异常处理比较复杂 (精确异常处理、不精确异常处理
3、精确异常处理、不精确异常处理)4.2 指令的动态调度4614.2.2 动态调度算法之一:记分牌 例:例:数据先读后写(数据先读后写(WARWAR)相关引起的阻塞)相关引起的阻塞 代码序列:代码序列:DIVDF0,F2,F4 ADDDF10,F0,F8 SUBDF8,F8,F14 指令乱序执行时就会出现指令乱序执行时就会出现先读后写相关先读后写相关。记分牌技术的目标:记分牌技术的目标:在资源充足时,尽可能早地执行没有数据阻在资源充足时,尽可能早地执行没有数据阻 塞的指令,达到每个时钟周期执行一条指令。塞的指令,达到每个时钟周期执行一条指令。4.2 指令的动态调度561 要要发发挥挥指指令令乱乱序
4、序执执行行的的好好处处,必必须须有有多多条条指指令令 同同时时处处于于执执行行阶阶段段,这这就就要要求求有有多多个个功功能能部部件件 或功能部件流水化或者两者兼有或功能部件流水化或者两者兼有。假设:处理器采用多个功能部件。假设:处理器采用多个功能部件。CDC 6600 CDC 6600具有具有1616个功能部件:个功能部件:4 4个个浮点部件,浮点部件,5 5个个存储器访问部件存储器访问部件 7 7个个整数操作部件整数操作部件 在在DLXDLX中,假设有中,假设有2 2个个乘法器、乘法器、1 1个个加法器、加法器、1 1 个个除法部件和除法部件和1 1个个整数部件。整数部件。4.2 指令的动态
5、调度1.1.采用记分牌技术的采用记分牌技术的DLXDLX处理器的基本结构。处理器的基本结构。图图4.1 4.1 具有记分牌的具有记分牌的DLXDLX处理器基本结构处理器基本结构 761 记分牌电路负责记录资源的使用,并负责相记分牌电路负责记录资源的使用,并负责相关检测,控制指令的流出和执行。关检测,控制指令的流出和执行。2.2.每条指令在流水线中的执行过程分为每条指令在流水线中的执行过程分为四段四段:(1)(1)流出(流出(IssueIssue,记为,记为ISIS)如果本指令所需的功能部件有空闲,并如果本指令所需的功能部件有空闲,并 且其它正在执行的指令使用的目的寄存器与且其它正在执行的指令使
6、用的目的寄存器与 本指令的不同,记分牌就向功能部件流出本本指令的不同,记分牌就向功能部件流出本 指令,并修改记分牌内部的数据记录。指令,并修改记分牌内部的数据记录。解决了指令间存在的解决了指令间存在的结构相关或写后写相关结构相关或写后写相关。4.2 指令的动态调度861(2)(2)读操作数(读操作数(Read OperandRead Operand,记为,记为RORO)。)。记分牌需要监测源操作数寄存器中数据的记分牌需要监测源操作数寄存器中数据的 有效性,如果前面已流出的还在运行的指令不有效性,如果前面已流出的还在运行的指令不 对本指令的源操作数寄存器进行写操作,或者对本指令的源操作数寄存器进
7、行写操作,或者 一个正在工作的功能部件已经完成了对这个寄一个正在工作的功能部件已经完成了对这个寄 存器的写操作,那么此操作数有效。当操作数存器的写操作,那么此操作数有效。当操作数 有效后,记分牌将启动本指令的功能部件读操有效后,记分牌将启动本指令的功能部件读操 作数并开始执行。作数并开始执行。解决了数据的解决了数据的先写后读(先写后读(RAWRAW)相关)相关。通过以上步骤,记分牌动态解决了结构相通过以上步骤,记分牌动态解决了结构相 和数据相关引发的阻塞,指令可能乱序流出。和数据相关引发的阻塞,指令可能乱序流出。4.2 指令的动态调度961(3)(3)执行(执行(ExecutionExecut
8、ion,记为,记为EXEX)。)。(4)(4)写结果(写结果(Write ResultWrite Result,记为,记为WRWR)。)。记分牌知道指令执行完毕后,如果目标记分牌知道指令执行完毕后,如果目标 寄存器空闲,就将结果写入到目标寄存器中,寄存器空闲,就将结果写入到目标寄存器中,然后释放本指令使用的所有资源。然后释放本指令使用的所有资源。检测先读后写(检测先读后写(WARWAR)相关)相关 在出现以下的情况时,就不允许指令写结果在出现以下的情况时,就不允许指令写结果:前面的某条指令(按顺序流出)还没有读取操作数;前面的某条指令(按顺序流出)还没有读取操作数;其中某个源操作数寄存器与本指
9、令的目的寄存器相同。其中某个源操作数寄存器与本指令的目的寄存器相同。4.2 指令的动态调度1061 存在一个问题存在一个问题:就是功能部件到寄存器文件的就是功能部件到寄存器文件的数据总线宽度是有限的,当流水线中进入读操作数据总线宽度是有限的,当流水线中进入读操作数段(数段(RORO)和写结果段()和写结果段(WBWB)的功能部件总数超)的功能部件总数超过可用总线的数目,这会导致过可用总线的数目,这会导致结构阻塞结构阻塞。3.3.记分牌需要纪录的信息分为三部分:记分牌需要纪录的信息分为三部分:(1)(1)指令状态表指令状态表 记录正在执行的各条指令已经进入记记录正在执行的各条指令已经进入记 分牌
10、分牌DLXDLX流水线四段中的哪一段。流水线四段中的哪一段。4.2 指令的动态调度1161(2)(2)功能部件状态表功能部件状态表 纪录各个功能部件的状态。每个功能部件纪录各个功能部件的状态。每个功能部件 在状态表中都由以下在状态表中都由以下九个域九个域来纪录:来纪录:BusyBusy:指示功能部件是否在工作指示功能部件是否在工作 OpOp:功能部件当前执行的操作功能部件当前执行的操作 FiFi:目的寄存器编号目的寄存器编号 FjFj,fkfk:源寄存器编号源寄存器编号 QjQj,QkQk:向向RjRj,RkRk中写结果的功能部件中写结果的功能部件 RjRj,RkRk:表示表示FjFj,FkF
11、k是否就绪,是否就绪,是否已经被使用是否已经被使用4.2 指令的动态调度1261(3)(3)结果寄存器状态表结果寄存器状态表 每个寄存器在表中有一个域,用于纪录写每个寄存器在表中有一个域,用于纪录写 入本寄存器的功能部件(编号)。如果当前正入本寄存器的功能部件(编号)。如果当前正 在运行的功能部件没有需要写入本寄存器的,在运行的功能部件没有需要写入本寄存器的,则相应域置为空。则相应域置为空。4.4.DLXDLX记分牌所要维护的数据结构记分牌所要维护的数据结构 给出下列代码运行过程中记分牌保存的信息给出下列代码运行过程中记分牌保存的信息.4.2 指令的动态调度1361LD F6,34(R2)LD
12、 F2,45(R3)MULTDF0,F2,F4SUBD F8,F6,F2DIVD F10,F0,F6ADDDF6,F8,F24.2 指令的动态调度1461指 令 指令状态表 IS RO EX WR LD F6,34(R2)LD F2,45(R3)MULTDF0,F2,F4 SUBDF8,F6,F2 DIVDF10,F0,F6 ADDDF6,F8,F2 图图4.2 DLX4.2 DLX记分牌信息组成和记录的信息记分牌信息组成和记录的信息 4.2 指令的动态调度部件名称 功能部件状态表 Busy Op Fi Fj Fk Qj Qk Rj Rk整数 yes LD F2 R3 no乘法1 yes MU
13、LTD F0 F2 F4 整数 no yes乘法2 no加法 yes SUBD F8 F6 F2 整数 yes no除法 yes DIVD F10 F0 F6 乘法1 no yes 结果寄存器状态表 F0 F2 F4 F6 F8 F10 F30部件名称 乘法1 整数 加法 除法1661 例例4.34.3 假设浮点流水线中执行的延迟如下:假设浮点流水线中执行的延迟如下:加法需加法需2 2个个时钟周期时钟周期 乘法需乘法需1010个个时钟周期时钟周期 除法需除法需4040个个时钟周期时钟周期 代代码码段段和和记记分分牌牌信信息息的的起起始始点点状状态态如如图图4.24.2。分分别别给出给出MULT
14、DMULTD和和DIVDDIVD准备写结果之前的记分牌状态。准备写结果之前的记分牌状态。解:解:在分析记分牌状态之前,首先需要分析指令之在分析记分牌状态之前,首先需要分析指令之间存在的相关性,因为相关性会影响指令进入记分间存在的相关性,因为相关性会影响指令进入记分牌牌DLXDLX流水线的相应段。流水线的相应段。4.2 指令的动态调度1761(1)(1)第二个第二个LDLD指令到指令到MULDMULD和和SUBDSUBD、MULTDMULTD到到DIVDDIVD 之间以及之间以及SUBDSUBD到到ADDDADDD之间存在着先写后读相关;之间存在着先写后读相关;(2)(2)DIVDDIVD和和A
15、DDDADDD之间存在着先读后写相关;之间存在着先读后写相关;(3)(3)ADDDADDD和和SUBDSUBD指令关于浮点加法部件还存在着结指令关于浮点加法部件还存在着结 构相关。构相关。图图4.34.3和和图图4.44.4分别给出了分别给出了MULTDMULTD指令和指令和DIVDDIVD 指令将要写结果时记分牌的状态。指令将要写结果时记分牌的状态。4.2 指令的动态调度1861指 令 指令状态表 IS RO EX WR LD F6,34(R2)LD F2,45(R3)MULTDF0,F2,F4 SUBDF8,F6,F2 DIVDF10,F0,F6 ADDDF6,F8,F2 图图4.3 4.
16、3 程序段执行到程序段执行到MULTDMULTD将要写结果时记分牌的状态将要写结果时记分牌的状态 4.2 指令的动态调度部件名称 功能部件状态表 Busy Op Fi Fj Fk Qj Qk Rj Rk整数 no 乘法1 yes MULTD F0 F2 F4 no no乘法2 no加法 yes ADDD F6 F8 F2 no no除法 yes DIVD F10 F0 F6 乘法1 no yes 结果寄存器状态表 F0 F2 F4 F6 F8 F10 F30部件名称 乘法1 加法 除法2061指 令 指令状态表 IS RO EX WRLD F6,34(R2)LD F2,45(R3)MULTD
17、F0,F2,F4 SUBD F8,F6,F2 DIVD F10,F0,F6 ADDD F6,F8,F2 图图4.4 4.4 程程序段执行到序段执行到DIVDDIVD将要写结果时记分牌的状态将要写结果时记分牌的状态 4.2 指令的动态调度部件名称 功能部件状态表 Busy Op Fi Fj Fk Qj Qk Rj Rk整数 no 乘法1 no乘法2 no加法 no除法 yes DIVD F10 F0 F6 no no 结果寄存器状态表 F0 F2 F4 F6 F8 F10 F30部件名称 除法22615.5.分析记分牌是如何控制指令执行的。分析记分牌是如何控制指令执行的。操作在记分牌流水线中前进
18、时,记分牌必须操作在记分牌流水线中前进时,记分牌必须 记录与操作有关的信息,如寄存器号等。记录与操作有关的信息,如寄存器号等。约定:约定:FjFj(FUFU)S1 S1:将将寄寄存存器器S1S1的的名名字字送送入入FjFj(FUFU)FU FU:指令使用的功能部件指令使用的功能部件 D D :目的寄存器的名字目的寄存器的名字 S1S1和和S2S2:源操作数寄存器的名字,源操作数寄存器的名字,OpOp:进行的操作进行的操作 FjFj(FUFU):):功能部件功能部件FUFU的的FjFj域域 resultresult(D D):):结果寄存器状态表中对应于寄存器结果寄存器状态表中对应于寄存器D D
19、的内容,为产生寄存器的内容,为产生寄存器D D中结果的功能部件名。中结果的功能部件名。4.2 指令的动态调度2361 流出(流出(ISIS)(1)(1)进入条件进入条件 not Busy(FU)and not result(D)not Busy(FU)and not result(D);/判断结构阻塞和写后写判断结构阻塞和写后写 (2)(2)计分牌记录内容计分牌记录内容 Busy(FU)yes;Busy(FU)yes;OP(FU)Op OP(FU)Op;Fi(FU)D Fi(FU)D;Fj(FU)S1 Fj(FU)S1;Fk(FU)S2Fk(FU)S2;4.2 指令的动态调度2461 Qjre
20、sult(S1)Qjresult(S1);/处理处理S1S1的的FUFU Qkresult(S2)Qkresult(S2);/处理处理S2S2的的FUFU Rjnot QjRjnot Qj;/Rj /Rj是否可用?是否可用?Rknot QkRknot Qk;/Rk /Rk是否可用?是否可用?result(D)FUresult(D)FU;/D /D被被FUFU用作目用作目的寄存器的寄存器读操作数(读操作数(RORO)(1)(1)进入条件进入条件 RjRk;RjRk;/解决先写后读,两个源操作数须同时就绪解决先写后读,两个源操作数须同时就绪 4.2 指令的动态调度2561 (2)(2)计分牌记录内
21、容计分牌记录内容 RjnoRjno;/已经读走了就绪的数据已经读走了就绪的数据RjRj RknoRkno;/已经读走了就绪的数据已经读走了就绪的数据RkRk Qj0Qj0;/不再等待其它不再等待其它FUFU的计算结果的计算结果 Qk0Qk0;执行(执行(EXEX)(1)(1)结束条件结束条件 功能部件操作结束功能部件操作结束4.2 指令的动态调度2661写结果(写结果(WRWR)(1)(1)进入条件进入条件 f(Fj(f)f(Fj(f)Fi(FU)or Rj(f)=no)Fi(FU)or Rj(f)=no)and(Fk(f)and(Fk(f)Fi(FU)or Rk(f)=no);Fi(FU)o
22、r Rk(f)=no);/检查是否存在先读后写检查是否存在先读后写 (2)(2)计分牌记录内容计分牌记录内容 f(if Qj(f)=FU then Rj(f)yes)f(if Qj(f)=FU then Rj(f)yes);/有等结果的指令,则数据可用有等结果的指令,则数据可用 f(if Qk(f)=FU then Rk(f)yes)f(if Qk(f)=FU then Rk(f)yes);result(Fi(FU)0result(Fi(FU)0;/没有没有FUFU使用寄存器使用寄存器FiFi为目的寄存器为目的寄存器 busy(FU)=nobusy(FU)=no/释放释放FUFU4.2 指令的
23、动态调度27616.6.记分牌的性能受限于以下几个方面:记分牌的性能受限于以下几个方面:(1)(1)程序指令中可开发的并行性,即是否存在程序指令中可开发的并行性,即是否存在 可以并行执行的不相关的指令。可以并行执行的不相关的指令。(2)(2)记分牌容量。记分牌的容量决定了流水线记分牌容量。记分牌的容量决定了流水线 能在多大范围内寻找不相关指令。能在多大范围内寻找不相关指令。流水线中可以同时容纳的指令数量又流水线中可以同时容纳的指令数量又 称为称为指令窗口指令窗口。(3)(3)功能部件的数目和种类。功能部件的总数功能部件的数目和种类。功能部件的总数 决定了结构冲突的严重程度。决定了结构冲突的严重
24、程度。(4)(4)反相关和输出相关。引起计分牌中先读后反相关和输出相关。引起计分牌中先读后 写和写后写阻塞。写和写后写阻塞。4.2 指令的动态调度28614.2.3 动态调度算法之二:Tomasulo算法 Tomasulo Tomasulo算法将记分牌的关键部分和寄存器换名算法将记分牌的关键部分和寄存器换名 技术结合在一起。技术结合在一起。基基本本核核心心:通通过过寄寄存存器器换换名名来来消消除除写写后后写写和和先先读读 后写相关而可能引发的流水线阻塞。后写相关而可能引发的流水线阻塞。下面的讨论是基于下面的讨论是基于DLXDLX的浮点流水线功能部件。的浮点流水线功能部件。TomasuloTom
25、asulo算算法法中中,寄寄存存器器换换名名是是通通过过保保留留站站来来实实 现现,它它保保存存等等待待流流出出和和正正在在流流出出指指令令所所需需要要的的操操 作数。作数。TomasuloTomasulo算法的基本思想算法的基本思想4.2 指令的动态调度2961 只只要要操操作作数数有有效效,就就将将其其取取到到保保留留站站,避避免免指令流出时才到寄存器中取数据。指令流出时才到寄存器中取数据。指指令令的的执执行行结结果果直直接接送送到到等等待待数数据据的的其其它它保保留站中去。留站中去。一一条条指指令令流流出出时时,存存放放操操作作数数的的寄寄存存器器名名被被换成为对应于该寄存器保留站的名称
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 指令 动态 调度
限制150内