《计算机体系结构指令调度实验报告.pdf》由会员分享,可在线阅读,更多相关《计算机体系结构指令调度实验报告.pdf(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、.实验六 指令调度实验报告 1实验目的:通过本实验,加深对指令调度的理解,了解指令调度技术对 CPU 性能改进的好处。2.实验内容:(1)通过Configuration菜单中的“Floating point stages”选项,把除法单 元数设置为 3,把加法乘法除法的延迟设置为 3 个时钟周期。(2)用 WinDLX 模拟器运行调度前的程序 sch-before.s。记录程序执行过程中各种相关发生的次数以及程序执行的总时钟周期数。(3)用 WinDLX 模拟器运行调度后的程序 sch-after.s,记录程序执行过程中各种相关发生的次数以及程序执行的总时钟周期数。(4)根据记录结果,比较调度
2、前和调度后的性能。(5)论述指令调度对于提高 CPU 性能的意义。3实验程序:程序 sch-before.s ;-;Example to illustrate instruction scheduling;-.data.global ONE ONE:.word 1.text.global main main:lf f1,ONE;turn divf into a move cvti2f f7,f1;by storing in f7 1 in nop;floating-point format divf f1,f8,f7;move Y=(f8)into f1 divf f2,f9,f7;move
3、Z=(f9)into f2 addf f3,f1,f2.divf f10,f3,f7;move f3 into X=(f10)divf f4,f11,f7;move B=(f11)into f4 divf f5,f12,f7;move C=(f12)into f5 multf f6,f4,f5 divf f13,f6,f7;move f6 into A=(f13)Finish:trap 0 调度后的程序 sch-after.s ;-;Example to illustrate instruction scheduling-reordered instructions;-.data.global
4、 ONE ONE:.word 1.text.global main main:lf f1,ONE;turn divf into a move cvti2f f7,f1;by storing in f7 1 in nop;floating-point format divf f1,f8,f7;move Y=(f8)into f1 divf f2,f9,f7;move Z=(f9)into f2 divf f4,f11,f7;move B=(f11)into f4 divf f5,f12,f7;move C=(f12)into f5 addf f3,f1,f2 multf f6,f4,f5 div
5、f f10,f3,f7;move f3 into X=(f10)divf f13,f6,f7;move f6 into A=(f13).Finish:trap 0 4.实验原理 由于相关的存在,使得指令中的下一条指令不能在指定的时钟周期执行。流水线冲突会给指令在流水线中的执行带来许多问题,如果不能很好地解决冲突问题,轻则影响流水线的性能,重则导致错误的执行结果。而对于各种冲突,都有可能用指令调度来解决。6.实验步骤 1设置除法单元数设置为 3,把加法乘法除法的延迟设置为 3 个时钟周期:2运行程序部分截图 3未用指令调度技术之前程序执行过程中的相关:.4未用指令调度技术之前,运行结果数据统计
6、5采用调度技术后发生的关联:.6采用调度技术后,运行结果数据统计:.7.实验结论 1采用指令调度之前:相关名 相关次数 所占比例 RAW stalls 9 33.33%WAW stalls 0 0 Structural stalls 0 0 Control stalls 0 0 Trap stalls 7 25.92%Total 16 59.26%采用循环调度前程序执行的过程中各种相关发生的次数如上表所示。发生相关的指令组合如实验数据中的截图所示。程序执行总的时钟周期数是 27。根据上述数据计算可得:吞吐率=10/27=0.37.2采用指令调度之后:相关名 相关次数 所占比例 RAW stal
7、ls 3 14.28%WAW stalls 0 0 Structural stalls 0 0 Control stalls 0 0 Trap stalls 6 28.57%Total 9 42.86%采用循环调度后程序执行过程中各种相关发生的次数如上表所示,发生相关的指令组合如实验数据中的截图所示。程序执行总的时钟周期数是 21。根据上述数据计算可得:吞吐率=10/21=0.476 8.实验总结 通过本实验,基本掌握了 WinDLX 模拟器的操作和使用,熟悉 DLX 指令集结构及其特点,对于采用指令调度技术减少各种相关、提高流水线速度的方法和技巧有了更深的认识,对于计算机体系结构这门课程的学习和以后的实验还是很有帮助的。做好本实验首先需要掌握 WinDLX 模拟器的使用。理解课本中的有关指令调度技术的基础知识以及使用汇编语言编程,是做好本实验的关键所在。.9.对本实验过程及方法、手段的改进建议:在进行本实验时,用指令调度技术解决流水线中的结构相关与数据相关,没有对是否采用定向技术进行考虑。而定向技术采用与否,会影响指令调度技术以及循环展开技术解决流水线中的结构相关与数据相关。所以,在今后做本实验时,应该考虑是否采用定向技术。
限制150内