2022年北邮大三计算机体系结构实验三DLX处理器程序设计.docx
《2022年北邮大三计算机体系结构实验三DLX处理器程序设计.docx》由会员分享,可在线阅读,更多相关《2022年北邮大三计算机体系结构实验三DLX处理器程序设计.docx(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1. 试验目的试验三DLX处理器程序设计学习文档 仅供参考学习简洁编译优化方法,观看采纳编译优化方法所带来的性能的提高;2. 试验原理采纳静态调度方法重排指令序列,削减相关,优化程序;3、试验内容和要求自编一段汇编代码,完成一维向量加法运算,并输出结果;观看程序中显现的数据/ 掌握/ 结构相关;注:使用一维数组表示一维向量; 4. 1 向量加法代码清单及注释说明1、向量加法设计源代码.dataVectorLength:.word16Vector1:.word1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16Vector2:.word1,2,3,4,5,6,7,8,9,
2、10,11,12,13,14,15,16;声明向量长度以及声明向量 1、2 Printf1:.asciizVector =Printf2:.asciiz %f.align2PrintPrompt:.wordPrintf1 PrintPar:.wordPrintf2Result:.space4 ;存放打印数据的空间申请.text main:addir14,r0,PrintPrompt trap5lwr20,VectorLength addir2,r0,0Loop:ldf10,Vector1r2ldf12,Vector2r2;循环体中读入向量cvti2df0,f10 cvti2df2,f12add
3、df4,f2,f0;加法运算Finish:;* Finish,write result into stdout sdResult,f4addir14,r0,PrintPartrap5;系统中断,输出结果addir2,r2,4 subir20,r20,1 bnezr20,Loop;* End trap02、运行结果5. 1 程序相关性分析结果1 观看程序中显现的数据/ 掌握/ 结构相关;指出程序中显现上述现象的指令组合;产生 34.12%的数据相关; 当对当前指令的操作数寄存器进行操作的时候,前几条指令的运算结果仍未写回结果寄存器,由此产生数据相关;没有产生结构相关;产生 3.94%的掌握相关;
4、 系统根据猜测胜利来执行指令,执行一条指令后立刻将其下一条指令 trap 读进来;2考察增加浮点运算部件对性能的影响;1 个浮点运算部件3 个浮点运算部件同一段代码执行相同步, 但是经过比照发觉浮点运算部件的多少对于程序执行效率并没有什么影响, 浮点运算部件的多少对统计结果都不造成影响,可能是由于该程序不存在争用浮点运算部件资源的情形3考察增加 forward部件对性能的影响;不使用 forward 部件使用 forward 部件使用forward 部件之后执行相同的代码用的时钟周期比不使用forward 部件少了大约100个时钟周期,由于没有结构相关,所以使用forward 部件主要使得 R
5、AW相关明显削减了,占总的时钟周期比例也削减了,对掌握相关没有什么影响;总之,使用 forward部件后,总的时钟周期削减,数据相关削减,流水线的性能得到很大的改善;4观看转移指令在转移胜利和转移不胜利时候的流水线开销;在本次试验中转移胜利的几率比较大,进行16 次转移只有一次转移不胜利的, 由于系统根据猜测胜利来执行指令,当判定转移不胜利时,系统对trap 指令进行的操作被全部作废,转而去执行跳转到的指令;4. 2 双精度浮点加法求和代码清单及注释说明1、双精度浮点加法求和源代码.data;初始化两个用于相加的一维向量双精度浮点数,向量长度为 20a:.double1.9,2.1,3.7,4
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022 年北邮 大三 计算机体系结构 实验 DLX 处理器 程序设计
限制150内