2022年高级计算机体系结构期末试题.docx
《2022年高级计算机体系结构期末试题.docx》由会员分享,可在线阅读,更多相关《2022年高级计算机体系结构期末试题.docx(19页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选学习资料 - - - - - - - - - 学而不思就惘,思而不学就殆1.CUP性能公式评判 cache 性能公式:平均储备拜访时间= 命中时间+ 缺失率 缺失代价命中时间:缓冲命中需要的时间;Cpu性能公式 分析经典的 CPU性能公式现在我们可以用指令数、CPI 和时钟周期时间来写出基本的性能公式:CPU时间 =指令数CPI 时钟周期时间CPI:每条指令的时钟周期数,表示执行某个程序或者程序片段时每条指令所需的时钟周期平均数;指令数:执行某程序所需的总指令数量;或 CPU时间 =指令数CPI/ 时钟频率这些公式特殊有用,由于它们把性能分解为三个关键因素;我们可用这些公式来比较不同的实现
2、方案或评估某个设计的替代方案;举例 代码段的比较一个编译器设计者试图在两个代码序列之间进行挑选;硬件设计者给出了如下数据:对于某行高级语言语句的实现,两个代码序列所需的指令数量如下:代码序列 1 共执行 2+1+2=5条指令;代码序列 2 共执行 4+1+1=6条指令;所以,代码序列 2 执行的指令数更多;基于指令数和 CPI,我们可以用 CPU时钟周期公式运算出每个代码序列的总时钟周期数为:名师归纳总结 - - - - - - -第 1 页,共 10 页精选学习资料 - - - - - - - - - 学而不思就惘,思而不学就殆因此,代码序列 1 的 CPU时钟周期数 =(2 1)+(1 2
3、)+(2 3)=10 周期,代码序列 2 的 CPU时钟周期数 =(4 1)+(1 2)+(1 3)=9 周期;故代码序列 2 更快,尽管它多执行了一条指令;由于代码序列 2 总时钟周期数较少,而指令数较多, 它肯定具有较小的CPI;CPI 的运算公式为:CPI=CPU时钟周期数 / 指令数代入相应数据可得 CPI1=CPU时钟周期数 1/ 指令数 1=10/5=2 CPI2=CPU时钟周期数 2/ 指令数 2=9/6=1.5 ;重点图 1-14 给出了运算机在不同层次上的性能测试指标及其测试单位;通过这些指标的组合可以运算出程序的执行时间(单位为秒):执行时间 =秒/ 程序 =指令数 / 程
4、序 时钟周期数/ 指令 秒 / 时钟周期永久记住, 唯独能够被完全牢靠测量的运算机性能指标是时间;例如, 对指令集削减指令数目的改进可能降低时钟周期时间或提高 CPI,从而抵消了改进的成效;类似地,CPI 与执行的指令类型相关,执行指令数最少的代码其执行速度未必是最快的;图 1-14 基本的性能指标及其测量单位如何确定性能公式中这些因素的值呢?我们可以通过运行程序来测量 CPU的执行时间, 并且运算机的说明书中通常介绍了时钟周期时间;难以测量的是指令数和 CPI;当然,假如确定了时钟频率和CPU执行时间 , 我们只需要知道指令数或者 CPI 两者之一 , 就可以依据性能公式运算出另一个;用仿真
5、器等软件工具可以测量出指令数,也可以用现代处理器中的硬件计数器来测量执行的指令数、 平均 CPI 和性能缺失源等; 由于指令数量取决于运算机名师归纳总结 - - - - - - -第 2 页,共 10 页精选学习资料 - - - - - - - - - 学而不思就惘,思而不学就殆体系结构, 并不依靠于运算机的详细实现, 因而我们可以在不知道运算机全部实现细节的情形下对指令数进行测量;但是,关,包括储备系统和处理器结构(我们将在第CPI 与运算机的各种设计细节亲密相 4、5 章中看到),以及应用程序中不同类型的指令所占的比例;因此,CPI 对于不同应用程序是不同的,对于相同指令集的不同实现方式也
6、是不同的;上述的例子说明,只用一种因素(如指令数)去评判性能是危急的;当比较两台运算机时, 必需考虑全部三个因素, 它们组合起来才能确定执行时间;假如某个因素相同(如上例中的时钟频率),必需考虑不同的因素,才能确定性能的优劣;由于 CPI 随着指令组合( instruction mix)而变化,这样指令的条数和CPU必需被比较,即使时钟频率是相同的;在本章最终的练习题中,有几个是关于运算机和编译程序的性能评判;种因素而导致的对性能的误会;懂得程序性能在 1.8 节,我们将争论一种因没有全面考虑各程序的性能与算法、编程语言、编译程序、体系结构以及实际的硬件有关;下表概括了这些成分是如何影响CPU
7、性能公式中的各种因素的;精解:或许你期望 CPI 最小值为 1.0 ;在第 4 章我们将看到,有些处理器在每个时钟周期可对多条指令取指并执行;有些设计者用 IPC(instruction per clock cycle )来代替 CPI;如一个处理器每时钟周期可执行 2 条指令,就它的 IPC=2,CPI=0.5;2.verlog 描述状态机(硬件描述语言(verylog)写状态机)名师归纳总结 - - - - - - -第 3 页,共 10 页精选学习资料 - - - - - - - - - 学而不思就惘,思而不学就殆状态机描述方法: 状态机描述时关键是要描述清晰几个状态机的要素,即 如何进
8、行状态转移, 每个状态的输出是什么, 状态转移的条件等; 常见的三种描 述方式:第一,整个状态机写到一个always 模块里面,在该模块中既描述状态转移,又描述状态的输入和输出;其次,用两个 always 模块来描述状态机,其中一个 always 模块采纳同步时序 描述状态转移; 另一个模块采纳组合规律判定状态转移条件,描述状态转移规律以输出;第三,在两个 awlays 模块描述方法基础上, 使用三个 awlays 模块,一个 awlays 模块采纳同步时序描述状态转移; 另一个模块采纳组合规律判定状态转移条件,描述状态转移规律;另一个awlays 模块描述状态的输出(可以组合电路输出,也可以
9、时序电路输出);状态机采纳 VerylogHDL 语言编码,建议分为三个 always 段完成;三段式建模 描述 FSM 的状态机输出时,只需指定 case 敏锐表为次态寄存器,然后直接在每个次态寄存器的 case 分支中描述该状态的输出即可, 不用考虑状态转移条件;/ 状态机设计的例子module FSMclk,clr,out,start,step2,step3; input clk,clr,start,step2,step3; output2:0 out; reg2:0 out; reg1:0 state,next_state; parameter state0=2b00,state1=2
10、b01, state2=2b11,state3=2b10; always posedge clk or posedge clr begin if clr state = state0; else state = next_state; end always state or start or step2 or step3 begin case state state0: begin if start next_state =state1; else next_state =state0; end state1: begin next_state = state2; end state2: be
11、gin 名师归纳总结 if step2 next_state =state3; 第 4 页,共 10 页else next_state =state0; end - - - - - - -精选学习资料 - - - - - - - - - 学而不思就惘,思而不学就殆state3: begin if step3 next_state =state0; else next_state =state3; end default: next_state =state0; endcase end always state begin casestate state0: out=3b001; state1:
12、 out=3b010; state2: out=3b100; state3: out=3b111; default:out=3b001; endcase end 3.流水线数据相关性及解决方法 流水线的概念流水线:把一个重复的过程分解为如干子过程,每个子过程由特地的功能部件来实现;将多个处理过程在时间错开,依次通过各功能段, 每个子过程就可以与其 他子过程并行进行;相关:指两条指令之间存在某种依靠关系;3 种类型:数据相关、名相关、掌握相关(1)数据相关 依次存在两条指令 i(在前)和 j(在后),如指令 j 使用指令 i 产生的结果或指令 j 与 k 数据相关,而 k 又与指令 i 数据相关
13、,就称 j 与 i 数据相关;(2)名相关 名:指指令所拜访的寄存器或储备单元名称;名相关:指两条指令使用的名相同,但没有数据流淌,就称它们名相关;(3)掌握相关掌握相关是指由分支指令引起的相关;它需要依据分支指令的执行结果来确定后续指令是否执行; 一般说来, 为确保程序应有的执行次序,必需严格按掌握相关确定的次序执行(3)掌握相关掌握相关是指由分支指令引起的相关;它需要依据分支指令的执行结果来确定后续指令是否执行; 一般说来, 为确保程序应有的执行次序,必需严格按掌握相关 确定的次序执行 流水线冲突: 指对于详细的流水线来说, 由于相关的存在, 使得指令流中的下一 条指令不能在特定的时钟周期
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022 年高 计算机体系结构 期末 试题
限制150内