2022年高级计算机体系结构期末试题 .pdf
《2022年高级计算机体系结构期末试题 .pdf》由会员分享,可在线阅读,更多相关《2022年高级计算机体系结构期末试题 .pdf(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、学而不思则惘,思而不学则殆1.CUP性能公式评价 cache 性能公式:平均存储访问时间= 命中时间+ 缺失率缺失代价命中时间:缓冲命中需要的时间。Cpu性能公式分析经典的 CPU性能公式现在我们可以用指令数、CPI 和时钟周期时间来写出基本的性能公式:CPU时间 =指令数 CPI时钟周期时间CPI:每条指令的时钟周期数,表示执行某个程序或者程序片段时每条指令所需的时钟周期平均数。指令数:执行某程序所需的总指令数量。或 CPU时间 =指令数 CPI/ 时钟频率这些公式特别有用,因为它们把性能分解为三个关键因素。我们可用这些公式来比较不同的实现方案或评估某个设计的替代方案。举例代码段的比较一个编
2、译器设计者试图在两个代码序列之间进行选择。硬件设计者给出了如下数据:对于某行高级语言语句的实现,两个代码序列所需的指令数量如下:代码序列 1 共执行 2+1+2=5条指令。代码序列 2 共执行 4+1+1=6条指令。所以,代码序列 2 执行的指令数更多。基于指令数和 CPI,我们可以用 CPU 时钟周期公式计算出每个代码序列的总时钟周期数为:精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 1 页,共 10 页学而不思则惘,思而不学则殆因此,代码序列1 的 CPU时钟周期数 =(21)+(12)+(23)=10 周期,代码序列 2 的 CPU时钟周期
3、数 =(41)+(12)+(13)=9 周期。故代码序列2 更快,尽管它多执行了一条指令。由于代码序列2总时钟周期数较少,而指令数较多, 它一定具有较小的CPI。CPI 的计算公式为:CPI=CPU时钟周期数 / 指令数代入相应数据可得CPI1=CPU时钟周期数1/ 指令数 1=10/5=2 CPI2=CPU时钟周期数2/ 指令数 2=9/6=1.5 。重点图 1-14 给出了计算机在不同层次上的性能测试指标及其测试单位。通过这些指标的组合可以计算出程序的执行时间(单位为秒):执行时间 =秒/ 程序 =指令数 / 程序时钟周期数/ 指令秒 / 时钟周期永远记住, 唯一能够被完全可靠测量的计算机
4、性能指标是时间。例如, 对指令集减少指令数目的改进可能降低时钟周期时间或提高CPI,从而抵消了改进的效果。类似地,CPI 与执行的指令类型相关,执行指令数最少的代码其执行速度未必是最快的。图 1-14 基本的性能指标及其测量单位如何确定性能公式中这些因素的值呢?我们可以通过运行程序来测量CPU 的执行时间,并且计算机的说明书中通常介绍了时钟周期时间。难以测量的是指令数和 CPI。当然,如果确定了时钟频率和CPU 执行时间 , 我们只需要知道指令数或者 CPI 两者之一 , 就可以依据性能公式计算出另一个。用仿真器等软件工具可以测量出指令数,也可以用现代处理器中的硬件计数器来测量执行的指令数、
5、平均 CPI 和性能损失源等。 由于指令数量取决于计算机精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 2 页,共 10 页学而不思则惘,思而不学则殆体系结构,并不依赖于计算机的具体实现, 因而我们可以在不知道计算机全部实现细节的情况下对指令数进行测量。但是,CPI 与计算机的各种设计细节密切相关,包括存储系统和处理器结构(我们将在第4、5 章中看到),以及应用程序中不同类型的指令所占的比例。因此,CPI 对于不同应用程序是不同的,对于相同指令集的不同实现方式也是不同的。上述的例子表明,只用一种因素(如指令数)去评价性能是危险的。当比较两台计算机时
6、, 必须考虑全部三个因素, 它们组合起来才能确定执行时间。如果某个因素相同(如上例中的时钟频率),必须考虑不同的因素,才能确定性能的优劣。因为 CPI 随着指令组合( instruction mix)而变化,这样指令的条数和CPU 必须被比较,即使时钟频率是相同的。在本章最后的练习题中,有几个是关于计算机和编译程序的性能评价。在 1.8 节,我们将讨论一种因没有全面考虑各种因素而导致的对性能的误解。理解程序性能程序的性能与算法、编程语言、编译程序、体系结构以及实际的硬件有关。下表概括了这些成分是如何影响CPU 性能公式中的各种因素的。精解:也许你期望 CPI 最小值为 1.0 。在第 4 章我
7、们将看到,有些处理器在每个时钟周期可对多条指令取指并执行。有些设计者用IPC(instruction per clock cycle )来代替 CPI。如一个处理器每时钟周期可执行2 条指令,则它的IPC=2,CPI=0.5。2.verlog描述状态机(硬件描述语言(verylog)写状态机)精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 3 页,共 10 页学而不思则惘,思而不学则殆状态机描述方法: 状态机描述时关键是要描述清楚几个状态机的要素,即如何进行状态转移, 每个状态的输出是什么, 状态转移的条件等。 常见的三种描述方式:第一,整个状态机
8、写到一个always 模块里面,在该模块中既描述状态转移,又描述状态的输入和输出;第二,用两个always 模块来描述状态机,其中一个always 模块采用同步时序描述状态转移; 另一个模块采用组合逻辑判断状态转移条件,描述状态转移规律以输出。第三,在两个 awlays 模块描述方法基础上, 使用三个 awlays 模块,一个 awlays模块采用同步时序描述状态转移; 另一个模块采用组合逻辑判断状态转移条件,描述状态转移规律;另一个awlays 模块描述状态的输出(可以组合电路输出,也可以时序电路输出)。状态机采用 VerylogHDL 语言编码,建议分为三个always 段完成。三段式建模
9、描述 FSM 的状态机输出时,只需指定case 敏感表为次态寄存器,然后直接在每个次态寄存器的case 分支中描述该状态的输出即可, 不用考虑状态转移条件。/ 状态机设计的例子module FSM(clk,clr,out,start,step2,step3); input clk,clr,start,step2,step3; output2:0 out; reg2:0 out; reg1:0 state,next_state; parameter state0=2b00,state1=2b01, state2=2b11,state3=2b10; always (posedge clk or p
10、osedge clr) begin if (clr) state = state0; else state = next_state; end always (state or start or step2 or step3) begin case (state) state0: begin if (start) next_state =state1; else next_state =state0; end state1: begin next_state = state2; end state2: begin if (step2) next_state =state3; else next
11、_state =state0; end 精选学习资料 - - - - - - - - - 名师归纳总结 - - - - - - -第 4 页,共 10 页学而不思则惘,思而不学则殆state3: begin if (step3) next_state =state0; else next_state =state3; end default: next_state =state0; endcase end always (state) begin case(state) state0: out=3b001; state1: out=3b010; state2: out=3b100; state
12、3: out=3b111; default:out=3b001; endcase end 3.流水线数据相关性及解决方法流水线的概念流水线:把一个重复的过程分解为若干子过程,每个子过程由专门的功能部件来实现。将多个处理过程在时间错开,依次通过各功能段, 每个子过程就可以与其他子过程并行进行。相关:指两条指令之间存在某种依赖关系。3 种类型:数据相关、名相关、控制相关(1)数据相关依次存在两条指令i(在前)和 j(在后) ,若指令 j 使用指令 i 产生的结果或指令j 与 k数据相关,而 k 又与指令 i 数据相关,则称 j 与 i 数据相关。(2)名相关名:指指令所访问的寄存器或存储单元名称。
13、名相关:指两条指令使用的名相同,但没有数据流动,则称它们名相关。(3)控制相关控制相关是指由分支指令引起的相关。它需要根据分支指令的执行结果来确定后续指令是否执行。 一般说来, 为确保程序应有的执行顺序,必须严格按控制相关确定的顺序执行(3)控制相关控制相关是指由分支指令引起的相关。它需要根据分支指令的执行结果来确定后续指令是否执行。 一般说来, 为确保程序应有的执行顺序,必须严格按控制相关确定的顺序执行流水线冲突: 指对于具体的流水线来说, 由于相关的存在, 使得指令流中的下一条指令不能在特定的时钟周期执行。流水线冲突有三种类型:结构冲突、数据冲突、控制冲突。(1)结构冲突定义:因硬件资源满
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年高级计算机体系结构期末试题 2022 年高 计算机体系结构 期末 试题
限制150内