书签分享收藏举报版权申诉 / 59

立即下载

当前位置：首页 > 应用文书 > 工作报告 > 计算机体系结构课后答案-.pdf

计算机体系结构课后答案-.pdf

上传人：索****

文档编号：78002545

上传时间：2023-03-16

格式：PDF

页数：59

大小：9.45MB

( 4.5 )

《计算机体系结构课后答案-.pdf》由会员分享，可在线阅读，更多相关《计算机体系结构课后答案-.pdf（59页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、计算机体系结构课后答安第1意计算机系统结构的基本概念角甲释下列术语层次机构：按照讨算机语言从低级到高级的次j芋，把剖算机系统按功能划分成多级层次结构，每一层以一利l不同的语言为特征。这些层次依次为：微程序机器级，传统机器语言机器级，汇编语言机器级，高级语言机器级，应用语言机器级等。虚拟机：用软件实现的机器。翻译：先用转换程序把高一级机器上的程序转换为低一级机器上等究生的程序，然后再在这低一级机器上运行，实现程序的功能。解释：对于高一级机器上的程序中的每一条语句或指令，都是转去执行低一级机器上的一段等效程序。执行完后，再去高一级机器取下一条语句或指令，再进行解释执行，如此反复，直到解释执行完整

2、个程序。计算机系统结构：传统机器程序员所看到的讨算机属性，即概念性结构与功能特性。在讨算机技术中，把这种本来存在的事物或属性，但从某种角度看又好像不存在的概念称为透明性。材算机组成：讨算机系统结构的逻辑实现，包含物理机器级中的数据流和控制流的组成以及逻辑设i.I等。材算机实现：剖算机组成的物理实现，包括处理机、主存等部件的物理结构，器件的集成度和速度，筷块、插件、l或板的划分与连接，信号传输，电源、冷却及黎机装配技术等。系统加速比：对系统中某部分进行改进肘，改进后系统性能提高的倍数。Amdahl定律：当对一个系统中的某个部件进行改进后，所能获得的整个系统性能的提高，受限于该部件的执行时间占总执

3、行时间的百分比。程序的局部性原理：程序执行时所访问的存储器地址不是随机分布的，而是相对地簇聚。包括时间局部性和空间局部性。CPI：每条指令执行的平均时钟周期数。测试程序套件：由各种不同的其实应用程序构成的一组测试程序，用来测试i才算机在各个方面的处理性能。存储程序ti算机：1马诺侬曼纺构计算机。其基本点是指令驱动。程序预先存放在ti算机存储苦苦中，机捞一且启动，就能按照程序指定的逻辑顺序执行这些程序，自动完成由程序所描述的处理工作。系列机：庄同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的讨算机。软件兼容：一个软件可以不经修改或者只需少量修改就可以由一台剖算机移植到另一台

4、t才算机上运行。差别只是执行时间的不同。向上（下兼容：按某档t才算机编制的程序，不加修改就能运行于比它高（低挡的t才算机。向后（前兼容：按3某个时期投入市场的某种型号t才算机编制的程序，不加修改地就能运行子在它之后（前投入市场的训算机。兼容机：庄l不同公司厂家生产的具有相同系统结构的材算机。模拟：用软件的方法在一台现有的讨算机称为宿主机上实现另一台t才算机（称为虚拟机的指令系统。仿真：用一台现有t才算机（称为宿主机上的微程序去解释实现另一台t才算机称为目标机的指令系统。并行性：材算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。只要在时间上相互重窍，就存在并行性。它包括同时性与并发性两种

5、含义。时间直奔：在并行性概念中号入时间因素，让多个处理过程在时间上相互错开，轮流重辞地使用同一套硬件设备的各个部分，以加快硬件周转而赢得速度。资源重复：在并行性概念中引入空间因素，以数量取胜。通过重复设置硬件资源，大幅度地提高计算机系统的性能。资源共享：这是一种软件方法，它使多个任务按一定时间顺序轮流使用同一套硬件设备。搞合度：反映多机系统中各材算机之间物理连接的紧密程度和交互作用能力的强弱。紧密鹅合系统：又称直接偶合系统。在这种系统中，训算机之间的物理连接的频带较高，一般是通过总线或高速开关互连，可以共享主存。松散搞合系统：又称间接偶合系统，一般是通过通道或通信线路实现剖算机之间的互连，可以

6、共阜外存设备（磁盘、磁带等。t才算机之间的相互作用是在文件或数据集一级上进行。异构型多处理机系统：囱多个不同类型、至少担负不同功能的处理机组成，它们按照作业要求的顺序，利用时间重桑原理，依次对它们的多个任务进行加工，各自完成规定的功能动作。同构型多处理机系统：主多个同类型或至少担负同等功能的处理机组成，它们同时处理同一作业中能并行执行的多个任务。试用实例说明讨算机系统结构、讨算机组成与讨算机实现之间的相互关系。答：如在设讨主存系统时，确定主存容量、编址方式、寻址范固等属于刘算机系统结构。确定主存周到1、逻辑上是否采用并行主存、逻辑设i.I等属于i.I算机组成。选择存储芯片类型、微组装技术、线路

7、设讨等属于讨算机实现。ti算机组成是计算机系统结构的逆辙实现。ti算机实现是i:1-算机组成的物理实现。一种体系结构可以有多种组成。一种组成可以有多种实现计算机系统结构的Flynn分类法是按什么来分类的共分为19)11几类答：Flynn分类法是按照指令流和数据流的多倍性进行分类。把材算机系统的结构分为：(1)单指令流单数据流SISD(2)单指令流多数据流SIMD(3)多指令流单数据流MISD(4)多指令流多数据流MIMDi才算机系统设讨中经常使用的4个定量原理是什么并说出它们的含义。答：(1）以经常性事件为重点。在计算机系统的设计中，对经常发生的情况，赋予它优先的处理权利资源使用权，以得到更多

8、的总体上的改进。(2)Amdahl定律。加快某部件执行速度所获得的系统性能力日速比，受限于该部件在系统中所占的重要性。(3)CPU性能公式。执行一个程序所需的CPU时间ICCPI时钟周期时间。(4）程片，的局部性原理。程序在执行时所访问地址的分布不是随机的，而是相对她簇聚。分别从执行程序的角度和处理数据的角度来看，i.-1算机系统中并行性等级从低到高可分为19111几级答：从处迎数据的角度来看，并行性等级从低到高可分为：(1）字串位串：每次只对一个字的一位进行处理。这是最基本的串行处理方式，不存在并行性；(2）字席位并：同时对一个字的全部位进行处理，不同字之间是感行的。已开始出现并行性；(3）

9、字并位串：同时对许多字的同一位称为位片进行处理。这种方式具有较高的并行性；(4）金并行：同时对许多字的全部位或部分位进行处理。这是最高一级的并行。从执行程序的角度来看，并行性等级从低圭lj商可分为(1）指令内部并行：单条指令中各微操作之间的并行；(2）指令级并行：并行执行两条或两条以上的指令：(3）线程级并行：并行执行两个或两个以上的线程，通常是以一个进程内派生的多个线程为调度单位；(4）任务级或过程级并行：并行执行两个或两个以上的过程或任务程序段，以子程序或进程为调度单元；(S）作业程序级并行：并行执行两个或两个以上的作业或程序。某台主颇为400MHz的计算机执行标准测试程序，程序中指令类型

10、、执行数量和平均时钟周期数如下：指令!i!指令执行数量平均时钟周I明数E在数45000 1 数据传送75000 2 浮点8000 4 分支1500 2 求该t才算机的有效CPI,Ml陀利程序执行时间。角平：(1)CPI=(450001+750002+sooo4+15002)I 129soo=460（或一一）259 5180(2)MIPS速率f/CPI=400/=（或一一 MIPS)259(3）程序执行时间（450001750002十80004+15002)I 400=575 s 将iI算机系统中某一功能的处理速度加快10倍，但该功能的处理时间仅为整个系统运行时间的40%，贝I采用此增强功能方

11、法后，能使整个系统的性能提高多少解由题可知：可改进比例40%=部件加速比10 根据Amdahl定律可知：系统111:1迷比一一！一一1.56乞0.4(1-0.4）一10 采用此增强功能方法后，能使整个系统的性能提高到原来的倍。t才算机系统中有三个部件可以改进，这三个部件的部件加速比为：部件加速比1=30;部件加速比2=20;部件加速比3=10(1）如果部件1和部件2的可改进比例均为30%，那么当部件3的可改边比例为多少时，系统加速比才可以达到10(2）如果三个部件的可改进比例分别为30%、30%和20%，三个部件同时改进，那么系统中不可加速部分的执行时间在总执行时间中占的比例是多少解：“在多个

12、部件可改进情况下，Amdahl定理的扩展：S11=I r(I-I;F;)+I;七L。t己知S1=30,S2=20,S3=lO,Sn=lO,F1=,F2，得：10=1-(0.3+0.3+I飞）+(0.3/30+0.3/20+I飞/10)得F3=,l!ll部件3的可改进比例为36%。(2）设系统改进前的执行时间为T，贝lj3个部件改进前的执行时间为：(+)T，不可改进部分的执行时间为。己知3个部件改进后的加速比分别为S1=30,S2=20,$3=10，因此3个部件改进后的执行时间为：,0.3T 0.3T 0.2T，一一一=U U4:,/30 20 10 改边后整个系统的执行时间为：Tn=+=那么系

13、统中不可改进部分的执行时间在总执行时间中占的比例是：2主二0.820.245T 假设某应用程序中有4类操作，通过改进，各操作获得不同的性能提高。具体数据如下表所示：除作类!1!l宇巾的数量t放进前的执行时间改进后的执行时间百万条指令周期）周期操作110 2 1 操作230 20 15 操作335 10 3 操作415 4 1(1）改进后，各类操作的加速比分别是多少(2）各类操作单独改进后，程序获得的加速比分别是多少(3)4类操作均改进后，整个程序的加速比是多少解根据Amdahl定律s,.一一一；：可得(I-Fe）仨二:,e 操作类型各类操作的指令条数在各类操作的JJni理tt乌程序巾所占的比例

14、f;操作1%2 操作2%操作3%操作4%4 4类操作均改进后，整个程序的加速比：s,.=I臼2.16(1-I;F；）三7.,i 第2章指令集结构的分类2.1解释下列术语各类操作单独战胜后，lJ宇获得的加迎比雄梭型机器：CPU中存储操作数的单元是堆梭的机器。累加器型机器：CPU中存储操作数的单元是累加器的机器。通用寄存器型机器：CPU中存储操作数的单元是通用寄存器的机器。CISC：复杂指令集计算机RISC：精简指令集计算机寻址方式：指令系统中如何形成所要访问的数据的地址。一般来说，寻址方式可以指明指令中的操作数是一个常数、一个寄存器操作数或者是一个存储器操作数。数据表示：硬件结构能够识别、指令系

15、统可以直接调用的那些数据结构。2.1区别不同指令集结构的主要因素是什么根据这个主要因素可将指令集结构分为哪3类答：区别不同指令集结构的主要因素是CPU中用来存储操作数的存储单元。据此可将指令系统结构分为推校结构、累加器结构和通用寄存器结构。2.2常见的3利通用寄存器型指令集结构的优缺点有l哪些答：指令系统结肉类型优点缺点指令字t是固定，指令结构简与指令巾含存俑者曾操作数的指令芽、统结构相寄存君寄存苦苦型沽，是一种简吼的代码生成比，指令条数多目标代倒不够紧凑，因而程(0,3)模型，各种指令的执行时钟周期数将Ii丘！宇占用的空间比较大可以在ALU指令中直接对存由于有个操作数的内容将被破坏，所以指令

16、中的两个秘作数不对称在一条指令中t,a)I时对俯哥哥跺作数进行号则，而不寄存存储吉普型寄存量操作数和I存俑却跺作数j进行编码，有可必先刷1。ad指令胜行加我(1,2)能剧，I）指令所能够表示的寄存苦苦个数指令的容易对指令进行编码，目标执行时钟周期数国银作数的来激（寄存苦苦或存代码比校紧i费h自然）不同而差别比较大指令字长变化很大，特别是3操作数指令e而存阳楼存储器型目标代码最紧凑，不简设且每条指令完成的i作也差别很大对存俑者曾(2,2）或（3,3)里寄存器来保存变量的频繁访问会使存储搅成为瓶颈这种类型的指令系统现在已不用（.2.3指令集应满足l国11几个基本要求答：对指令集的基本要求是：完整

17、性、规整性、高效率和兼容性。完整性是指在一个有限可用的存储空间内，对于任何可解的问题，编制讨算程序时，指令集所提供的指令足够使用。规整性主要包括对称性和均匀性。对称性是指所有与指令集有关的存储单元的使用、操作码的设置等都是对称的。均匀性是指对于各种不同的操作数类型、字长、操作种类和数据存储单元，指令的设置都要同等对待。高效率是指指令的执行速度快、使用频度高。2.1指令集结构设i:I所涉及的内容有l哪些答：“）指令集功能设计：主要有RISC丰llCISC两科技术发展方向：（2）寻址方式的设讨：设置寻址方式可以通过对基准程序进行测试统剖，察看各种寻址方式的使用频率，根据适用频率设置必要的寻址方式。

18、（3）操作数表示和操作数类型：主要的操作数类型和操作数表示的选择有：浮点数据类型、整型数据类型、字符型、十进制数据类型等等。（4）寻址方式的表示：可以将寻址方式编码子操作码中，也可以将寻址方式作为一个单独的域来表示。（5）指令集格式的设讨：有变长编码格式、固定长度编码格式和混合型编码格式3手中。2.2简述CISC指令集结构功能设计的主要目标。从当前的讨算机技术观点来看，CISC指令集结构的计算机有什么缺点答：主要目标是增强指令功能，把越来越多的功能交主硬件来实现，并且指令的数量也是越来越多。缺点：（1)CISC结构的指令集中，各种指令的使用频率相差悬殊。(2)CISC结构指令的复杂性带来了计算

19、机体系结构的复杂性，这不仅增加了研制时间和成本，而且还容易造成设剖错误。(3)CISC结构指令簇的复杂性给VLSI设t才增加了很大负担，不利于单片集成。(4)CISC结构的指令集中，许多复杂指令需要很复杂的操作，因而运行速度。眶。（5）在CISC结构的指令集中，由于各条指令的功能不均衡性，不利于采用先进的材算机体系结构技术如流水技术来提高系统的性能。2.3简述RISC指令集结构的设计原则。答（1)j在取使用频率最高的指令，并补充一些最有用的指令；(2）每条指令的功能应尽可能简单，并在一个机器周期内完成：(3）所有指令长度均相同；(4）只有Load和Store操作指令才访问存储器，其它指令操作均

20、在寄存器之间进行；（5）以简单有效的方式支持高级语言。2.4指令中表示操作数类型的方法有明11几乎1,答：操作数类型有两种表示方法：(1）操作数的类型由操作码的编码指定，这是最常见的一种方法；(2）数据可以附上出硬件解霖的标记，由这些标记指定操作数的类型，从而选择适当的运算。2.5表示寻址方式的主要方法有哪些简述这些方法的优缺点。答：表示寻址方式有两种常用的方法：(1）将寻址方式编于操作码中，由操作码在描述指令的同时也描述了相应的寻址方式。这种方式译码快，但操作码和寻址方式的结合不仅增加了指令的条数，导致了指令的多样性，而且增加了CPU对指令译码的难度。(2）为每个操作数设置一个地址描述符，由

21、该地址描述钩表示相应操作数的寻址方式。这种方式译码较慢，但操作码和寻址独立，易于指令扩展。2.6通常有明11几种指令格式，请简述其适用范围。答：（1）变长编码格式。如果系统结构设计者感兴趣的是程序的目标代码大小，而不是性能，就可以采用变长编码格式。(2）固定长度编码格式。如果感兴趣的是性能，而不是程序的目标代码大小，则可以选择固定长度编码格式。(3）混合型编码格式。需要兼顾降低目标代码长度和降低译码复杂度时，可以采用混合型编码格式。2.7根据CPU性能公式简述RISC指令集结构i-1算机和CISC指令集结构剖算机的性能特点。答：CPU性能公式：CPU时间ICCPIT其中，IC为目标程序被执行的

22、指令条数，CPI为指令平均执行周期数，T是时钟周期的时间。相同功能的CISC目标程序的指令条数ICc1sc少于RISC的ICRISC，但是CISC的CPlc1sc和Tc,sc都大于RISC的CPIRISC和TRISC因此，CISC目标程斤，的执行时间比RISC的更长。第3主流水线技术解释下列术语流水线：将一个重复的时序过程，分解成为若干个子过程，而每一个子过程都可有效地在其专用功能段上与其它子过程同时执行。单功能流水线：指流水线的各段之间的连接固定不变、只能完成一种固定功能的流水线。多功能流水线：指各段可以进行不同的连接，以实现不同的功能的流水线。静态流水线：指在同一时间内，多功能流水线中的各

23、段只能按同一种功能的连接方式工作的流水线。当流水线要切换到另一种功能时，必须等前丽的任务都流出流水线之后，才能改变连接。动态流水线：指在同一时间内，多功能流水线中的各段可以按照不同的方式连接，同时执行多种功能的流水线。它允许在某些段正在实现某种运算时，另一些段却在实现另一种运算。部件级流水线：把处理机中的部件进行分段，再把这些部件分段相互连接而成。它使得运算操作能够按流水方式进行。这种流水线也称为运算操作流水线。处理机级流水线：又称指令流水线。它是把指令的执行过程按照流水方式进行处理，即把一条指令的执行过程分解为若干个子过程，每个子过程在独立的功能部件中执行。处理机间流水线：又称为宏流水线。它

24、是把多个处理机串行连接起来，对同一数据流进行处理，每个处理机完成整个任务中的一部分。前一个处理机的输出结果存入存储器中，作为后一个处理机的输入。线性流水线：指各段串行连接、没有反馈回路的流水线。数据通过流水线中的各段时，每一个段最多只流过一次。非线性流水线：指各段除了有串行的连接外，还有反馈臼赂的流水线。顺序流水线：流水线输出端任务流出的顺序与输入端任务流入的顺序完全相同。乱J芋流水线：流水线输出端任务流出的顺序与输入端任务流入的顺序可以不同，允许后进入流水线的任务先完成。这种流水线又称为无序流水线、错J字流水线、异步流水线。吞吐率：在单位时间内流水线所完成的任务数量或输出结果的数量。流水线的

25、加速比：使用顺序处理方式处理一批任务所用的时间与按流水处理方式处理同一批任务所用的时间之比。流水线的效率：即流水线设备的利用率，它是指流水线中的设备实际使用时间与整个运行时间的比值。数据相关：考虑两条指令i和l，在j的前丽，如果下述条件之一成立，则称指令j与指令i数据相关：(1）指令l佼用指令，产生的结果：(2）指令j与指令k数据相关，而指令k又与指令i数据相关。名相关：如果两条指令使用了相同的名，但是它们之间并没有数据流动，则称这两条指令存在名相关。控制相关：是指出分支指令引起的相关。它需要根据分支指令的执行结果来确定后面该执行l哪个分支上的指令。反相关：考虑两条指令i和ji在j的前面，如果

26、指令j所写的名与指令i所读的名相同，则称指令i和j发生了反相关。输出相关：考虑两条指令i和ji在j的前面，如果指令j和指令i所写的名相同，则称指令i和j；发生了输出相关。换名技术：名相关的两条指令之间并没有数据的传送，只是使用了相同的名。可以把其中一条指令所使用的名换成别的，以此来消除名相关。结构冲突：因硬件资源满足不了指令重桑执行的要求而发生的冲突。数据冲突：当指令在流水线中重奔执行时，因需要用到前面指令的执行结果而发生的冲突。控制冲突：流水线遇到分支指令或其它会改变PC值的指令所引起的冲突。定向：用来解决写后读冲突的。在发生写后读相关的情况下，在讨费：结果尚未出来之前，后面等待使用该结果的

27、指令并不见得是马上就要用该结果。如果能够将该剖算结果从其产生的地方直接送到其它指令需要它的地方，那么就可以避免停顿。写后读冲突：考虑两条指令1和j，且l在1之前进入流水线，指令j用到指令i的t才算结果，而且在i将结果写入寄存器之前就去读该寄存器，因而得到的是旧值。读后写冲突：考虑、两条指令i和j，且i在j之前进入流水线，指令j的目的寄存器和指令i的源操作数寄存器相同，而且j在i读取该寄存器之前就先对它进行了写操作，导致i读到的值是错误的。写后写冲突：考虑两条指令i和j，且i在j之前进入流水线，指令j和指令i的结果单元（寄存器或存储器单元相同，而且j在i写入之前就先对该单元进行了写入操作，从而导

28、致写入顺序错误。这时在结果单元中留下的是i写入的值，而不是j写入的。链接技术：具有先写后读相关的两条指令，在不出现功能部件冲突和v，冲突的情况下，可以把功能部件链接起来进行流水处理，以达到加快执行的目的。分段开采：当向量的长度大于向量寄存器的长度时，必须把长向量分成长度固定的段，然后循环分段处理，每一次循环只处理一个向量段。半性能向量长度：向量处理机的性能为其最大性能凡的一半时所需的向量长度。向量长度临界值：向量流水方式的处理速度优于标量串行方式的处理速度时所帘的向量长度的最小值。指令的执行可采用顺序执行、重叠执行和流水线三种方式F它们的主要区别是什么各有何优缺点。答：(1）指令的顺序执行是指

29、指令与指令之间顺序串行。即上一条指令全部执行完后，才能开始执行下一条指令。优点：控制简单，节省设备。缺点：执行指令的速度。陵，功能部件的利用率低。(2）指令的重辛辛，指令是在相邻的指令之间，让第k条指令与取第k+I条指令同时进行。亟窍1执行不能加快单条指令的执行速度，但在硬件增加不多的情况下，可以加快相邻两条指令以及整段程序的执行速度。与顺序方式相比，功能部件的利用率提高了，控制变复杂了。(3）指令的流水执行是把一个指令的执行过程分解为若干个子过程，每个子过程主专门的功能部件来实现。把多个处理过程在时间上铺开，依次通过各功能段，每个子过程与其它的子过程并行进行。依靠提高吞吐率来提高系统性能。流

30、水线中各段的时间应尽可能相等简述先行控制的基本思想。答：先行控制技术是把缓冲技术和预处理技术相结合。缓冲技术是在工作速度不固定的两个功能部件之间设置缓冲器，用以平滑它们的工作。预处理技术是指预取指令、对指令进行加工以及预取操作数等。采用先行控制方式的处理机内部设置多个缓冲站，用于平滑主存、指令分析部件、运算器三者之间的工作。这样不仅使它们都能独立地工作，充分忙碌而不用相互等待，而且使指令分析部件和运算器分别能快速地取得指令和操作数，大幅度地提高指令的执行速度和部件的效率。这些缓冲站都按先进先出的方式工作，而且都是主一组若干个能快速访问的存储单元和相关的控制逻辑组成。采用先行控制技术可以实现多条

31、指令的重桑解释执行。设一条指令的执行过程分成取指令、分析指令和执行指令三个阶段，每个阶段所需的时间分别为.6t、.6t和2.6t。分另lj求出下列各种悄况下，连续执行N条指令所需的时间。t t(1）顺序执行方式；(2）只有“取指令”与“执行指令”重桑；(3）“取指令”、“分析指令”与“执行指令”重窍。解：(1）每条指令的执行时间为：.6t+.6t+2.6t=4.6t 连续执行N条指令所需的时间为：4N.6t(2）连续执行N条指令所需的时间为：4.6t3(N-1).6t=(3N+l).6(3）连续执行N条指令所帘的时间为：4.6t十2(N-1).6t=(2N+2).6 简述流水线技术的特点。答：

32、流水技术有以下特点：(1）流水线把一个处理过程分解为若干个子过程，每个子过程囱一个专门的功能部件来实现。因此，流水线实际上是把一个大的处理功能部件分解为多个独立的功能部件，并依靠它们的并行工作来提高吞吐率。(2）流水线中各段的时间应尽可能相等，否则将引起流水线培塞和断流。(3）流水线每一个功能部件的前面都要有一个缓冲寄存器，称为流水寄存器。(4）流水技术适合于大量重复的时序过程，只有在输入端不断地提供任务，才能充分发挥流水线的效率。(S）流水线需要有通过时间和排空时间。在这两个时间段中，流水线都不是满负荷工作。解决流水线瓶颈问题有明11两种常用方法答：细分瓶颈段与重复设置瓶颈段减少流水线分支延

33、迟的静态方法有19.111些答：(1）预测分支失败：沿失败的分支继续处理指令，就好象什么都没发生似的。当确定分支是失败时，说明预测正确，流水线正常流动；当确定分支是成功时，流水线就把在分支指令之后取出的指令转化为空操作，并按分支目标地址重新取指令执行。(2）预测分支成功：当流水线ID段检测到分支指令后，一旦t才算出了分支目标地址，就开始从该目标地址取指令执行。(3）延迟分支：主要思想是从逻辑上“延长”分支指令的执行时间。把延迟分支看成是由原来的分支指令和若干个延迟槌构成。不管分支是否成功，都要按顺序执行延迟捕中的指令。3和p方法的共同特点：它们对分支的处理方法在程斤，的执行过程中始终是不变的。

34、它们要么总是预测分支成功，要么总是预测分支失败。简述延迟分支方法中的三利l调度策略的优缺点。调度策略对i/,IJ度的要求对流水线性能改穆的影响从前调度分支必须不依赖于被调度的指令总是可以有效提高流水线性能如果分支转移失败，必须保证被调度的指令对分支转移成功时可以是高流水线性从目标处诩度程岸的执行没有影响可能铺要复审1被调度tl!i能但由于复1!il指令，可能力日大程序空令问从失败处调度如果分支转移成功，必须保证被调度的指令对分支转移失败时，可以提高流水线性能程19(J执行没有影响列举出下面循环中的所有相关，包括输出相关、反相关、真相关。for(i=2;iI l I 11 111 l1110 时

35、间.有一个流水线主14段组成，其中每当流经第3段时，总要在该段循环一次，然后才能流到第4段。如果每段经过一次所需要的时间都是缸，问：(1)当在流水线的输入端连续地每11t时间输入任务时，该流水线会发生什么情况(2)此流水线的最大吞吐率为多少如果每21:,.f输入一个任务，连续处理10个任务时的实际吞吐率和效率是多少(3)当每段时间不变肘，如何提高该流水线的吞吐率仍连续处理10个任务时，其吞吐率提高多少解：(1）会发生流水线阻塞情况。第1个任务Sl S2$3$3 S4 ffi 2个任务Sl$2 stall$3$3$4 ffi 3个任务Sl stall$2 stall$3 S3$4 ffi 4个任

36、务Sl stall$2 stall$3$3$4(2)段aa丸”内Z“，一一一2 3 I-6,S S 9 9 口S 9 10 i时间S 9 10 23 I%，、J句JA斗，、JA川uq，vmw斤Jm阶-artuf l一gmFS-12P B；：ip-:en/T PWM俨FUTTTA(3）重复设置部件9q,旦段1 四 3 s 6 9 日、-6 6 2。,o 1 1 s s 3目,-同 5 6 10 3 5 6?s 9 10 l付问。44-21 唱3。J14111 TP；后pq,elin,=l ri4 tlt=17 tlt 吞吐率提高倍数瓮有一条静态多功能流水线由5段组成，加法用1、3、4、5段，乘法

37、用1、2、5段，第3段的时间为2L:.t，其余各段的时间均为L:,.t，而且流水线的输出可以直接返回输入端或暂存于相应的流水寄存器中。现要在该流水线-fll饵B；），画出其时空阁，并iI算其吞吐率、加速比利效率。叫力Di去盯日乘法解：首先，应选择适合于流水线工作的第法。对于本题，应先t才算A181、A2+B2、A3+83和A4+84；再计算（A1+B1）（A282）和（A383）（A4+84）；然后求总的结果。其次，画出完成该iI算的时空阁，如l到所示，阁中阴影部分表示该段在工A B c囚D AB CD AaxeD c日dA=A,+B,B=A,+B,C=A,+B,D=A,+B,段5.4 1 t

38、.i,.叫I f.李t:.叫1:f:t=0:可军於宁：13 2 1:t:：号：t:：亿二：:i:1 8 9 10”l时间A,A,A,B,B,B,B,I 12 13 1 4 15 16 17 18 A C AB B D CD。如卡,AES 应l图可见，它在18个At时间中，给出了7个结果。所以吞吐率为：TP=_!_ l 8Ll.r 如果不用流水线，由于一次求积需3LJ.t，一次求和需SLJ.t，贝I产生上述7个结果共需（45+3x3)Ll t=29LJ.t。所以加速比为：S 296I,一l 86I 该流水线的效率可佳l阴影区的商积和5个段总时空区的丽积的比值求得：45+33=-=0322 518

39、动态多功能流水线主16个功能段组成，如下图：:bn法乘i去其中，Sl、S4、SS、S6组成乘法流水线，Sl、S2、S3、56组成加法流水线，各个功能段时间均为so肘，假设该流水线的输出结果可以直接返回输入端，而且设置有足够的缓冲寄存器，若以最快的方式用该流水讨算：LX;Y;Z;(1)画出时空阁；(2)i才算实际的吞吐率、加速比利效率。解：机器一共要做10次乘法，4次加法。6 s 4 3 2 1 I2;3 i也：5;6,7121川10最后结靠国国回观的，.7-s-AY-EE z-l u1x-co-qe-nc bpllFlsJ vams6了4726-3-4-Rd h唱h二234Y卜lLILIj

40、又一l232(!)役肿i司22Af l(2)14 TP=-22t 144 1田i亘rt=-=2 ss 226 t 14,4效率一一”42.42 226 在MIPS流水线上运行如下代码斤，如rJ:LOOP:LW Rl,0(R2)DADDIU Rl,Rl,#1 SW Rl,0(R2)DADDIU R2,R2,#4 DSUB R4,R3,R2 BNEZ R4,LOOP 其中：阳的：值是R2396。假设：在整个代码斤，列的运行过程中，所有的存储器访问都是命中的，并且在一个时钟周期中对同一个寄存器的读操作和写操作可以通过寄存器文件”定向飞问：(1)在没有任何其它定向或旁路硬件的支持下，请画出该指令序歹1

41、J执行的流水线时空阁。假设采用排空流水线的策略处理分支指令，且所有的存储器访问都命中Cache，那么执行上述循环需要多少个时钟周期(2)假设该流水线有正常的定向路径，请画出该指令序列执行的流水线时空阁。假设采用预测分支失败的策略处理分支指令，且所有的存储器访问都命中Cache，那么执行上述循环需要多少个时钟周期(3)假设该流水线有正常的定向路径和一个单周期延迟分支，请对该循环中的指令进行调度，你可以重新组织指令的顺序，也可以修改指令的操作数，但是注意不能增加指令的条数。i青画出该指令舟，歹1）执行的流水线时空图，并计算执行上述循环所需要的时钟周期数。解：寄存器读写可以定向，无其他旁路硬件支持。

42、排空流水线。指令l 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 LW IF ID EX M W唱DADDIO IF S S ID EX M WB SW IFSSIDEX M飞l8DADDIO IF ID EX M WB DSUB IF S S ID EX M WB BNEZ LW IFSSIDEX M飞，VBIFSSIFIDEXMWB 第i次j运代（i=0.98）开始周期：1+(i17)总的时钟周期数：(9817)+18=1684 有正常定向路径，预测分支失败。指令L.V DADD JU S.V DADD JU DSUB BNE

43、Z LW 1 2 3 4 5 6 7 8 9 10 11 IF ID EX M WB IF ID s EX M WB IF s ID EX M.VB IF ID EX h1 WB IF ID EX M VB IF ID EX M.VB IF 1niss n1iss IF 第i次法代（i=0.98）开始周朔：1+(i10)总的时钟周期数：(9810)+11=991 有正常定向路径。单周期延迟分支。LOOP:LW Rl,O(R2)DADDIU R2,R2,#4 DADDIU Rl,Rl,#1 DSUB R4，只3,R2 BNEZ R4,LOOP SW Rl,-4(R2)第1次j运代。0.98）开始

44、周朔：1十（j6)总的时钟周期数：(986)+10=598 指令1 2 3 4:,6 7 8 9 LvV IF ID EX lvl,VB DADDIU IF ID EX M,VB DADDIU IF ID EX lvl,VB DSUB IF ID EX M,VB BNEZ IF ID EX lvl,VB 1 13 14 ID EX h1 10 11 s,v IF ID EX M vVB LvV IF ID 假设各种分支指令数占所有指令数的百分比如下：条件分支跳转和诩州2”其巾的60%是分文成功的5%EX 11 vVB 15 WB 现有一条段数为4的流水线，无条件分支在第二个时钟周期结束时就被解

45、析出来，而条件分支要到第三个时钟周期结束时才能够被解析出来。第一个流水段是完全独立于指令类型的，f,!J所有类型的指令都必须经过第一个流水段的处理。请问在没有任何控制相关的情况下，该流水线相对于存在上述控制相关情况下的加速比是多少解：没有控制相关时流水线的平均CPl=l存在控制相关时：由于无条件分支在第二个时钟周期结束时就被解析出来，而条件分支要到第3个时钟周知l结束时才能被解析出来。所以：(1）若使用排空流水线的策略，则对于条件分支，有两个额外的sta川，对无条件分支，有一个额外的stall:CPI=1+20%*2+5%*1=加速比S=CPl/1=(2）若使用预测分支成功策略，则对于不成功的

46、条件分支，有两个额外的stall，对无条件分支和成功的条件分支，有一个额外的stall1:CPI=1+20%气60%*1+40%*2)+5%*1=加速比S=CPl/1=(3）若使用预测分支失败策略，则对于成功的条件分支，有两个额外的stall；对无条件分支，有一个额外的stall；对不成功的条件分支，其目标地址已经囱PC值给出，不必等待，所以无延迟：CPI=1+20%气60%*2+40%*0)+5%*1=加速比S=CPl/1=在CRAY-1机器上，按照链接方式执行下述4条向量指令（括号中给出了相应功能部件的执行时间，如果向量寄存器和功能部件之间的数据传送需要1抱，试求此链按流水线的通过时间是多

47、少拍如果向量长度为64，贝I需多少拍才能得到全部结果Vo存储器（从存储器中取数：7拍V2VoV1（向量加：3拍）V3V2每i也循环的平均At钟周期：(2)每个时钟周期流出指令数：(3)操作稽功能部件的使用效率：(4)如果展开10i毡，会出现哪些问题解：展开7遍循环访存指令1访存指令2浮点指令1浮点指令2FO,O(Rl)F6,-8(Rl)Fl0,-16(Rl)F14,-24(Rl)F18,-32(Rl)F22,-40(Rl)F4,FO,F2 F8,F6,F2 F26,-48(Rl)F12,F10,F2 f16,F14,F2 F20,F18,F2 F24,f22,F2 F4,0(Rl)F8,-8(

48、Rl)F28,F26,F2 Fl2,-16(Rl)F16,-24(Rl)F20,-32(Rl)F24,-40(Rl)F28,8(Rl)ff数转移指令DADDIU Rl,Rl,”-56 BNE Rl,Loop 这段程序的运行时间为9个时钟周期，每遍循环平均约个时钟周期。9个时钟周期内流出了23条指令，每个时钟周期条。9个时钟周期共有操作槽9 5=45个，有效糟的比例为%。设指令流水线l如取指令、分析指令和执行指令3个部件构成，每个部件经过的时间为.6t，连续流入12条指令。分别画出标量流水处理机以及ILP均为4的超标量处理机、超长指令字处理机、超流水处理机的时空阁，并分别i.-1算它们相对于标量

49、流水处理机的加速比。解：标量流水处理机的时空阁：执行分析取指14 时间执行完12条指令需T1=146t。超标量流水处理机与超长指令字处理机的时空图：执行I.分析,执行分析ittt旨.5 时问Jttt旨越长指令字处理：lfll付空阔5时间越标最处理机时空阁超标量流水处理机中，每一个时钟周期同时启动4条指令。执行完12条指令需T2=S6t，相对于标量流水处理机的加速比为：SoI 4Jr ，、一一，T2 Sllt 超长指令字处理机中，每4条指令组成一条长指令，共形成3条长指令。执行完12条指令需T3=S6t，相对于标量流水处理机的加速比为：S,立型2.8 T 3 Sllt 超流水处理机的时空阁：执行

50、分析取4肯时间超流水处理机中，每1/4个时钟周期启动一条指令。执行完12条指令需T4=6t，相对于标量流水处理机的加速比为：T,14Jt 4.！.一2435T4 5.15t!J 第5章存储层次解释下列术语多级存储层次：采用不同的技术实现的存储器，处在离CPU不同距离的层次上，各存储器之间一般满足包容关系，即任何一层存储器中的内容都是其下一层（离CPU更远的一层）存储器中内容的子袋。目标是达到离CPU最近的存储器的速度，最远的存储器的容量。全相联映象：主存中的任一块可以被放直到Cache中任意一个地方。直接映象：主存中的每一块只能被放盟到Cache中唯一的一个地方。组相联映象：主存中的每一块可以

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 计算机体系结构课后答案

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：计算机体系结构课后答案-.pdf
链接地址：https://www.taowenge.com/p-78002545.html