计算机体系结构课后答案-.pdf
《计算机体系结构课后答案-.pdf》由会员分享,可在线阅读,更多相关《计算机体系结构课后答案-.pdf(59页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、计算机体系结构课后答安 第1意计算机系统结构的基本概念角甲释下列术语层次机构:按照讨算机语言从低级到高级的次j芋,把剖算机系统按功能划分成多级层次结构,每一层以一利l不同的语言为特征。这些层次依次为:微程序机器级,传统机器语言机器级,汇编语言机器级,高级语言机器级,应用语言机器级等。虚拟机:用软件实现的机器。翻译:先用转换程序把高一级机器上的程序转换为低一级机器上等究生的程序,然后再在这低一级机器上运行,实现程序的功能。解释:对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整
2、个程序。计算机系统结构:传统机器程序员所看到的讨算机属性,即概念性结构与功能特性。在讨算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。材算机组成:讨算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设i.I等。材算机实现:剖算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,筷块、插件、l或板的划分与连接,信号传输,电源、冷却及黎机装配技术等。系统加速比:对系统中某部分进行改进肘,改进后系统性能提高的倍数。Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执
3、行时间的百分比。程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。包括时间局部性和空间局部性。CPI:每条指令执行的平均时钟周期数。测试程序套件:由各种不同的其实应用程序构成的一组测试程序,用来测试i才算机在各个方面的处理性能。存储程序ti算机:1马诺侬曼纺构计算机。其基本点是指令驱动。程序预先存放在ti算机存储苦苦中,机捞一且启动,就能按照程序指定的逻辑顺序执行这些程序,自动完成由程序所描述的处理工作。系列机:庄同一厂家生产的具有相同系统结构、但具有不同组成和实现的一系列不同型号的讨算机。软件兼容:一个软件可以不经修改或者只需少量修改就可以由一台剖算机移植到另一台
4、t才算机上运行。差别只是执行时间的不同。向上(下兼容:按某档t才算机编制的程序,不加修改就能运行于比它高(低挡的t才算机。向后(前兼容:按3某个时期投入市场的某种型号t才算机编制的程序,不加修改地就能运行子在它之后(前投入市场的训算机。兼容机:庄l不同公司厂家生产的具有相同系统结构的材算机。模拟:用软件的方法在一台现有的讨算机称为宿主机上实现另一台t才算机(称为虚拟机的指令系统。仿真:用一台现有t才算机(称为宿主机上的微程序去解释实现另一台t才算机称为目标机的指令系统。并行性:材算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。只要在时间上相互重窍,就存在并行性。它包括同时性与并发性两种
5、含义。时间直奔:在并行性概念中号入时间因素,让多个处理过程在时间上相互错开,轮流重辞地使用同一套硬件设备的各个部分,以加快硬件周转而赢得速度。资源重复:在并行性概念中引入空间因素,以数量取胜。通过重复设置硬件资源,大幅度地提高计算机系统的性能。资源共享:这是一种软件方法,它使多个任务按一定时间顺序轮流使用同一套硬件设备。搞合度:反映多机系统中各材算机之间物理连接的紧密程度和交互作用能力的强弱。紧密鹅合系统:又称直接偶合系统。在这种系统中,训算机之间的物理连接的频带较高,一般是通过总线或高速开关互连,可以共享主存。松散搞合系统:又称间接偶合系统,一般是通过通道或通信线路实现剖算机之间的互连,可以
6、共阜外存设备(磁盘、磁带等。t才算机之间的相互作用是在文件或数据集一级上进行。异构型多处理机系统:囱多个不同类型、至少担负不同功能的处理机组成,它们按照作业要求的顺序,利用时间重桑原理,依次对它们的多个任务进行加工,各自完成规定的功能动作。同构型多处理机系统:主多个同类型或至少担负同等功能的处理机组成,它们同时处理同一作业中能并行执行的多个任务。试用实例说明讨算机系统结构、讨算机组成与讨算机实现之间的相互关系。答:如在设讨主存系统时,确定主存容量、编址方式、寻址范固等属于刘算机系统结构。确定主存周到1、逻辑上是否采用并行主存、逻辑设i.I等属于i.I算机组成。选择存储芯片类型、微组装技术、线路
7、设讨等属于讨算机实现。ti算机组成是计算机系统结构的逆辙实现。ti算机实现是i:1-算机组成的物理实现。一种体系结构可以有多种组成。一种组成可以有多种实现计算机系统结构的Flynn分类法是按什么来分类的共分为19)11几类答:Flynn分类法是按照指令流和数据流的多倍性进行分类。把材算机系统的结构分为:(1)单指令流单数据流SISD(2)单指令流多数据流SIMD(3)多指令流单数据流MISD(4)多指令流多数据流MIMDi才算机系统设讨中经常使用的4个定量原理是什么并说出它们的含义。答:(1)以经常性事件为重点。在计算机系统的设计中,对经常发生的情况,赋予它优先的处理权利资源使用权,以得到更多
8、的总体上的改进。(2)Amdahl定律。加快某部件执行速度所获得的系统性能力日速比,受限于该部件在系统中所占的重要性。(3)CPU性能公式。执行一个程序所需的CPU时间ICCPI时钟周期时间。(4)程片,的局部性原理。程序在执行时所访问地址的分布不是随机的,而是相对她簇聚。分别从执行程序的角度和处理数据的角度来看,i.-1算机系统中并行性等级从低到高可分为19111几级答:从处迎数据的角度来看,并行性等级从低到高可分为:(1)字串位串:每次只对一个字的一位进行处理。这是最基本的串行处理方式,不存在并行性;(2)字席位并:同时对一个字的全部位进行处理,不同字之间是感行的。已开始出现并行性;(3)
9、字并位串:同时对许多字的同一位称为位片进行处理。这种方式具有较高的并行性;(4)金并行:同时对许多字的全部位或部分位进行处理。这是最高一级的并行。从执行程序的角度来看,并行性等级从低圭lj商可分为(1)指令内部并行:单条指令中各微操作之间的并行;(2)指令级并行:并行执行两条或两条以上的指令:(3)线程级并行:并行执行两个或两个以上的线程,通常是以一个进程内派生的多个线程为调度单位;(4)任务级或过程级并行:并行执行两个或两个以上的过程或任务程序段,以子程序或进程为调度单元;(S)作业程序级并行:并行执行两个或两个以上的作业或程序。某台主颇为400MHz的计算机执行标准测试程序,程序中指令类型
10、、执行数量和平均时钟周期数如下:指令!i!指令执行数量平均时钟周I明数E在数45000 1 数据传送75000 2 浮点8000 4 分支1500 2 求该t才算机的有效CPI,Ml陀 利程序执行时间。角平:(1)CPI=(450001+750002+sooo4+15002)I 129soo=460(或一一)259 5180(2)MIPS速率f/CPI=400/=(或一一 MIPS)259(3)程序执行时间(450001750002十80004+15002)I 400=575 s 将iI算机系统中某一功能的处理速度加快10倍,但该功能的处理时间仅为整个系统运行时间的40%,贝I采用此增强功能方
11、法后,能使整个系统的性能提高多少解由题可知:可改进比例40%=部件加速比10 根据Amdahl定律可知:系统111:1迷比一一!一一1.56乞0.4(1-0.4)一10 采用此增强功能方法后,能使整个系统的性能提高到原来的倍。t才算机系统中有三个部件可以改进,这三个部件的部件加速比为:部件加速比1=30;部件加速比2=20;部件加速比3=10(1)如果部件1和部件2的可改进比例均为30%,那么当部件3的可改边比例为多少时,系统加速比才可以达到10(2)如果三个部件的可改进比例分别为30%、30%和20%,三个部件同时改进,那么系统中不可加速部分的执行时间在总执行时间中占的比例是多少解:“在多个
12、部件可改进情况下,Amdahl定理的扩展:S11=I r(I-I;F;)+I;七L。t己知S1=30,S2=20,S3=lO,Sn=lO,F1=,F2,得:10=1-(0.3+0.3+I飞)+(0.3/30+0.3/20+I飞/10)得F3=,l!ll部件3的可改进比例为36%。(2)设系统改进前的执行时间为T,贝lj3个部件改进前的执行时间为:(+)T,不可改进部分的执行时间为。己知3个部件改进后的加速比分别为S1=30,S2=20,$3=10,因此3个部件改进后的执行时间为:,0.3T 0.3T 0.2T,一一一=U U4:,/30 20 10 改边后整个系统的执行时间为:Tn=+=那么系
13、统中不可改进部分的执行时间在总执行时间中占的比例是:2主二0.820.245T 假设某应用程序中有4类操作,通过改进,各操作获得不同的性能提高。具体数据如下表所示:除作类!1!l宇巾的数量t放进前的执行时间改进后的执行时间百万条指令周期)周期操作110 2 1 操作230 20 15 操作335 10 3 操作415 4 1(1)改进后,各类操作的加速比分别是多少(2)各类操作单独改进后,程序获得的加速比分别是多少(3)4类操作均改进后,整个程序的加速比是多少解根据Amdahl定律s,.一一一;:可得(I-Fe)仨二:,e 操作类型各类操作的指令条数在各类操作的JJni理tt乌程序巾所占的比例
14、f;操作1%2 操作2%操作3%操作4%4 4类操作均改进后,整个程序的加速比:s,.=I臼2.16(1-I;F;)三7.,i 第2章指令集结构的分类2.1解释下列术语各类操作单独战胜后,lJ宇获得的加迎比雄梭型机器:CPU中存储操作数的单元是堆梭的机器。累加器型机器:CPU中存储操作数的单元是累加器的机器。通用寄存器型机器:CPU中存储操作数的单元是通用寄存器的机器。CISC:复杂指令集计算机RISC:精简指令集计算机寻址方式:指令系统中如何形成所要访问的数据的地址。一般来说,寻址方式可以指明指令中的操作数是一个常数、一个寄存器操作数或者是一个存储器操作数。数据表示:硬件结构能够识别、指令系
15、统可以直接调用的那些数据结构。2.1区别不同指令集结构的主要因素是什么根据这个主要因素可将指令集结构分为哪3类答:区别不同指令集结构的主要因素是CPU中用来存储操作数的存储单元。据此可将指令系统结构分为推校结构、累加器结构和通用寄存器结构。2.2常见的3利通用寄存器型指令集结构的优缺点有l哪些答:指令系统结肉类型优点缺点指令字t是固定,指令结构简与指令巾含存俑者曾操作数的指令芽、统结构相寄存君寄存苦苦型沽,是一种简吼的代码生成比,指令条数多目标代倒不够紧凑,因而程(0,3)模型,各种指令的执行时钟周期数将Ii丘!宇占用的空间比较大可以在ALU指令中直接对存由于有个操作数的内容将被破坏,所以指令
16、中的两个秘作数不对称在一条指令中t,a)I时对俯哥哥跺作数进行号则,而不寄存存储吉普型寄存量操作数和I存俑却跺作数j进行编码,有可必先刷1。ad指令胜行加我(1,2)能剧,I)指令所能够表示的寄存苦苦个数指令的容易对指令进行编码,目标执行时钟周期数国银作数的来激(寄存苦苦或存代码比校紧i费h自然)不同而差别比较大指令字长变化很大,特别是3操作数指令e而存阳楼存储器型目标代码最紧凑,不简设 且每条指令完成的i作也差别很大对存俑者曾(2,2)或(3,3)里寄存器来保存变量的频繁访问会使存储搅成为瓶颈这种类型的指令系统现在已不用(.2.3指令集应满足l国11几个基本要求答:对指令集的基本要求是:完整
17、性、规整性、高效率和兼容性。完整性是指在一个有限可用的存储空间内,对于任何可解的问题,编制讨算程序时,指令集所提供的指令足够使用。规整性主要包括对称性和均匀性。对称性是指所有与指令集有关的存储单元的使用、操作码的设置等都是对称的。均匀性是指对于各种不同的操作数类型、字长、操作种类和数据存储单元,指令的设置都要同等对待。高效率是指指令的执行速度快、使用频度高。2.1指令集结构设i:I所涉及的内容有l哪些答:“)指令集功能设计:主要有RISC丰llCISC两科技术发展方向:(2)寻址方式的设讨:设置寻址方式可以通过对基准程序进行测试统剖,察看各种寻址方式的使用频率,根据适用频率设置必要的寻址方式。
18、(3)操作数表示和操作数类型:主要的操作数类型和操作数表示的选择有:浮点数据类型、整型数据类型、字符型、十进制数据类型等等。(4)寻址方式的表示:可以将寻址方式编码子操作码中,也可以将寻址方式作为一个单独的域来表示。(5)指令集格式的设讨:有变长编码格式、固定长度编码格式和混合型编码格式3手中。2.2简述CISC指令集结构功能设计的主要目标。从当前的讨算机技术观点来看,CISC指令集结构的计算机有什么缺点答:主要目标是增强指令功能,把越来越多的功能交主硬件来实现,并且指令的数量也是越来越多。缺点:(1)CISC结构的指令集中,各种指令的使用频率相差悬殊。(2)CISC结构指令的复杂性带来了计算
19、机体系结构的复杂性,这不仅增加了研制时间和成本,而且还容易造成设剖错误。(3)CISC结构指令簇的复杂性给VLSI设t才增加了很大负担,不利于单片集成。(4)CISC结构的指令集中,许多复杂指令需要很复杂的操作,因而运行速度。眶。(5)在CISC结构的指令集中,由于各条指令的功能不均衡性,不利于采用先进的材算机体系结构技术如流水技术来提高系统的性能。2.3简述RISC指令集结构的设计原则。答(1)j在取使用频率最高的指令,并补充一些最有用的指令;(2)每条指令的功能应尽可能简单,并在一个机器周期内完成:(3)所有指令长度均相同;(4)只有Load和Store操作指令才访问存储器,其它指令操作均
20、在寄存器之间进行;(5)以简单有效的方式支持高级语言。2.4指令中表示操作数类型的方法有明11几乎1,答:操作数类型有两种表示方法:(1)操作数的类型由操作码的编码指定,这是最常见的一种方法;(2)数据可以附上出硬件解霖的标记,由这些标记指定操作数的类型,从而选择适当的运算。2.5表示寻址方式的主要方法有哪些简述这些方法的优缺点。答:表示寻址方式有两种常用的方法:(1)将寻址方式编于操作码中,由操作码在描述指令的同时也描述了相应的寻址方式。这种方式译码快,但操作码和寻址方式的结合不仅增加了指令的条数,导致了指令的多样性,而且增加了CPU对指令译码的难度。(2)为每个操作数设置一个地址描述符,由
21、该地址描述钩表示相应操作数的寻址方式。这种方式译码较慢,但操作码和寻址独立,易于指令扩展。2.6通常有明11几种指令格式,请简述其适用范围。答:(1)变长编码格式。如果系统结构设计者感兴趣的是程序的目标代码大小,而不是性能,就可以采用变长编码格式。(2)固定长度编码格式。如果感兴趣的是性能,而不是程序的目标代码大小,则可以选择固定长度编码格式。(3)混合型编码格式。需要兼顾降低目标代码长度和降低译码复杂度时,可以采用混合型编码格式。2.7根据CPU性能公式简述RISC指令集结构i-1算机和CISC指令集结构剖算机的性能特点。答:CPU性能公式:CPU时间ICCPIT其中,IC为目标程序被执行的
22、指令条数,CPI为指令平均执行周期数,T是时钟周期的时间。相同功能的CISC目标程序的指令条数ICc1sc少于RISC的ICRISC,但是CISC的CPlc1sc和Tc,sc都大于RISC的CPIRISC和TRISC因此,CISC目标程斤,的执行时间比RISC的更长。第3主流水线技术解释下列术语流水线:将一个重复的时序过程,分解成为若干个子过程,而每一个子过程都可有效地在其专用功能段上与其它子过程同时执行。单功能流水线:指流水线的各段之间的连接固定不变、只能完成一种固定功能的流水线。多功能流水线:指各段可以进行不同的连接,以实现不同的功能的流水线。静态流水线:指在同一时间内,多功能流水线中的各
23、段只能按同一种功能的连接方式工作的流水线。当流水线要切换到另一种功能时,必须等前丽的任务都流出流水线之后,才能改变连接。动态流水线:指在同一时间内,多功能流水线中的各段可以按照不同的方式连接,同时执行多种功能的流水线。它允许在某些段正在实现某种运算时,另一些段却在实现另一种运算。部件级流水线:把处理机中的部件进行分段,再把这些部件分段相互连接而成。它使得运算操作能够按流水方式进行。这种流水线也称为运算操作流水线。处理机级流水线:又称指令流水线。它是把指令的执行过程按照流水方式进行处理,即把一条指令的执行过程分解为若干个子过程,每个子过程在独立的功能部件中执行。处理机间流水线:又称为宏流水线。它
24、是把多个处理机串行连接起来,对同一数据流进行处理,每个处理机完成整个任务中的一部分。前一个处理机的输出结果存入存储器中,作为后一个处理机的输入。线性流水线:指各段串行连接、没有反馈回路的流水线。数据通过流水线中的各段时,每一个段最多只流过一次。非线性流水线:指各段除了有串行的连接外,还有反馈臼赂的流水线。顺序流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序完全相同。乱J芋流水线:流水线输出端任务流出的顺序与输入端任务流入的顺序可以不同,允许后进入流水线的任务先完成。这种流水线又称为无序流水线、错J字流水线、异步流水线。吞吐率:在单位时间内流水线所完成的任务数量或输出结果的数量。流水线的
25、加速比:使用顺序处理方式处理一批任务所用的时间与按流水处理方式处理同一批任务所用的时间之比。流水线的效率:即流水线设备的利用率,它是指流水线中的设备实际使用时间与整个运行时间的比值。数据相关:考虑两条指令i和l,在j的前丽,如果下述条件之一成立,则称指令j与指令i数据相关:(1)指令l佼用指令,产生的结果:(2)指令j与指令k数据相关,而指令k又与指令i数据相关。名相关:如果两条指令使用了相同的名,但是它们之间并没有数据流动,则称这两条指令存在名相关。控制相关:是指出分支指令引起的相关。它需要根据分支指令的执行结果来确定后面该执行l哪个分支上的指令。反相关:考虑两条指令i和ji在j的前面,如果
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机体系结构 课后 答案
限制150内