《计算机体系结构试题及答案.doc》由会员分享,可在线阅读,更多相关《计算机体系结构试题及答案.doc(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、计算机体系结构试题及答案12008年01月23日 22:211、计算机高性能发展受益于:(1)电路技术的发展;(2)计算机体系结构技术的发展。2、层次结构:计算机系统可以按语言的功能划分为多级层次结构,每一层以不同的语言为特征。第六级:应用语言虚拟机 - 第五级:高级语言虚拟机 - 第四级:汇编语言虚拟机 - 第三级:操作系统虚拟机 - 第二级:机器语言(传统机器级) -第一级:微程序机器级。3、计算机体系结构:程序员所看到的计算机的属性,即概括性结构与功能特性。4、透明性:在计算机技术中,对本来存在的事物或属性,从某一角度来看又好像不存在的概念称为透明性。5、Amdahl提出的体系结构是指机
2、器语言级程序员所看见的计算机属性。6、经典计算机体系结构概念的实质3是计算机系统中软、硬件界面的确定,也就是指令集的设计,该界面之上由软件的功能实现,界面之下由硬件和固件的功能来实现。7、计算机组织是计算机系统的逻辑实现;计算机实现是计算机系统的物理实现。8、计算机体系结构、计算机组织、计算机实现的区别和联系?答:一种体系结构可以有多种组成,一种组成可以有多种物理实现,体系结构包括对组织与实现的研究。9、系列机:是指具有相同的体系结构但具有不同组织和实现的一系列不同型号的机器。10、软件兼容:即同一个软件可以不加修改地运行于系统结构相同的各机器,而且它们所获得的结果一样,差别只在于运行时间的不
3、同。11、兼容机:不同厂家生产的、具有相同体系结构的计算机。12、向后兼容是软件兼容的根本特征,也是系列机的根本特征。13、当今计算机领域市场可划分为:服务器、桌面系统、嵌入式计算 三大领域。14、摩尔定律:集成电路密度大约每两年翻一番。15、定量分析技术基础(1)性能的评测:(a)响应时间:从事件开始到结束之间的时间;计算机完成某一任务所花费的全部时间。(b)流量:单位时间内所完成的工作量。(c)假定两台计算机 x、y;x 比 y 快意思为:对于给定任务,x 的响应时间比y少。x的性能是y的几倍是指:响应时间x / 响应时间y = n,响应时间与性能成反比。16、大概率事件优先原则:(基本思
4、想)对于大概率事件(最常见的事件),赋予它优先的处理权和资源使用权,以获得全局的最优结果。17、Amdahl定律:加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。系统加速比 = 总执行时间(改进前)/ 总执行时间(改进后)= 18、Amdahl定律推论:如果仅仅对计算机中的一部分做性能改进,则改进越多,系统获得的效果越小。如果只针对整个任务的一部分进行优化,那么多获得的加速比不大于1 /(1-可改进比例)。19、cpu性能:Cpu时间 = 总时钟周期数 / 时钟频率 Cpi = 总时钟周期数 / ic(cpi:平均每条指令的时钟周期数;ic:执行过程当中的指令条数。
5、)Cpu性能公式:总cpu时间 = cpi ic / 时钟频率 其中:cpi反映了计算机实现技术、计算机指令集的结构和计算机组织;Ic反映了计算机指令集的结构和编程技术;时钟频率:反映了计算机实现技术,生产工艺和计算机组织。20、并行性:是指在同一时刻或是同一时间间隔内完成两种或两种以上性质相同或不相同工作。第二章1、根据cpu内部存储单元类型对指令集结构进行分类,一般可分为堆栈型指令集结构、累加器型指令集结构和通用寄存器型指令集结构。2、通用寄存器型指令集机进一步细分为3种类型: 寄存器-寄存器型(R-R)、寄存器-存储器型(R-M)、存储器-寄存器型。3、寻址方式:(1)寄存器寻址:例:A
6、DD R4, R3 含义:RegsR4-RegsR4+RegsR3(2)立即值寻址:例:ADD R4, 3 含义:RegsR4-RegsR4+3(3)偏移寻址:例:ADD R4, 100(R1) 含义:RegsR4+Mem100+RegsR1(4)寄存器间接寻址:例:ADD R4, (R1) 含义:RegsR4-RegsR4+MemRegsR1(5)索引寻址:例:ADD R3, (R1+R2) 含义:RegsR3-RegsR3+MemRegsR1+RegsR2(6)直接寻址或绝对寻址:例:ADD R1, (1001) 含义:RegsR1-RegsR1+Mem1001(7)存储器间接寻址:例:A
7、DD R1, a(R3) 含义:RegsR1-RegsR1+MemMemRegsR3(8)自增寻址:例:ADD R1, (R2)+ 含义:RegsR1-RegsR1+MemRegs(9)自减寻址(10)缩放寻址4、指令集结构的功能设计: 指令集结构中操作的分类 操作类型 实例(1)算术与逻辑运算 整数的算术和逻辑运算:加、减、与、或等(2)数据传输 LOAD/STORE(3)控制 分支、跳转、过程调用和返回、自陷等(4)系统 操作系统调用、虚拟存储器管理。(5)浮点 浮点加、减等操作(6)十进制 十进制加、十进制乘、十进制到字符的转换(7)字符串 字符串移动、比较(8)图形 像素操作,压缩操作
8、5、复杂指令机(CISC):是指强化指令功能,实现软件功能向硬件功能转移,基于这种指令集结构而设计实现的计算机系统。CISC指令集存在的缺点:(1) 在这种指令系统中,各种指令的使用频率相差悬殊。(2) CISC指令集结构的复杂性带来了计算机体系结构的复杂性,这不仅增加了研制时间和成本,而且还容易造成设计错误。(3) CISC指令集结构的复杂性给VLSI设计带来了很大负担,不利于单片集成。(4) 在CISC指令集结构中,许多复杂指令需要很复杂的操作,因而运行速度慢。(5) 在CISC指令集结构中,由于各条指令功能的不均衡,不利于采用先进的计算机体系结构技术(如流水技术)来提高系统的性能。6、2
9、0世纪80年代发展起来的精简指令集计算机:其目的是尽可能地降低指令集结构的复杂性,以达到简化实现,提高性能的目的,也是当今指令集结构功能设计的一个主要趋势。其设计时遵循的原则:(1) 选取使用频率最高的指令,并补充一些最有用的指令。(2) 每条指令的功能尽可能简单,并在一个机器周期内完成。(3) 所有指令长度均相同。(4) 只有LOAD和STORE操作指令才访问存储器,其它指令操作均在寄存器之间进行。(5) 以简单有效的方式支持高级语言。7、操作数类型:整数(定点)、浮点、十进制、字符、字符串、向量、堆栈等。8、操作数类型的表示有两种方法:(1)由操作码的编码指定。(2)数据可以附上由硬件解释
10、的标记,由这些标记指定操作数的类型,从而选择适当运算。9、操作数类型大小有:字节(8)、半字(16b)、单字(32b)、双字(64b)第三章1、流水线技术:是指将一个重复的时序过程,分解为若干个子过程,而每一个子过程都可有效地在其专用功能段上与其它子过程同时执行。2、流水线分类:(1)按功能的多少来分:单功能流水线、多功能流水线;(2)按同一时间内各段之间的连接方式来分:静态流水线、动态流水线(3)按流水线的级别来分:部件级流水线(运算操作流水线)、处理机级流水线(指令流水线)、处理机间流水线(宏流水线)(4)按各个流水段之间是否有反馈回路来分:线性流水线、非线性流水线(5)按数据表示分:标量
11、流水处理机、向量流水处理机3、先行控制器处理机结构:包括三个独立的控制器和四个缓冲栈。其中三个控制器为:存储控制器、指令控制器、运算控制器。四个缓冲栈:先行指令缓冲栈、线性读数缓冲栈、现行操作栈,后行写数栈。4、吞吐率:是指单位时间内流水线所完成的任务数或输出结果的数量。TP = n / Tk实际吞吐率小于最大吞吐率 Tk = (k+n-1)t5、加速比:是指流水线的速度与等功能非流水线的速度之比(s);效率:是指流水线的设备利用率(E)。6、若流水线各段的时间相等:吞吐率:TP=n/(k+n-1)t TPmax=1/t若各段执行时间不相等时,完成几个任务:TP=n /(ti + (n-1)m
12、ax(t1, t2 tk)7、加速比和使用效率的关系: E = s/m 或 S = mE8、效率和吞吐率的关系: E = TP t0 或 TP = E/t 11、效率:E = n个任务占用的时空区 / k个流水段的总的时空区 = T0 / KTk E = n/(k+n-1) S = kn /(k+n-1) TP = n / (k+n-1)t12、单功能流水栈:是指只能完成一种固定功能的流水栈。13、多功能流水栈:流水栈的各段通过不同连接实现不同功能。14、非线性流水线调度:任务时要找出一个最小的循环周期,按照个周期向流水线输入新任务,流水线的各个功能段都不会发生冲突,而且流水线的吞吐率和效率最
13、高。15、非线性流水线:某些流水段之间有反馈回路或前馈回路。16、启动距离:连续输入连个任务之间的时间间隔。17、流水线冲突:几个任务争用同一个流水段。18、禁止向量:预约表中每一行任意两个“x”之间距离的集合。19、冲突向量:C = (CmCm-1C2C1) 其中m时禁止向量中的最大值20、数据相关:在执行本条指令的过程中,如果用到的指令、操作数、变量等是前面指令的执行结果,这种相关称为数据相关。21、控制相关:由条件分支指令、转子程序指令、中断等引起的相关。22、三种数据相关:限度后写相关、先写后读相关、写写相关。第五章(存储系统)1、存储系统定义:两个或两个以上速度、容量和价格各不相同的
14、存储器用硬件、软件或软件与硬件相结合的方法连接起来成为一个存储系统。这个存储器系统对应用程序员时透明的,并且,以应用程序员看,它是一个存储器,这个存储器的速度接近最快的那个存储器,存储容量与容量最大的那个存储器相等,单位容量的价格接近最便宜的那个存储器。2、存储系统分为两类:(1)Cache存储系统:由Cache与主存储器构成,目的是提高存储器速度。(2)虚拟存储系统:由主存储器和硬盘构成,目的是扩大存储器容量。3、存储系统的价格: C = (C1S1+C2S2)/(S1+S2)4、存储系统的速度: 表示方法:访问周期、存取周期、存储周期、存取时间等。5、命中率定义:在M1存储器中访问到的概率
15、u = N1 / (N1+N2) N1是对存储器M1的访问次数,N2是对M2存储器的访问次数。6、访问效率: T1 1e = T1/T = = = f(u, T2/T1) uT1+(1-u)T2 u+(1-u)T2/T17、采用预取技术提高命中率.(方法) 不命中时,把M2存储器中相邻多个单元组成的一个数据块取出来送入M1存储器中. u= (u+n-1) / n 其中u是采用预取技术之后的命中率;u是原来的命中率; n为数据块大小与数据重复使用次数的乘积。8、加速内部地址变换方法:(1)目录表:用一个小容量高速存储器存放页表;(2)快慢表:快表、慢表构成一个两级存储系统;(3)散列函数:把相联
16、访问变成接地址访问。9、页面替换算法:(1)随机算法(RAND);(2)先进先出算法(FIFO);(3) 近期最少使用算法(LFV);(4)最久没有使用算法(LRV);(5)最优替换算法(OPT)。10、“颠簸”现象:一个页面刚被调出主存储器,又要被调入。11、堆栈型替换算法:对任意一个程序的页地址流作两次主存页面数分配,分别分配m个主存页面和n个主存页面,并且mn 。如果在任何时刻t,主存页面数集合Bt都满足关系:Bt(m)Bt(n) 则这类算法成为堆栈型替换算法。12、Cache地址映像方法:(1)全相联映像;(2)直接映像;(3)组相联映像;(4)位选择组相联映像;(5)段相联映像。13
17、、Cache存储替换算法:(1)轮换法(2)LRV算法(3)比较对法(4)堆栈法。14、单处理机的Cache一致性:包括写直达法:写通过法,CPU的数据写入Cache时,同时页写入主存还有写回法:抵触修改法,CPU的数据只写入Cache,不写入主存,仅当替换时才把修改过的Cache块写回主存二者优缺点比较:(1) 可靠性:写直达法优于写回法。(2) 与主存的通讯量,写回法少于写直达法。(3) 控制的复杂性,写直达法比写回法简单。(4) 硬件实现的代价,写回法比写直达法好。15、多处理机的一致性:(1)目录协议 (2)兼听协议第六章(输入/输出系统)1、衡量I/O系统的性能指标主要有响应时间和可
18、靠性。2、磁盘的数据传输率分为外部传输率和内部传输率。3、外部传输率(突发数据传输率):计算机通过磁盘接口从硬盘的缓存中将数据读出,发给相应的控制器的速度。4、内部传输率(持续传输率):硬盘将数据从盘片上读取出,交给硬盘上的缓冲存储器的速度。5、反映存储外设可靠性能的参数有可靠性、可用性和可信性。6、可靠性衡量标准用:平均无故障时间。7、可用性衡量标准用:平均失效间隔时间。8、总线:总线时各子系统之间共享的通信链路,具有低成本和多样性这两个优点。9、总线的主要缺点:它必须独占使用,造成了设备信息交换的瓶颈,从而限制了系统中总的I/O吞吐量。10、分离事务总线:在有多个设备时,可用通过打包技术来
19、提高总线带宽,这样每次I/O操作就不必在整个传输过程中都占有总线,其基本思想时将总线事务分成请求和应答两部分,这样总线就可以在某个总线事务的请求和应答间的空闲时间间隔内被其它总线事务使用。(又称流水总线、悬挂总线、包交换总线)11、控制外部设备的输入/输出方式分为:直接传送、程序查询、中断、DMA、通道方式。12、I/O设备的编址方式:(1)存储器映射I/O或称为统一编址(2)I/O设备单独编址13、通道:能够执行有限的I/O指令,并且能够被多台外围设备共享的小型的DMA专用处理机。14、通道的功能:(1)接受来自CPU的I/O指令,并根据指令要求选择指定的外围设备与通道相连接。(2)执行CP
20、U为通道组织的通道程序,从主存中取出通道指令,对通道指令进行译码,并根据需要向被选中的设备控制器发出各种操作命令。(3)为主存和外设装配和拆卸信息,控制主存和I/O设备传送数据并提供传送通路,指示数据存放的主存地址和传送字节数。(4)指定传送工作结束时要进行的操作。(5)检查外围设备的工作状态,时正常还是故障。(6)在数据传输过程中完成必需的格式变换。15、通道的种类:(1)字节多路通道(2)选择通道(3)数组多路通道。16、通道的工作过程:(1)在用户程序中使用访管指令进入管理程序,由CPU通过管理程序组织一个通道程序,并启动通道。(2)通道处理机执行CPU为它组织的通道程序,完成指定的数据
21、I/O工作。通道处理机执行通道程序是与CPU执行用户程序并行的。(3)通道程序结束后向CPU发中断请求,CPU响应某个中断请求后,第二次进入操作系统,调用管理程序对I/O中断请求进行处理。第七章(多处理机)1、Cache一致性协议:(1)目录协议和兼听协议;(2)横向分为:写作废协议和写更新协议;(3)纵向分为:单处理协议和单数据流协议。2、并行计算机体系结构的分类:单指令流单数据流(SISD)、单指令流多数据流(SIMD)、多指令流单数据流(MISD)和多指令流多数据流(MIMD)。3、目录协议分为三类:全映射目录、有限目录、链式目录。4、链式目录:通过维护一个目录指针链来跟踪共享数据拷贝。
22、思想:当p1读x时,存储器送x到cachel,同时写cachel的一个链结束指针ct在存储器也保存一个指向cachel的指针,到p2读x时,存储器则保存一个指向cachel2的指针,到某一处理机需要写x时,他必须沿整个目录连发送一个数据无敌信息,在收到所有处理机的回答信号后,存储器才给该处理机写允许权到cachel中的数据块需要替换时,要把该cache从目录链中删除,有如下解决方法;(1) 把cachei+1的指针指向cachei+1,在cachel中存放新数据块(2)使cachel及在链中位子其后的所有cachel中的单元x无效(3)使用双向链,在替换时不再需要遍历整个链,但指针增加了一倍,
23、一致性协议更加完美优点:b不限制共享数据块的拷贝数目又保持了可扩展性,指针的长度已处理机数目的对属关系增长,cache的每个数据块的指针数目与处理机的数目无关缺点:链式目录的复杂成都超过了前两种目录5 定义:互联网络;是将对称式系统或分布式系统中的节点可能好似处理器,存储模块或者其它设备,它们通过互联网络进行信息交换,在拓扑上,互联网络为输入和输出两组节点之间提供一组互联或映像6 (1)节点数称为网络规模 (2) 与节点互联的边的数目为节点的最大值称为网络直径(3) 网络中任意连个结点间最短路径长的最大值称为网络直径(4) 等分宽度(b)在将某一网络切成相两半的各种切法中,沿切口的最小道数边数
24、称为通道等分宽度(5)路由:指 在网络通信中对路径的选择与指定7互联函数:如果把互连网络的N个a端和N个出端各自用整数0,1,.N代数,则互连函数表示合练的出编号和如编号的一一对称关系8 互连网络表示方法(1)互连函数表示法 (2)图形表示法(3)输入输出对应表示法9 常见的数据路由(或互连函数)的功能:计算机系统结构考试试卷一、填空(每空1分,共20分)(1) 计算机系统中提高并行性的技术途径有:( )、( )和( )。(2) 数据相关有三种:( )、( )和( )。(3) 调度分支延迟指令的三种常用方法是:( )、( )和( )。(4) 减少Cache失效开销的方法有:( )、( )、(
25、)、( )和( )。(5) 在“Cache-主存”层次中,主存的更新算法有两种:( )和( )。(6) 当组相联的路数n变为1时,组相联就变成了( ),当组数G变为1时,组相联就变成了( )。(7) 对向量的处理有( )方式、( )方式和分组处理方式。二、名词解释(每小题3分,共15分) (1) 通用寄存器型机器(2) 指令级并行(3) 透明性(4) 失效开销(5) 故障性预取 二、简答题(每小题5分,共25分)(1) 试从目的、技术途径、组成、分工方式、工作方式等5个方面对同构型多处理机和异构型多处理机作一比较(列表)。(2) 软件兼容有几种?其中哪一种是软件兼容的根本特征?(3) 简述“C
26、ache-主存”层次与“主存-辅存”层次的区别。(4) 在基于目录的Cache一致性中,Cache块状态有那3种,分别表示什么含义?(5) 试举例说明DLX流水线中存在不能依靠定向技术解决的数据相关及其解决方法。四、(15分)有一条动态多功能流水线由5段组成,加法用1、2、3、5段,乘法用1、4、5段,第4段的时间为2t,其余各段时间均为t,而且流水线的输出可以直接返回输入端或暂存于相应的流水线寄存器中。若在该流水线上计算 f=A1*B1+A2*B2+A3*B3+A4*B4,(1) 画出处理过程的时空图;(2) 计算其吞吐率、加速比和效率。五、(15分)给定以下的假设,试计算直接映象Cache
27、 和两路组相联Cache的平均访问时间以及CPU的性能。根据计算结果,你认为哪种Cache更好?为什么?(1) 理想Cache情况下的CPI为2.0,时钟周期为2ns,平均每条指令访存1.4次;(2) 两者Cache容量均为128KB,块大小都是32字节;(3) 组相联Cache中的多路选择器使CPU的时钟周期增加了10%;(4) 这两种Cache的失效开销都是80ns;(5) 命中时间为1个时钟周期;(6) 128KB直接映象Cache的失效率为1.0%,128KB两路组相联Cache的失效率为0.7%。六、(4分)将计算机系统中某一功能的处理速度加快10倍,但该功能的处理时间仅为整个系统运行时间的90%,则采用此增强功能方法后,能使整个系统的性能提高多少? 七、(6分)假设有一个长流水线,仅仅对条件转移指令使用分支目标缓冲。假设分支预测错误的开销为4个时钟周期,缓冲不命中的开销为3个时钟周期。假设:命中率为92%,预测精度为90%,分支频率为15%,没有分支的基本CPI为1。(1) 求程序执行的CPI;(2) 相对于采用固定的2个时钟周期延迟的分支处理,哪种方法程序执行速度更快?
限制150内