计算机系统结构重点不完全总结_计算机-计算机原理.pdf
《计算机系统结构重点不完全总结_计算机-计算机原理.pdf》由会员分享,可在线阅读,更多相关《计算机系统结构重点不完全总结_计算机-计算机原理.pdf(12页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、计算机系统结构重点不完全总结 名词解释:系统加速比:对系统中某部分进行改进时,改进后系统性能提高的倍数。Amdahl定律:当对一个系统中的某个部件进行改进后,所能获得的整个系统性能的提高,受限于该部件的执行时间占总执行时间的百分比。程序的局部性原理:程序执行时所访问的存储器地址不是随机分布的,而是相对地簇聚。包括时间局部性和空间局部性。模拟:用软件的方法在一台现有的计算机(称为宿主机)上实现另一台计算机(称为虚拟机)的指令系统。仿真:用一台现有计算机(称为宿主机)上的微程序去解释实现另一台计算机(称为目标机)的指令系统。流水线:将一个重复的时序过程,分解成为若干个子过程,而每一个子过程都可有效
2、地在其专用功能段上与其它子过程同时执行。线性流水线:指各段串行连接、没有反馈回路的流水线。数据通过流水线中的各段时,每一个段最多只流过一次。结构冲突:因硬件资源满足不了指令重叠执行的要求而发生的冲突。数据冲突:当指令在流水线中重叠执行时,因需要用到前面指令的执行结果而发生的冲突。控制冲突:流水线遇到分支指令或其它会改变 PC 值的指令所引起的冲突。链接技术:具有先写后读相关的两条指令,在不出现功能部件冲突和 Vi冲突的情况下,可以把功能部件链接起来进行流水处理,以达到加快执行的目的。指令级并行:简称 ILP。是指指令之间存在的一种并行性,利用它,计算机可以并行执行两条或两条以上的指令。指令调度
3、:通过在编译时让编译器重新组织指令顺序或通过硬件在执行时调整指令顺序来消除冲突。指令的动态调度:是指在保持数据流和异常行为的情况下,通过硬件对指令执行顺序进行重新安排,以提高流水线的利用率且减少停顿现象。是由硬件在程序实际运行时实施的。指令的静态调度:是指依靠编译器对代码进行静态调度,以减少相关和冲突。它不是在程序执行的过程中、而是在编译期间进行代码调度和优化的。前瞻执行:解决控制相关的方法,它对分支指令的结果进行猜测,然后按这个猜测结果继续取指、流出和执行后续的指令。只是指令执行的结果不是写回到寄存器或存储器,而是放到一个称为 ROB 的缓冲器中。等到相应的指令得到“确认”(即确实是应该执行
4、的)后,才将结果写入寄存器或存储器。超标量:一种多指令流出技术。它在每个时钟周期流出的指令条数不固定,依代码的具体情况而定,但有个上限。超流水:在一个时钟周期内分时流出多条指令。循环展开:是一种增加指令间并行性最简单和最常用的方法。它将循环展开若干遍后,通过重命名和指令调度来开发更多的并行性。多级存储层次:采用不同的技术实现的存储器,处在离 CPU 不同距离的层次上,各存储器之间一般满足包容关系,即任何一层存储器中的内容都是其下一层(离 CPU 更远的一层)存储器中内容的子集。目标是达到离 CPU 最近的存储器的速度,最远的存储器的容量。组相联映象:主存中的每一块可以放置到 Cache 中唯一
5、的一组中任何一个地方(Cache 分成若干组,每组由若干块构成)。写直达法:在执行写操作时,不仅把信息写入 Cache 中相应的块,而且也写入下一级存储器中相应的块。写回法:只把信息写入 Cache 中相应块,该块只有被替换时,才被写回主存。TLB:一个专用高速存储器,用于存放近期经常使用的页表项,其内容是页表部分内容的一个副本。网络直径:指互连网络中任意两个结点之间距离的最大值。结点度:指互连网络中结点所连接的边数(通道数)。等分带宽:把由 N 个结点构成的网络切成结点数相同(N/2)的两半,在各种切法中,沿切口边数的最小值。对称网络:从任意结点来看,网络的结构都是相同的。多 Cache 一
6、致性:多处理机中,当共享数据进入 Cache,就可能出现多个处理器的 Cache 中都有同一存储器块的副本,要保证多个副本数据是一致的。当对一个系统中的某个部件进行改进后所能获得的整个系统性能的提高受限于该部件的执行时间占总执行时间的百分比程序的局部性原理程序执行时所访问的存储器地址不是随机分布的而是相对地簇聚包括时间局部性和空间局部性算机称为宿主机上的微程序去解释实现另一台计算机称为目标机的指令系统流水线将一个重复的时序过程分解成为若干个子过程而每一个子过程都可有效地在其专用功能段上其它子过程同时执行线性流水线指各段串行连接没有反馈要求而发生的冲突数据冲突当指令在流水线中重叠执行时因需要用到
7、前面指令的执行结果而发生的冲突控制冲突流水线遇到分支指令或其它会改变值的指令所引起的冲突链接技术具有先写后读相关的两条指令在不出现功能部件冲突简答题:1、试用实例说明计算机系统结构、计算机组成与计算机实现之间的相互关系。答:计算机系统结构:传统机器程序员所看到的计算机属性,即概念性结构与功能特性。计算机组成:计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。计算机实现:计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。计算机组成是计算机系统结构的逻辑实现。计算机实现是计算
8、机组成的物理实现。一种体系结构可以有多种组成。一种组成可以有多种实现。如在设计主存系统时,确定主存容量、编址方式、寻址范围等属于计算机系统结构。确定主存周期、逻辑上是否采用并行主存、逻辑设计等属于计算机组成。选择存储芯片类型、微组装技术、线路设计等属于计算机实现。2、提高计算机系统并行性的 3 种技术途径分别是?答:并行性:计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。只要在时间上相互重叠,就存在并行性。它包括同时性与并发性两种含义。时间重叠:使多个处理过程在时间上相互错开,交叉轮流地使用同一套硬件设备的各个部分,提高硬件利用率,缩短执行时间,例如,指令流水线处理机。资源重复:在并
9、行性概念中引入空间因素,以数量取胜。通过重复设置硬件资源,大幅度地提高计算机系统的性能。例如,阵列处理机。资源共享:这是一种软件方法,它使多个任务按一定时间顺序轮流使用同一套硬件设备。3、简述先行控制的基本思想。答:先行控制技术是把缓冲技术和预处理技术相结合。缓冲技术是在工作速度不固定的两个功能部件之间设置缓冲器,用以平滑它们的工作。预处理技术是指预取指令、对指令进行加工以及预取操作数等。采用先行控制方式的处理机内部设置多个缓冲站,用于平滑主存、指令分析部件、运算器三者之间的工作。这样不仅使它们都能独立地工作,充分忙碌而不用相互等待,而且使指令分析部件和运算器分别能快速地取得指令和操作数,大幅
10、度地提高指令的执行速度和部件的效率。这些缓冲站都按先进先出的方式工作,而且都是由一组若干个能快速访问的存储单元和相关的控制逻辑组成。采用先行控制技术可以实现多条指令的重叠解释执行。4、简述三种向量处理方式,它们对向量处理机的结构要求有何不同?答(1)横向处理方式:若向量长度为 N,则水平处理方式相当于执行 N次循环。若使用流水线,在每次循环中可能出现数据相关和功能转换,不适合对向量进行流水处理。(2)纵向处理方式:将整个向量按相同的运算处理完毕之后,再去执行其他运算。适合对向量进行流水处理,向量运算指令的源/目向量都放在存储器内,使得流水线运算部件的输入、输出端直接与存储器相联,构成 M-M
11、型的运算流水线。(3)纵横处理方式:把长度为 N的向量分为若干组,每组长度为 n,组内按纵向方式处理,依次处理各组,组数为N/n,适合流当对一个系统中的某个部件进行改进后所能获得的整个系统性能的提高受限于该部件的执行时间占总执行时间的百分比程序的局部性原理程序执行时所访问的存储器地址不是随机分布的而是相对地簇聚包括时间局部性和空间局部性算机称为宿主机上的微程序去解释实现另一台计算机称为目标机的指令系统流水线将一个重复的时序过程分解成为若干个子过程而每一个子过程都可有效地在其专用功能段上其它子过程同时执行线性流水线指各段串行连接没有反馈要求而发生的冲突数据冲突当指令在流水线中重叠执行时因需要用到
12、前面指令的执行结果而发生的冲突控制冲突流水线遇到分支指令或其它会改变值的指令所引起的冲突链接技术具有先写后读相关的两条指令在不出现功能部件冲突水处理。可设长度为 n 的向量寄存器,使每组向量运算的源/目向量都在向量寄存器中,流水线的运算部件输入、输出端与向量寄存器相联,构成 R-R型运算流水线。5、简述 Tomasulo 算法的基本思想。答:核心思想是:记录和检测指令相关,操作数一旦就绪就立即执行,把发生 RAW冲突的可能性减小到最少;通过寄存器换名来消除 WAR 冲突和 WAW 冲突。寄存器换名是通过保留站来实现,它保存等待流出和正在流出指令所需要的操作数。基本思想:只要操作数有效,就将其取
13、到保留站,避免指令流出时才到寄存器中取数据,这就使得即将执行的指令从相应的保留站中取得操作数,而不是从寄存器中。指令的执行结果也是直接送到等待数据的其它保留站中去。因而,对于连续的寄存器写,只有最后一个才真正更新寄存器中的内容。一条指令流出时,存放操作数的寄存器名被换成为对应于该寄存器保留站的名称(编号)。计算题 1、某台主频为 400MHz 的计算机执行标准测试程序,程序中指令类型、执行数量和平均时钟周期数如下:指令类型 指令执行数量 平均时钟周期数 整数 45000 1 数据传送 75000 2 浮点 8000 4 分支 1500 2 求该计算机的有效 CPI、MIPS 和程序执行时间。解
14、:(1)CPI(4500017500028000415002)/1295001.776(或259460)(2)MIPS 速率f/CPI 400/1.776 225.225MIPS(或2595180MIPS)(3)程序执行时间=(4500017500028000415002)400=575 s 2、将计算机系统中某一功能的处理速度加快 10 倍,但该功能的处理时间仅为整个系统运行时间的 40%,则采用此增强功能方法后,能使整个系统的性能提高多少?解:由题可知:可改进比例=40%=0.4 部件加速比=10 根据 Amdahl 定律可知:5625.1104.04.011系统加速比 采用此增强功能方法
15、后,能使整个系统的性能提高到原来的 1.5625 倍。3、假设某应用程序中有 4 类操作,通过改进,各操作获得不同的性能提高。具体数据如下表所示:操作类型 程序中的数量(百万条指令)改进前的执行时间(周期)改进后的执行时间(周期)当对一个系统中的某个部件进行改进后所能获得的整个系统性能的提高受限于该部件的执行时间占总执行时间的百分比程序的局部性原理程序执行时所访问的存储器地址不是随机分布的而是相对地簇聚包括时间局部性和空间局部性算机称为宿主机上的微程序去解释实现另一台计算机称为目标机的指令系统流水线将一个重复的时序过程分解成为若干个子过程而每一个子过程都可有效地在其专用功能段上其它子过程同时执
16、行线性流水线指各段串行连接没有反馈要求而发生的冲突数据冲突当指令在流水线中重叠执行时因需要用到前面指令的执行结果而发生的冲突控制冲突流水线遇到分支指令或其它会改变值的指令所引起的冲突链接技术具有先写后读相关的两条指令在不出现功能部件冲突操作 1 10 2 1 操作 2 30 20 15 操作 3 35 10 3 操作 4 15 4 1(1)改进后,各类操作的加速比分别是多少?(2)各类操作单独改进后,程序获得的加速比分别是多少?(3)4 类操作均改进后,整个程序的加速比是多少?解:根据 Amdahl 定律SeFeFeSn)1(1可得 操作类型 各类操作的指令条数在程序中所占的比例 Fi 各类操
17、作的加速比 Si 各类操作单独改进后,程序获得的加速比 操作 1 11.1%2 1.06 操作 2 33.3%1.33 1.09 操作 3 38.9%3.33 1.37 操作 4 16.7%4 1.14 4 类操作均改进后,整个程序的加速比:2.16)1(1iiinSFFS 4、有一指令流水线如下所示 (1)求连续输入 10 条指令,该流水线的实际吞吐率和效率;(2)该流水线的“瓶颈”在哪一段?请采取两种不同的措施消除此“瓶颈”。对于你所给出的两种新的流水线,连续输入 10 条指令时,其实际吞吐率和效率各是多少?解:(1)2200(ns)2009200)10050(50t)1n(tTmaxm1
18、iipipeline)(ns2201TnTP1pipeline 45.45%1154400TPmtTPEm1ii(2)瓶颈在 3、4 段。变成八级流水线(细分)入 1 2 3 4 出 50ns 50ns 100ns 200ns 当对一个系统中的某个部件进行改进后所能获得的整个系统性能的提高受限于该部件的执行时间占总执行时间的百分比程序的局部性原理程序执行时所访问的存储器地址不是随机分布的而是相对地簇聚包括时间局部性和空间局部性算机称为宿主机上的微程序去解释实现另一台计算机称为目标机的指令系统流水线将一个重复的时序过程分解成为若干个子过程而每一个子过程都可有效地在其专用功能段上其它子过程同时执行
19、线性流水线指各段串行连接没有反馈要求而发生的冲突数据冲突当指令在流水线中重叠执行时因需要用到前面指令的执行结果而发生的冲突控制冲突流水线遇到分支指令或其它会改变值的指令所引起的冲突链接技术具有先写后读相关的两条指令在不出现功能部件冲突 850(ns)509850t1)(ntTmaxm1iipipeline)(ns851TnTP1pipeline 58.82%17108400TPmtiTPEm1i 重复设置部件 )(ns851TnTP1pipeline 58.82%1710885010400E 5、有一个流水线由 4 段组成,其中每当流经第 3 段时,总要在该段循环一次,然后才能流到第 4 段。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机系统 结构 重点 不完全 总结 计算机 原理
限制150内