欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    计算机体系结构名词解释大全.docx

    • 资源ID:28505431       资源大小:420.94KB        全文页数:60页
    • 资源格式: DOCX        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    计算机体系结构名词解释大全.docx

    Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-date计算机体系结构名词解释大全计算机体系结构名词解释大全名词解释:(1)静态流水线同一时间内,流水线的各段只能按同一种功能的连接方式工作。(2)分段开采当向量的长度大于向量寄存器的长度时,必须把长向量分成长度固定的段,然后循环分段处理,每一次循环只处理一个向量段。(3)计算机体系结构程序员所看到的计算机的属性,即概念性结构与功能特性(4)时间重叠在并行性中引入时间因素,即多个处理过程在时间上相互错开,轮流重叠地使用同一套硬件设备的各个部分,以加快硬件周转而赢得速度。(5)TLB个专用高速存储器,用于存放近期经常使用的页表项,其内容是页表部分内容的一个副本(6)结构冲突指某种指令组合因为资源冲突而不能正常执行(7)程序的局部性原理程序在执行时所访问的地址不是随机的,而是相对簇聚;这种簇聚包括指令和数据两部分。(8)2:1Cache经验规则大小为N的直接映象Cache的失效率约等于大小为N /2的两路组相联Cache的实效率。(9)组相联映象主存中的每一块可以放置到Cache中唯一的一组中任何一个地方(10)数据相关当指令在流水线中重叠执行时,流水线有可能改变指令读/写操作的顺序,使得读/写操作顺序不同于它们非流水实现时的顺序,将导致数据相关。(1)动态流水线同一时间内,当某些段正在实现某种运算时,另一些段却在实现另一种运算。(2)透明性指在计算机技术中,把本来存在的事物或属性,但从某种角度看又好像不存在的特性。(3)层次结构计算机系统可以按语言的功能划分为多级层次结构,每一层以不同的语言为特征。(4)资源共享是一种软件方法,它使多个任务按一定的时间顺序轮流使用同一套硬件设备。(5)快表个专用高速存储器,用于存放近期经常使用的页表项,其内容是页表部分内容的一个副本。(6)控制相关指由分支指令引起的相关,它需要根据分支指令的执行结果来确定后续指令是否执行。(7)存储层次采用不同的技术实现的存储器,处在离CPU不同距离的层次上,目标是达到离CPU最近的存储器的速度,最远的存储器的容量。(8)失效开销CPU向二级存储器发出访问请求到把这个数据调入一级存储器所需的时间。(9)全相联映象主存中的任一块可以被放置到Cache中任意一个地方。计算机组成指的是计算机组成的物理实现,包括物理机器中的数据流和控制流的组成以及逻辑设计等。系列机是指由同一厂家生产的具有相同体系结构的单具有不同不同组成和实现的一系列不同型号的机器。兼容机:不同制造商生产的具有相同系统结构的计算机。 软件兼容:同一个软件可以不加修改第运行于体系结构相同的各档及其,而且它们所获得的结果一样,差别只在于运行时间不同。向后前兼容是指按照某个时期投入市场的某种型号计算机编制的程序,不加修改的就能运行于再他之后前投入市场计算机。向上下兼容:指的是按照某档计算机编制的程序,不加修改就能运行于比他高低的计算机。模拟:是指用软件的方法在一台现有的计算机上实现另一台计算机的指令集。并行性:是指计算机系统在同一时刻或者同一时间间隔内进行多种运算或者操作。只要在实践上互相重叠,就存在并行性,他包含同时性和并发性两种含义同时性:两个或者两个以上的时间在同一时刻发生。并发性:两个或者两个以上的时间在同一时间间隔内发生。提高并行性的技术途径:(1)时间重叠:多个处理过程在时间上相互错开,轮流重叠地使用同一套硬件设备的各个部分,以加快硬件周转而赢得速度。(2)资源重复:通过重复设置资源,尤其是硬件资源,大幅度提高计算机系统的性能。(3)资源共享:是一种软件方法,它使多个任务按一定时间顺序轮流使用同一套硬件设备。3、计算机系统结构、计算机组成、计算机实现之间的关系:计算机系统结构指的是计算机系统的软、硬件的界面,即机器语言程序员所看到的传统机器级所具有的属性。计算机组成:指的是计算机系统结构的逻辑实现,包含物理机器级中的数据流和控制流的组成以及逻辑设计等。它着眼于物理机器级内各事件的排序方式与控制方式、各部件的功能以及各部件之间的关系。计算机的实现:指的是计算机组成的物理实现,包括处理机、主存等部件的物理结构,器件的集成度和速度,模块、插件、底板的划分与连接,信号传输,电源、冷却及整机装配技术等。它着眼于器件技术和微组装技术,其中器件技术在实现技术中起主导作用。4存储程序计算机(冯·诺依曼结构)采用存储程序原理,将程序和数据存放在同一存储器中。指令在存储器中按其执行顺序存储,由指令计数器指明每条指令所在的单元地址。1. 响应时间从事件开始到结束之间的时间,也称执行时间。2. 测试程序用于测试计算机性能的程序,可分为四类:真实程序、核心程序、小测试程序、合成测试程序。3. 测试程序组件选择一个各个方面有代表性的测试程序,组成一个通用的测试程序集合。这个通用的测试程序集合称为测试程序组件。4. 大概率事件优先此原则是计算机体系结构中最重要和最常用的原则。对于大概率事件(最常见的事件),赋予它优先的处理权和资源使用权,以获得全局的最优结果。5. 系统加速比系统改进前与改进后总执行时间之比。6. Amdahl定律加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中的所占的重要性。7. 程序的局部性原理程序在执行时所访问的地址不是随机的,而是相对簇聚;这种簇聚包括指令和数据两部分。8. CPI指令时钟数(Cycles per Instruction)。第二章1 CISC复杂指令集计算机。RISC精简指令集计算机。2 增强CISC指令功能主要是从以下几个方面着手:面向目标程序增强指令功能 a增强运算型指令的功能;b增强数据传送指令的功能;c增强程序控制指令的功能,丰富的程序控制指令为编程提供了多种选择。 1. CISC结构存在的缺点(1) 在CISC结构的指令系统中,各种指令的使用频率相差悬殊。(2) CISC结构指令系统的复杂性带来了计算机体系结构的复杂性,这不仅增加了研制时间和成本,而且还容易造成设计错误。(3) CISC结构指令系统的复杂性给VLSI设计增加了很大负担,不利于单片集成。(4) CISC结构的指令系统中,许多复杂指令需要很复杂的操作,因而运行速度慢。(5) 在CISC结构的指令系统中,由于各条指令的功能不均衡性,不利于采用先进的计算机体系结构技术(如流水技术)来提高系统的性能。数据表示:是计算机硬件能够直接识别、指令集可以直接调用的数据类型。所有数据类型中最常用、相对比较简单、用硬件实现比较容易的几种MIPS的寄存器(了解)P43页MIPS的数据寻址方式有那四种?寄存器寻址、立即数寻址、偏移量寻址、寄存器间接寻址哈弗曼编码方法的计算(1)码长表示法(2)码点表示法2设计RISC原则(1)选取使用频率最高的指令,并补充一些最有用的指令;(2)每条指令的功能应尽可能简单,并在一个机器周期内完成;(3)所有指令长度均相同;(4)只有Load和Store操作指令才访问存储器;(5)其它指令操作均在寄存器之间进行;(6)以简单有效的方式支持高级语言。数据表示:硬件能够直接识别、指令集可以直接调用的数据类型。MIPS寄存器有32个64位通用寄存器,提供了单精度和双精度(32位和64位)操作的指令;寻址方式:a.立即数寻址b.偏移量寻址c.寄存器间接寻址(0作偏移量)d.16位绝对寻址(R0作基址寄存器);指令格式:I类、R类、J类指令第三章1、流水技术是指:将一个重复的时序过程分解成为若干个子过程,而每个子过程都可有效地在其专用功能段上与其他子过程同时执行。流水线实现的五步:取指令、指令编译或寄存器读取、执行或有效地址计算、存储器访问或分支完成、写回2、指令流水线特点:(1) 流水线把一个处理过程分解成若干个子过程,每个子过程由专用的功能段实现;(2) 各个功能段所需时间应尽量相等,否则,时间长的功能段将成为流水线的瓶颈,会造成流水线的“堵塞”和“断流”。(3) 流水线每个功能部件后面都有一个缓冲寄存器(4) 流水技术适合于大量重复的时序过程,只有输入端能连续地提供任务,流水线的效率才能充分发挥。(5) 流水线需要有通过时间和排空时间3、流水线中的相关是指相邻或相近的两条指令因存在某种关联相关分类:(1)数据相关(2)名相关,包括反相关和输出相关(输出相关用换名技术来消除)(3)控制冲突 流水线冲突分类及对策:(1)结构冲突(2)数据冲突,包括写后读冲突、写后写冲突和读后写冲突,对策有定向技术、停顿(气泡法)和编译器解决(3)控制冲突,最简单方法冻结或排空4、流水线的分类(1)功能上;单功能流水线;多功能流水线(2)同一时段各段之间联系(对多功能来说):静态流水线、动态流水线;(3)级别上:部件级流水线、处理机级流水线、处理机间流水线;(4)按是否有反馈回路:线性流水线、非线性流水线;(5)按任务流入和流出顺序是否相同:顺序流水线、乱序流水线;5, 吞吐率是指单位时间内流水线所完成的任务数或输出结果的数量。最大吞吐率是指流水线在连续流动达到稳定状态后所得到的吞吐率。第五章 存储层次1、cache降低失效率的几种方法 增加块大小、提高相联度、victim cache、伪相联 cache、硬件预存、编译器控制的预存、编译器优化2、子块放置技术:把Cache块进一步划分为更小的块(子块),并给每个子块赋予一位有效位,用于指明该子块中的数据是否有效。Cache与下一级存储器之间以子块为单位传送数据。但标识仍以块为单位4、减少失效开销技术让读失效优先于写子块放置技术请求字处理技术非阻塞Cache技术采用两级Cache5、请求字优先:调块时,从请求字所在的位置读起。这样,第一个读出的字便是请求字。将之立即发送给CPU从执行程序的角度来看,并行性等级从低到高可分为:(1)指令内部并行:单条指令中各微操作之间的并行。(2)指令级并行:并行执行两条或两条以上的指令。(3)线程级并行:并行执行两个或两个以上的线程。通常是以一个进程内派生的多个线程为调度单位。(4)任务级或过程级并行:并行执行两个或两个以上的过程或任务(程序段)以子程序或进程为调度单元。(5)作业或程序级并行:并行执行两个或两个以上的作业或程序。 1存储器层次结构设计技术的基本依据是程序的 局部性 原理,它包含时间局部性 和空间局部性两方面。2伪相联既能获得多路组相联 cache的命中率,又能保持直接映像 cache的命中速度。3CPU中用来存储操作数的存储单元主要有寄存器、 堆栈和累加器 。4将计算机系统中某一功能的处理速度提高到原来的20倍,但该系统的处理时间仅占整个系统运行时间的40%,则采用此提高性能的方法后,能使整个系统的性能提高到原来的 1.61 倍。5虚拟存储器采用 全相联 映像规则,写策略采用 写回策略 。1. 计算机系统的多层结构从高到低可以分为应用语言虚拟机 高级语言虚拟机 , 汇编语言虚拟机 ,操作系统机器级,传统机器级和 微程序机器级 。2并行性包含 同时性 和 并发性 二重含义。3系列机软件必须保证 向后 兼容。4某计算机系统采用浮点运算部件后,使浮点运算速度提高到原来的20倍,而系统运行某一程序的整体性能提高到原来的5倍,则该程序中浮点操作所占的比例是 84.2% 。系统加速比是 5 。5由软件实现的机器称为 虚拟机 。在一个计算机系统中,低层机器的属性对高层机器的程序员往往是的 透明的 。集中式共享存储器结构(centralized shared memory architecture):这类多处理机在目前至多有几十个处理器,可通过大容量的cache和总线互连使各处理器共享一个单独的集中式存储器。 物理上分离的多个存储器可作为一个逻辑上共享的存储空间进行编址,每个处理器可以访问任何一个其他的局部存储器。这类机器的结构被称为分布式共享存储器(DSM,distributed shared memory)或可缩放共享存储器(SSM,scalable shared memory)体系结构。整个地址空间由多个独立的地址空间构成,它们在逻辑上也是独立的,远程的处理器不能对其直接寻址。在这种机器的不同处理器中,相同的物理地址指向不同存储器的不同单元,每一个处理器、存储器模块实际上是一个单独的计算机,因而这种机器也称为多计算机(multicomputers)。通讯延迟:发送开销跨越时间传输延迟接收开销。迁移是把远程的共享数据项的拷贝放在一个本处理器局部的cache中使用,从而可降低对远程共享数据的访问延迟。复制是把多个处理器需要同时读取的共享数据项的拷贝放在各自局部cache中使用,复制不仅降低了访存的延迟,也减少了访问共享数据时的产生的冲突。目录(directory):物理存储器中用来保存共享数据块的状态及相关信息的数据结构。监听(snooping):每个cache除了包含物理存储器中块的数据拷贝外,也保存着各个块的共享状态信息。Cache通常连在共享存储器的总线上,各个cache控制器通过监听总线来判断它们是否有总线请求的数据块。在一个处理器写某个数据项之前保证它对此数据项有唯一的访问权,对应这种方法的协议称为写作废(write invalidate)协议。cache块拥有唯一的拷贝的处理器通常称为这个cache块的拥有者(ower)。处理器的写操作使其成为对应cache块的拥有者。原子性(atomic),即操作运行过程中不能被打断,例如将写失效的检测、申请总线连接、接收响应作为一个单独的原子操作。基于目录的相关性协议称为全映射(full map)。原子交换(atomic change):将一个存储单元的值和一个寄存器的值进行交换。建立一个锁,锁值为0表示开锁,为1表示上锁。旋转锁是指处理器环绕一个锁不停地旋转而试图获得该锁。栅栏(barrier)同步:是一个同步操作,它强制所有到达该栅栏的进程进行等待,直到全部的进程到达栅栏,然后释放全部的进程,从而形成同步。组合树是多个请求在局部结合起来形成树的一种分级结构,它降低冲突的原因是将大冲突化解成为并行的多个小冲突。排队记录等待的进程,当锁释放时送出一个已确定的等待进程,这种机制称为排队锁(queuing lock)。一个处理器对变量的写和另一个处理器对该变量的访问(读或写)由一对同步操作分开,其中一个在写操作后执行,另一个在别的处理机访问之前执行,则称数据访问有序。无同步操作排序变量可能提前被刷新,这种情况称为数据竞争(data race),从而对于同步的程序可称之为无数据竞争(dataracefree)。称与解锁相对应的同步操作为释放(release)与加锁相对应的则称为获取(acquire)。防护(fence)是计算过程中的固定点,用来保证无读或写穿过防护点。预取能返回最新数据值,并且保证对数据实际的存储器访问返回的是最新的数据项,则被称为非绑定的(nonbinding)。互连网络是将集中式系统或分布式系统中的结点连接起来所构成的网络,这些结点可能是处理器、存储模块或其它设备,它们通过互连网络进行信息交换。静态网络由点和点直接相连而成,这种连接方式在程序执行过程中不会改变。动态网络是用开关通道实现的,它可动态地改变结构,使其与用户程序中通信要求匹配。与结点相连接的边的数目称为结点度(node degree)。链路或通路是指网络中连接两个结点并传送数字信号的通路。在单向通道的情况下,进入结点的通道数叫做入度(in degree),而从结点出来的通道数则称为出度(out degree),结点度是这两点之和。结点度应尽可能地小并保持恒定。网络中任意两个结点间最短路径长度的最大值称为网络直径。网络直径应当尽可能地小。在将某一网络切成相等两半的各种切法中,沿切口的最小通道边数称为通道等分宽度(channel bisection width)。对于一个网络,如果从其中的任何一个结点看,拓朴结构都是一样的话,则称此网络为对称网络。计算/通讯比:是衡量并行程序性能的尺度,是应用程序中相对于每次数据通信需要进行的计算。 路由(routing):在网络通信中对路径的选择与指定。置换(permutation):指对象的重新排序。 虫蚀(wormhole):把包进一步分成小片,硬件路由器有片缓冲区,同一个包中所有片象不可分离的同伴一样,以流水方式顺序传送。只有片头包含目标地址,所有片必须跟随片头。存储转发:是指每个结点有一个包缓冲区,包先进入缓冲区,当所需要的输出通道和接收结点的包缓冲区可用时,就将它传输给下一结点。维序:按多维网络维序的特定顺序来选择后续通道。由于唯一性,可能产生死锁。虚拟自适应:将一个物理通道分成几个虚拟的通道,根据后续各虚拟通道的忙闲情况自适应选择后续通道。线性阵列(linear array):是一种一维的线性网络,其中n个结点用n1个链路连成一行。如果多级网络通过重新安排连接方式可以建立所有可能的输入输出之间的连接,则称之为非阻塞网络(nonblocking network)。粗粒度:每台处理机所执行的程序为20秒以上,共享主存。中粒度:每台处理机所执行的程序为10毫秒以上,消息传递。细粒度:并行性高,在几个微秒量级,但通信开销大。指令级并行(instruction level parallelism ILP):指令序列中存在的潜在并行性。循环级并行:循环体指令之间的并行性。指令调度:通过改变指令在程序中的位置,将相关指令之间的距离加入到不小于指令执行延迟的时钟数,这样就可以将相关指令转化为实际上无关指令。循环展开:通过多次复制循环体并改变结束条件来相对增加有效操作时间。名相关:如果两条指令使用相同的名,但是它们之间并没有数据流。包括反相关和输出相关。指令使用的寄存器或存储器称为名。反相关:指令i先执行,指令j写的名是指令i读的名。WAR输出相关:指令j与指令i写的名相同。WAW重命名技术:通过改变指令中操作数的名来消除名相关。控制相关:是指分支指令引起的相关。动态调度:通过硬件重新安排指令的执行顺序,来调整相关指令实际执行的关系,减少处理器的空转。记分牌(scoreboarding):指令运行所需的资源满足并且没有数据相关,允许指令乱序执行,并同时记录指令运行状态的技术。寄存器重命名:一条指令流出时,存放操作数的寄存器被重命名为对应于该存储器保留站的名称(编号)的过程。动态分支预测:一种给予历史记录的分支预测,它解决记录一个分支指令的历史和决定预测的分支的一个问题的两个方面。分支目标缓冲(PTB):将分支成功的分支指令的地址和它的分支目标地址都放到一个缓冲中保存起来,缓冲区分支指令的地址作为标示。前瞻(speculation)执行:允许在处理器还未判断指令是否能执行之前就提前执行,以克服控制相关。保留站:用于保存等待流出和正在流出的指令所需的操作数。再定序缓冲:在前瞻执行的指令之间传送结果的一套额外的硬件缓冲,保存指令执行完毕到指令得到确认之间的所有指令及结果。超标量(superscalar):每个时钟流出的指令不定。超流水(super pipeling):是指每个功能部件进一步流水化,使得一个功能部件在一拍中可以处理多条指令。超长指令字VLIW(very long instruction word):每个时钟周期流出的指令数是固定的,它们构成一条长指令,或者是一个混合的指令包。DLX标量:每个时钟流出两条指令。The compiler technique to create sdditional instruction-level parallelism for a loop is simply called loop unrolling.The hardware technique to create additional instruction-level parallism for a loop is simply called register renaming.Reservation stations: buffers hold instructions and operands that have been issued and are awaiting execution at a functional unit.A recurrence is when a variable is defined based on the value of that variable in an earlier iteration, often the one immediately preceeding, as in the above fragment.As an example, a simple and sufficient test for the absence of a dependence is the greatest common divisor (GCD) test.软件流水:是一项重构造相互重叠进行的软件流水性代码的循环,使其指令从原始的循环中的不同重复中选取的技术。路径调度是用一项通过不同于循环分支的条件分支发觉并行的技术,扩展可循环展开。路径:试图去发觉一个可能的其操作将被放入一个小数目的指令集基本程序块的顺序称为路径(trace),须子此路径称为路径选择(trace selection)。路径精简:试图去精简路径到一个小数目的广泛的指令集的过程(trace compaction)a set of status, called poison bits, are attached to the result registers written by speculated instructions when the instructions cause exceptions.An alternative is to move instructions past branches, flagging them as speculative, and providing renaming and buffering in the hardware, much as Tomasulos algorithm does. This concept has been called boosting(推进).Adding this commit phase to the instruction execution sequence requires some changes to the sequence as well as an additional hardware buffer, called the reorder buffer, to hold the results of instructions that have finished execution but have not committed.31 术语1. 流水线:将一个重复的时序过程,分解为若干个子过程,而每一个子过程都可有效地在其专用功能段上与其他子过程同时执行。2. 单功能流水线:只能完成一种固定功能的流水线。3. 多功能流水线:流水线的各段可以进行不同的连接,从而使流水线在不同的时间,或者在同一时间完成不同的功能。4. 静态流水线:同一时间内,流水线的各段只能按同一种功能的连接方式工作。5. 动态流水线:同一时间内,当某些段正在实现某种运算时,另一些段却在实现另一种运算。6. 部件级流水线:(运算操作流水线)把处理机的算术逻辑部件分段,以便为各种数据类型进行流水操作。7. 处理机型流水线:(指令流水线)把解释指令的过程按照流水方式处理。8. 处理机间流水线:(宏流水线)由两个以上的处理机串行地对同一数据流进行处理,每一个处理机完成一项任务。9. 线形流水线:指流水线的各段串行连接,没有反馈回路。10. 非线形流水线:指流水线中除有串行连接的通路外,还有反馈回路。11. 标量流水处理机:处理机不具有向量数据表示,仅对标量数据进行流水处理。12. 向量流水处理机:处理机具有向量数据表示,并通过向量指令对向量的各元素进行处理。13. 结构相关:某些指令组合在流水线中重叠执行时,长生资源冲突,则称该流水线有结构相关。14. 数据相关:当指令在流水线中重叠执行时,流水线有可能改变指令读/写操作的顺序,使得读/写操作顺序不同于它们非流水实现时的顺序,将导致数据相关。15. 定向:将计算结果从其产生的地方直接送到其他指令需要它的地方,或所有需要它的功能单元,避免暂停。两条指令i,j,i在 j前进入流水线。16. RAW:j执行要用到i的结果,但当其在流水线中重叠执行时,j可能在I写入其结果之前就先行对保存该结果的寄存器进行读操作,得到错误值。17. WAW:j、I的操作数一样,在流水线中重叠执行时,j可能在I写入其结果之前就先行对保存该结果的寄存器进行写操作,导致写错误。18. WAR:j可能在I读某个寄存器之前对该寄存器进行写操作,导致I读出数据错误。32 答:1. 流水过程由多个相联系的子过程组成。 2. 每个子过程由专用的功能段实现。 3. 各个功能段所需时间尽量相等。 4. 流水线有“通过时间”(第一个任务流出结果所需的时间)。在此之后流水过程 才进入稳定工作状态,一拍流出一个结果。 5. 流水技术适合于大量重复的时序过程,只有输入端连续提供任务,流水线效率 才可充分发挥。33 答:工作原理:把一条DLX指令在5个周期内实现,将每一个时钟周期看作是流水 线的一个时钟周期,硬件每个时钟周期启动一条新的指令,并执行5条不同指令 中的某一部分。每条指令虽仍需5个时钟周期完成,但提高了吞吐率,实现了流水。instr./clock123456789IIFIDEXMEMWBI+1IFIDEXMEMWBI+2IFIDEXMEMWBI+3IFIDEXMEMWBI+4IFIDEXMEMWB34 答:指令多周期实现可以降低时钟周期时间,单周期实现则可降低CPI,同时延长时 钟周期。单周期实现可以省去一些临时寄存器,但是对多数机器而言,单周期实 现并非十分有效,因为不同指令完成的操作与所需时钟周期时间都不同。单周期 实现必须重复设置指令执行功能部件,多周期实现可采用流水技术共享功能单元。35 答:(1)流水化功能单元 (2)资源重复36 解:(1)在流水线中尽早判断出分支转移是否成功; (2)尽早计算出分支转移成功时的PC值(即分支的目标地址)l “冻结”“排空”流水线的方法l 预测分支失败l 预测分支成功l 延迟分支37 答:1、从前调动:分支必须不倚赖于被调度的指令,总是可以有效提高流水线性能。 2、从目标处调度:若分支转移失败,必须保证被调度的指令对程序的执行没有影 响,可能需要复制被调度指令。分支转移成功时,可提高流水线性能。但由于 复制指令,可能加大程序空间。 3、从失败处调度:若分支转移成功,必须保证被调度的指令对程序的执行无影响。 分支转移失败时,可提高流水线性能。38 答:1、水平处理方式:若向量长度为N,则水平处理方式相当于执行N次循环。若 使用流水线,在每次循环中可能出现数据相关和功能转换,不适合对向量进行 流水处理。 2、垂直处理方式:将整个向量按相同的运算处理完毕之后,再去执行其他运算。 适合对向量进行流水处理,向量运算指令的源/目向量都放在存储器内,使得 流水线运算部件的输入、输出端直接与存储器相联,构成M-M型的运算流水 线。 3、分组处理方式:把长度为N的向量分为若干组,每组长度为n,组内按纵向方 式处理,依次处理各组,组数为,适合流水处理。可设长度为n的向 量寄存器,使每组向量运算的源/目向量都在向量寄存器中,流水线的运算部 件输入、输出端与向量寄存器相联,构成R-R型运算流水线。 -

    注意事项

    本文(计算机体系结构名词解释大全.docx)为本站会员(豆****)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开