欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    流水线结构精选文档.ppt

    • 资源ID:69412054       资源大小:1.61MB        全文页数:40页
    • 资源格式: PPT        下载积分:18金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要18金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    流水线结构精选文档.ppt

    流水线结构本讲稿第一页,共四十页内容简介内容简介 计算机系统结构是指机器语言一级的计算机系统结构是指机器语言一级的程序员所看到的计算机属性。本章详细介程序员所看到的计算机属性。本章详细介绍流水线技术,包括先行控制技术、流水绍流水线技术,包括先行控制技术、流水线原理、流水线性能分析、相关和相关的线原理、流水线性能分析、相关和相关的处理方法、超标量处理机和超流水线处理处理方法、超标量处理机和超流水线处理机等。讨论系统结构中的并行性问题、单机等。讨论系统结构中的并行性问题、单机和多机系统中并行处理的实现以及突破机和多机系统中并行处理的实现以及突破冯冯诺依曼型结构的新型计算机系统结构。诺依曼型结构的新型计算机系统结构。从而了解新一代计算机的发展动向。从而了解新一代计算机的发展动向。本讲稿第二页,共四十页8-4 新型计算机系统结构8-3 多处理机8-2 向量处理机8-1 流水线技术本章主要内容本讲稿第三页,共四十页流水线技术流水线技术 提高计算机的处理速度就要提高处理提高计算机的处理速度就要提高处理机指令执行的速度,人们采取的办法通机指令执行的速度,人们采取的办法通常有三种:常有三种:1提高处理机的工作主频。提高处理机的工作主频。2采采用用更更好好的的算算法法和和设设计计更更好好的的功功能能部部件。件。3采用指令级并行技术。采用指令级并行技术。3 3是是目目前前和和将将来来提提高高处处理理机机指指令令执执行行速度的一条主要途径。速度的一条主要途径。本讲稿第四页,共四十页8-1-1 先行控制技术先行控制技术1 1指令的重叠执行方式指令的重叠执行方式 处处理理机机在在执执行行多多条条指指令令时时,有有多多种种执执行行控控制制方方式式:顺顺序序方方式式、重重叠叠方方式式、先先行行控控制制方方式式、流流水水线线控控制制方方式式等等,我我们们先先从从最最简简单单的的来来讲讲。一一条条指指令令的的执执行行过过程程可可以以分分为为多多个个阶阶段段,通常,把通常,把条指令的执行过程分为条指令的执行过程分为3 3个阶段。个阶段。取指令分析指令执行指令时间t本讲稿第五页,共四十页 取取指指令令阶阶段段:按按照照指指令令计计数数器器的的内内容容访访问问主主存存储储器器,取取出出一一条条指指令令送送到到指指令令寄寄存器。存器。分分析析指指令令阶阶段段:对对指指令令的的操操作作码码进进行行译译码码后后,按按照照给给定定的的寻寻址址方方式式和和地地址址字字段段中中的的内内容容形形成成操操作作数数的的地地址址,并并用用这这个个地地址址读读取取操操作作数数,操操作作数数可可能能在在主主存存储储器或寄存器中。器或寄存器中。指指令令阶阶段段:是是指指根根据据操操作作码码的的要要求求,完完成成指指令令规规定定的的功功能能,在在此此期期间间,要要把把运运算结果写到寄存器或主存储器中。算结果写到寄存器或主存储器中。本讲稿第六页,共四十页指令的几种执行方式本讲稿第七页,共四十页 假设取指令、分析指令和执行指令的时间都相等,每段的时间都为t,执行一条指令的时间为T1,则T1=t取指令+t分析指令+t执行指令=3t,(1)顺序执行方式如图82(a)所示,采用顺序执行方式执行n条指令所用时间为:Tn=3tn=3nt (2)一次重叠执行方式如图82(b)图所示。这是一种最简单的重叠方式,把执行第k条指令与取第k十1条指令同时进行。则执行n条指令所用的时间为:Tn=3t+2t(n-1)=(1+2n)t(3)二次重叠执行方式。如图82(c)所示,我们如果把取第k十1条指令提前到与分析第k条指令同时进行,那么,分析第k十l条指令会与执行第k条指令同时进行,则执行n条指令所用的时间为:T=3t+t(n-1)=(2+n)t本讲稿第八页,共四十页 采用一次重叠执行方式,指令的执行时间缩短了近二分之,而且各功能部件在并行工作,利用率明显提高。采用二次重叠执行方式能够将指令的执行时间缩短近三分之二,进步提高了指令的执行速度。但是处理机中同时在取指令、分析和执行指令,因此,要把顺序执行方式中的一个集中的指令控制器分解为三个相对独立的控制器来同时发出三种控制信号,它们是主存储控制器,指令控制器,运算控制器。另外,在指令分析或指令执行过程中都要访问主存储器取指令,存在解决访问主存储器的冲突问题。现现代代计计算算机机的的指指令令系系统统非非常常复复杂杂,我我们们前前面面假假设设的的情情况况是是一一种种理理想想状状态态,在在实实际际当当中中,各各种种指指令令难难以以做做到到“分分析析”与与“执执行行”时时间间始始终终相相等等,所所以以二二次次重重叠叠执执行行方方式式是是种种理理想想的的指指令令执执行行方方式。式。本讲稿第九页,共四十页2 2先行控制技术先行控制技术 要要解解决决二二次次重重叠叠执执行行方方式式中中存存在在的的访访问问主主存存储储器器的的冲冲突突问问题题,方法有三种:方法有三种:第第一一,把把主主存存储储器器分分成成两两个个独独立立编编址址的的存存储储器器,一一个个专专门门存存放放指指令令,称称为为指指令令存存储储器器,另另一一个个专专门门存存放放操操作作数数,称称为为数数据据存存储储器器。两两个个存存储储器器同同时时独独立立访访问问,解解决决了了取取指指令令和和读读操作数的冲突。操作数的冲突。第第二二,指指令令和和数数据据仍仍然然混混合合存存放放在在同同一一个个主主存存作作储储器器内内,采采用用低低位交叉存取方式。位交叉存取方式。第三,解决访问存储器冲突的根本办法是处理机结构作较大第三,解决访问存储器冲突的根本办法是处理机结构作较大的改变,采用先行控制技术。的改变,采用先行控制技术。本讲稿第十页,共四十页 先先行行控控制制的的基基本本思思想想是是使使分分析析部部件件和和执执行行部部件件能能分分别别连连续续不不断断地地分分析析和和执执行行指指令令,这这种种技技术术实实际际上上是是预预处处理理技技术术和和缓缓冲冲技技术术的的结结合合,即即通通过过对对指指令令流流和和数数据据流流的的预预处处理理和和缓缓冲冲,能能够够尽尽量量使使指指令令分分析析器器和和指指令令执执行行部部件件独独立立地地工工作作,并并始始终终处处于于忙忙碌碌状状态态。这这样样,就就能能够够使使取取指指令令、分分析析指指令令和和执执行行指指令令重重叠叠起起来来执执行行。使使指指令令分分析析器器和和执执行行部部件件能能尽尽量量地地连连续续工工作作。而而且且,在在采采用用了了缓缓冲冲技技术术和和预预处处理理技技术术之之后后,运运算算器器能能够够专专心心干干数数据据的的运运算算、从从而而大大幅幅度度提提高高指指令令的的执执行行速速度度。在在正常情况下,处理机中同时有三条指令在执行。正常情况下,处理机中同时有三条指令在执行。先先行行控控制制技技术术最最早早在在IBM公公司司研研制制的的机机器器中中采采用用。目目前前,先先行行控控制制技技术术是是现现代代计计算算机机系系统统中中被被普普遍遍采采用用的的一一项项重重要要技技术术,许许多多处处理理机机中中都都已已经经采采用用了了这这种种技技术术,包包括括超超流流水水线线处处理理机机和和超标量处理机等超标量处理机等。本讲稿第十一页,共四十页8-1-2 流水流水线线 流流水水处处理理技技术术是是在在重重叠叠、先先行行控控制制方方式式的的基基础础上上发发展展起起来来的的,它它基基于于重重叠叠的的原理,但却是在更高程度上的重叠。原理,但却是在更高程度上的重叠。流流水水线线方方式式是是把把一一个个重重复复的的过过程程分分解解为为若若干干个个子子过过程程,每每个个子子过过程程可可以以与与其其他他子子过过程程同同时时进进行行。由由于于这这种种工工作作方方式式与与工工厂厂中中生生产产流流水水线线十十分分相相似似,因因此此,把它称为流水线工作方式。把它称为流水线工作方式。本讲稿第十二页,共四十页1 1流水线工作原理流水线工作原理 根据上面的重叠技术和先行控制技术根据上面的重叠技术和先行控制技术,进一步发展应用就是标进一步发展应用就是标量流水技术。假如把一条指令的解释过程进一步细分成量流水技术。假如把一条指令的解释过程进一步细分成取指、译取指、译码、执行、访存、写回寄存器码、执行、访存、写回寄存器五个子过程,并用五个独立的功能五个子过程,并用五个独立的功能部件分别处理每个子过程。那么就像工厂中的流水线,五个子部件部件分别处理每个子过程。那么就像工厂中的流水线,五个子部件可以同时对不同的五条指令中的相对应的子过程进行操作。可以同时对不同的五条指令中的相对应的子过程进行操作。在流水技术中有如下一些特点:在流水技术中有如下一些特点:(1 1)一条流水线由多个流水段组成。)一条流水线由多个流水段组成。(2 2)每个流水段有专门的功能部件对指令进行某种加工。)每个流水段有专门的功能部件对指令进行某种加工。(3 3)各流水段所需时间是一样的。)各流水段所需时间是一样的。(4 4)在在理理想想情情况况下下,在在流流水水线线上上,每每隔隔tt时时间间将将会会有有一一个个结结果果流流出流水线。出流水线。本讲稿第十三页,共四十页 描述流水线常用的方法是用描述流水线常用的方法是用“时空图时空图”。在时空图中,横坐。在时空图中,横坐标表示时间,也就是输入到流水线中的各个任务在流水线中所经标表示时间,也就是输入到流水线中的各个任务在流水线中所经过的时间。当流水线中的各个功能部件的执行时间都相等时、横过的时间。当流水线中的各个功能部件的执行时间都相等时、横坐标被分割成相等长度的时间段,纵坐标表示空间,即流水线的坐标被分割成相等长度的时间段,纵坐标表示空间,即流水线的各个子过程。在时空图中,流水线的一个子过程通常称为各个子过程。在时空图中,流水线的一个子过程通常称为“功能功能段段”。前面的例子用时空图描述如图。前面的例子用时空图描述如图8-3所示。所示。本讲稿第十四页,共四十页2 2流水线的分类流水线的分类 从不同的角度,按照不同的观点可以把流水线分成多种不同的种类。从名称上能反映这种流水线在某一方面的特点或性能。(1)按流水线结构分类 如图8-4(a)所示,按照流水线的各个功能段之间是否有反馈信号,可以把流水线分为线性与非线性流水线两类。线性流水线中,输入数据从流水线的一端进入,另一端输出,各功能段逐个串接起来。如图8-4(a)所示,这种方式下,数据在流水线中的各个功能段仅仅流过一次。所以通常一条线性流水线只能完成种固定的功能。非线性流水线中,除有串行连接通路外,还有反馈回路,在流水过程中,某些功能段要重复使用。如图8-4(b)所示,功能段S2的输出又被反馈回送给S2的输入端。因为,功能段S2可能要被多次调用,所以这时流水线中数据由输入端到输出端不再是经过原来的三个时钟周期,还要加上反馈回路多次调用的执行周期。本讲稿第十五页,共四十页 非线性流水线中,除有串行连接通路外,还有反馈回路,在非线性流水线中,除有串行连接通路外,还有反馈回路,在流水过程中,某些功能段要重复使用。如图流水过程中,某些功能段要重复使用。如图8-4(b)所示,功能段)所示,功能段S2的输出又被反馈回送给的输出又被反馈回送给S2的输入端。因为,功能段的输入端。因为,功能段S2可能要被多可能要被多次调用,所以这时流水线中数据由输入端到输出端不再是经过原来的三次调用,所以这时流水线中数据由输入端到输出端不再是经过原来的三个时钟周期,还要加上反馈回路多次调用的执行周期。个时钟周期,还要加上反馈回路多次调用的执行周期。图84 线性与非线性流水线本讲稿第十六页,共四十页 在非线性流水线中,只用图8-4(b)这样一种连接图不能表示出一个任务在非线性流水线中的实际流动的过程,还要用一张“预约表”,两者共同来表示流水线的工作情况。在预约表中可以很清楚地表示出反馈回路的使用次数。如图8-5所示,它表示图8-4(b)中S2在反馈回路仅重复使用次的预约表,图中用“”表示功能段在相应的这一段时间内有效,即任务经过了这一个功能段。条非线性流水线可以对应有很多张预约表,一张预约表表示非线性流水线的一种工作方式。图85 非线性流水线预约表本讲稿第十七页,共四十页3 3流水线的性能流水线的性能 衡量流水线性能的主要指标有吞吐率、加速比和效率。衡量流水线性能的主要指标有吞吐率、加速比和效率。(1 1)流水线吞吐率)流水线吞吐率最最大大吞吞吐吐率率指指流流水水线线达达到到稳稳定定状状态态后后,单单位位时时间间内内处处理理的的任任务务总总数数。实实际际吞吞吐吐率率是是指指单单位位时时间间内内能能处处理理的的任任务务数数或或输输出出结结果果的的数数量量,它它总总是是小小于于最最大大吞吞吐吐率率。因因为为流流水水线线有有“装装入入时时间间”和和“排排空空时时间间”,以及其他因素也会影响流水线的连续流动。,以及其他因素也会影响流水线的连续流动。(2)加加速速比比:不不使使用用流流水水线线所所用用的的时时间间与与使使用用流流水水线线所所用用的的时时间间之之比比称称为为流流水水线线的的加加速速比比,即即采采用用流流水水方方式式后后的的工工作作速速度度与与顺顺序序串行方式的工作速度之比。串行方式的工作速度之比。(3)流水线效率:指流水线中各功能部件的利用率。)流水线效率:指流水线中各功能部件的利用率。本讲稿第十八页,共四十页4 4数据相关与控制相关数据相关与控制相关 由于流水线中同时要处理多条指令,所以各种各样的由于流水线中同时要处理多条指令,所以各种各样的冲突几率就会很大,比如在执行一条指令的过程中,如冲突几率就会很大,比如在执行一条指令的过程中,如果用果用到的指令、操作数、变址偏移量等正好是前面指令的执到的指令、操作数、变址偏移量等正好是前面指令的执行结果,行结果,则必须等待前面的指令执行完成,并把结果写到则必须等待前面的指令执行完成,并把结果写到主存或通用寄存器中之后,本条指令才能开始执行;当后主存或通用寄存器中之后,本条指令才能开始执行;当后继指令的操作数刚好是前一指令的运算结果的情况下,也继指令的操作数刚好是前一指令的运算结果的情况下,也会发生不协调的情况等等,类似这些冲突我们称之为相关。会发生不协调的情况等等,类似这些冲突我们称之为相关。在在流流水水线线中中相相关关分分为为两两大大类类,类类是是数数据据相相关关,另另一一类类是控制相关。流水线技术必须较好的解决解这些相关问题。是控制相关。流水线技术必须较好的解决解这些相关问题。本讲稿第十九页,共四十页(1)数据相关)数据相关 在在采采用用先先行行控控制制方方式式的的处处理理机机中中,数数据据相相关关有有四四种种情情况况:它它们们是是指指令令相相关关、主主存存操操作作数数相相关关、通通用用寄寄存存器器相相关关和和变变址址相相关关等等。解解决数据相关的方法有两种:决数据相关的方法有两种:一一种种方方法法是是推推后后分分析析法法,即即在在遇遇到到数数据据相相关关时时,就就停停顿顿后后继继指指令令的的执执行行,直直到到前前面面指指令令的的结结果果已已经经生生成成后后再再继继续续。另另一一种种方方法法是是设设置置专专用用路路,即即旁旁路路技技术术,:就就是是使使用用专专门门设设置置的的通通路路将将产产生生的的结结果果直直接接送送往往需需要要它它的的地地方方而而不不是是通通过过寄寄存存器器再再访访问问,这这样样就就可可使使流流水水线线不不发生停顿。发生停顿。在在按按序序流流动动的的流流水水线线中中,只只可可能能出出现现主主操操作作数数相相关关。可可通通过过定定向向传传送送的的方方法法解解决决。在在非非按按序序流流动动的的流流水水线线中中,则则各各种种相相关关都都可可能能发发生生。在在RISC机机流流水水线线中中,还还存存在在一一种种装装入入延延迟迟。解解决决这这种种装装入入延延迟迟的的办办法法是是采采用用硬硬件件联联锁锁或或重重排排指指令令的的优优化化编编译方法。译方法。本讲稿第二十页,共四十页(2)控制相关)控制相关 控制相关是指由条件分支指令、转子程序指控制相关是指由条件分支指令、转子程序指令、中断等引起的相关。例如:在执行条件转移令、中断等引起的相关。例如:在执行条件转移指令,前一条指令还没有生成条件码,当转移发指令,前一条指令还没有生成条件码,当转移发生时,将使流水线的流动受到破坏。为了减少因生时,将使流水线的流动受到破坏。为了减少因转移引起的流水线性能损失,可采用下述方法:转移引起的流水线性能损失,可采用下述方法:一种是同数据相关的推后法。另一种是猜测一种是同数据相关的推后法。另一种是猜测法。尽早判别转移是否发生,尽早生成转移目标法。尽早判别转移是否发生,尽早生成转移目标地址,加快和提前形成条件码。推后法实现起来地址,加快和提前形成条件码。推后法实现起来简单,但是由于等待而降低了流水线效率,其他简单,但是由于等待而降低了流水线效率,其他解决相关的方法在控制上要复杂一些。解决相关的方法在控制上要复杂一些。本讲稿第二十一页,共四十页8-1-3 超标量处理机与超流水线处理机超标量处理机与超流水线处理机 一般的流水线处理机只有一条指令流水线,一个多一般的流水线处理机只有一条指令流水线,一个多一般的流水线处理机只有一条指令流水线,一个多一般的流水线处理机只有一条指令流水线,一个多功能的操作部件,每个时钟周期功能的操作部件,每个时钟周期功能的操作部件,每个时钟周期功能的操作部件,每个时钟周期“取指令取指令取指令取指令”和和和和“分析分析”完成完成一条指令。另一种流水线处理机虽然也只有一条一条指令。另一种流水线处理机虽然也只有一条指令流水线,每个时钟周期指令流水线,每个时钟周期“取指令取指令取指令取指令”和和和和“分析分析”完成一完成一完成一完成一条指令,但是有多个独立的操作部件,可以同时并条指令,但是有多个独立的操作部件,可以同时并条指令,但是有多个独立的操作部件,可以同时并条指令,但是有多个独立的操作部件,可以同时并行工作,例如,定点算术逻辑部件、浮点加减法部行工作,例如,定点算术逻辑部件、浮点加减法部行工作,例如,定点算术逻辑部件、浮点加减法部行工作,例如,定点算术逻辑部件、浮点加减法部件、乘除法部件、取数存数部件等。这种处理机通件、乘除法部件、取数存数部件等。这种处理机通件、乘除法部件、取数存数部件等。这种处理机通件、乘除法部件、取数存数部件等。这种处理机通常称为多操作部件处理机。常称为多操作部件处理机。常称为多操作部件处理机。常称为多操作部件处理机。本讲稿第二十二页,共四十页(1)超标量处理机 超标量处理机:一个时钟周期内能够同时发射多条指令的处理机称为超标量处理机。超标量处理机最基本的要求是必须有两套或两条以上完整的指令执行部件,它是利用硬件资源重复来实现空间的并行操作。主要特点是:有多个性能不同的处理部件,将可并行执行的指令送往不同的执行部件,形成多条流水线并行处理。由于超标量处理机在一个时钟周期内能够发射多条指令,因此,它对指令序列的要求与单流水线的标量处理机不同。在单流水线的标量处理机中,只有连续出现相同操作的指令序列时,流水线才能不“断流”,功能部件的效率才能得到充分发挥。(2)超流水线处理机 超流水线处理机的工作方式与超标量处理机不同,在一个时钟周期内能够分时发射多条指令的处理机称为超流水处理机。它只需要增加少量硬件,通过各部分硬件的充分重叠工作来提高处理机性能。而超流水线处理机采用的是时间并行性。为了进一步提高处理机的指令级并行度、可以把超标量技术与超流水线技术结合在一起,这就是超标量超流水线处理机。本讲稿第二十三页,共四十页8-2-1 向量流水的基本概念向量流水的基本概念1 1向量数据向量数据 向向向向量量量量数数数数据据据据是是是是一一一一组组组组不不不不相相相相关关关关数数数数据据据据的的的的集集集集合合合合,向向向向量量量量元元元元素素素素之之之之间间间间的的的的次次次次序序序序是是是是固固固固定定定定的的的的,而而而而且且且且所所所所有有有有的的的的数数数数据据据据元元元元素素素素具具具具有有有有相相相相同同同同的的的的结结结结构构构构,如如如如数数数数据据据据类类类类型型型型、数数数数据据据据长长长长度度度度等等等等属属属属性性性性相相相相同同同同。所所所所谓谓谓谓不不不不相相相相关关关关即即即即对对对对向向向向量量量量中中中中任任任任意意意意一一一一个个个个数数数数据据据据元元元元素素素素的的的的操操操操作作作作,结结结结果果果果不不不不影影影影响响响响到到到到其其其其他他他他向向向向量量量量元元元元素素素素。比比比比如如如如有有有有一一一一个个个个数数数数组组组组,我我我我们们们们要要要要使使使使数数数数组组组组中中中中的的的的每每每每一一一一个个个个元元元元素素素素AiAi都都都都乘乘乘乘以以以以一一一一个个个个数数数数b b,它它它它们们们们的的的的结结结结果互不影响,各自独立。果互不影响,各自独立。果互不影响,各自独立。果互不影响,各自独立。向量数据的参数有:向量数据的参数有:向量数据的参数有:向量数据的参数有:起始地址:即第一个向量元素存放的地址。起始地址:即第一个向量元素存放的地址。起始地址:即第一个向量元素存放的地址。起始地址:即第一个向量元素存放的地址。向量长度:即向量元素的数量。向量长度:即向量元素的数量。向量长度:即向量元素的数量。向量长度:即向量元素的数量。向量间距:即相邻两个向量元素之间的距离。向量间距:即相邻两个向量元素之间的距离。向量间距:即相邻两个向量元素之间的距离。向量间距:即相邻两个向量元素之间的距离。本讲稿第二十四页,共四十页2 2向量流水的主要特点向量流水的主要特点 因为一个向量数据中,包含有N个数据元素,对这个向量数据处理一次,就是处理了N次数据,所以,一条向量指令就相当于多个标量数据的循环,而且向量指令所要访问的向量元素均相邻,可以依次访问它们,比一串标量指令操作快,并且消除了标量数据中由循环引起的控制相关。向量流水线由于无数据相关、无程序转移,流水线可以充满,从而获得较高的吞吐率和流水线效率。由于取一次指令便可以完成很长的向量运算,所以要求向量计算机的存储器系统能提供给运算器连续不断的数据流,以及接收来自运算器的连续不断的运算结果,这是设计存储器系统的困难之处。本讲稿第二十五页,共四十页8-2-2 向量处理机的结构与性能 1 1 1 1向量处理机的结构向量处理机的结构向量处理机的结构向量处理机的结构系系统统结结构构设设计计中中所所面面临临的的主主要要问问题题是是,如如何何设设计计出出一一个个能能满满足足运运算算器器带带宽宽要要求求的的存存储储器器系系统统。目目前前向向量量计计算算机机采采用用两两种种方法:方法:(1 1)利利用用几几个个独独立立的的存存储储器器完完成成对对相相互互独独立立的的数数据据的的并并发发访访问问。从而达到所要求的存储器带宽,即存储器从而达到所要求的存储器带宽,即存储器存储器结构。存储器结构。(2 2)构构造造一一个个具具有有所所要要求求带带宽宽的的高高速速中中间间存存储储器器,并并能能实实现现该该高高速速中中间间存存储储器器与与主主存存储储器器之之间间的的快快速速数数据据交交换换,即即寄存器寄存器寄存器结构。寄存器结构。本讲稿第二十六页,共四十页 存储器-存储器结构的向量处理机的工作特点,是向量操作的源向量都取自内存,且操作生成的结果向量也存放到内存中;而寄存器寄存器结构的向量处理机,则都取自或存放到向量寄存器中。在向量机中,为了加快向量操作,采用多个独立的功能部件,并使它们并行工作。因为这些部件都是独立的,所以只要符合下面的条件,它们就可以并行工作:(1)不存在向量寄存器使用冲突:向量寄存器使用冲突就是指多条并行工作的向量指令中的源向量或结果向量使用相同的向量寄存器。(2)不存在功能部件使用冲突:功能部件冲突是指多条向量指令都要使用同一个功能部件,如两条向量指令都是加法运算时,浮点加的功能部件就无法同时满足,而发生冲突。本讲稿第二十七页,共四十页8-3 多处理机系统1 1 1 1多处理机系统的组成多处理机系统的组成多处理机系统的组成多处理机系统的组成多处理机系统的组成有以下几部分:多处理机系统的组成有以下几部分:多处理机系统的组成有以下几部分:多处理机系统的组成有以下几部分:(1)(1)(1)(1)两个或两个以上功能大致相同的处理器;两个或两个以上功能大致相同的处理器;两个或两个以上功能大致相同的处理器;两个或两个以上功能大致相同的处理器;(2)(2)(2)(2)由由由由所所所所有有有有处处处处理理理理器器器器共共共共享享享享的的的的一一一一个个个个公公公公共共共共主主主主存存存存和和和和I/OI/O通通通通道道道道、控控控控制制制制器器器器和外设;和外设;和外设;和外设;(3)(3)(3)(3)在在在在处处处处理理理理器器器器和和和和程程程程序序序序之之之之间间间间实实实实现现现现作作作作业业业业、任任任任务务务务、程程程程序序序序段段段段、数数数数组组组组和和和和数组元素等各级的全面并行。必须有统一控制的操作系统。数组元素等各级的全面并行。必须有统一控制的操作系统。数组元素等各级的全面并行。必须有统一控制的操作系统。数组元素等各级的全面并行。必须有统一控制的操作系统。本讲稿第二十八页,共四十页2 2多处理机系统的特点多处理机系统的特点 多多处处理理机机系系统统属属于于多多指指令令流流多多数数据据流流(MIMD)结结构构,与与属属于于单单指指令令流流多多数数据据流流(SIMD)计计算算机机有有很很大大的的不不同同,流流水水线线机机、并并行行处处理理机机都都属属于于SIMD计计算算机机,多多处处理理机机实实现现的的是是任任务务作作业业一一级级的的并并行行,SIMD计计算算机机只只能能实实现现指指令令间间的的并并行行操操作作。所所谓谓任任务务级级是是指指比比较较独独立立的的程程序序段段,也也就就是是同同时时并并行行执执行行多多段段程程序序。在在结结构构上上多多处处理理机机系系统统中中的的每每个个处处理理机机都都需需要要有有各各自自的的控控制制部部件件,以以执执行行各各自自的的程程序序,并并用用复复杂杂的的互互连连网网络络实实现现各各个个处处理理机机间间的的通通信信;在在算算法法上上也也不不局局限限于于某某种种算算法法,而而是是充充分分利利用用通通用用算算法法的的各各种种并并行行性性;在在系系统统软软件件上上要要解解决决多多处处理理机机的的资资源源的的管管理理与与进进程程调调度度等等多多种种问问题题。因因而而,多多处处理理机机具具有有较较强强的的通通用用性性,适适用用于于向向量量、标标量量、各各种种数数据据的的不不同同处处理理,也也适适用用于于多多种种算算法法,结结构构灵灵活活,可可以以实实现现多多种种机机间连接,图间连接,图8-8是一种多处理机结构。是一种多处理机结构。本讲稿第二十九页,共四十页8-3-2多处理机结构 多多处处理理机机在在系系统统结结构构上上分分为为两两类类:紧紧耦耦合合系系统统和和松松耦耦合合系系统。统。(1)松耦合系统 松松耦耦合合系系统统也也称称为为间间接接耦耦合合系系统统,通通常常通通过过通通道道或或通通信信线线路路实实现现机机间间联联系系,通通过过消消息息传传递递方方式式来来实实现现处处理理机机间间的的相相互互通通信信,信信息息传传送送的的速速度度较较慢慢,而而且且每每个个处处理理机机是是一个独立性较强的计算机模块。一个独立性较强的计算机模块。本讲稿第三十页,共四十页8-3-2多处理机结构(2 2)紧耦合系统)紧耦合系统 紧紧耦耦合合系系统统也也称称为为直直接接耦耦合合系系统统,目目前前大大多多数数多多处处理理机机系系统统都都属属于于紧紧耦耦合合系系统统。紧紧耦耦合合是是通通过过共共享享主主存存实实现现处处理理机机间间的的互互相相通通信信,主主存存储储器器对对所所有有的的处处理理机机有有一一个个统统一一的的地地址址编编址址。系系统统中中的的各各台台处处理理机机既既可可以以共共同同执执行行一一个个任任务务,也也可可以以同同时时执执行行几几个个程程序序。各各处处理理机机通通过过一一个个公公共共的的硬硬件件资资源源连连接接在在一一起起,处处理理机机间间的的相相互互联联系系比比较较紧紧密密。按按所所用用处处理理机机类类型型是是否否相相同同及及对对称称,又又可可分分为为同同构构或或异异构构及及对对称称或或非非对对称称的的形形式式。常常见见组组合合是同构对称式和异构非对称式多机系统。是同构对称式和异构非对称式多机系统。本讲稿第三十一页,共四十页8-4-1计算机系统结构的新概念 各各各各种种种种不不不不同同同同的的的的系系系系统统统统结结结结构构构构按按按按照照照照计计计计算算算算机机机机内内内内部部部部的的的的控控控控制制制制机机机机制制制制可可可可分分分分为为为为控制驱动、数据驱动、需求驱动和模式匹配四种类型。控制驱动、数据驱动、需求驱动和模式匹配四种类型。控制驱动、数据驱动、需求驱动和模式匹配四种类型。控制驱动、数据驱动、需求驱动和模式匹配四种类型。1.1.1.1.控制驱动控制驱动控制驱动控制驱动这这这这是是是是传传传传统统统统的的的的冯冯冯冯诺诺依依曼曼系系统统结结构构使使用用的的控控制制方方式式,计计算算机机中中有有一一个个程程序序计计数数器器PCPC,每每执执行行一一条条指指令令,程程序序计计数数器器就就自自动动加加“1 1 1 1”,指指指指向向向向下下下下一一一一条条条条指指指指令令令令的的的的地地地地址址址址单单单单元元元元,可可可可见见见见程程程程序序序序的的的的执执执执行行行行是是是是在在在在程程程程序序序序计计计计数数数数器器器器的的的的控控控控制制制制下下下下进进进进行行行行的的的的,当当当当它它它它指指指指向向向向某某某某条条条条指指指指令令令令时时时时,才才才才驱驱驱驱动动动动该该该该条条条条指指指指令令令令的的的的执执执执行行行行。我我我我们们们们把把把把这这这这种种种种方方方方式式式式称称称称为为为为控控控控制驱动。制驱动。制驱动。制驱动。本讲稿第三十二页,共四十页2 2数据驱动数据驱动 数据驱动控制方式,与上面的控制驱动方式不同,数据驱动控制方式,与上面的控制驱动方式不同,它的指令不是在控制下顺序执行的,当且仅当指令所它的指令不是在控制下顺序执行的,当且仅当指令所需要的数据可用时,指令就可执行,即任何指令只要需要的数据可用时,指令就可执行,即任何指令只要它所需要的操作数全部齐备且可用时,这些指令就可它所需要的操作数全部齐备且可用时,这些指令就可以同时执行,不需要程序计数器。可见指令的执行不以同时执行,不需要程序计数器。可见指令的执行不受其他控制条件的约束。这种方式中,不使用变量,受其他控制条件的约束。这种方式中,不使用变量,不存在数据共享等。数据驱动的原理形成了两个优点:不存在数据共享等。数据驱动的原理形成了两个优点:指令的执行是无序的,完全受数据流的驱动,与指令指令的执行是无序的,完全受数据流的驱动,与指令在程序中出现的先后顺序无关。直接支持函数语言,在程序中出现的先后顺序无关。直接支持函数语言,有利于开发程序中各级的并行性,而且有利于改善软有利于开发程序中各级的并行性,而且有利于改善软件环境,缩短软件的研制时间。件环境,缩短软件的研制时间。本讲稿第三十三页,共四十页3 3需求驱动需求驱动在需求驱动的系统结构中,需要执行哪一条指令时,在需求驱动的系统结构中,需要执行哪一条指令时,该指令就被驱动执行,我们举例说明,例如:求该指令就被驱动执行,我们举例说明,例如:求X=(Y+Z)/(1-Y),用函数的形式可以表示),用函数的形式可以表示成,求成,求X=f(u),f(u)=h(v)+g(w),h(v)=Y+z,g(w)=1-y,需求驱动的执行过程是这样的:求,需求驱动的执行过程是这样的:求X,就必须求,就必须求f(u),求),求f(u)就必须求就必须求h(v)和和g(w)。4 4模式匹配驱动模式匹配驱动模式驱动控制方式是,给定模式匹配符号串,模式驱动控制方式是,给定模式匹配符号串,搜索与该对象相匹配的对象,一旦匹配就驱动搜索与该对象相匹配的对象,一旦匹配就驱动执行该指令。执行该指令。本讲稿第三十四页,共四十页8-4-2新概念系统结构计算机 1 1数据流计算机数据流计算机(1 1)驱动原理)驱动原理 在在数数据据流流计计算算机机中中有有两两种种驱驱动动方方式式,种种是是数数据据驱驱动动方方式式。只只要要某某一一个个操操作作所所要要求求的的输输入入数数据据全全部部到到齐齐而而且且可可用用时时。该该操操作作就就可可以以立立即即执执行行,另另一一种种是是需需求求驱驱动动驱驱动动方方式式。只只有有当当某某一一个个函函数数需需要要某某个个自自变变量量时时才才驱驱动动对对该该自自变变量量的的求求值值操操作作,在在数数据据流流计计算算机机没没有有变变量量的的概概念念,在在指指令令之之间间直直接接传传送送数数据据,有有纯纯函函数数的的特特点点。数数据据流流计计算算机机中中数数据据流流运运算算具具有有异异步步性性、并并行行性、函数性和局部性的特点。性、函数性和局部性的特点。本讲稿第三十五页,共四十页 需求驱动方式与数据驱动方式相比可以减少许多不必要需求驱动方式与数据驱动方式相比可以减少许多不必要的操作,有助于提高处理机的工作效率。但需求驱动方的操作,有助于提高处理机的工作效率。但需求驱动方式实现起来更为困难,目前的数据流计算机一般采用数式实现起来更为困难,目前的数据流计算机一般采用数据驱动方式。据驱动方式。(2)数据流计算机模型)数据流计算机模型 在在数数据据流流计计算算机机中中,信信息息项项以以操操作作包包和和数数据据“令令牌牌”形形式式出出现现。操操作作包包由由操操作作码码、操操作作数数和和其其后后继继指指令令所所在在地地组组成成。令令牌牌实实质质是是一一种种表表示示某某一一操操作作数数或或参参数数已已准准备备就就绪绪的的标标志志数数据据。数数据据流流机机根根据据对对数数据据令令牌牌处处理理方方式式的的不同,可以分为静态和动态两类结构。不同,可以分为静态和动态两类结构。本讲稿第三十六页,共四十页2 2面向函数程序设计语言的归约机面向函数程序设计语言的归约机 归归约约机机和和数数据据流流机机一一样样,都都是是基基于于数数据据流流的的计计算算模模型型,但但其其驱驱动动方方式式是是采采用用需需求求驱驱动动。在在这这种种模模型型中中,某某条条指指令令的执行,仅当其他指令需要用它时才会进行。的执行,仅当其他指令需要用它时才会进行。归归约约机机是是一一种种面面向向函函数数程程序序设设计计语语言言的的计计算算机机,指指令令的的执执行行顺顺序序取取决决于于这这些些指指令令产产生生结结果果数数据据的的需需求求,而而这这种种需需求求又源于函数式程序设计语言对表达式的归约。又源于函数式程序设计语言对表达式的归约。归约机按其归约模型可分为串归约机和图归约机两类。归约机按其归约模型可分为串归约机和图归约机两类。两者的主要区别是对函数表达式所使用的存储方式不同,两者的主要区别是对函数表达式所使用的存储方式不同,前者以字符串形式存储而后者以图的形式存储前者以字符串形式存储而后者以图的形式存储。本讲稿第三十七页,共四十页3 3人工智能计算机人工智能计算机 随着计算机应用领域的不断扩大,计算机在人工智能AI领域中的发展极为迫切。智能机是一个知识信息处理系统,必须解决好有关知识的获取、表示、存储、处理和应用等诸方面的问题,使计算机能更好地模拟人类大脑的思维活动。这一领域中的处理有着其特殊性,主要表现在:(1)AI主要的处理的对象是符号,不是数值。这是因为人们在现实生活中遇到的问题大多数是非数值问题。(2)AI系统由于能够实现数据和知识的采集、存储、查询、删除和修改等功能,能够有效维护数据库和知识库的致性及完整性,所以数据具有动态的不确定性。(3)AI系统由于大量的知识存储,所以存在知识管理问题等。本讲稿第三十八页,共四十页 目前,人工智能计算机系统分为目前,人工智能计算机系统分为三类:它们分别是基于语言的智能三类:它们分别是基于语言的智能机、基于知识的智能机和智能化的机、基于知识

    注意事项

    本文(流水线结构精选文档.ppt)为本站会员(石***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开