欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    计算机基础知识治疗精选PPT.ppt

    • 资源ID:42767575       资源大小:3.20MB        全文页数:103页
    • 资源格式: PPT        下载积分:18金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要18金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    计算机基础知识治疗精选PPT.ppt

    计算机基础知识治疗计算机基础知识治疗第1页,此课件共103页哦6.1 计算机并行技术概述计算机并行技术概述 6.1.1 计算机硬件并行技术的发展计算机硬件并行技术的发展 6.1.2 计算机并行性开发的技术对策计算机并行性开发的技术对策 6.1.3 Flynn分类法分类法 第2页,此课件共103页哦 计算机系统的发展主要是在元器件技术和体系结构两条战线上不断计算机系统的发展主要是在元器件技术和体系结构两条战线上不断向前推进的。这一章首先介绍对于计算机体系结构具有决定性影响的几向前推进的。这一章首先介绍对于计算机体系结构具有决定性影响的几种并行技术,然后介绍几种非种并行技术,然后介绍几种非Neumann体系结构,最后介绍人们在体系结构,最后介绍人们在计算机元器件技术方面的一些探索。计算机元器件技术方面的一些探索。6.1.1 计算机硬件并行技术的发展计算机硬件并行技术的发展 广广义义地地讲讲,并并行行性性包包含含同同时时性性(simultaneitysimultaneity)和和并并发发性性(concurrencyconcurrency)两两个个方方面面。前前者者是是指指两两个个或或多多个个事事件件在在同同一一时时刻刻发发生生。后后者者是是指指两两个个或或多多个个事事件件在在同同一一时时间间间间隔隔内内发发生生。简简单单地地说说,在在同同一一时时刻刻或或同同一一时时间间间间隔隔内内完完成成两两种种或或两两种种以以上上性性质质相相同同或或不不相相同同的的功功能能,只只要时间上互相重叠,就存在并行性。要时间上互相重叠,就存在并行性。第3页,此课件共103页哦 并并行行处处理理是是改改进进系系统统性性能能以以获获得得最最好好性性能能价价格格比比的的重重要要手手段段。计计算算机机系统在其发展过程中在各个层次上都引入了不同形式的并行性:系统在其发展过程中在各个层次上都引入了不同形式的并行性:19521952年设计了运算器中的并行算术运算逻辑。年设计了运算器中的并行算术运算逻辑。19551955年年在在IBM IBM 704704机机中中采采用用了了I/OI/O通通道道技技术术,实实现现了了I/OI/O操操作作与与CPUCPU的并行工作。的并行工作。19561956年年在在IBMIBM的的StretchStretch设设计计中中,指指令令预预取取控控制制机机构构和和存存储储器器多多体交叉,迈开了指令流水线和并行存储技术第一步。体交叉,迈开了指令流水线和并行存储技术第一步。19611961年年在在曼曼彻彻斯斯特特大大学学的的ATLASATLAS机机中中,又又讨讨论论了了多多道道程程序序的的技技术术,使一台处理机可以同时运行多个程序。使一台处理机可以同时运行多个程序。第4页,此课件共103页哦 19641964年年在在CDC CDC 66006600机机中中又又设设计计了了多多功功能能部部件件,在在一一个个CPUCPU中中有有1010个互相独立、可以并行工作的功能部件。个互相独立、可以并行工作的功能部件。2020世世纪纪7070年年代代初初出出现现的的向向量量计计算算机机TI-ASCTI-ASC(19721972)和和STAR-100 STAR-100(1973(1973),又开始采用运算流水线技术。),又开始采用运算流水线技术。经经过过2020世世纪纪70 70 8080年年代代的的发发展展,RISCRISC技技术术进进一一步步完完善善,VLIWVLIW计计算算机机和和超超标标量量计计算算机机把把系系统统结结构构技技术术同同优优化化编编译译技技术术相相结结合合,进进一一步步挖挖掘掘了了指指令令级级的的并并行行性性。这这时时在在单单处处理理机机上上并并行行性性潜潜力力的的挖挖掘掘已已趋于饱和,并行技术便主要转向高度并行技术,即多处理机方面。趋于饱和,并行技术便主要转向高度并行技术,即多处理机方面。第5页,此课件共103页哦6.1.2 计算机并行性开发的技术对策计算机并行性开发的技术对策 并行性的开发主要从时间重叠、资源重复、资源共享并行性的开发主要从时间重叠、资源重复、资源共享3 3个方面展开。个方面展开。1.时间重叠时间重叠 时时间间重重叠叠是是多多个个处处理理过过程程在在时时间间上上相相互互错错开开,轮轮流流、重重叠叠地地使使用用同同一一套套硬硬件件设设备备的的各各个个部部分分,以以提提高高硬硬件件的的利利用用率率而而赢赢得得高高速速度度,获获得得较较高高的的性性能能价价格格比比。它它是是通通过过时时间间重重叠叠技技术术实实现现并并行行处处理理,主主要要表表现现在在各各种种流流水水线线部部件件和和流流水水线线处处理理机机,而而不不靠靠增增加加重重复复硬硬件件设设备,是一种备,是一种“挖掘内部潜力挖掘内部潜力”的方法。的方法。流流水水线线在在指指令令和和操操作作一一级级的的实实施施,形形成成单单处处理理机机内内部部的的指指令令流流水水线线和和操操作作流流水水线线;进进一一步步发发展展到到任任务务一一级级,形形成成处处理理机机级级的的流流水水线或称宏(线或称宏(macro)流水线。)流水线。第6页,此课件共103页哦 流流水水线线技技术术的的特特点点是是各各部部件件的的专专用用性性,设设备备的的发发展展形形成成专专用用部部件件(如如流流水水线线中中的的各各功功能能站站)专专用用处处理理机机(如如通通道道、数数组组处处理理机机等等)、专专用用计计算算机机系系统统(如如工工作作站站、客客户户机机等等)等等3个个层层次次。沿沿着着这这条条路路线线形形成成的的多多处处理理机机系系统统的的特特点点是是非非对对称称型型(asymmetrical)或或称称异异构构型型多多处处理理机机(heterogeneous multiprocessor)。它它们们由由多多个个不不同同类类型型、至至少少担担负负不不同同功功能能的的处处理理机机组组成成,按按照照程程序序要要求求的的顺顺序序,对对多多个个进进程程进进行行加加工工,各各自自实实现现规规定定的的操操作作功功能能,并并且且这这些些进进程程的的加工在时间上是重叠的。加工在时间上是重叠的。第7页,此课件共103页哦2.资源重复资源重复 资资源源重重复复是是通通过过重重复复地地设设置置硬硬件件资资源源以以大大幅幅度度提提高高计计算算机机系系统统的的性性能能,是是一一种种“以以多多取取胜胜”的的方方法法。它它的的初初级级阶阶段段是是多多存存储储体体和和多多操操作作部部件件,目目的的在在于于把把一一个个程程序序分分成成许许多多任任务务(过过程程),分分给给不不同同的的部部件件去去执执行行。这这些些部部件件在在发发展展中中功功能能不不断断增增强强,独独立立性性不不断断提提高高,发发展展成成为为3 3个个层次:层次:在多个部件中的并行处理;在多个部件中的并行处理;在多台处理机中的并行处理在多台处理机中的并行处理紧藕合多处理机系统;紧藕合多处理机系统;在在多多台台自自治治的的计计算算机机系系统统中中的的并并行行处处理理松松藕藕合合多多处处理理机机系统。系统。沿沿着着这这条条路路线线形形成成的的多多处处理理机机系系统统的的特特点点是是对对称称型型(SymmetricalSymmetrical)或或称称同同构构型型多多处处理理机机(Homogeneous Homogeneous MultiprocessorMultiprocessor)。它它们们由由多多个个同同类类型型的的,至至少少同同等等功功能能的的处处理理机机组组成成,同同时时处处理理同同一一程程序序中中能能并并行行执行的多个任务。执行的多个任务。第8页,此课件共103页哦 3.资源共享资源共享 资资源源共共享享是是多多个个用用户户之之间间可可以以互互相相使使用用它它者者另另一一方方的的资资源源(硬硬件件、软软件件、数数据据),以以提提高高计计算算机机设设备备利利用用率率。计计算算机机网网络络就就是是这这一一技技术术路线的产物。它通过计算机与通信技术的融合,实现信息资源共享。路线的产物。它通过计算机与通信技术的融合,实现信息资源共享。以以上上3 3条条路路线线并并不不是是孤孤立立的的。现现代代科科学学技技术术已已经经打打破破了了学学科科、专专业业、领领域域的的界界限限,在在计计算算机机不不同同技技术术之之间间也也在在不不断断渗渗透透、借借鉴、融合,把并行技术推向更高的水平。鉴、融合,把并行技术推向更高的水平。第9页,此课件共103页哦6.1.3 Flynn分类法分类法 19661966年年M.J.FlynnM.J.Flynn提提出出了了一一种种按按信信息息处处理理特特征征的的计计算算机机分分类类方方法法按按指指令令流流和和数数据据流流对对计计算算机机进进行行分分类类的的方方法法。他他首首先先引引入入了了下下列定义:列定义:指令流指令流机器执行的指令序列。机器执行的指令序列。数据流数据流由指令流调用的数据序列(包括输入数据和中间结果)。由指令流调用的数据序列(包括输入数据和中间结果)。多多倍倍性性在在系系统统受受限限制制的的元元件件上上处处于于同同一一执执行行阶阶段段的的指指令令或数据的最大可能个数。或数据的最大可能个数。第10页,此课件共103页哦 按指令流和数据流分别具有的多倍性,可将计算机系统分为下列按指令流和数据流分别具有的多倍性,可将计算机系统分为下列4类:类:SISD SISD单指令流单数据流系统;单指令流单数据流系统;SIMD SIMD单指令流多数据流系统;单指令流多数据流系统;MISD MISD多指令流单数据流系统;多指令流单数据流系统;MIMD MIMD多指令流多数据流系统。多指令流多数据流系统。1.SISD1.SISD系统系统 SISDSISD系系统统是是传传统统的的顺顺序序处处理理计计算算机机,通通常常由由一一个个处处理理器器和和一一个个存存储储器器组组成成。它它通通过过执执行行单单一一的的指指令令流流对对单单一一的的数数据据流流进进行行处处理理。即即指指令令按按顺顺序序读读取取,指指令令部部件件一一次次只只对对一一条条指指令令进进行行译译码码,并并只只对对一一个个操操作作部部件件分分配数据。配数据。第11页,此课件共103页哦 2.SIMD 2.SIMD系统系统 典型的典型的SIMD系统由一个控制器、多个处理器、多个存储模块和一系统由一个控制器、多个处理器、多个存储模块和一个互连网络组成。互连网络用来在各处理器和各存储模块间进行通信,个互连网络组成。互连网络用来在各处理器和各存储模块间进行通信,由控制器向各个处理器由控制器向各个处理器“发布发布”指令,所有被指令,所有被“激活的激活的”处理器在同处理器在同一时刻执行同一条指令,这就是单指令流。但在每台流动的处理器执行一时刻执行同一条指令,这就是单指令流。但在每台流动的处理器执行这条指令时所用的数据是从它本身的存储器模块中读取的,所以各处理这条指令时所用的数据是从它本身的存储器模块中读取的,所以各处理器加工的数据是不同的,这就是多数据流。器加工的数据是不同的,这就是多数据流。第12页,此课件共103页哦3.MIMD3.MIMD系统系统 典型的典型的MIMD系统由多台独立的处理机(包含处理器和控制系统由多台独立的处理机(包含处理器和控制器)、多个存储模块和一个互连网络组成;每个处理机执行自器)、多个存储模块和一个互连网络组成;每个处理机执行自己的指令(多指令流),操作数据也是各取各的(多数据流)。己的指令(多指令流),操作数据也是各取各的(多数据流)。这是一种全面并行的计算机系统。这是一种全面并行的计算机系统。MIMD的互连网络可以安排在的互连网络可以安排在两个不同级别两个不同级别系统系统-系统级(如系统级(如图图6.1(a)所示)和处理机所示)和处理机-存储器存储器接口级(如接口级(如图图6.1(b)所示)上。系统所示)上。系统-系统级系统级MIMD系统的特点是各台系统的特点是各台处理机都有自己的存储器,互连网络仅仅用来进行处理机间的通信,处理机都有自己的存储器,互连网络仅仅用来进行处理机间的通信,通信带宽较窄,称为松耦合多处理机系统(通信带宽较窄,称为松耦合多处理机系统(loosely coupled multiprocessor system),一般多计算机系统(),一般多计算机系统(multicomputer system)就是指这种系统。)就是指这种系统。处理机处理机-存储器接口级上的存储器接口级上的MIMD的特点是各台处理机共享公用的特点是各台处理机共享公用的存储器,存储器可以由多个模块组成,互连网络用来在处理机的存储器,存储器可以由多个模块组成,互连网络用来在处理机-存储器之间传送信息,通信带宽较宽,称为紧耦合多处理机系存储器之间传送信息,通信带宽较宽,称为紧耦合多处理机系统(统(tightly coupledmulti processor system),通常说的多处理系统一),通常说的多处理系统一般就是指这一类型的系统。般就是指这一类型的系统。第13页,此课件共103页哦 4.MISD 4.MISD系统系统 关于关于MISD系统的界定,众说不一,有的认为根本就不存在系统的界定,众说不一,有的认为根本就不存在MISD系系统;有的把流水线处理机划分在这一类。但也有的把流水线处理机称为统;有的把流水线处理机划分在这一类。但也有的把流水线处理机称为SIMD系统一类。系统一类。第14页,此课件共103页哦 6.2 指令级并行技术指令级并行技术 6.2.1 指令流水技术指令流水技术 6.2.2 流水线中的多发射技术流水线中的多发射技术 6.2.3 Pentium CPU 6.2.4 RISC处理器的体系结构处理器的体系结构 6.2.5 RISC、CISC、VLIW技术的融合技术的融合 6.2.6 流水线向量处理机流水线向量处理机 第15页,此课件共103页哦 ILP(Instruction Level Parallelism,指指令令级级并并行行运运算算)技术,是一种可以让技术,是一种可以让CPU在相同周期内执行更多指令的方法。在相同周期内执行更多指令的方法。6.2.1 指令流水技术指令流水技术 1.指令的重叠与流水指令的重叠与流水 指指令令的的作作业业方方式式与与CPUCPU结结构构及及其其对对指指令令的的解解释释有有关关。早早期期的的CPUCPU虽虽然然也也把把指指令令分分解解为为一一系系列列的的微微指指令令,但但是是如如图图6.26.2所所示示,在在同同一一时时间间段段内内处处理理器器只只能能进进行行一一个个指指令令的的作作业业;一一条条指指令令的的作作业业完完成成后后,才才能开始另外一条指令的作业。能开始另外一条指令的作业。第16页,此课件共103页哦 顺顺序序作作业业方方式式的的优优点点是是控控制制简简单单,由由于于下下条条指指令令的的地地址址在在前前指指令令解解释释过过程程的的末末尾尾形形成成,因因此此不不论论是是由由指指令令指指针针加加1 1方方式式,还还是是由由转转移移指指令令把把地地址址送送到到指指令令指指针针形形成成下下条条指指令令地地址址,由由当当前前指指令令转转入入下下条条指指令令的的时时序序关关系系都都是是相相同同的的。顺顺序序作作业业方方式式的的缺缺点点是是速速度度慢慢,因因为为当当前前操操作作完完成成前前,下下一一步步操操作作不不能能开开始始。另另外外机机器器各各部部件件的的利利用用率也不高,如主存与运算器(率也不高,如主存与运算器(EUEU)不能同时工作。)不能同时工作。实实际际上上,CPUCPU可可以以分分成成两两个个相相对对独独立立的的部部件件:指指令令部部件件和和执执行行部部件件,分分别别负负责责指指令令的的解解释释和和执执行行。在在一一条条指指令令的的执执行行过过程程同同时时,指指令令部部件件可可以以取取下下一一条条指指令令并并进进行行解解释释,这这样样两两个个部部件件就就可可以以同同时时并并行行操操作,如图作,如图6.36.3所示所示第17页,此课件共103页哦 当当CPUCPU分分成成多多个个相相对对独独立立的的部部件件(如如图图6.46.4所所示示),并并且且可可以以把把一一条条指指令令解解释释为为多多个个子子过过程程时时,不不同同的的部部件件将将分分别别对对微微指指令令流流中中不不同同的的子子过过程程进进行行操操作作,于于是是就就形形成成流流水水作作业业方方式式。流流水水线线是是CPUCPU实实现现高高速速作作业业的的关关键键性性技技术术。它它如如同同将将一一条条生生产产流流水水线线分分成成多多个个工工序序,各各工工序序可可以以同同时时工工作作,但但加加工工的的是是不不同同的的零零件件。显显然然,工工序序分得越多,同时加工的零件就越多。分得越多,同时加工的零件就越多。采用指令流水线,能使各操作部件同时对不同的指令进行加工,提高采用指令流水线,能使各操作部件同时对不同的指令进行加工,提高了机器的工作效率。从另一方面讲,当处理器可以分解为了机器的工作效率。从另一方面讲,当处理器可以分解为m个部件时,便个部件时,便可以每隔可以每隔1/m个指令周期解释一条指令,加快了程序的执行速度。注个指令周期解释一条指令,加快了程序的执行速度。注意,这里说的是意,这里说的是“加快了程序的执行速度加快了程序的执行速度”,而不是,而不是“加快了指加快了指令的解释速度令的解释速度”,因为就一条指令而言,其解释速度并没有加快。,因为就一条指令而言,其解释速度并没有加快。第18页,此课件共103页哦 2.指令流水线结构指令流水线结构 指令流水线是将指令的整个执行过程进行分段处理。典型的指令流水线是将指令的整个执行过程进行分段处理。典型的指令执行过程是取指令指令译码形成地址取操作数执指令执行过程是取指令指令译码形成地址取操作数执行指令回写结果修改指令指针,与此相对应的指令流水线行指令回写结果修改指令指针,与此相对应的指令流水线由由图图6.5所示的各部件组成。所示的各部件组成。如果上述如果上述7步中,每一步需要一个时钟周期,从指令进入流水线,步中,每一步需要一个时钟周期,从指令进入流水线,到出来结果,就要到出来结果,就要7个时钟周期;但此后后每个时钟周期便可以执行个时钟周期;但此后后每个时钟周期便可以执行一条指令。设一条流水线由一条指令。设一条流水线由k个时间步(功能段)组成,每个时间步的个时间步(功能段)组成,每个时间步的长度为长度为tt。对对n条指令顺序执行时所需的时间为条指令顺序执行时所需的时间为nkt,而流水作业时而流水作业时所需时间为所需时间为kt(n-1)t=(k+n-1)t,吞吐量就提高了,吞吐量就提高了(k+n-1)/nk。显然,。显然,k值越大,流水线吞吐量提高得越高。值越大,流水线吞吐量提高得越高。第19页,此课件共103页哦 上面讨论的流水线是时间步均衡的流水线问题。实际上,取指、上面讨论的流水线是时间步均衡的流水线问题。实际上,取指、取数和回写取数和回写3 3步需要的时间要比其他步需要的时间要比其他4 4步长得多,对低速存储器差别步长得多,对低速存储器差别更大。更大。图图6.66.6为为3 3个访存步需要个访存步需要4 4个时钟周期、其他步需要个时钟周期、其他步需要1 1个时钟个时钟周期时,流水线的工作情形。这时,第一条指令的解释用去周期时,流水线的工作情形。这时,第一条指令的解释用去1616个时个时钟周期,以后每钟周期,以后每4 4个时钟周期出一条指令。这说明流水线的吞吐量主个时钟周期出一条指令。这说明流水线的吞吐量主要由时间步最长的功能段决定。这个最长的功能段就是流水线的要由时间步最长的功能段决定。这个最长的功能段就是流水线的“瓶颈瓶颈”。第20页,此课件共103页哦 解解决决流流水水线线“瓶瓶颈颈”(图图6.76.7(a a)可可以以通通过过两两条条途途径径:一一是是如如图图6.76.7(b b)所所示示,将将“瓶瓶颈颈”部部分分再再细细分分,当当分分成成与与其其他他时时间间步步(设设为为1 1个个时时钟钟周周期期)几几乎乎相相等等的的功功能能段段时时,就就会会每每一一个个时时间间步步(1 1个个时时钟钟周周期期)出出一一条条指指令令;另另一一种种是是采采用用如如图图6.76.7(c c)所所示示的的“瓶瓶颈颈”段段复复制制的的方方法法,用用数数据据分分配配器器,将将多多条条指指令令的的“瓶瓶颈颈”段段(访访存存)并并行行地地执执行行,加加快快执执行行过过程程。当当然然,后后者者的的复复杂杂度度要要高。高。这个例子是针对低速存储器的,说明了流水线对存储系统有很高的要这个例子是针对低速存储器的,说明了流水线对存储系统有很高的要求。在理想的流水线处理机中,希望平均一个机器周期处理一条指令,求。在理想的流水线处理机中,希望平均一个机器周期处理一条指令,为此就要按这个速度给其提供指令和数据。现在的单一大型存储器的一为此就要按这个速度给其提供指令和数据。现在的单一大型存储器的一个存储周期相当于个存储周期相当于420个时钟周期。为此必须借助个时钟周期。为此必须借助Cache。假如一个。假如一个指令系统中的每条指令最多只需要访存取一个操作数,那么每执行指令系统中的每条指令最多只需要访存取一个操作数,那么每执行一条指令只需访问两次存储器:取指令和存取数据。一条指令只需访问两次存储器:取指令和存取数据。第21页,此课件共103页哦 3.运算流水线运算流水线 前前面面讨讨论论了了指指令令流流水水线线,它它是是处处理理机机级级的的流流水水技技术术。流流水水处处理理技技术术还还可可用用于于部部件件级级,如如浮浮点点运运算算、乘乘法法、除除法法等等都都需需要要多多个个机机器器周周期期才才能能完完成成。为为加加速速运运算算速速度度,把把流流水水线线技技术术引引入入到到运运算算操操作作中中就形成运算流水线。下面介绍两种运算流水线分类方法。就形成运算流水线。下面介绍两种运算流水线分类方法。第22页,此课件共103页哦 (1)(1)单功能和多功能流水线单功能和多功能流水线 单功能流水线是只能实现一种特定的专门功能的流水线。多单功能流水线是只能实现一种特定的专门功能的流水线。多功能流水线是指同一流水线可以有多种连结方式,实现多种功功能流水线是指同一流水线可以有多种连结方式,实现多种功能。例如能。例如T1-ASC计算机共有计算机共有8个站,可以对个站,可以对16,32或或64位的标量位的标量和向量操作数进行定点和浮点算术运算。图和向量操作数进行定点和浮点算术运算。图6.8为它的功能块及为它的功能块及3种种功能连结方式。功能连结方式。(2)(2)静态和动态流水线静态和动态流水线 静静态态流流水水线线在在同同一一时时间间内内只只能能按按一一种种运运算算连连结结方方式式工工作作。动动态态流流水水线线在在同同一一时时间间内内允允许许按按多多种种不不同同的的运运算算连连结结方方式式工工作作。单单一一流流水水线线一一定定是是静静态态流流水水线线,动动态态流流水水线线一一定定是是多多功功能能流流水水线线,但但多多功功能能流流水水线线可可以以是是动动态态的的,也也可可以以是是静静态态的的。静静态态流流水水线线仅仅指指令令是是同同一一类类型型时时才才能能连连续续不不断断地地作作业业。多多功功能能动动态态流流水水线线的的连连结结控控制制比比多多功功能能静静态态流流水水线线要要复复杂杂得得多,但效率比较高。多,但效率比较高。第23页,此课件共103页哦 4.访存冲突访存冲突 “取取指指令令”与与“执执行行指指令令”都都要要访访问问主主存存,一一个个要要取取指指令令,一一个个要要取取操操作作数数。所所以以重重叠叠流流水水方方式式要要求求CPUCPU能能同同时时访访问问主主存存中中的的两两个个单单元元。这这对对一一般般将将操操作作数数和和指指令令混混合合存存储储在在同同一一主主存存中中的的机机器器来来说说是是难难以以实实现现的的。为为了了实实现现重重叠叠解解释释,应应在在硬硬件件结结构构上上采采取取措措施施。通通常常有有如如下下一些方法。一些方法。(1)(1)设设置置两两个个独独立立编编址址的的主主存存储储器器,分分别别存存放放操操作作数数和和指指令令,以以免免取取指与取操作数同时进行时互相冲突。指与取操作数同时进行时互相冲突。第24页,此课件共103页哦 (2)(2)采采用用多多体体交交叉叉存存储储结结构构,使使两两条条相相邻邻指指令令的的操操作作数数不不在在同同一一存存储储体体内内。这这时时指指令令和和操操作作数数虽虽然然还还存存在在同同一一主主存存内内,但但可可以以利利用用多多体体存存储储器器在在同同一一存存储储周周期期内内取取出出一一条条指指令令和和另另一一指指令令所所需需的的操操作作数数实实现现时时间间上上的重叠。的重叠。(3)(3)指指令令预预取取技技术术,也也称称指指令令缓缓冲冲技技术术,如如8086 8086 CPUCPU中中设设置置了了指指令令队队列列,用用于于预预先先将将指指令令取取到到指指令令队队列列中中排排队队。指指令令预预取取技技术术的的实实现现是是基基于于访访内内周周期期往往往往是是很很短短的的。在在“执执行行指指令令”期期间间,“取取数数”时时间间很很短短,在在这这段段时时间间内内存存储储器器会会有有空空闲闲,这这时时只只要要指指令令队队列列空空闲闲,就就可可以以将将一一条条指指令令取取来来。这这样样,当当开开始始执执行行指指令令K K时时就就可可以以同同时时开开始始对对指指令令K+1K+1的的解解释释,即即任任何何时时候候都都是是“执执行行K K”与与“分析分析K+1K+1”的重叠。的重叠。第25页,此课件共103页哦 5.相关处理相关处理 指指令令间间的的相相关关(instuction instuction dependencydependency)是是指指由由于于一一段段机机器器语语言言程程序序的的相相近近指指令令之之间间出出现现了了某某种种关关联联,使使它它们们不不能能同同时时被被解解释释,造造成成指指令令流流水水线线出出现现停停顿顿,从从而而影影响响指指令令流流水水线线的的效效率率。指指令令间间的的相相关关发发生生在在一一条条指指令令要要用用到到前前面面一一条条(或或几几条条)指指令令的的结结果果,因因而而必必须须等等待待它它们们流流过过流流水水线线后后才才能能执执行行。这这些些现现象象在在重重叠叠方方式式下下也也会会发发生生,但但由由于于流流水水是是同同时时解解释释多多条条指指令令,所所以以相相关关状状况况比比重重叠叠机机器器复复杂杂得得多多。指指令令间间的的相相关关大大体体 可可 分分 控控 制制 相相 关关(control control dependencydependency)和和 数数 据据 相相 关关(data data dependencydependency)两种。)两种。第26页,此课件共103页哦 (1)(1)控制相关控制相关 当一条指令要等前一条(或几条)指令作出转移方向的决定当一条指令要等前一条(或几条)指令作出转移方向的决定后才能开始进入流水线时,便发生控制相关。典型的情况是条后才能开始进入流水线时,便发生控制相关。典型的情况是条件转移指令:一条条件转移指令必须等待前面指令有结果后,件转移指令:一条条件转移指令必须等待前面指令有结果后,才能让其下一条指令进入流水线。由于转移指令的使用频度约才能让其下一条指令进入流水线。由于转移指令的使用频度约占执行指令总数的占执行指令总数的1/51/4,仅次于传送类指令,所以转移指令对流水,仅次于传送类指令,所以转移指令对流水线的设计有较大影响。线的设计有较大影响。进行控制相关处理的第一步是要先确定是否转移指令。这一点进行控制相关处理的第一步是要先确定是否转移指令。这一点很容易的,在指令流水线的前端通过指令译码就能确定。如果是无很容易的,在指令流水线的前端通过指令译码就能确定。如果是无条件转移指令,经指令译码便可确定转移目标,在该指令后的已经条件转移指令,经指令译码便可确定转移目标,在该指令后的已经进入指令列中的指令一般都应废除,而后按转移地址重新读取新的进入指令列中的指令一般都应废除,而后按转移地址重新读取新的指令序列。指令序列。第27页,此课件共103页哦这时,由于有指令队列的缓冲,不一定会引起执行部件的停顿。因而这时,由于有指令队列的缓冲,不一定会引起执行部件的停顿。因而无条件转移指令对流水线的影响比较小。但如果是条件转移,问题就无条件转移指令对流水线的影响比较小。但如果是条件转移,问题就麻烦多了。因为虽然条件转移指令在指令流水线的前端进行指令译码麻烦多了。因为虽然条件转移指令在指令流水线的前端进行指令译码时就能发现,但该指令条件码是其前一条指令在指令流水线的末端执时就能发现,但该指令条件码是其前一条指令在指令流水线的末端执行部件中才产生,必须等它执行完后,才能给条件转移指令提供条件行部件中才产生,必须等它执行完后,才能给条件转移指令提供条件码,以决定转移是否成功。因此,若一旦发现是条件转移指令,指令码,以决定转移是否成功。因此,若一旦发现是条件转移指令,指令部件就停止作业,直等到条件码给出,才能确定转移方向,但这时流部件就停止作业,直等到条件码给出,才能确定转移方向,但这时流水线中已经基本流空(前一条指令已流出,当前条件转移指令因无运水线中已经基本流空(前一条指令已流出,当前条件转移指令因无运算内容而无须流入执行部件,其后因指令部件已停止作业也无多少指算内容而无须流入执行部件,其后因指令部件已停止作业也无多少指令读入)。如果转移成功,要引入新的指令流;如果转移不成功,流令读入)。如果转移成功,要引入新的指令流;如果转移不成功,流水线上也无多少指令(流水线较长时,可能有少许指令流入),这样水线上也无多少指令(流水线较长时,可能有少许指令流入),这样等确定后的指令流到执行部件时,执行部件已经停止作业一段时间。等确定后的指令流到执行部件时,执行部件已经停止作业一段时间。第28页,此课件共103页哦 (2)(2)数据相关数据相关 数据相关发生在几条相近的指令间共用同一个存储单元或寄存器数据相关发生在几条相近的指令间共用同一个存储单元或寄存器时。例如,某条流经指令部件的指令,为计算操作数地址要用到一个时。例如,某条流经指令部件的指令,为计算操作数地址要用到一个通用寄存器的内容。而其前产生这个通用寄存器的内容的指令还没有通用寄存器的内容。而其前产生这个通用寄存器的内容的指令还没有进入执行部件。这时指令部件中的流水作业只能暂停等待。数相关有进入执行部件。这时指令部件中的流水作业只能暂停等待。数相关有3种情形,读种情形,读写相关(先写后读,写相关(先写后读,RAW,Read After Write)、写)、写-读相关(先读后写,读相关(先读后写,WAR,Write Ater Read)、写)、写-写相关(先写写相关(先写后写,后写,WAW,Write After Write)。它们的发生与流水线的控制方式)。它们的发生与流水线的控制方式有关。流水线流动顺序的安排和控制有如下两种方式。有关。流水线流动顺序的安排和控制有如下两种方式。第29页,此课件共103页哦 顺序流动流水线顺序流动流水线 这这种种流流水水线线输输出出端端的的信信息息流流出出顺顺序序与与输输入入端端指指令令的的流流入入顺顺序序一一致致。在在这这种种流流水水线线上上只只可可能能发发生生先先写写后后读读(RAWRAW)的的数数相相关关,即即写写数数指指令令在在前前,读读数数指指令令在在后后。由由于于写写操操作作要要在在处处于于流流水水线线末末端端的的执执行行部部件件中中才才能能进进行行,而而读读操操作作(如如取取操操作作数数、取取变变址址值值或或间间接接址址等等)是是在在流流水水线线前前端端的的指指令令部部件件中中进进行行的的。这这样样,很很有有可可能能在在写写操操作作尚尚未未执执行行完完时时,取取数数指指令令已已在在执执行行,读读出出的的是是旧旧的的内内容容,从从而而产产生生错错误误。解解决决这这种种数数相相关关,应应设设置置专专门门的的硬硬件件进进行行检检查查。每每一一次次取取数数时时,要要对对其其前前已已在在流流水水线线上上的的写写数数指指令令的的写写数数地地址址进进行行比比较较,若若有有相相同同地地址址,就就会会有有数数相相关关产产生生,应应推推迟迟读读数数操操作作。这这样样做做当当然然要要影影响响程程序序的的效效率率,为为缩缩短短等等待待时时间间,可可采采用用数数据据旁旁路路(bypassingbypassing)或或称称数数据据内内部部传传递递(internal internal forwardingforwarding)技技术术。它它是是在在执执行行部部件件与与指指令令部部件件之之间间设设置置直直接接传传送送数数据据的的通通路路,使使执执行行部部件件向向主主存存或或向向寄寄存存器器传传递递数数据据的的同同时,把数直接传送到正在等待这个数的指令部件中去。时,把数直接传送到正在等待这个数的指令部件中去。第30页,此课件共103页哦 非顺序流动流水线非顺序流动流水线 在这种流水线中,指令的流动顺序可能发生变化。这时会发生在这种流水线中,指令的流动顺序可能发生变化。这时会发生另外两种数相关。处理的办法类似另外两种数相关。处理的办法类似RAW,但要复杂得多。,但要复杂得多。第31页,此课件共103页哦6.2.2 流水线中的多发射技术流水线中的多发射技术 流流水水线线技技术术使使计计算算机机系系统统结结构构产产生生重重大大革革新新。它它的的进进一一步步发发展展,除除了了要要通通过过优优化化编编译译,采采用用好好的的指指令令调调度度算算法法,重重新新组组织织指指令令执执行行顺顺序序,降降低低相相关关带带来来的的干干扰扰外外,另另一一方方面面的的出出路路是是开开发发多多发发射射技技术术,即即设设法法在在一一个个时时钟钟周周期期内内发发出出多多条条指指令令。常常见见的的多多发发射射技技术术有有超超标标量技术、超流水技术和超长指令技术。量技术、超流水技术和超长指令技术。1.超标量技术超标量技术 超超标标量量 (Super(Super Scalar)Scalar)技技术术是是指指可可以以在在每每个个时时钟钟周周期期内内同同时时并并发发多多条条独独立立指指令令,即即以以并并行行操操作作方方式式将将两两条条或或两两条条以以上上指指令令编译、执行之,如编译、执行之,如图图6.9(b)6.9(b)所示。所示。第32页,此课件共103页哦 在超级标量机的处理机中配置了多个功能部件和指令译码电在超级标量机的处理机中配置了多个功能部件和指令译码电路,还有多个寄存器端口和总线,以便能同时执行多个操作,路,还有多个寄存器端口和总线,以便能同时执行多个操作,并且要由编译程序决定哪几条相邻的指令可以并行执行。请看并且要由编译程序决定哪几条相邻的指令可以并行执行。请看下面的程序段。下面的程序段。MOV BLMOV BL,5 5 ADD AX ADD AX,0123H0123H ADD CL ADD CL,AHAH 在在这这个个程程序序段段中中,3 3条条指指令令是是互互相相独独立立的的,它它们们之之间间不不存存在在数数相相关关,存在指令级并行性,程序段并行度为存在指令级并行性,程序段并行度为3 3。第33页,此课件共103页哦再看下面的程序段:再看下面的程序段:INC AXINC AX ADD AX ADD AX,BXBX MOV DS MOV DS,AXAX 这这3 3条条指指令令间间存存在在相相关关性性,不不能能并并行行执执行行,程程序序段段的的并并行行度度为为1 1,指指令令只只能能逐逐条条执执行行。超超级级标标量量机机不不能能对对指指令令的的执执行行次次序序进进行行重重新新安安排排,对对这这种种情情况况无无可可奈奈何何。但但是是可可以以通通过过编编译译程程序序采采取取优优化化技技术术,在在将将高高级级语语言言程程序序翻翻译译成成机机器器语语言言时时,进进行行精精心心安安排排,把把能能并并行行执执行的指令搭配起来,挖掘更多的指令并行性。行的指令搭配起来,挖掘更多的指令并行性。第34页,此课件共1

    注意事项

    本文(计算机基础知识治疗精选PPT.ppt)为本站会员(石***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开