第五章中央处理器56CPU实例.ppt
《第五章中央处理器56CPU实例.ppt》由会员分享,可在线阅读,更多相关《第五章中央处理器56CPU实例.ppt(35页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1.传统传统CPU2.流水流水CPU3.RISC CPU4.多媒体多媒体CPU 5.6 CPU实例实例5.6.1 并行处理技术并行处理技术 并行性的两种含义:并行性的两种含义:同时性同时性 指两个以上事件在同一时刻发生;指两个以上事件在同一时刻发生;并发性并发性 指两个以上事件在同一时间间隔内发生。指两个以上事件在同一时间间隔内发生。计算机的并行处理技术概括起来主要有以下三种形式:计算机的并行处理技术概括起来主要有以下三种形式:1.时间并行时间并行 时间并行指时间重叠,在并行性概念中引入时间因素,让多时间并行指时间重叠,在并行性概念中引入时间因素,让多个处理过程在时间上相互错开,轮流重叠地使用
2、同一套硬件设备的个处理过程在时间上相互错开,轮流重叠地使用同一套硬件设备的各个部分,以加快硬件周转而赢得速度。各个部分,以加快硬件周转而赢得速度。时间并行性概念的实现方式就是采用流水处理部件。这是一时间并行性概念的实现方式就是采用流水处理部件。这是一种非常经济而实用的并行技术,能保证计算机系统具有较高的性能种非常经济而实用的并行技术,能保证计算机系统具有较高的性能价格比。目前的高性能微型机几乎无一例外地使用了流水技术。价格比。目前的高性能微型机几乎无一例外地使用了流水技术。5.6 CPU实例实例2.空间并行空间并行 空间并行指资源重复,在并行性概念中引入空间空间并行指资源重复,在并行性概念中引
3、入空间因素,以因素,以“数量取胜数量取胜”为原则来大幅度提高计算机的为原则来大幅度提高计算机的处理速度。大规模和超大规模集成电路的迅速发展为处理速度。大规模和超大规模集成电路的迅速发展为空间并行技术带来了巨大生机,因而成为目前实现并空间并行技术带来了巨大生机,因而成为目前实现并行处理的一个主要途径。空间并行技术主要体现行处理的一个主要途径。空间并行技术主要体现 在多在多处理器系统和多计算机系统。但是在单处理器系统中处理器系统和多计算机系统。但是在单处理器系统中也得到了广泛应用。也得到了广泛应用。3.时间并行时间并行+空间并行空间并行 指时间重叠和资源重复的综合应用指时间重叠和资源重复的综合应用
4、,既采用时间,既采用时间并行性又采用空间并行性。显然,第三种并行技术带并行性又采用空间并行性。显然,第三种并行技术带来的高速效益是最好的。来的高速效益是最好的。5.6.1 并行处理技术并行处理技术5.6.2 流水计算机的系统组成流水计算机的系统组成 1、现代流水计算机的系统组成原理如下图所示。其中、现代流水计算机的系统组成原理如下图所示。其中CPU按按流水线方式组织,通常由三部分组成:指令部件、指令队列、执流水线方式组织,通常由三部分组成:指令部件、指令队列、执行部件。这三个功能部件可以组成一个行部件。这三个功能部件可以组成一个3级流水线。级流水线。为了使存储器的存取时间能与流水线的其他各过程
5、段为了使存储器的存取时间能与流水线的其他各过程段的速度相匹配,一般都采用多体交叉存器。的速度相匹配,一般都采用多体交叉存器。执行段的速度匹配问题:通常采用并行的运算部件以执行段的速度匹配问题:通常采用并行的运算部件以及部件流水线的工作方式来解决。方法包括:及部件流水线的工作方式来解决。方法包括:(1)将执行部件分为定点执行部件和浮点执行部件两个将执行部件分为定点执行部件和浮点执行部件两个可并行执行的部分,可并行执行的部分,分别处理定点运算指令和浮点运算分别处理定点运算指令和浮点运算指令;指令;(2)在浮点执行部件中,又有浮点加法部件和浮点在浮点执行部件中,又有浮点加法部件和浮点 乘乘/除部件,
6、它们也可以同时执行不同的指令;除部件,它们也可以同时执行不同的指令;(3)浮点运算部件都以流水线方式工作。浮点运算部件都以流水线方式工作。5.6 CPU实例实例 5.6.2 流水计算机的系统组成流水计算机的系统组成 2.流水流水CPUCPU的时空图的时空图 计算机的流水处理过程非常类似于工厂中的流水装计算机的流水处理过程非常类似于工厂中的流水装配线。为了实现流水,首先把输入的任务配线。为了实现流水,首先把输入的任务(或过程或过程)分割为分割为一系列子任务,并使各子任务能在流水线的各个阶段并发一系列子任务,并使各子任务能在流水线的各个阶段并发地执行。当任务连续不断地输入流水线时,在流水线的输地执
7、行。当任务连续不断地输入流水线时,在流水线的输出端便连续不断地吐出执行结果,从而实现了子任务级的出端便连续不断地吐出执行结果,从而实现了子任务级的并行性。并行性。下面通过下面通过时空图时空图来证明这明这个结论。来证明这明这个结论。5.6 CPU实例实例 5.6.2 流水计算机的系统组成流水计算机的系统组成 5.6 CPU实例实例图图(a)表示流水表示流水CPU中一个指令周期的任务分解。中一个指令周期的任务分解。5.6.2 流水计算机的系统组成流水计算机的系统组成 5.6 CPU实例实例图图(b)表示非流水计算机的时空图。表示非流水计算机的时空图。8个单位时间中能个单位时间中能执行执行2条指令。
8、条指令。5.6.2 流水计算机的系统组成流水计算机的系统组成 5.6 CPU实例实例图图(c)表示流水计算机的时空图。表示流水计算机的时空图。8个单位时间中能执个单位时间中能执行行5条指令。条指令。5.6.2 流水计算机的系统组成流水计算机的系统组成 5.6.2 流水计算机的系统组成流水计算机的系统组成 图图(d)d)表示超标量流水计算机的时空图。当流水线满载表示超标量流水计算机的时空图。当流水线满载时,每一个时钟周期可以执行时,每一个时钟周期可以执行2 2条指令。条指令。(如如Pentium机机)具有具有2条以上的指令流水线条以上的指令流水线 5.6 CPU实例实例 3.流水线分类流水线分类
9、 指令流水线指令流水线 指指令步骤的并行。将指令流的处理过程划分为取指指令步骤的并行。将指令流的处理过程划分为取指令、译码、执行、写回等几个并行处理的过程段。目前,几乎所指令、译码、执行、写回等几个并行处理的过程段。目前,几乎所有的高性能计算机都采用了指令流水线。有的高性能计算机都采用了指令流水线。算术流水线算术流水线 指运算操作步骤的并行。如流水加法器、流水乘法指运算操作步骤的并行。如流水加法器、流水乘法器、流水除法等。器、流水除法等。现代计算机中已广泛采用了流水的算术运算器。现代计算机中已广泛采用了流水的算术运算器。处理机流水线处理机流水线 又称为又称为宏流水线宏流水线,是指程序步骤的并行
10、。由一串,是指程序步骤的并行。由一串级联的处理机构成流水线的各个过程段,每台处理机负责某一特定级联的处理机构成流水线的各个过程段,每台处理机负责某一特定的任务。数据流从第一台处理机输入,经处理后被送入与第二台处的任务。数据流从第一台处理机输入,经处理后被送入与第二台处理机相联的缓冲存储器中。第二台处理机从该存储器中取出数据进理机相联的缓冲存储器中。第二台处理机从该存储器中取出数据进行处理,然后传送给第三台处理机,如此串联下去。随着高档微处行处理,然后传送给第三台处理机,如此串联下去。随着高档微处理器芯片的出现,理器芯片的出现,构造处理机流水线将变得容易了。处理机流水线构造处理机流水线将变得容易
11、了。处理机流水线应用在多机系统中。应用在多机系统中。5.6.2 流水计算机的系统组成流水计算机的系统组成 4.流水线中的主要问题流水线中的主要问题 流水过程中通常会出现以下三种相关冲突,使流水线断流流水过程中通常会出现以下三种相关冲突,使流水线断流。资源相关资源相关是指多条指令进入流水线后在同一机器时钟周期内是指多条指令进入流水线后在同一机器时钟周期内争用同一个功能部件所发生的冲突。假定一条指令流水线由五段组争用同一个功能部件所发生的冲突。假定一条指令流水线由五段组成。由下表可以看出,在时钟成。由下表可以看出,在时钟4时,时,I1与与I4两条指令发生争用存储器两条指令发生争用存储器资源的相关冲
12、突。资源的相关冲突。5.6.2 流水计算机的系统组成流水计算机的系统组成 5.6 CPU实例实例 4.流水线中的主要问题流水线中的主要问题两条指令同时访问内存发生资源相关冲突两条指令同时访问内存发生资源相关冲突解决资源相关冲突的办法:解决资源相关冲突的办法:一是第一是第I4条指令停顿一拍后再启动;二是增设一个存储器,将指令条指令停顿一拍后再启动;二是增设一个存储器,将指令和数据分别放在两个存储器中。和数据分别放在两个存储器中。5.6.2 流水计算机的系统组成流水计算机的系统组成 4.流水线中的主要问题流水线中的主要问题数据相关数据相关:在一个程序中,如果必须等前一条指令执行完毕后,:在一个程序
13、中,如果必须等前一条指令执行完毕后,才能执行后一条指令,那么这两条指令就是数据相关的。才能执行后一条指令,那么这两条指令就是数据相关的。流水线中有三类数据相关冲突:写后读相关;读后写相关;写流水线中有三类数据相关冲突:写后读相关;读后写相关;写后写相关。后写相关。在流水计算机中,指令的处理是重叠进行的,前一条指令还在流水计算机中,指令的处理是重叠进行的,前一条指令还没有结束,第二、三条指令就陆续地开始工作。由于多条指令的没有结束,第二、三条指令就陆续地开始工作。由于多条指令的重叠处理,当后继指令所需的操作数,刚好是前一指令的运算结重叠处理,当后继指令所需的操作数,刚好是前一指令的运算结果时,便
14、发生数据相关冲突。如下表所示,果时,便发生数据相关冲突。如下表所示,ADD指令与指令与SUB指令指令发生了数据相关冲突。发生了数据相关冲突。两条指令发生数据相关冲突两条指令发生数据相关冲突 5.6.2 流水计算机的系统组成流水计算机的系统组成 5.6 CPU实例实例 4.流水线中的主要问题流水线中的主要问题 在流水计算机中,指令的处理是重叠进行的,前一条指令还没在流水计算机中,指令的处理是重叠进行的,前一条指令还没有结束,第二、三条指令就陆续地开始工作。由于多条指令的重叠有结束,第二、三条指令就陆续地开始工作。由于多条指令的重叠处理,当后继指令所需的操作数,刚好是前一指令的运算结果时,处理,当
15、后继指令所需的操作数,刚好是前一指令的运算结果时,便发生数据相关冲突。如下表所示,便发生数据相关冲突。如下表所示,ADD指令与指令与SUB指令发生了数指令发生了数据相关冲突。据相关冲突。两条指令发生数据相关冲突两条指令发生数据相关冲突 5.6.2 流水计算机的系统组成流水计算机的系统组成 5.6.3 Pentium CPU 1.Pentium的技术性能的技术性能pentium是是Intel公司生产的超标量流水处理器,早期使用公司生产的超标量流水处理器,早期使用5V工工作电压,后期使用作电压,后期使用3.3V工作电压。工作电压。CPU的主频是片外主总线时钟频的主频是片外主总线时钟频率率(60MH
16、z或或66MHz)的倍频,有的倍频,有120,166,200MHz等多种。等多种。CPU内部的主要寄存器宽度为内部的主要寄存器宽度为32位,故认为它是一个位,故认为它是一个32位微处位微处理器。但它通向存储器的外部数总线宽度为理器。但它通向存储器的外部数总线宽度为64位,每次总线操作可位,每次总线操作可以同时传输以同时传输8个字节。以主总线个字节。以主总线(存储器总线存储器总线)时钟频率时钟频率66MHz计算,计算,64位数据总线可使位数据总线可使CPU与主存的数据交换速率达到与主存的数据交换速率达到528MB/s。CPU支持多种类型的总线周期,其中一种称猝发模式,在此模式下,支持多种类型的总
17、线周期,其中一种称猝发模式,在此模式下,可在一个总线周期内读出或与入可在一个总线周期内读出或与入256位位(32字节字节)的数据。的数据。5.6 CPU实例实例 5.6 CPU实例实例 5.6.3 Pentium CPU CPU外部地址总线宽度是外部地址总线宽度是36位,但一般使用位,但一般使用32位宽,故物理位宽,故物理地址空间为地址空间为4096MB(4GB)。虚拟地址空间为虚拟地址空间为64TB,分页模式除支分页模式除支持持4KB页面外页面外(与与486相同相同),还支持,还支持2MB和和4MB页面。其中页面。其中2MB页页面的分页模式必须使用面的分页模式必须使用36位地址总线。位地址总
18、线。CPU内部分别设置指令内部分别设置指令cache和数据和数据cache,外部还可接外部还可接L2cache。CPU采用采用U,V两条指令流水线,能在一个时钟周期内两条指令流水线,能在一个时钟周期内发射两条简单的整数指令,也可发射一条浮点指令。操作控制器采发射两条简单的整数指令,也可发射一条浮点指令。操作控制器采用硬布线控制和微程序控制相结合的方式。用硬布线控制和微程序控制相结合的方式。pentium具有非固定长度的指令格式,具有非固定长度的指令格式,9种寻址方式,种寻址方式,191条指条指令,但是在每个时钟周期又能执行两条指令。因此它具有令,但是在每个时钟周期又能执行两条指令。因此它具有C
19、ISC和和RlSC两者的特性,不过具有的两者的特性,不过具有的CISC特性更多一些,因此被看成为特性更多一些,因此被看成为一个一个CISC结构的处理器。以结构的处理器。以CISC结构实现超标量流水线,并有结构实现超标量流水线,并有BTB方式的转移预测能力,堪称为当代方式的转移预测能力,堪称为当代CISC机器的经典。机器的经典。5.6.3 Pentium CPU (1)超标量流水线超标量流水线 (2)指令指令cache和数据和数据cache (3)浮点运算部件浮点运算部件 (4)动态转移预测技术动态转移预测技术5.6 CPU实例实例 5.6.3 Pentium CPU 5.6.3 Pentium
20、 CPU RISC的三个要素是:的三个要素是:(1)一个有限的简单的指令集;一个有限的简单的指令集;(2)CPU配备大量的通用寄存器;配备大量的通用寄存器;(3)强调对指令流水线的优化。强调对指令流水线的优化。5.6 CPU实例实例 5.6.4 RISC CPU 5.6 CPU实例实例基于三要素的基于三要素的RISCRISC机器的特征是:机器的特征是:(1)使用等长指令,目前的典型长度是使用等长指令,目前的典型长度是4个字节。个字节。(2)寻址方式少且简单,一般为寻址方式少且简单,一般为23种,最多不超过种,最多不超过4种,绝不出种,绝不出现存储器间接寻址方式。现存储器间接寻址方式。(3)只有
21、取数指令、存数指令访问存储器。指令中最多出现只有取数指令、存数指令访问存储器。指令中最多出现RS型型指令,绝不出现指令,绝不出现SS型指令。型指令。(4)指令集中的指令数目一般少于指令集中的指令数目一般少于100种,指令格式一般少于种,指令格式一般少于4种。种。(5)指令功能简单,控制器多采用硬布线方式,以期更快的执行指令功能简单,控制器多采用硬布线方式,以期更快的执行速度。速度。(6)平均而言,所有指令的执行时间为一个处理时钟周期。平均而言,所有指令的执行时间为一个处理时钟周期。(7)指令格式中用于指派整数寄存器的个数不少于指令格式中用于指派整数寄存器的个数不少于32个,用于指个,用于指派浮
22、点数寄存器的个数不少于派浮点数寄存器的个数不少于16个。个。(8)强调通用寄存器资源的优化使用。强调通用寄存器资源的优化使用。(9)支持指令流水并强调指令流水的优化使用。支持指令流水并强调指令流水的优化使用。(10)RlSC技术的复杂性于它的编译程序,因此软件系统开发时间技术的复杂性于它的编译程序,因此软件系统开发时间比比CISC机器长。机器长。5.6 CPU实例实例 5.6.4 RISC CPU5.6 CPU实例实例 5.6.5 多媒体多媒体CPU多媒体技术解决的主要问题有:多媒体技术解决的主要问题有:1.图像与声音的压缩技术图像与声音的压缩技术 2.适应多媒体技术的软件技术适应多媒体技术的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 中央处理器 56 CPU 实例
限制150内