第五章中央处理器56CPU实例.ppt
1.传统传统CPU2.流水流水CPU3.RISC CPU4.多媒体多媒体CPU 5.6 CPU实例实例5.6.1 并行处理技术并行处理技术 并行性的两种含义:并行性的两种含义:同时性同时性 指两个以上事件在同一时刻发生;指两个以上事件在同一时刻发生;并发性并发性 指两个以上事件在同一时间间隔内发生。指两个以上事件在同一时间间隔内发生。计算机的并行处理技术概括起来主要有以下三种形式:计算机的并行处理技术概括起来主要有以下三种形式:1.时间并行时间并行 时间并行指时间重叠,在并行性概念中引入时间因素,让多时间并行指时间重叠,在并行性概念中引入时间因素,让多个处理过程在时间上相互错开,轮流重叠地使用同一套硬件设备的个处理过程在时间上相互错开,轮流重叠地使用同一套硬件设备的各个部分,以加快硬件周转而赢得速度。各个部分,以加快硬件周转而赢得速度。时间并行性概念的实现方式就是采用流水处理部件。这是一时间并行性概念的实现方式就是采用流水处理部件。这是一种非常经济而实用的并行技术,能保证计算机系统具有较高的性能种非常经济而实用的并行技术,能保证计算机系统具有较高的性能价格比。目前的高性能微型机几乎无一例外地使用了流水技术。价格比。目前的高性能微型机几乎无一例外地使用了流水技术。5.6 CPU实例实例2.空间并行空间并行 空间并行指资源重复,在并行性概念中引入空间空间并行指资源重复,在并行性概念中引入空间因素,以因素,以“数量取胜数量取胜”为原则来大幅度提高计算机的为原则来大幅度提高计算机的处理速度。大规模和超大规模集成电路的迅速发展为处理速度。大规模和超大规模集成电路的迅速发展为空间并行技术带来了巨大生机,因而成为目前实现并空间并行技术带来了巨大生机,因而成为目前实现并行处理的一个主要途径。空间并行技术主要体现行处理的一个主要途径。空间并行技术主要体现 在多在多处理器系统和多计算机系统。但是在单处理器系统中处理器系统和多计算机系统。但是在单处理器系统中也得到了广泛应用。也得到了广泛应用。3.时间并行时间并行+空间并行空间并行 指时间重叠和资源重复的综合应用指时间重叠和资源重复的综合应用,既采用时间,既采用时间并行性又采用空间并行性。显然,第三种并行技术带并行性又采用空间并行性。显然,第三种并行技术带来的高速效益是最好的。来的高速效益是最好的。5.6.1 并行处理技术并行处理技术5.6.2 流水计算机的系统组成流水计算机的系统组成 1、现代流水计算机的系统组成原理如下图所示。其中、现代流水计算机的系统组成原理如下图所示。其中CPU按按流水线方式组织,通常由三部分组成:指令部件、指令队列、执流水线方式组织,通常由三部分组成:指令部件、指令队列、执行部件。这三个功能部件可以组成一个行部件。这三个功能部件可以组成一个3级流水线。级流水线。为了使存储器的存取时间能与流水线的其他各过程段为了使存储器的存取时间能与流水线的其他各过程段的速度相匹配,一般都采用多体交叉存器。的速度相匹配,一般都采用多体交叉存器。执行段的速度匹配问题:通常采用并行的运算部件以执行段的速度匹配问题:通常采用并行的运算部件以及部件流水线的工作方式来解决。方法包括:及部件流水线的工作方式来解决。方法包括:(1)将执行部件分为定点执行部件和浮点执行部件两个将执行部件分为定点执行部件和浮点执行部件两个可并行执行的部分,可并行执行的部分,分别处理定点运算指令和浮点运算分别处理定点运算指令和浮点运算指令;指令;(2)在浮点执行部件中,又有浮点加法部件和浮点在浮点执行部件中,又有浮点加法部件和浮点 乘乘/除部件,它们也可以同时执行不同的指令;除部件,它们也可以同时执行不同的指令;(3)浮点运算部件都以流水线方式工作。浮点运算部件都以流水线方式工作。5.6 CPU实例实例 5.6.2 流水计算机的系统组成流水计算机的系统组成 2.流水流水CPUCPU的时空图的时空图 计算机的流水处理过程非常类似于工厂中的流水装计算机的流水处理过程非常类似于工厂中的流水装配线。为了实现流水,首先把输入的任务配线。为了实现流水,首先把输入的任务(或过程或过程)分割为分割为一系列子任务,并使各子任务能在流水线的各个阶段并发一系列子任务,并使各子任务能在流水线的各个阶段并发地执行。当任务连续不断地输入流水线时,在流水线的输地执行。当任务连续不断地输入流水线时,在流水线的输出端便连续不断地吐出执行结果,从而实现了子任务级的出端便连续不断地吐出执行结果,从而实现了子任务级的并行性。并行性。下面通过下面通过时空图时空图来证明这明这个结论。来证明这明这个结论。5.6 CPU实例实例 5.6.2 流水计算机的系统组成流水计算机的系统组成 5.6 CPU实例实例图图(a)表示流水表示流水CPU中一个指令周期的任务分解。中一个指令周期的任务分解。5.6.2 流水计算机的系统组成流水计算机的系统组成 5.6 CPU实例实例图图(b)表示非流水计算机的时空图。表示非流水计算机的时空图。8个单位时间中能个单位时间中能执行执行2条指令。条指令。5.6.2 流水计算机的系统组成流水计算机的系统组成 5.6 CPU实例实例图图(c)表示流水计算机的时空图。表示流水计算机的时空图。8个单位时间中能执个单位时间中能执行行5条指令。条指令。5.6.2 流水计算机的系统组成流水计算机的系统组成 5.6.2 流水计算机的系统组成流水计算机的系统组成 图图(d)d)表示超标量流水计算机的时空图。当流水线满载表示超标量流水计算机的时空图。当流水线满载时,每一个时钟周期可以执行时,每一个时钟周期可以执行2 2条指令。条指令。(如如Pentium机机)具有具有2条以上的指令流水线条以上的指令流水线 5.6 CPU实例实例 3.流水线分类流水线分类 指令流水线指令流水线 指指令步骤的并行。将指令流的处理过程划分为取指指令步骤的并行。将指令流的处理过程划分为取指令、译码、执行、写回等几个并行处理的过程段。目前,几乎所指令、译码、执行、写回等几个并行处理的过程段。目前,几乎所有的高性能计算机都采用了指令流水线。有的高性能计算机都采用了指令流水线。算术流水线算术流水线 指运算操作步骤的并行。如流水加法器、流水乘法指运算操作步骤的并行。如流水加法器、流水乘法器、流水除法等。器、流水除法等。现代计算机中已广泛采用了流水的算术运算器。现代计算机中已广泛采用了流水的算术运算器。处理机流水线处理机流水线 又称为又称为宏流水线宏流水线,是指程序步骤的并行。由一串,是指程序步骤的并行。由一串级联的处理机构成流水线的各个过程段,每台处理机负责某一特定级联的处理机构成流水线的各个过程段,每台处理机负责某一特定的任务。数据流从第一台处理机输入,经处理后被送入与第二台处的任务。数据流从第一台处理机输入,经处理后被送入与第二台处理机相联的缓冲存储器中。第二台处理机从该存储器中取出数据进理机相联的缓冲存储器中。第二台处理机从该存储器中取出数据进行处理,然后传送给第三台处理机,如此串联下去。随着高档微处行处理,然后传送给第三台处理机,如此串联下去。随着高档微处理器芯片的出现,理器芯片的出现,构造处理机流水线将变得容易了。处理机流水线构造处理机流水线将变得容易了。处理机流水线应用在多机系统中。应用在多机系统中。5.6.2 流水计算机的系统组成流水计算机的系统组成 4.流水线中的主要问题流水线中的主要问题 流水过程中通常会出现以下三种相关冲突,使流水线断流流水过程中通常会出现以下三种相关冲突,使流水线断流。资源相关资源相关是指多条指令进入流水线后在同一机器时钟周期内是指多条指令进入流水线后在同一机器时钟周期内争用同一个功能部件所发生的冲突。假定一条指令流水线由五段组争用同一个功能部件所发生的冲突。假定一条指令流水线由五段组成。由下表可以看出,在时钟成。由下表可以看出,在时钟4时,时,I1与与I4两条指令发生争用存储器两条指令发生争用存储器资源的相关冲突。资源的相关冲突。5.6.2 流水计算机的系统组成流水计算机的系统组成 5.6 CPU实例实例 4.流水线中的主要问题流水线中的主要问题两条指令同时访问内存发生资源相关冲突两条指令同时访问内存发生资源相关冲突解决资源相关冲突的办法:解决资源相关冲突的办法:一是第一是第I4条指令停顿一拍后再启动;二是增设一个存储器,将指令条指令停顿一拍后再启动;二是增设一个存储器,将指令和数据分别放在两个存储器中。和数据分别放在两个存储器中。5.6.2 流水计算机的系统组成流水计算机的系统组成 4.流水线中的主要问题流水线中的主要问题数据相关数据相关:在一个程序中,如果必须等前一条指令执行完毕后,:在一个程序中,如果必须等前一条指令执行完毕后,才能执行后一条指令,那么这两条指令就是数据相关的。才能执行后一条指令,那么这两条指令就是数据相关的。流水线中有三类数据相关冲突:写后读相关;读后写相关;写流水线中有三类数据相关冲突:写后读相关;读后写相关;写后写相关。后写相关。在流水计算机中,指令的处理是重叠进行的,前一条指令还在流水计算机中,指令的处理是重叠进行的,前一条指令还没有结束,第二、三条指令就陆续地开始工作。由于多条指令的没有结束,第二、三条指令就陆续地开始工作。由于多条指令的重叠处理,当后继指令所需的操作数,刚好是前一指令的运算结重叠处理,当后继指令所需的操作数,刚好是前一指令的运算结果时,便发生数据相关冲突。如下表所示,果时,便发生数据相关冲突。如下表所示,ADD指令与指令与SUB指令指令发生了数据相关冲突。发生了数据相关冲突。两条指令发生数据相关冲突两条指令发生数据相关冲突 5.6.2 流水计算机的系统组成流水计算机的系统组成 5.6 CPU实例实例 4.流水线中的主要问题流水线中的主要问题 在流水计算机中,指令的处理是重叠进行的,前一条指令还没在流水计算机中,指令的处理是重叠进行的,前一条指令还没有结束,第二、三条指令就陆续地开始工作。由于多条指令的重叠有结束,第二、三条指令就陆续地开始工作。由于多条指令的重叠处理,当后继指令所需的操作数,刚好是前一指令的运算结果时,处理,当后继指令所需的操作数,刚好是前一指令的运算结果时,便发生数据相关冲突。如下表所示,便发生数据相关冲突。如下表所示,ADD指令与指令与SUB指令发生了数指令发生了数据相关冲突。据相关冲突。两条指令发生数据相关冲突两条指令发生数据相关冲突 5.6.2 流水计算机的系统组成流水计算机的系统组成 5.6.3 Pentium CPU 1.Pentium的技术性能的技术性能pentium是是Intel公司生产的超标量流水处理器,早期使用公司生产的超标量流水处理器,早期使用5V工工作电压,后期使用作电压,后期使用3.3V工作电压。工作电压。CPU的主频是片外主总线时钟频的主频是片外主总线时钟频率率(60MHz或或66MHz)的倍频,有的倍频,有120,166,200MHz等多种。等多种。CPU内部的主要寄存器宽度为内部的主要寄存器宽度为32位,故认为它是一个位,故认为它是一个32位微处位微处理器。但它通向存储器的外部数总线宽度为理器。但它通向存储器的外部数总线宽度为64位,每次总线操作可位,每次总线操作可以同时传输以同时传输8个字节。以主总线个字节。以主总线(存储器总线存储器总线)时钟频率时钟频率66MHz计算,计算,64位数据总线可使位数据总线可使CPU与主存的数据交换速率达到与主存的数据交换速率达到528MB/s。CPU支持多种类型的总线周期,其中一种称猝发模式,在此模式下,支持多种类型的总线周期,其中一种称猝发模式,在此模式下,可在一个总线周期内读出或与入可在一个总线周期内读出或与入256位位(32字节字节)的数据。的数据。5.6 CPU实例实例 5.6 CPU实例实例 5.6.3 Pentium CPU CPU外部地址总线宽度是外部地址总线宽度是36位,但一般使用位,但一般使用32位宽,故物理位宽,故物理地址空间为地址空间为4096MB(4GB)。虚拟地址空间为虚拟地址空间为64TB,分页模式除支分页模式除支持持4KB页面外页面外(与与486相同相同),还支持,还支持2MB和和4MB页面。其中页面。其中2MB页页面的分页模式必须使用面的分页模式必须使用36位地址总线。位地址总线。CPU内部分别设置指令内部分别设置指令cache和数据和数据cache,外部还可接外部还可接L2cache。CPU采用采用U,V两条指令流水线,能在一个时钟周期内两条指令流水线,能在一个时钟周期内发射两条简单的整数指令,也可发射一条浮点指令。操作控制器采发射两条简单的整数指令,也可发射一条浮点指令。操作控制器采用硬布线控制和微程序控制相结合的方式。用硬布线控制和微程序控制相结合的方式。pentium具有非固定长度的指令格式,具有非固定长度的指令格式,9种寻址方式,种寻址方式,191条指条指令,但是在每个时钟周期又能执行两条指令。因此它具有令,但是在每个时钟周期又能执行两条指令。因此它具有CISC和和RlSC两者的特性,不过具有的两者的特性,不过具有的CISC特性更多一些,因此被看成为特性更多一些,因此被看成为一个一个CISC结构的处理器。以结构的处理器。以CISC结构实现超标量流水线,并有结构实现超标量流水线,并有BTB方式的转移预测能力,堪称为当代方式的转移预测能力,堪称为当代CISC机器的经典。机器的经典。5.6.3 Pentium CPU (1)超标量流水线超标量流水线 (2)指令指令cache和数据和数据cache (3)浮点运算部件浮点运算部件 (4)动态转移预测技术动态转移预测技术5.6 CPU实例实例 5.6.3 Pentium CPU 5.6.3 Pentium CPU RISC的三个要素是:的三个要素是:(1)一个有限的简单的指令集;一个有限的简单的指令集;(2)CPU配备大量的通用寄存器;配备大量的通用寄存器;(3)强调对指令流水线的优化。强调对指令流水线的优化。5.6 CPU实例实例 5.6.4 RISC CPU 5.6 CPU实例实例基于三要素的基于三要素的RISCRISC机器的特征是:机器的特征是:(1)使用等长指令,目前的典型长度是使用等长指令,目前的典型长度是4个字节。个字节。(2)寻址方式少且简单,一般为寻址方式少且简单,一般为23种,最多不超过种,最多不超过4种,绝不出种,绝不出现存储器间接寻址方式。现存储器间接寻址方式。(3)只有取数指令、存数指令访问存储器。指令中最多出现只有取数指令、存数指令访问存储器。指令中最多出现RS型型指令,绝不出现指令,绝不出现SS型指令。型指令。(4)指令集中的指令数目一般少于指令集中的指令数目一般少于100种,指令格式一般少于种,指令格式一般少于4种。种。(5)指令功能简单,控制器多采用硬布线方式,以期更快的执行指令功能简单,控制器多采用硬布线方式,以期更快的执行速度。速度。(6)平均而言,所有指令的执行时间为一个处理时钟周期。平均而言,所有指令的执行时间为一个处理时钟周期。(7)指令格式中用于指派整数寄存器的个数不少于指令格式中用于指派整数寄存器的个数不少于32个,用于指个,用于指派浮点数寄存器的个数不少于派浮点数寄存器的个数不少于16个。个。(8)强调通用寄存器资源的优化使用。强调通用寄存器资源的优化使用。(9)支持指令流水并强调指令流水的优化使用。支持指令流水并强调指令流水的优化使用。(10)RlSC技术的复杂性于它的编译程序,因此软件系统开发时间技术的复杂性于它的编译程序,因此软件系统开发时间比比CISC机器长。机器长。5.6 CPU实例实例 5.6.4 RISC CPU5.6 CPU实例实例 5.6.5 多媒体多媒体CPU多媒体技术解决的主要问题有:多媒体技术解决的主要问题有:1.图像与声音的压缩技术图像与声音的压缩技术 2.适应多媒体技术的软件技术适应多媒体技术的软件技术3.计算机系统结构方面的技术计算机系统结构方面的技术4.第一,选择专用芯片和专插卡来扩充功能,如声卡、视第一,选择专用芯片和专插卡来扩充功能,如声卡、视频卡、网卡、内接或外接调制解调器。频卡、网卡、内接或外接调制解调器。5.第二,进一步改善总第二,进一步改善总 线的结构和性能,如加宽系统总线,线的结构和性能,如加宽系统总线,提高时钟速率。提高时钟速率。6.第三,将一些重要的多媒体技术融合到第三,将一些重要的多媒体技术融合到 CPU芯片或设片芯片或设片全新的多媒体全新的多媒体CPU芯片。芯片。5.6 CPU实例实例5.6 CPU实例实例 MMX是一种多媒体扩展结构技术,它极大提高了计是一种多媒体扩展结构技术,它极大提高了计算机在多媒体和通信应用方式的功能。算机在多媒体和通信应用方式的功能。MMX技术集成到新一代技术集成到新一代pentium CPU时,主要体时,主要体现在:现在:采用采用4种新的数据类型种新的数据类型 使用使用8个个64 位宽的位宽的MMX寄存器寄存器 增设增设57条新指令。条新指令。5.6.5 多媒体多媒体CPU英国英国英国英国ARM ARM 公司是全球领先的公司是全球领先的公司是全球领先的公司是全球领先的16/32 16/32 位嵌入式位嵌入式位嵌入式位嵌入式 RISC RISC 微处理器解决方案的供应商,向全球各微处理器解决方案的供应商,向全球各微处理器解决方案的供应商,向全球各微处理器解决方案的供应商,向全球各大领先电子公司提供高性能、低成本和高效率大领先电子公司提供高性能、低成本和高效率大领先电子公司提供高性能、低成本和高效率大领先电子公司提供高性能、低成本和高效率的的的的RISC RISC 处理器、外设和系统芯片技术授权。处理器、外设和系统芯片技术授权。处理器、外设和系统芯片技术授权。处理器、外设和系统芯片技术授权。ARM ARM 还为开发完整系统提供综合技术支持。还为开发完整系统提供综合技术支持。还为开发完整系统提供综合技术支持。还为开发完整系统提供综合技术支持。ARM ARM 的微处理器核技术广泛用于便携式通信的微处理器核技术广泛用于便携式通信的微处理器核技术广泛用于便携式通信的微处理器核技术广泛用于便携式通信产品、手持运算、多媒体和嵌入式解决方案等产品、手持运算、多媒体和嵌入式解决方案等产品、手持运算、多媒体和嵌入式解决方案等产品、手持运算、多媒体和嵌入式解决方案等领域,已成为领域,已成为领域,已成为领域,已成为RISC RISC 标准。标准。标准。标准。5.6.5 多媒体多媒体CPU英文缩写为英文缩写为英文缩写为英文缩写为Advanced RISC MachineAdvanced RISC MachineARMARM是一种通用的是一种通用的是一种通用的是一种通用的3232位位位位RISCRISC处理器处理器处理器处理器3232位是指处理器的外部地址和数据总线是位是指处理器的外部地址和数据总线是位是指处理器的外部地址和数据总线是位是指处理器的外部地址和数据总线是3232位位位位的,相比的,相比的,相比的,相比1616位的同频处理器性能更强大。位的同频处理器性能更强大。位的同频处理器性能更强大。位的同频处理器性能更强大。RISCRISC是一种指令集,也指采用该指令集的处理是一种指令集,也指采用该指令集的处理是一种指令集,也指采用该指令集的处理是一种指令集,也指采用该指令集的处理器,英文缩写:器,英文缩写:器,英文缩写:器,英文缩写:Reduced Instruction Set Reduced Instruction Set Computer,Computer,相比相比相比相比CISCCISC代码效率更高。代码效率更高。代码效率更高。代码效率更高。ARMARM是一种功耗很低的高性能处理器是一种功耗很低的高性能处理器是一种功耗很低的高性能处理器是一种功耗很低的高性能处理器 5.6.5 多媒体多媒体CPUARMARM本质上并不是一种芯片,而是一种芯片结本质上并不是一种芯片,而是一种芯片结本质上并不是一种芯片,而是一种芯片结本质上并不是一种芯片,而是一种芯片结构技术,不涉及到芯片生产工艺。构技术,不涉及到芯片生产工艺。构技术,不涉及到芯片生产工艺。构技术,不涉及到芯片生产工艺。授权生产授权生产授权生产授权生产ARMARM结构芯片的公司采用不同的半导结构芯片的公司采用不同的半导结构芯片的公司采用不同的半导结构芯片的公司采用不同的半导体技术,面对不同的应用进行扩展和集成,标体技术,面对不同的应用进行扩展和集成,标体技术,面对不同的应用进行扩展和集成,标体技术,面对不同的应用进行扩展和集成,标有不同系列号。有不同系列号。有不同系列号。有不同系列号。ARMARM是一种可扩展,可移植、可集成的处理器。是一种可扩展,可移植、可集成的处理器。是一种可扩展,可移植、可集成的处理器。是一种可扩展,可移植、可集成的处理器。ARMARM内核有四个功能模块可供生产厂商根据内核有四个功能模块可供生产厂商根据内核有四个功能模块可供生产厂商根据内核有四个功能模块可供生产厂商根据不同用户的要求来配置生产。不同用户的要求来配置生产。不同用户的要求来配置生产。不同用户的要求来配置生产。ARM7TDMI-SARM7TDMI-S给用户预留出功能扩展接口。给用户预留出功能扩展接口。给用户预留出功能扩展接口。给用户预留出功能扩展接口。5.6.5 多媒体多媒体CPUARM7ARM7的特点:的特点:的特点:的特点:ARM7ARM7采用采用采用采用ARMV4TARMV4T(NewmanNewman)结构,)结构,)结构,)结构,三级三级三级三级流水,流水,流水,流水,平均功耗平均功耗平均功耗平均功耗0.6mW/MHz0.6mW/MHz,时钟速度,时钟速度,时钟速度,时钟速度66MHz66MHz,ARMARM内核的四个功能模块:内核的四个功能模块:内核的四个功能模块:内核的四个功能模块:TT:ThumbThumb,即,即,即,即3232位模式下的位模式下的位模式下的位模式下的1616位指令集,位指令集,位指令集,位指令集,可以在兼顾性能的同时减少代码尺寸。可以在兼顾性能的同时减少代码尺寸。可以在兼顾性能的同时减少代码尺寸。可以在兼顾性能的同时减少代码尺寸。DD:DebugDebug,在内核中放置了用于调试的结,在内核中放置了用于调试的结,在内核中放置了用于调试的结,在内核中放置了用于调试的结构,接口形式为构,接口形式为构,接口形式为构,接口形式为JTAGJTAG(Joint Test Action Joint Test Action GroupGroup)。)。)。)。MM:MultiplierMultiplier,指,指,指,指8 8位乘法器。位乘法器。位乘法器。位乘法器。II:EmbeddedICE LogicEmbeddedICE Logic,指用于实现断点,指用于实现断点,指用于实现断点,指用于实现断点观测及变量观测的逻辑电路部分。观测及变量观测的逻辑电路部分。观测及变量观测的逻辑电路部分。观测及变量观测的逻辑电路部分。ARM9ARM9的特点:的特点:的特点:的特点:ARMV4TARMV4T(HarvardHarvard)结构,五级流水,指)结构,五级流水,指)结构,五级流水,指)结构,五级流水,指令与数据分离的令与数据分离的令与数据分离的令与数据分离的CacheCache,平均功耗,平均功耗,平均功耗,平均功耗0.7mW/MHz0.7mW/MHz,时钟为,时钟为,时钟为,时钟为120MHz-200MHz120MHz-200MHzARM10ARM10的特点:的特点:的特点:的特点:采用采用采用采用ARMV5TARMV5T结构,六级流水处理,时钟速结构,六级流水处理,时钟速结构,六级流水处理,时钟速结构,六级流水处理,时钟速度度度度300MHz300MHz,性能约为,性能约为,性能约为,性能约为ARM9ARM9的两倍。的两倍。的两倍。的两倍。5.6.5 多媒体多媒体CPU ARMARM的应用范围的应用范围的应用范围的应用范围嵌入式嵌入式嵌入式嵌入式控制控制控制控制 汽车、电子设备、保安设备、大容量存储器、调制解调器、打汽车、电子设备、保安设备、大容量存储器、调制解调器、打汽车、电子设备、保安设备、大容量存储器、调制解调器、打汽车、电子设备、保安设备、大容量存储器、调制解调器、打印机。印机。印机。印机。数字消费产品数字消费产品数字消费产品数字消费产品 数码相机、数字式电视机、游戏机、数码相机、数字式电视机、游戏机、数码相机、数字式电视机、游戏机、数码相机、数字式电视机、游戏机、GPSGPS、机顶盒、机顶盒、机顶盒、机顶盒便携式产品便携式产品便携式产品便携式产品 手提式计算机、移动电话、手提式计算机、移动电话、手提式计算机、移动电话、手提式计算机、移动电话、PDAPDA关于关于关于关于THUMBTHUMB指令集指令集指令集指令集ARM7TDMIARM7TDMI可以使用两套指令集可以使用两套指令集可以使用两套指令集可以使用两套指令集 标准标准标准标准3232位位位位ARMARM指令集指令集指令集指令集1616位的位的位的位的THUMBTHUMB指令集指令集指令集指令集 两套指令集可以交两套指令集可以交两套指令集可以交两套指令集可以交*编译和连接编译和连接编译和连接编译和连接 5.6.5 多媒体多媒体CPU THUMBTHUMB的特点的特点的特点的特点THUMBTHUMB是对是对是对是对3232位寄存器操作的位寄存器操作的位寄存器操作的位寄存器操作的1616位指令集位指令集位指令集位指令集 与与与与3232位位位位ARMARM指令集相比代码尺寸更小,更适合嵌入式应指令集相比代码尺寸更小,更适合嵌入式应指令集相比代码尺寸更小,更适合嵌入式应指令集相比代码尺寸更小,更适合嵌入式应用。用。用。用。因为是对因为是对因为是对因为是对3232位结构的位结构的位结构的位结构的CPUCPU操作,所以比纯操作,所以比纯操作,所以比纯操作,所以比纯1616位的指令集位的指令集位的指令集位的指令集效率更高。效率更高。效率更高。效率更高。与其它与其它与其它与其它3232位下的位下的位下的位下的1616位指令集相比,它还可以切换到位指令集相比,它还可以切换到位指令集相比,它还可以切换到位指令集相比,它还可以切换到3232位位位位ARMARM指令集并全速执行。指令集并全速执行。指令集并全速执行。指令集并全速执行。5.6.5 多媒体多媒体CPUHTHT技术是超线程技术,技术是超线程技术,技术是超线程技术,技术是超线程技术,HTHT技术是在处理器实现技术是在处理器实现技术是在处理器实现技术是在处理器实现2 2个逻辑处理器,是充分利用处理器资源,双核心处个逻辑处理器,是充分利用处理器资源,双核心处个逻辑处理器,是充分利用处理器资源,双核心处个逻辑处理器,是充分利用处理器资源,双核心处理器是集成理器是集成理器是集成理器是集成2 2个物理核心,是实际意义上的双核心个物理核心,是实际意义上的双核心个物理核心,是实际意义上的双核心个物理核心,是实际意义上的双核心处理器。处理器。处理器。处理器。双核处理器双核处理器双核处理器双核处理器(Dual Core Processor)(Dual Core Processor):双核处理器是指在一个处理器上集成两个运算核心,双核处理器是指在一个处理器上集成两个运算核心,双核处理器是指在一个处理器上集成两个运算核心,双核处理器是指在一个处理器上集成两个运算核心,从而提高计算能力。从而提高计算能力。从而提高计算能力。从而提高计算能力。“双核双核双核双核”的概念最早是由的概念最早是由的概念最早是由的概念最早是由IBMIBM、HPHP、SunSun等支持等支持等支持等支持RISCRISC架构的高端服务器厂商提出架构的高端服务器厂商提出架构的高端服务器厂商提出架构的高端服务器厂商提出的。的。的。的。5.6.5 多媒体多媒体CPU双核与双芯双核与双芯双核与双芯双核与双芯(Dual Core(Dual Core PKPK Dual CPU)Dual CPU):AMDAMD和和和和IntelIntel的双核技术在物理结构上也有很大不同之处。的双核技术在物理结构上也有很大不同之处。的双核技术在物理结构上也有很大不同之处。的双核技术在物理结构上也有很大不同之处。AMDAMD将两个内核做在一个将两个内核做在一个将两个内核做在一个将两个内核做在一个DieDie(晶元)上,通过直连架构(晶元)上,通过直连架构(晶元)上,通过直连架构(晶元)上,通过直连架构连接起来,集成度更高。连接起来,集成度更高。连接起来,集成度更高。连接起来,集成度更高。IntelIntel则是将放在不同则是将放在不同则是将放在不同则是将放在不同DieDie(晶元)(晶元)(晶元)(晶元)上的两个内核封装在一起,因此有人将上的两个内核封装在一起,因此有人将上的两个内核封装在一起,因此有人将上的两个内核封装在一起,因此有人将IntelIntel的方案称为的方案称为的方案称为的方案称为“双双双双芯芯芯芯”,认为,认为,认为,认为AMDAMD的方案才是真正的的方案才是真正的的方案才是真正的的方案才是真正的“双核双核双核双核”。从用户端的角。从用户端的角。从用户端的角。从用户端的角度来看,度来看,度来看,度来看,AMDAMD的方案能够使双核的方案能够使双核的方案能够使双核的方案能够使双核CPUCPU的管脚、功耗等指标的管脚、功耗等指标的管脚、功耗等指标的管脚、功耗等指标跟单核跟单核跟单核跟单核CPUCPU保持一致,从单核升级到双核,不需要更换电保持一致,从单核升级到双核,不需要更换电保持一致,从单核升级到双核,不需要更换电保持一致,从单核升级到双核,不需要更换电源、芯片组、散热系统和主板,只需要刷新源、芯片组、散热系统和主板,只需要刷新源、芯片组、散热系统和主板,只需要刷新源、芯片组、散热系统和主板,只需要刷新BIOSBIOS软件即可,软件即可,软件即可,软件即可,这对于主板厂商、计算机厂商和最终用户的投资保护是非这对于主板厂商、计算机厂商和最终用户的投资保护是非这对于主板厂商、计算机厂商和最终用户的投资保护是非这对于主板厂商、计算机厂商和最终用户的投资保护是非常有利的。客户可以利用其现有的常有利的。客户可以利用其现有的常有利的。客户可以利用其现有的常有利的。客户可以利用其现有的9090纳米基础设施,通过纳米基础设施,通过纳米基础设施,通过纳米基础设施,通过BIOSBIOS更改移植到基于双核心的系统。更改移植到基于双核心的系统。更改移植到基于双核心的系统。更改移植到基于双核心的系统。5.6.5 多媒体多媒体CPU讨论课论题讨论课论题(Issues for Seminar)1.CPU主要性能指标与主流主要性能指标与主流CPU 芯片产品芯片产品介绍及特点比较介绍及特点比较(desktop,laptop,server)2.并行流水处理技术及流水并行流水处理技术及流水CPU3.RISC CPU及及ARM4.Pentium CPU与双与双(四四)核核CPU5.嵌入式处理器嵌入式处理器嵌入式系统与数字信号处嵌入式系统与数字信号处理器理器DSP6.大规模并行计算机系统结构与分布式系统大规模并行计算机系统结构与分布式系统及集群及集群讨论课论文讨论课论文(及电子版及电子版)请于请于2008年年11月月19日前提交日前提交第五章第五章 复习提纲复习提纲1.CPU组成,重点是内部数据通路结构组成,重点是内部数据通路结构(单、双总线结构)(单、双总线结构)2.拟定指令流程、微命令序列拟定指令流程、微命令序列3.微程序控制(包括微指令、分段原则、微程序控制(包括微指令、分段原则、编码格式、微地址形成方法)编码格式、微地址形成方法)4.基本概念(同步基本概念(同步/异步、硬布线控制、微异步、硬布线控制、微程序控制、控制存储器、程序控制、控制存储器、PSW、主设备、主设备、从设备等)从设备等)参见参见P208 小结小结