CPU的逻辑结构与原理.pptx
冯诺依曼计算机的结构与原理(1)计算机的工作由程序控制,程序是一个指令序列,指令是能被计算机理解和执行的操作命令;(2)程序(指令)和数据均以二进制编码表示,均存放在存储器中;(3)存储器中存放的指令和数据按地址进行存取;(4)指令是由CPU一条一条顺序执行的。中央处理器运算器和控制器输入设备输出设备存储器第1页/共27页“存储程序控制”原理将问题的解算步骤编制成为程序,程序连同它所处理的数据都用二进位表示并预先存放在存储器中程序运行时,CPU从内存中一条一条地取出指令和相应的数据,按指令操作码的规定,对数据进行运算处理,直到程序执行完毕为止 CPU从从内内存存中中逐逐条条读读取取该该程程序序的的指指令令及及相关的数据相关的数据将将指指令令的的运运算算处处理理结果送回内存保存结果送回内存保存任任务务完完成成后后,将将处处理理得得到到的的全全部部结结果果成成批批传传送送到到外外存存以以长长久久保存保存外存储器内存储器CPU任任务务启启动动时时,执执行行该该任任务务的的程程序序和和数数据据从从外外存存成成批批传传送送到到内内存存指令1指令2指令k指令n程序数据1数据2数据m数据CPU逐逐 条条执执行行指指令令,按按指指令令要要求求完完成成对对数数据据的的运算和处理运算和处理第2页/共27页存储器中央处理器存储数据和指令执行指令处理数据指令,数据处理结果CPU的任务CPU的主要任务是执行指令,它按指令的规定对数据进行操作第3页/共27页指令是什么?指令就是命令,它用来规定CPU执行什么操作。指令是构成程序的基本单位,程序是由一连串指令组成的指令采用二进位表示,大多数情况下,指令由两个部分组成:操作码操 作 数 地 址指出CPU应执行何种操作的一个命令词,例如加、减、乘、除、取数、存数等 指出该指令所操作(处理)的数据或者数据所在位置 举例:100206把02存储单元和06存储单元中的内容相加,和数保存在02单元第4页/共27页CPU的结构和任务CPU主要由运算器、控制器和寄存器组3个部分组成CPU的任务:取指令并完成指令所规定的操作寄存器组运算器中央处理器指令计数器指令寄存器控制器数 据程序指令1指令2指令k指令n数据1数据2数据m数据内存储器指 令 指令地址 操作数地址存放待执行指令的地址已经启动运行的程序和数据存放待执行的指令并进行译码完成规定的运算暂存等待处理的数据操作命令第5页/共27页内存储器AC927BALU0 1 2 3 4 5 6 7运算器(ALU)与通用寄存器(GPR)运算器用来对数据进行各种算术或逻辑运算,所以称为算术逻辑部件(ALU),参加ALU运算的操作数通常来自通用寄存器GPR,运算结果也送回GPRSTORER1内存地址C例3:存数指令9例2:加法指令ADDR1R3R5(3寄存器内容与5寄存器内容相加,并把和数写入1寄存器)例1:取数指令LOADR3内存地址ALOADR5内存地址B27362793636通用寄存器GPR第6页/共27页2.2.2 指令与指令系统instructionsetsoftwarehardware第7页/共27页指令及其格式指令采用二进位表示,大多数情况下由两个部分组成:操作码操 作 数 地 址指出CPU应执行何种操作的一个命令词,例如加、减、乘、除等指出该指令所操作(处理)的数据或者数据所在位置n指令的格式:n操作码用几位表示?(多少种不同的操作功能)n操作数地址是2个还是3个?nR1R3+R5nR1R1-R3n如何指出内存地址?(寻址方式)n指令长度是多少位,固定长度/可变长度?ADDR1R3R5SUBR1R3第8页/共27页指令在计算机中的执行过程1.取指令:CPU的控制器从存储器读取一条指令并放入指令寄存器2.指令译码:指令寄存器中的指令经过译码,决定该指令应进行何种操作、操作数在哪里3.执行指令3.1 取操作数3.2 进行运算4.修改指令计数器,决定下一条指令的地址1取指令4修改指令计数器3执行指令2指令译码指令执行周期问题:CPU的时钟频率(主频)与指令执行速度是什么关系?第9页/共27页关于指令系统CPU可执行的全部指令称为该CPU的指令系统,即它的机器语言指令应该简单,简单才能提高速度!1.操作功能要简单,不宜太多、太复杂2.指令的格式要统一:固定长度、统一分段3.操作数的来源要有限制:算术逻辑运算指令的操作数只能来自寄存器LOAD/STORE指令的操作数来自(或送到)内存寄存器内存 内存寄存器Intel 奔腾处理器的指令系统由于历史的原因,并不符合上述原则!第10页/共27页关于指令的操作功能指令系统中的指令分成许多类,例如奔腾4处理器中共有七大类指令:数据传送类 算术运算类逻辑运算类 移位操作类位(位串)操作类 控制转移类输入/输出类等每一类指令(如数据传送类、算术运算类)又按照操作数的性质(如整数还是实数)、长度(16位、32位、64位、128位等)而区分为许多不同的指令,因此CPU往往有数以百计的不同的指令第11页/共27页关于奔腾4系列的指令系统产品发展过程为:8088(8086)80286 8038680486 PentiumPentium PROPentium II Pentium III Pentium 4 奔腾D奔腾至尊酷睿酷睿2为解决软件兼容性问题,采用“向下兼容方式”开发新的处理器,即所有新处理器均保留老处理器的全部指令,同时还扩充功能更强的新指令。例如:Pentium比80386增加了的80多条浮点指令,Pentium II比Pentium增加了50多条处理多媒体信息的指令(Multimedia Extension,称为MMX),Pentium III比Pentium II增加了70条处理128位长操作数的流式单指令多数据指令(Streaming SIMD Extention,SSE)Pentium 4又比Pentium III 增加了144条指令(称为SSE2)奔腾D、奔腾至尊、酷睿2等又增加了13条SSE3指令第12页/共27页关于CPU的兼容性不同公司生产不同的CPU产品:Intel公司:Pentium系列、赛扬系列、至强等AMD公司:独龙、闪龙、炫龙等IBM公司:Power5、Power6等(苹果的Macintosh使用)SUN公司:Ultra SPARC处理器HP公司:PA-RISC、Itanium 处理器同一公司同一系列的CPU具有向下(前)兼容性:A计算机(使用新型号CPU)的程序不能在B计算机(使用老型号CPU)上运行,B计算机的程序却能在A计算机上运行不同公司的不同CPU产品其指令系统不同,它们互相不兼容:A计算机的程序不能在B计算机上直接运行,B计算机的程序也不能在A计算机上直接运行互相兼容第13页/共27页2.2.3 CPU的性能指标第14页/共27页如何衡量CPU的性能?计算机的性能主要表现在程序执行速度的快慢,它由许多因素决定,例如CPU、内存、硬盘、显卡等,但通常CPU是主要因素CPU性能高低的主要指标是CPU的速度,有2种衡量方法:1.计算每秒钟可执行的指令数目(单位:MIPS、MFLOPS)2.使用常用软件(办公软件、数字媒体处理软件和3D游戏等)的运行速度来衡量CPU的性能 第15页/共27页影响CPU性能的主要因素(之一)CPU的字长(位数)目前PC使用的CPU大多是32位处理器,新一代的PC机将使用64位处理器主频(CPU时钟频率)主频提高,CPU的处理速度通常也会加快CPU总线(前端总线)的速度CPU总线速度决定了CPU与内存间数据传输速度的快慢高速缓存(cache)的容量与结构cache容量越大、级数越多,其效用就越显著 第16页/共27页影响CPU性能的主要因素(之二)CPU的指令系统指令的格式和功能会影响程序的执行速度CPU的逻辑结构CPU包含的定点运算器和浮点运算器数目是否流水线结构,流水线的条数和级数有无指令预测和数据预测功能是否具有数字信号处理功能是否多核,有几个内核第17页/共27页Intel 微处理器主要技术参数比较 处理器处理器主要参数主要参数8086802868038680486奔腾奔腾高能奔腾高能奔腾奔腾奔腾奔腾奔腾奔腾奔腾4酷睿酷睿2(双核双核)酷睿酷睿2(四核四核)推出时间推出时间(年年)197819821985198919931996199519971997199819992003200020062007主频主频(MHz)4.7710620163333100 602001502002333334501400150038001800316024002830前端总线频前端总线频率率(MHz)4.7710620163325或或3350或或666666100或或133400,533或或800,10668001333 1066,1333外部数据线外部数据线数目数目1616323264646464646464地址线数目地址线数目2024323232363636363636L2cache容容量量无无无无无无仅仅L1仅仅L10.25MB0.5MB0.5MB0.252MB26MB612MB内核数目内核数目11111111124晶体管数目晶体管数目(万万)2.913.427.51203105507509504200291004100082000制造工艺制造工艺(m)21.51.51.01.00.80.80.350.60.350.350.250.250.130.130.090.065,0.0450.065,0.045芯片引脚数芯片引脚数目目,4068132168273或或296387242370478或或775775775第18页/共27页附:Pentium4的逻辑结构寄存器组与CPU字长超标量结构ALU流水线处理技术SIMD技术EM-64T超线程技术双核与多核技术第19页/共27页Pentium 4 处理器的逻辑结构 指令译码器整 数 寄 存 器 组L2cache(48GB/s)L1数据cache(8KB)浮 点 寄 存 器 组慢ALU复杂指令2xALU简单指令2xALU简单指令2xAGU存地址浮点存浮 点 取2xAGU取地址MMXSSE/SSE2浮点加浮点乘浮点除跟踪cache分支预测器执行跟踪cache(12000微操作)微码ROM微操作队列微操作队列指令预取部件动态分支预测器前端总线256位,时钟频率64位,时钟频率总线接口部件预取控制逻辑总线接口运算器寄存器组控制器第20页/共27页为什么需要64位计算?原因:可以进行更大范围的整数运算可以支持更大的内存 进行64位计算的条件:64位的处理器64位的操作系统(如 Windows XP X64,Windows Vista)64位的应用软件 产品:RISC(UltraSparc、IBM公司的POWER5、HP公司的Alpha)Intel 安腾处理器(Itanium 和 Itanium 2)AMD64(Athlon 64系列、Athlon FX系列和Opteron系列)Intel EM-64T(Extended Memory 64 Technology)至强(Xeon)系列、Pentium 4 6xx系列 和 Pentium D系列、P4 至尊版 第21页/共27页Pentium的64位扩展技术(EM-64T)整数寄存器组P4Pentium803868048680868088指令计数器标志寄存器64位处理器的整数寄存器组 共共16个个64位寄存器,另外位寄存器,另外还增加还增加8个个128位的位的SSE寄存器寄存器增加了处理64位整数的指令支持c语言中的“longint”数据类型,对应的是64位整数Pentium4的64位寄存器组第22页/共27页超线程(Hyper-Threading,HT)技术背景:实际应用中CPU的执行单元没有被充分使用,性能未得到充分发挥超线程(HT)技术:把硬件模拟成两个处理器芯片,从OS来看就像有两个CPU一样,可同时执行2个线程P4处理器增加了一个逻辑CPU指针,而整数运算单元、浮点运算单元、L2 Cache等均由2个线程共享处理器有两种运行模式:Single Task Mode(单任务模式):系统只有1个逻辑处理器Multi Task Mode(多任务模式):系统有2个逻辑处理器分析:由于不是2个真正的CPU,它们需要共享ALU、cache等资源,当两个线程同时需要使用某个资源时,一个线程必须暂停运行,直到该资源空闲后才能继续执行。因此超线程的性能达不到2个物理CPU的性能超线程技术需要芯片组、OS和应用软件支持,才能发挥该项技术的优势,Windows2000就不支持双线程 当运行单线程应用软件时,超线程技术甚至会降低系统性能第23页/共27页双核处理器出现的背景n提高主频来提升处理器性能的瓶颈是散热问题:n3.2GHz的Pentium4处理器功率超过100W,内核温度达摄氏70度n提升到4.0GHz时功率会达到150W,散热问题更难处理n超线程技术虽然可以提高执行部件的使用效率,但有一定开销,对于单线程的软件反而降低了效率n集成电路制造及封装技术的进步,有能力把2个甚至更多个处理器做在1个芯片内第24页/共27页双核处理器1个芯片中有两个功能相同的处理器(内核),在操作系统看来,系统中有2个CPU 2个内核可以各有自己的L2 cache,但必须保正其中的信息完全一致,否则就会出现运算错误(由955X芯片组中北桥芯片负责),也可以共享同一个L2 cache用途:面向计算密集型应用和娱乐发烧友 产品:Pentium D(不支持超线程技术)Pentium Extreme Edition(至尊版)支持HT,最多可作为4个处理器用酷睿(Core Duo)双核处理器(嵌入式应用和笔记本):不支持HT和64位扩展酷睿2(Core 2 Duo)双核处理器:支持EM64T揭开外壳后的PentiumD处理器独立cache共享cache第25页/共27页小结:Pentium4提高速度的措施扩展CPU的字长:64位存储扩展提高CPU的主频:已经从1.5GHz逐步提高到3GHz以上,目前最高已经接近4GHz;加快CPU前端总线的数据传输速度:CPU总线宽度增加为64128位CPU总线频率从400MHz、533 MHz提高到800MHz和1066MHz因此,传输速率也相应地从3.2GB/s、4.3GB/s提高到6.4GB/s和8.6GB/s采用cache存储器增大cache容量:L2 cache的容量从256KB也已经增大为1MB或2MB增加cache的级数:有些处理器采用L3 cache采用超标量运算器结构和超流水线技术提供和支持向量运算指令(SIMD指令)采用超线程技术,提高执行部件的工作效率采用双(多)核处理器技术 第26页/共27页谢谢大家观赏!第27页/共27页