汇编语言课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《汇编语言课件.ppt》由会员分享,可在线阅读,更多相关《汇编语言课件.ppt(104页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、教 材:汇编语言与接口设计 北京理工大学出版社 李元章、张华平、谭毓安办公地点:中心教学楼,1,参考书及答疑,课时安排,参见安排表,2,第一章 微型计算机硬件系统,张华平 副教授 博士Email: Website: http:/www.nlpir.org/ICTCLAS张华平博士大数据搜索挖掘实验室 (wSMSBIT),计算机系统硬件组成,1.1 微处理器,Microprocessor,简称P、MP或MPU(Microprocess Unit) 采用大规模和超大规模集成电路技术将算术逻辑部件ALU、控制部件CU和寄存器组三个基本部分,以及内部总线集成在一块半导体芯片上构成的电子器件。微处理器又
2、称为“中央处理单元”(Central Processor Unit),简称CPU。,1.1 微处理器,通用微处理器 PC、笔记本电脑、工作站和服务器专用微处理器 专用微处理器面向特定的应用,包括单片机和数字信号处理器,DSP等。,2.1 计算机系统硬件组成1总体结构,Von Neumann system,7,计算机系统硬件组成2组成部分,CPUI/O DeviceMemorySystem BusData BusAddress BusControl Bus,8,计算机系统硬件组成3总线,9,通用微处理器,4位微处理器1971年,Intel 4004,第一个微处理器8位微处理器M6800、Z80和
3、Intel 8080/8085Apple公司苹果机16位微处理器Intel 8086/8088 16位个人计算机(PC:Personal Computer),Intel 4004,通用微处理器,32位微处理器80386,80486,PentiumPentium 432位PC机,APPLE公司的Macintosh机64位微处理器IA-64结构:Itanium(安腾)x86结构:AMD的64位处理器、Intel 64处理器,英特尔32位结构:IA-32(Intel Architecture-32)IA-32微处理器:80386,80486,Pentium系列,12,4位微处理器和8位微处理器,In
4、tel 4004 Intel 8008 Intel 8080,1971年,4004 :寻址4k个4bit存储单元位,45条指令,50KIPS的速度。1971年,8008:4004的8位扩展型微处理器,16k存储空间,48条指令。1973年,8080:现代第一个8位微处理器。 速度十倍于8008。,13,8086/8088,1978年推出第一款16位CPU,第二年推出8088。16位结构的微处理器:数据总线为16位主存容量1MB:地址总线为20位时钟频率5MHz(IBM PC使用4.77MHz)准16位微处理器8088:外部数据总线为8位8087数字协处理器IBM使用Intel 8088 CPU
5、推出了第一代IBM PC,14,80286,1983年推出。16位数据总线,24位地址总线(16MB主存)实方式(Real Mode)与8086工作方式一样保护方式(Protected Mode)提供存储管理、保护机制和多任务管理的硬件支持80287数字协处理器,15,80386,1986年推出,32位结构数据总线32位,地址总线32位,可寻址4GB主存虚拟8086方式(Virtual 8086 Mode)保护方式下的8086工作方式内存分页机制80387数字协处理器,16,80486,1989年 8048680386803878KB CacheGUI(Graphic User Interfa
6、ce)广泛应用倍频技术的应用L1 Cache,17,准64位CPU Pentium,1993年推出,俗称80586或者P5,奔腾微处理器32位结构,寻址空间4GB,连接主存的外部数据总线64位超标量(Superscalar)技术 两条可以并行工作的整数处理流水线,每个时钟周期执行2条彼此独立的指令。动态转移预取技术,加速了循环的执行。双路高速缓冲结构8KB代码和8KB数据高速缓冲存储器,18,Pentium Pro,原称P6,中文名称为“高能奔腾”36位地址总线,寻址范围64GB两个芯片组CPU一级(L1)Cache(8KB代码和8KB数据)二级(L2)Cache(256KB或512KB)扩展
7、的超标量技术12级指令流水线三个指令执行部件,能同时执行3条指令。动态执行技术分支预测、数据流分析和推测执行,19,Pentium II,1997年推出,多个芯片模组,单边接触盒封装形式。片内32KBCache,L2为512KB多媒体扩展指令(MMX指令)MMX(MutliMedia eXtension)整数运算多媒体指令对图像、音频、视频和通信方面的程序进行优化提升微机对多媒体的处理能力Pentium MMX(多能奔腾):MMX指令应用于Pentium处理器Pentium II:MMX指令应用于Pentium Pro赛扬(Celeron)系列:Pentium II去掉L2 Cache,20,
8、Pentium III,1999年推出。数据流SIMD扩展指令(SSE指令)SSE(Streaming SIMD Extensions)浮点单精度多媒体运算指令提高浮点3D数据的处理能力。SSE指令类似于AMD公司发布的3D Now!指令内核速度比Pentium II更快。 128位唯一的处理器序号单指令多数据SIMD(Single Instruction Multiple Data)表示一条指令具有同时处理多组数据的能力。,21,Pentium 4,2000年末推出,芯片组支持用RAMBUS存储总线技术或者DDR替代曾经的SDRAM技术。超线程HT(Hyper Threading)线程级并行
9、TLP(Thread-Level Parallel)发掘程序中的并行性一个物理处理器形成两个逻辑处理器SSE2指令增强浮点双精度多媒体运算能力SSE3指令增强和完善MMX,SSE和SSE2指令,22,64位CPU,IA-64 2001年英特尔发布了Itanium(安腾)处理器。Itanium处理器是英特尔第一款64位的产品。AMD64位技术AMD 皓龙 处理器、AMD 速龙 处理器系列和 AMD 炫龙 64 移动技术EM64T技术Xeon系列等,CPU的微结构(Micro-Architecture),微结构也叫做叫做计算机组织,它包含处理器内部的构成以及这些构成起来的部分如何执行指令集。同一个
10、微结构下可能有多款CPU。同一个名称的CPU也可对应不同的微结构。如Core i7就包括Nehalem微结构和Westmere微结构。,单片机(微控制器,嵌入式控制器,MCU)Intel的MCS-48,MCS-51,MCS-96/98系列爱特梅尔(Atml)公司的AT89系列(与MCS-51兼容),AT91系列(基于ARM内核)Microchip Technology公司的PIC系列数字信号处理器(DSP)专注于数字信号的高速处理美国德州仪器TI公司TMS320各代产品主要应用:嵌入式系统,专用微处理器,微处理器性能指标,1.主频、外频和倍频 主频也叫时钟频率,表示在CPU内数字脉冲信号振荡的
11、速度。 外频是CPU与主板之间同步运行的速度。目前外频有66 MHz、100 MHz和133 MHz。,25,倍频是指CPU和系统总线之间工作频率相差的倍数,当外频不变时,倍频越高,CPU主频也就越高。倍频可使系统总线工作在相对较低的频率上,而CPU速度可以通过倍频来无限提升。 计算公式为:主频=外频倍频。,例题 11 假定购买了一颗CPU,它的工作频率是2.4GHz,倍频系数设定为18,请问外频是多少?,解答:2.4GHz/18 133MHz ,因此在设置主板跳线时应将主板频率置为133MHz。,消失的前端总线,前端总线(Front Side Bus,FSB)是指处理器到北桥之间的总线。前端
12、总线的数据带宽(总线频率数据位宽)8。,例1-2 Intel Pentium 4处理器中采用了四倍传输率的前端总线,当主频为3.2GHz,外频为200MHz时,试问倍频是多少?已知数据位宽为64位,则前端总线频率为多少?前端总线的数据传输性能峰值为多少?,解答:倍频= 3.2GHz/200MHz=16FSB频率= 200MHz4=800MHz峰值传输性能200M4648 = 6.4G/s,FSB的替代品,AMD速龙64系列(K8)以后,Intel微处理器酷睿i系列以后,两大CPU公司在处理器集成了内存控制器,前端总线消失。 AMD公司采用HT(HyperTransport)总线,Intel公司
13、采用QPI(QuickPath Interconnect)总线。二者原理相同。最高的QPI速率为6.4GT/s,Gordon Moore定律:每18-24个月CPU翻一倍,软件特性,1.工作模式 CPU工作模式是指各种影响CPU可以执行的指令和芯片功能的操作环境。不同的工作模式决定了CPU如何看到并管理内存。传统的IA-32模式:从80386开始,CPU具有三种工作模式:实模式、保护模式和虚拟实模式。,32,2 指令系统,1、复杂指令集CISC(Complex Instruction Set Computing)指令集。在CISC微处理器中,程序的各条指令是按顺序串行执行的,每条指令中的各个操
14、作也是按顺序串行执行的。顺序执行的优点是控制简单,但计算机各部分的利用率不高,执行速度慢。英特尔生产的x86系列(也就是IA-32架构)CPU及其兼容CPU,如AMD、VIA,包括X86-64都属于CISC的范畴。,传统的串行结构SISD,传统的串行结构SIMD,1).多媒体增强指令集技术,Multi-Media Extension,MMX技术增加了单指令多数据(SIMD, Simple Instruction,Multi Data)。SIMD功能使一条指令可以对多个数据同时进行操作,从而提高程序的运行速度。MMX技术包括57条新增加的指令,专门处理视频,音频和图形数据。,35,2)单指令的数
15、据流式扩展技术,Streaming SIMD Extensions,SSE技术 MMX只支持整数运算,SSE支持对单精度浮点数的SIMD操作,加快3D图形处理速度,如三维几何变换,裁减等。一条SSE指令可以同时对四个浮点数据进行操作。 Intel公司在SSE的基础上发展起来一系列的指令包括SSE2,SSE3,SSSE3,SSE4.1,SSE4.2等。,36,3)3D NOW!技术,3DNOW技术是由AMD开发的一套SIMD多媒体指令集,支持单精度浮点数的矢量运算,用于增强x86架构的计算机在三维图像处理上的性能。作为MMX技术的扩展,3DNOW和SSE技术相似,但指令格式不同,互不兼容。,37
16、,2、精简指令集(RISC),Reduced Instruction Set Computing 这种指令集的特点是指令数目相对较少,执行时间短;每条指令都采用标准字长,方便快速译码;大部分的操作数由寄存器提供,寻址模式简单,并且硬件中只支持少数的数据类型,适合流水线操作。 常见的精简指令集如MIPS等。,3.超线程技术,理论上实行超线程技术(Hyper-Threading Technology)后一个物理处理器核上会模拟出两个逻辑内核,每一个内核模拟成一个CPU芯片,实现线程级别上并行处理。对于操作系统而言,它会把这个物理处理器视为两个独立的逻辑处理器,每个逻辑处理器可以各自对请求做出响应,
17、运行不同的线程。两个逻辑处理器共享一组处理器执行单元,即每个CPU执行单元同时为两个“处理器”服务,并行完成各种操作,实现更高的整体性能。,39,4.超标量和超长指令字,超标量技术指的是CPU在同一时刻执行两条或两条以上指令的能力。超标量结构使用多个功能部件同时执行多条指令,实现指令级的并行(Instruction Level Parallelism,ILP)。,40,41,超标量,超标量(superscalar)超标量和超级流水线技术一起使用,VLIW体系结构是美国Multiflow和 Cydrome公司于20世纪80年代设计的体系结构。 VLIW使用多个相同功能部件执行一条超长的指令,从而
18、提高性能。该体系结构要求编译程序能够控制所有功能单元,精确地调度在何处执行每个操作、每个寄存器、存储器读和每个转移操作等,对编译技术提出了极高的要求。,EPIC结构,从VLIW中衍生出来。并行指令代码(Explicitly Parallel Instruction Code,EPIC)体系结构。EPIC体系结构是Intel的64位芯片架构,本身不能执行x86指令,但能通过译码器能兼容旧有的x86指令,只是运算速度比真正的32位芯片有所下降。,5.动态执行技术,动态执行是对多路分支预测、数据流分析和猜测执行这三种技术进行了革新式的组合。动态执行使CPU通过更符合逻辑的顺序而不是简单地按指令序列来
19、执行,以获得更高的效率。这是Pentium Pro及以后的芯片和兼容芯片的特征之一。,44,多路分支预测,多路分支预测通过几个分支来预测程序的执行。CPU通过特殊的取指/译码单元使用优化的算法,可以预测到指令流中的跳转和分支,并且在多级分支调用和返回中预先执行指令。通过提前预测要执行的指令,指令就可以不用等待而马上得到执行。,数据流分析,数据流分析是CPU分析和调度指令,使指令以更优的顺序执行(也叫乱序执行)。CPU利用一个特殊的发布/执行单元检测软件指令并确定它们是否是CPU可用的或者与先执行的指令没有任何关系,然后CPU才决定处理的最优顺序并以最高效的方式执行指令。,猜测执行,猜测执行是指
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 汇编语言 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内