计算机系统结构 第一章 计算机体系结构的基本概念(同济大学).ppt
-
资源ID:88405395
资源大小:764KB
全文页数:111页
- 资源格式: PPT
下载积分:15金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
计算机系统结构 第一章 计算机体系结构的基本概念(同济大学).ppt
计算机系统结构第一章计算机体系结构的基本概念(同济大学)张晨曦 刘依21111.1 引 言1.计算机性能的高速增长受益于:2.体系结构的重要性3.基于微处理器的系统l电路技术的发展电路技术的发展l体系结构技术的发展体系结构技术的发展第一章 计算机体系结构的基本概念项目调研与实践 张晨曦 刘依31114111 张晨曦 刘依5111 张晨曦 刘依61111.2.2 计算机体系结构1.计算机体系结构的定义:程序员所看到的计算机的属性,即概念性程序员所看到的计算机的属性,即概念性 结构与功能特性。结构与功能特性。2.按照计算机系统的多级层次结构,不同级程序 员所看到的计算机具有不同的属性。3.透明性 在计算机技术中,对这种本来是存在的在计算机技术中,对这种本来是存在的 事物或属性,但从某种角度看又好象不存在。事物或属性,但从某种角度看又好象不存在。1.2 计算机体系结构的概念 张晨曦 刘依71114.Amdahl提出的体系结构:传统机器级的体系结构。传统机器级的体系结构。即一般所说的机器语言程序员所看到的传统即一般所说的机器语言程序员所看到的传统 机器级所具有的属性。机器级所具有的属性。5.对于通用寄存器型机器,这些属性主要是指:(1)(1)数据表示数据表示 (硬件能直接辩认和处理的数据类型)(硬件能直接辩认和处理的数据类型)(2)(2)寻址规则寻址规则 (包括最小寻址单元、寻址方式及其表示)(包括最小寻址单元、寻址方式及其表示)(3)(3)寄存器定义寄存器定义 (包括各种寄存器的定义、数量和使用方式)(包括各种寄存器的定义、数量和使用方式)1.2 计算机体系结构的概念项目调研与实践 张晨曦 刘依8111 (4)(4)指令集指令集 (包括机器指令的操作类型和格式、指令间的排(包括机器指令的操作类型和格式、指令间的排 序和控制机构等)序和控制机构等)(5)(5)中断系统中断系统 (中断的类型和中断响应硬件的功能等)(中断的类型和中断响应硬件的功能等)(6)(6)机器工作状态的定义和切换机器工作状态的定义和切换 (如管态和目态等)(如管态和目态等)(7)(7)存储系统存储系统 (主存容量、程序员可用的最大存储容量等)(主存容量、程序员可用的最大存储容量等)1.2 计算机体系结构的概念 张晨曦 刘依9111(8)(8)信息保护信息保护 (包括信息保护方式和硬件对信息保护的支持)(包括信息保护方式和硬件对信息保护的支持)(9)(9)I/OI/O结构结构 (包括(包括I/OI/O连接方式、处理机连接方式、处理机/存储器与存储器与I/OI/O设备设备 间数据传送的方式和格式以及间数据传送的方式和格式以及I/OI/O操作的状态等)操作的状态等)经典计算机体系结构概念的实质:计算机系统中计算机系统中软硬件界面软硬件界面的确定,其界面之上的确定,其界面之上的是软件的功能,界面之下的是硬件和固件的功能。的是软件的功能,界面之下的是硬件和固件的功能。1.2 计算机体系结构的概念项目调研与实践 张晨曦 刘依101111.2.3 计算机组成和计算机实现技术1.计算机组成:计算机体系结构的逻辑实现。2.计算机实现:计算机组成的物理实现。一种体系结构可以有多种组成。一种体系结构可以有多种组成。一种组成可以有多种物理实现。一种组成可以有多种物理实现。3.系列机 (1)(1)系列机系列机 在一个厂家内生产的具有相同的体系在一个厂家内生产的具有相同的体系 结构,但具有不同组成和实现的一系列不结构,但具有不同组成和实现的一系列不 同型号的机器。同型号的机器。1.2 计算机体系结构的概念项目调研与实践 张晨曦 刘依11111(2)IBM PC(2)IBM PC系列机系列机 (处理器、处理器字宽、主要(处理器、处理器字宽、主要I/OI/O总线、存储空间、总线、存储空间、主要操作系统和计算机结构)主要操作系统和计算机结构)如:如:IBM 370IBM 370系列有系列有370/115370/115、125125、135135、145145、158158、168168等一系列从低速到高速的各种型号。等一系列从低速到高速的各种型号。1.2 计算机体系结构的概念项目调研与实践 张晨曦 刘依121111.2 计算机体系结构的概念项目调研与实践 张晨曦 刘依131111.2 计算机体系结构的概念项目调研与实践 张晨曦 刘依141111.2 计算机体系结构的概念项目调研与实践 张晨曦 刘依151111.2 计算机体系结构的概念项目调研与实践 张晨曦 刘依161111.2 计算机体系结构的概念 张晨曦 刘依17111 计算机 PC和PC XT PC AT 80386 PC 80486 PC Pentium PCPentium II PCPentium III PCPentium 4 PC时间19811982198519891993199719992000处理器8088802868038680486PentiumPentium IIPentium IIIPentium 4字宽16位16位32位32位32位32位32位32位主要I/O总线PC总线AT(ISA)ISA/EISAISA+VLISA+PCIISA+PCI+AGPPCI+AGP+USBPCI-X+AGP+USB存储空间20位24位32位32位32位32位32位32位主要操作系统DOSDOS、XENIXDOS、Windows 3.0 DOS、Windows 3.1DOS、Windows 3.1Windows 95Windows 98、2000Windows Me、XP表1.1 PC系列机典型特性比较 1.2 计算机体系结构的概念 张晨曦 刘依181114.软件兼容:同一个软件可以不加修改地运行于体同一个软件可以不加修改地运行于体 系结构相同的各档机器,而且它们所获得的结果系结构相同的各档机器,而且它们所获得的结果 一样,差别只在于有不同的运行时间。一样,差别只在于有不同的运行时间。1.2 计算机体系结构的概念 张晨曦 刘依19111 向上向上(下下)兼容:兼容:按某档机器编制的程序,不加修按某档机器编制的程序,不加修 改的就能运行于比它高改的就能运行于比它高(低低)档的机器。档的机器。向前向前(后后)兼容:兼容:按某个时期投入市场的某种型号按某个时期投入市场的某种型号 机器编制的程序,不加修改地就能运行于在它之机器编制的程序,不加修改地就能运行于在它之 前前(后后)投入市场的机器。投入市场的机器。向后兼容是软件兼容的根本特征,也是系列机的根本特征。5.兼容机 不同厂家生产的具有相同体系结构的计算机。不同厂家生产的具有相同体系结构的计算机。1.2 计算机体系结构的概念 张晨曦 刘依201111.3计算机体系结构的发展 1.3.1 存储程序计算机体系结构及其发展 第一章 计算机体系结构的基本概念 张晨曦 刘依211111.存储程序计算机的主要特点(1)(1)机器以运算器为中心;机器以运算器为中心;(2)(2)采用存储程序原理;采用存储程序原理;(3)(3)存储器是按地址访问的、线性编址的空间;存储器是按地址访问的、线性编址的空间;(4)(4)控制流由指令流产生;控制流由指令流产生;(5)(5)指令由操作码和地址码组成;指令由操作码和地址码组成;(6)(6)数据以二进制编码表示,采用二进制运算。数据以二进制编码表示,采用二进制运算。1.3 计算机体系结构的发展 张晨曦 刘依221112.对体系结构进行的改进 (1)(1)分布的分布的I/OI/O处理能力处理能力 以运算器为中心带来了慢速输入输以运算器为中心带来了慢速输入输 出操作占用快速运算器的问题。出操作占用快速运算器的问题。为了解决这一问题,人们提出了各种为了解决这一问题,人们提出了各种 输入输入/输出方式输出方式。1.3 计算机体系结构的发展 张晨曦 刘依231111.3 计算机体系结构的发展 张晨曦 刘依24111(2)(2)保护保护的的存储器空间存储器空间 是否把指令和数据放在同一存储器中?是否把指令和数据放在同一存储器中?优点优点:l 不必预先区分指令和数据,易实现存储管理软件;不必预先区分指令和数据,易实现存储管理软件;l 程序和指令在执行过程中可以被修改,因而可以程序和指令在执行过程中可以被修改,因而可以 编写出灵活的可修改的程序;编写出灵活的可修改的程序;l 对于存取指令和数据仅需一套读对于存取指令和数据仅需一套读/写和寻写和寻址址电路,电路,硬件简单;硬件简单;l 数据可以分配于任何可用空间,从而可更有数据可以分配于任何可用空间,从而可更有效效地地 利用存储空间等。利用存储空间等。1.3 计算机体系结构的发展 张晨曦 刘依25111缺点:缺点:l 不利于进行程序调试诊断;不利于进行程序调试诊断;l 不利于实现程序的可再入性和程序的递归调用;不利于实现程序的可再入性和程序的递归调用;l 不利于重叠和流水方式的操作。不利于重叠和流水方式的操作。现在绝大多数计算机都规定,在执行进程中不准修改程序。1.3 计算机体系结构的发展 张晨曦 刘依26111(3)(3)存储器组织结构的发展存储器组织结构的发展 l 相联存储器和相联处理机相联存储器和相联处理机 l 通用寄存器通用寄存器 l 高速缓冲高速缓冲存储器存储器和多级存储器组织结构和多级存储器组织结构 (4)(4)并行处理技术并行处理技术 如何挖掘传统机器中的并行性如何挖掘传统机器中的并行性?改进改进CPUCPU的组成的组成l 重叠方式重叠方式l 先行控制先行控制1.3 计算机体系结构的发展 张晨曦 刘依27111 在体系结构上对某些计算问题实现并行计算。在体系结构上对某些计算问题实现并行计算。如向量计算如向量计算 多机并行处理系统多机并行处理系统 把一个作业把一个作业(程序程序)划分成能并行执行的多个任划分成能并行执行的多个任 务务(程序段程序段),把每个任务分配给一个处理机执行。,把每个任务分配给一个处理机执行。l 多操作部件多操作部件l 流水方式流水方式1.3 计算机体系结构的发展 张晨曦 刘依28111l 复杂指令集计算机复杂指令集计算机(CISC)(CISC)l 精简指令集计算机精简指令集计算机(RISC)(RISC)(5)5)指令集结构的发展指令集结构的发展 指令集的功能指令集的功能 指令的地址空间和寻址方式指令的地址空间和寻址方式 多种灵活的寻址方式。多种灵活的寻址方式。1.3 计算机体系结构的发展 张晨曦 刘依291111.3.2 计算机的分代和分型1.计算机到目前为止已经发展了五代 这五代计算机分别具有明显的器件、体系结这五代计算机分别具有明显的器件、体系结 构技术和软件技术的特征。构技术和软件技术的特征。2.计算机可以根据价格分为五个档次:巨型机、大型机、中型机、小型机、微型机巨型机、大型机、中型机、小型机、微型机1.3 计算机体系结构的发展第一代第一代(1945-1954)电子管和继电子管和继电器电器存储程序计算存储程序计算机、程序控制机、程序控制I/O机器语言和机器语言和汇编语言汇编语言普林斯顿普林斯顿ISA、ENIAC、IBM701第二代第二代(1955-1964)晶体管、磁晶体管、磁芯、印刷电芯、印刷电路路浮点数据表示、浮点数据表示、寻址技术、中寻址技术、中断、断、I/O处理机处理机高级语言和高级语言和编译、批处编译、批处理监控系统理监控系统Univac LARC、CDC1604、IBM7030第三代第三代(1965-1974)SSI和和MSI、多层印刷电多层印刷电路、微程序路、微程序流水线、流水线、Cache、先行处理、系先行处理、系列计算机列计算机多道程序和多道程序和分时操作系分时操作系统统IBM360/370、CDC6600/7600、DEC PDP-8第四代第四代(1974-1990)LSI和和VLSI、半导体存储半导体存储器器向量处理、分向量处理、分布式存储器布式存储器并行与分布并行与分布处理处理Cray-1、IBM 3090、DEC VAX9000、Convax-1第五代第五代(1991-)高性能微处高性能微处理器、高密理器、高密度电路度电路超标量、超流超标量、超流水、水、SMP、MP、MPP大规模、可大规模、可扩展并行与扩展并行与分布处理分布处理SGI Cray T3E、IBM SP2、DEC AlphaServer8400 张晨曦 刘依31111 3.计算机系统性能随时间“下移”1.3 计算机体系结构的发展 张晨曦 刘依321111.3 计算机体系结构的发展4.根据当前的计算机应用市场的现状和价格特征,通常把计算机分为服务器、桌面系统和嵌入式计 算三大领域。张晨曦 刘依331115.新型体系结构的设计 (1)(1)合理地增加合理地增加计算机系统中硬件的功能比例,计算机系统中硬件的功能比例,这种体系结构对操作系统、高级语言甚至应这种体系结构对操作系统、高级语言甚至应 用软件提供更多更好的支持;用软件提供更多更好的支持;(2)(2)通过多种途径通过多种途径提高计算机体系结构中的并行提高计算机体系结构中的并行 性等级,性等级,使得凡是能并行计算和处理的问题使得凡是能并行计算和处理的问题 都能并行计算和处理,使这种体系结构和组都能并行计算和处理,使这种体系结构和组 成对算法提供更多更好的支持。成对算法提供更多更好的支持。1.3 计算机体系结构的发展 张晨曦 刘依341111.3.3 应用需求的发展 1.计算机的设计受两方面因素的影响2.软件技术最重要的发展趋势 (1)(1)程序及数据所使用存储器容量的不断增大;程序及数据所使用存储器容量的不断增大;(2)(2)编译器的重要性日益突出,逐渐成为用户编译器的重要性日益突出,逐渐成为用户 与计算机的主要界面。与计算机的主要界面。l 计算机现在和未来的使用方法计算机现在和未来的使用方法l 下层的实现技术下层的实现技术1.3 计算机体系结构的发展 张晨曦 刘依351113.计算机技术和市场分化成为桌面计算、服务器 和嵌入式计算三个部分,这三个不同的领域应 用需求的特点对计算机系统设计的影响巨大。l 桌桌面面计计算算市市场场是是销销售售额额最最大大的的市市场场,是是对对 性能价格比要求最为苛刻和敏感的市场。性能价格比要求最为苛刻和敏感的市场。l 服服务务器器市市场场对对计计算算机机的的要要求求是是可可用用性性、大大 容量和可扩展性。容量和可扩展性。l 嵌嵌入入式式计计算算与与解解决决的的应应用用问问题题密密切切相相关关,需求千差万别。需求千差万别。1.3 计算机体系结构的发展 张晨曦 刘依36111表1.3 桌面计算、服务器和嵌入式计算三类应用 领域的一些典型特性 系统价格(美元)系统价格(美元)每个处理器价格(美元)每个处理器价格(美元)20002000年芯片销售量(片)年芯片销售量(片)关键指标关键指标1000-10 000 100-1 000150 000 000性能价格比10 000-10 000 000 200-2 000 4 000 000可用性、可扩展性嵌入式计算(只考虑32位和64位)10-100 000 0.2-200 300 000 000随应用领域需求而变化,主要有:成本、功耗、实时性等。特征桌面计算服务器 张晨曦 刘依371111.3.4 计算机实现技术的发展1.现代计算机实现技术的基础核心是以晶体管为 基本单元的平面集成电路2.摩尔定律 集成电路密度大约每两年翻一番。集成电路密度大约每两年翻一番。3.内存芯片和Intel微处理器的发展变化 1.3 计算机体系结构的发展 张晨曦 刘依38111图图1.71.7 内存芯片密度和内存芯片密度和IntelIntel微处理器集成度的发展微处理器集成度的发展 1.3 计算机体系结构的发展 张晨曦 刘依391114.四种实现技术对于当代计算机的发展发挥着非 常关键的作用 l 逻辑电路逻辑电路 l 半导体半导体DRAM(DRAM(动态随机访问存储器动态随机访问存储器)l 磁盘磁盘 l 网络网络 1.3 计算机体系结构的发展 张晨曦 刘依401111.3.5 技术的挑战和体系结构的生命周期 1.对计算机系统设计人员的技术挑战 体系结构、设计工具、制造工艺、软件和体系结构、设计工具、制造工艺、软件和 应用等多个方面,甚至包括经济的问题。应用等多个方面,甚至包括经济的问题。2.集成电路制造中的重要技术指标之一:特征尺寸特征尺寸 1.3 计算机体系结构的发展41111型号4004400480088008808080808086/80888086/8088802868028680386DX80386DX80486DX80486DXPentiumPentiumPentium ProPentium ProPentium IIPentium IIPentium IIIPentium IIIPentium 4Pentium 4发布日期197119721974197819821985198919931995199719992000制造工艺PMOSPMOSNMOSNMOSCMOSCMOSCMOSBiCMOSBiCMOSCMOSCMOSCMOS特征尺寸(m)1010631.51.51.00.80.350.350.180.18集成度(晶体管)2 3003 5006 00029 000134 000275 0001 200 0003 100 0005 500 0007 500 00028 000 00042 000 000工作频率108KHz200kHz2MHz5MHz6MHz16MHz25/33MHz60/66MHz150MHz233MHz500MHz1400MHz基片面积(mm2)13.515.220.028.668.7104163264310209140224表1.4 Intel公司部分微处理器的部分工艺参数 张晨曦 刘依421113.随着特征尺寸减小,挑战首先是功耗。原因:原因:1.3 计算机体系结构的发展(1)(1)导致集成电路连线的相对长度增加,单位导致集成电路连线的相对长度增加,单位 长度阻抗也增大,更高的电路工作主频需长度阻抗也增大,更高的电路工作主频需 要更大的电流来驱动电平的翻转和信号变要更大的电流来驱动电平的翻转和信号变 化的传递;化的传递;(2)(2)电路密度增加,导致芯片单位面积功率电路密度增加,导致芯片单位面积功率 (功率密度)上升;(功率密度)上升;(3)(3)集成电路在减小特征尺寸的同时,也在减集成电路在减小特征尺寸的同时,也在减 张晨曦 刘依43111 少电路各层的厚度,从而降低了工作电压;少电路各层的厚度,从而降低了工作电压;(4)(4)随着特征尺寸的下降,晶体管各个电极之随着特征尺寸的下降,晶体管各个电极之 间的绝缘层性能急剧下降,电极之间漏电间的绝缘层性能急剧下降,电极之间漏电 流的问题日益突出;流的问题日益突出;(5)(5)由于现代微处理器中的部件成千上万,由于现代微处理器中的部件成千上万,而这些部件并不都是同时工作,这就需而这些部件并不都是同时工作,这就需 要在设计中合理分配电力使用,对于不要在设计中合理分配电力使用,对于不 工作的部件暂时减低工作性能或者暂停工作的部件暂时减低工作性能或者暂停 工作,以减少系统的功耗。工作,以减少系统的功耗。1.3 计算机体系结构的发展 张晨曦 刘依44111图图1.81.8 微处理器中的工作电流和漏电流微处理器中的工作电流和漏电流 1.3 计算机体系结构的发展 张晨曦 刘依451114.在设计上将面临的问题:微处理器芯片正确性验证复杂性成倍上升微处理器芯片正确性验证复杂性成倍上升.5.从经济角度看问题和从技术角度看问题往往 是不同的6.一个计算机体系结构,从产生到消亡,大致 需要1520年的时间。1.3 计算机体系结构的发展46111图图1.91.9 体系结构的生命周期体系结构的生命周期 张晨曦 刘依471111.4影响计算机体系结构的 成本和价格因素 1.4.1 计算机系统的成本和价格1.组装一台较高档配置PC的硬件各部件价格分布 从总体看,价格变化的趋势是不断下降的。从总体看,价格变化的趋势是不断下降的。计算机的价格是与成本紧密相关的。计算机的价格是与成本紧密相关的。第一章 计算机体系结构的基本概念48111配件处理器处理器主板(含基本主板(含基本I/OI/O)存储器存储器硬盘硬盘显示卡显示卡显示器显示器光驱光驱键盘和鼠标键盘和鼠标音箱音箱其他配件其他配件合计:合计:型号Pentium 4 2.6C GHz微星865PE-Neo2-PFSKingston 256M DDR400(两条)三星SP80GB 2MB缓冲Unika GeForce FX5900FXc 128MB DDRMagvision PR700M2MIDA 48 ComboBenQ海湾键盘+微软IE4.0漫步者R301T II机箱、电源、软驱、CPU风扇等价格(¥)1400980600680169913993904982604208326总价格中的比例17%12%7%8%20%17%5%6%3%5%表1.5 一台组装PC及其各个部件的价格分布 张晨曦 刘依491112.价格与成本是不同的概念 商品的标价商品的标价(价格价格)由这样一些因素构成:由这样一些因素构成:(1)(1)原料成本原料成本 一件产品中所有部件的采购成本总和。一件产品中所有部件的采购成本总和。(2)(2)直接成本直接成本 与一件产品生产直接相关的成本。与一件产品生产直接相关的成本。(3)(3)毛利毛利 主要包括:主要包括:l 公司的研发费用公司的研发费用1.4 影响计算机体系结构的成本和价格因素 张晨曦 刘依50111l 市场建立费用市场建立费用l 销售费用销售费用l 生产设备维护费用生产设备维护费用l 房租房租l 贷款利息贷款利息l 税后利润和所得税税后利润和所得税 (4)(4)平均销售价格与折扣平均销售价格与折扣1.4 影响计算机体系结构的成本和价格因素工作站的成本和价格 3.工作站的成本和价格4.PC的成本和价格 张晨曦 刘依531111.4.2 时间因素1.影响计算机系统成本的主要因素 (1)(1)时间时间 (对成本产生最直接影响)(对成本产生最直接影响)即使实现技术没有变动,计算机系统的制造即使实现技术没有变动,计算机系统的制造 成本也会不断下降。成本也会不断下降。(2)(2)产量产量 产量的增加会加速工艺的稳定;产量的增加会加速工艺的稳定;产量增加提高了生产效率,降低了成本;产量增加提高了生产效率,降低了成本;1.4 影响计算机体系结构的成本和价格因素 张晨曦 刘依54111 产量增加降低每台单机必须加入的开发费用,产量增加降低每台单机必须加入的开发费用,从而使得单机成本下降。从而使得单机成本下降。(3)(3)商品化商品化 (更重要的是它影响产品的价格)(更重要的是它影响产品的价格)2.价格随时间下降 存储器价格变化的学习曲线存储器价格变化的学习曲线 2002 2002年年IntelIntel的一些的一些Pentium 4Pentium 4处理器零售处理器零售 价格变化的学习曲线价格变化的学习曲线 1.4 影响计算机体系结构的成本和价格因素 张晨曦 刘依55111图图1.12 DRAM1.12 DRAM价格的学习曲线价格的学习曲线 1.4 影响计算机体系结构的成本和价格因素 张晨曦 刘依56111图图1.131.13 IntelIntel公司部分型号公司部分型号Pentium 4Pentium 4处理器零售价格的学习曲线处理器零售价格的学习曲线 1.4 影响计算机体系结构的成本和价格因素 张晨曦 刘依571111.4.3 集成电路的成本集成电路的基本制造工艺:集成电路的基本制造工艺:1.首先生产圆片;2.在圆片上制造出大量电路单元;3.园片经过测试后按照制造的电路单元被切割成 基片;4.基片在外壳中封装好以后就是集成电路成品。1.4 影响计算机体系结构的成本和价格因素 张晨曦 刘依58111集成电路的圆片和基片集成电路的圆片和基片 1.4 影响计算机体系结构的成本和价格因素 集成电路成本集成电路成本=基片成本基片成本=每块园片上的基片数每块园片上的基片数=-基片成品率基片成品率=园片成品率园片成品率 (1+)(1+)-基片成本基片成本=u 园片成本、园片成品率、园片成本、园片成品率、值及疵点密度等值及疵点密度等 由生产工艺决定;由生产工艺决定;u 基片面积由设计人员控制。基片面积由设计人员控制。张晨曦 刘依611115.当前一些典型芯片的工艺参数和成本 微处理器Alpha 21264CAlpha 21264CPower3-IIPower3-IIItaniumItaniumMIPS R14000MIPS R14000UltraSPARC IIIUltraSPARC III基片面积(mm2)115163300204210制造工艺0.18m工艺6层金属布线CMOS0.22m工艺6层金属布线CMOS0.18m工艺6层金属布线CMOS0.25m工艺4层金属布线CMOS0.15m工艺6层金属布线CMOS圆片成本估计(美元)470040004900370052001.4 影响计算机体系结构的成本和价格因素 张晨曦 刘依621111.5定量分析技术基础1.5.1 计算机性能的评测 响应时间:响应时间:从事件开始到结束之间的时间,从事件开始到结束之间的时间,也称为执行时间。也称为执行时间。(计算机完成某一任务所花费的全部时间计算机完成某一任务所花费的全部时间)流量:流量:在单位时间内所能完成的工作量。在单位时间内所能完成的工作量。相同点相同点:都认为能够以最短时间完成指定任务的都认为能够以最短时间完成指定任务的 计算机就是最快的。计算机就是最快的。不同点:不同点:响应时间针对单任务,而流量针对多任务。响应时间针对单任务,而流量针对多任务。第一章 计算机体系结构的基本概念响应时间与性能成反比,上式变成响应时间与性能成反比,上式变成n=n=1.1.假设两台计算机为假设两台计算机为X X和和Y Y,“X X比比Y Y快快”的意思是的意思是 对于给定任务,对于给定任务,X X的响应时间比的响应时间比Y Y少。少。X X比比Y Y快快n n倍倍:=n =n 张晨曦 刘依64111l 用户用户CPUCPU时间时间l 系统系统CPUCPU时间时间 2.CPU时间 CPUCPU工作的时间,不包含工作的时间,不包含I/OI/O等待时间及运行等待时间及运行 其它程序的时间。其它程序的时间。1.5 定量分析技术基础 张晨曦 刘依651111.5.2 测试程序 1.目前常用的测试程序可以分为五类:(按测试可靠性由高至低的顺序列出)(按测试可靠性由高至低的顺序列出)(1)(1)实际应用程序实际应用程序 (2)(2)修正的(或者脚本化)应用程序修正的(或者脚本化)应用程序 (3)(3)核心测试程序核心测试程序 (3)(3)小测试程序小测试程序 (4)(4)合成测试程序合成测试程序 1.5 定量分析技术基础 张晨曦 刘依661112.测试程序组件 选择一组各个方面有代表性的测试程序,选择一组各个方面有代表性的测试程序,组成一个通用测试程序集合。组成一个通用测试程序集合。最大优点:最大优点:避免了独立测试程序存在的片面性,尽避免了独立测试程序存在的片面性,尽 可能全面地测试了一个计算机系统的性能可能全面地测试了一个计算机系统的性能。最常见的测试程序组件是基于最常见的测试程序组件是基于UNIXUNIX的的SPECSPEC 主要版本包括主要版本包括SPEC89SPEC89、SPEC92SPEC92、SPEC95 SPEC95和和SPEC2000SPEC2000等。等。1.5 定量分析技术基础测试程序程序类型SPEC89SPEC92SPEC95SPEC2000gcc整数采用修正修正修正espresso整数采用修正舍弃li整数采用修正修正舍弃eqntott整数采用舍弃spice浮点采用修正舍弃doduc浮点采用舍弃nasa7浮点采用舍弃fpppp浮点采用修正舍弃matrix300浮点采用舍弃tomcatv浮点采用修正舍弃compress整数采用修正舍弃sc整数采用舍弃mdljdp2浮点采用舍弃wave5浮点采用修正舍弃ora浮点采用舍弃mdljsp2浮点采用舍弃alvinn浮点采用舍弃ear浮点采用舍弃表1.7 SPEC不同版本所包含测试程序的演化过程 swm256(aka swim)浮点采用修正修正su2cor浮点采用修正舍弃hydro2d浮点采用修正舍弃go整数采用舍弃m88ksim整数采用舍弃ijpeg整数采用舍弃perl整数采用修正vortex整数采用修正mgrid浮点采用修正applu浮点采用舍弃apsi浮点采用修正turb3d浮点采用舍弃表1.8 SPEC CPU2000测试程序组件中的程序 测试程序程序类型源码类型说 明gzip整数C使用Lempel-Ziv的压缩算法vpr整数CFPGA布局布线gcc整数C使用GNU C编译器生成优化的机器代码mcf整数C公交调度的组合优化crafty整数C下棋程序parser整数C英语句法分析eon整数C+一种图形学中的光线跟踪算法perlmbk整数C四个输入脚本的Perlgap整数C一个群论算法包vortex整数C一个面向对象的数据库系统bzip2整数C一种块分类压缩算法twolf整数CTimberwolf:一种用于VLSI布局布线的模拟退火算法wupwise浮点F77量子色动力学的格群论模型swim浮点F77使用有限差分方程求解浅水方程mgrid浮点F77三维场上的多栅格解算机apply浮点F77抛物线和椭圆偏微分方程解算器mesa浮点C三维图形库galgel浮点F90流体动力学计算art浮点C使用神经网络对温度图进行图像识别equake浮点C地震波传播模拟facerec浮点C使用小波和图形匹配进行面像识别ammp浮点C一种水中蛋白质的分子动力学模拟lucas浮点F90进行Mersenne素数的基本测试fma3d浮点F90采用有限元方法的撞击模拟sixtrack浮点F77设计高能加速器的模拟器apsi浮点F77大气污染的气象学方法模拟 张晨曦 刘依71111 SPEC2000SPEC2000测试程序组件,除了含有测试测试程序组件,除了含有测试CPUCPU的的 SPEC CPU2000SPEC CPU2000,还包括其他一系列测试程序组,还包括其他一系列测试程序组 件:件:l SPECviewperfSPECviewperf 用于测试图形系统支持用于测试图形系统支持OpenGLOpenGL库的性能库的性能l SPECapcSPECapc 测试图形密集型应用的性能测试图形密集型应用的性能l SPECSFSSPECSFS 基于基于NFSNFS文件系统的文件服务器测试程文件系统的文件服务器测试程l SPECWebSPECWeb WebWeb服务器测试程序服务器测试程序 1.5 定量分析技术基础 张晨曦 刘依72111 TPCTPC测试程序组件测试程序组件 事务处理(事务处理(Transaction-processingTransaction-processing,TPTP)测试程序主要测试在线事务处理系统的性能。测试程序主要测试在线事务处理系统的性能。核心内容:核心内容:数据库访问和相关的信息决策能力。数据库访问和相关的信息决策能力。l TPC-ATPC-Al TPC-CTPC-C 模拟一个复杂队列环境。模拟一个复杂队列环境。l TPC-HTPC-H 一一个个特特别别的的决决策策支支持持模模型型,其其队队列列执执 行时间特别长。行时间特别长。1.5 定量分析技术基础 张晨曦 刘依73111l TPC-RTPC-R 模模拟拟面面向向一一组组标标准准队队列列的的商商业业决决策策支支持持 系统,涉及到系统,涉及到DBMSDBMS的优化。的优化。l TPC-WTPC-W 基于基于WebWeb的商业事务处理活动。的商业事务处理活动。面向事务处理的测试程序组件主要用于测试服面向事务处理的测试程序组件主要用于测试服务器的性能。务器的性能。测试基于测试基于MicrosoftMicrosoft公司的公司的WindowsWindows系列操系列操 作系统平台的测试组件作系统平台的测试组件 1.5 定量分析技术基础 张晨曦 刘依74111l PCMark04PCMark04 包括中央处理器测试组、内存测试组、图包括中央处理器测试组、内存测试组、图 形芯片测试组、硬盘测试组等。形芯片测试组、硬盘测试组等。l BusinessBusiness Winstone Winstone 2004 2004 主要用于测试计算机系统商业应用的综合主要用于测试计算机系统商业应用的综合 性能。性能。l MultimediaContentCreationWinstone2004 主主要要用用于于测测试试计计算算机机系系统统多多媒媒体体应应用用的的综综合性能。合性能。1.5 定量分析技术基础 张晨曦 刘依75111l SiSoftSiSoft Sandra Pro 2004 Sandra Pro 2004 拥有超过拥有超过3030种以上的分析与测试模组,种以上的分析与测试模组,主要包括有主要包括有CPUCPU、存储器、存储器、I/OI/O接口(如接口(如SCSISCSI、APM/ACPIAPM/ACPI、网络等)、网络等)、I/OI/O设备(如设备(如CD-CD-ROM/DVD ROM/DVD、鼠标、键盘、打印机等)、主板鼠标、键盘、打印机等)、主板 等。等。1.5 定量分析技术基础 张晨曦 刘依76111l 3 3DMark03DMark03 主要测试显卡性能和主要测试显卡性能和DirectXDirectX的性能。的性能。l Prime95Prime95 用来估计分布式计算程序的通信情况,用来估计分布式计算程序的通信情况,可使计算机高负荷运转,所以也用来测试计可使计算机高负荷运转,所以也用来测试计 算机的稳定性。算机的稳定性。l SuperPiSuperPi/SuperESuperE 计算圆周率计算圆周率/自然指数自然指数e e的软件,通常的软件,通常 用来测试用来测试CPUCPU的稳定性。的稳定性。一些专门的一些专门的性能指标测试程序性能指标测试程序 1.5 定量分析技术基础 张晨曦 刘依771111.5.3 性能设计和评测的基本原则 三条基本原则和方法:三条基本原则和方法:1.大概率事件优先的原则 对于大概率事件(最常见的事件),赋予对于大概率事件(最常见的事件),赋予 它优先的处理权和资源使用权,以获得全局的它优先的处理权和资源使用权,以获得全局的 最优结果。最优结果。2.2.AmdahlAmdahl定律定律 加快某部件执行速度所获得的系统性能加快某部件执行速度所获得的系统性能 加速比,受限于该部件在系统中所占的重要性。加速比,受限于该部件在系统中所占的重要性。1.5 定量分析技术基础(1)(1)加速比加速比 系统加速比依赖于两个因素:系统加速比依赖于两个因素:可改进比例可改进比例:可改进部分在原系统计算时间中所占的:可改进部分在原系统计算时间中所占的 比例,它总是小于等于比例,它总是小于等于的。的。例如例如:一个需运行一个需运行6060秒的程序中有秒的程序中有2020秒的运算秒的运算 可以加速,那么该比例就是可以加速,那么该比例就是20/6020/60。系统加速比系统加速比=张晨曦 刘依79111 部件加速比:部件加速比:可改进部分改进以后的性能提高,可改进部分改进以后的性能提高,一般情况下它是大于的一般情况下它是大于的 。例如例如:系统改进后执行程序,其中可改进部分花系统改进后执行程序,其中可改进部分花 费费2 2秒的时间,而改进前该部分需花费秒的时间,而改进前该部分需花费5 5秒,秒,则性能提高为则性能提高为5/25/2。1.5 定量分析技术基础总执行时间总执行时间改进后改进后=(1-=(1-可改进比例可改进比例)总执行时间总执行时间改进前改进前 +=(1-=(1-可改进比例可改进比例)+)+总执行时间总执行时间改进前改进前 总执行时间总执行