计算机组成与结构PPT课件(全)第11章计算机系统.ppt
第第11章章 计算机系统计算机系统11.1 计算机系统概述计算机系统概述11.2 微机系统微机系统11.3 工作站和服务器工作站和服务器11.4 多媒体计算机多媒体计算机11.5 超级标量处理机、超级流水线处理机和超超级标量处理机、超级流水线处理机和超长指令字处理机长指令字处理机11.6 向量处理机向量处理机11.7 阵列处理机和多处理机系统阵列处理机和多处理机系统11.8 计算机网络计算机网络习题习题11.1 计算机系统概述计算机系统概述11.1.1 计算机系统的分类计算机系统的分类随着计算机系统结构的发展,出现了各种复杂程度随着计算机系统结构的发展,出现了各种复杂程度不同,运算速度、处理能力各异的计算机系统,同不同,运算速度、处理能力各异的计算机系统,同时也出现了对计算机系统进行分类的各种方法。目时也出现了对计算机系统进行分类的各种方法。目前常用的是前常用的是1966年弗林根据指令流和数据流数量进年弗林根据指令流和数据流数量进行分类的方法。其中指令流是机器执行的指令序列,行分类的方法。其中指令流是机器执行的指令序列,数据流是由指令流调用的数据序列。可将计算机系数据流是由指令流调用的数据序列。可将计算机系统分成下列四类。统分成下列四类。1.单指令流单数据流单指令流单数据流(SISD)计算机系统计算机系统通常由一个处理器和一个存储器组成。典型的通常由一个处理器和一个存储器组成。典型的 SISD 计算机每次执行一条指令,每次从存储器取计算机每次执行一条指令,每次从存储器取(或存或存)一个数据,为了提高运算速度,有些一个数据,为了提高运算速度,有些 SISD 计算机设置了指令流水线和运算操作流水线,有些计算机设置了指令流水线和运算操作流水线,有些还设置了多个功能部件和多体交叉存储器。还设置了多个功能部件和多体交叉存储器。2.单指令流多数据流单指令流多数据流(SIMD)计算机系统计算机系统通常由一个指令控制部件、多个处理器和多个存储通常由一个指令控制部件、多个处理器和多个存储器组成。各处理器和各存储器之间通过互联网络进器组成。各处理器和各存储器之间通过互联网络进行通信。在程序运行时由指令控制部件向各个处理行通信。在程序运行时由指令控制部件向各个处理器器“播送播送”同一条指令,所有同一条指令,所有“活动的活动的”处理器在处理器在同一时刻执行同样的指令,这就是单指令流同一时刻执行同样的指令,这就是单指令流(各处各处理器可由程序分别设置成理器可由程序分别设置成“活动的活动的”或或“不活动的不活动的”,“不活动的不活动的”处理器不执行指令规定的操作处理器不执行指令规定的操作);各;各“活动的活动的”处理器执行指令时所需的数据是从处理器执行指令时所需的数据是从它本身专用的存储器中取的,所以各处理器所处理它本身专用的存储器中取的,所以各处理器所处理的数据是各不相同的,这就是多数据流。为各个处的数据是各不相同的,这就是多数据流。为各个处理器所专用的存储器又叫局部存储器。理器所专用的存储器又叫局部存储器。3.多指令流单数据流多指令流单数据流(MISD)计算机系统计算机系统MISD 计算机系统在同一时刻执行多条指令,但处计算机系统在同一时刻执行多条指令,但处理同一个数据。大多数人认为能列在这一系统中的理同一个数据。大多数人认为能列在这一系统中的计算机很少或根本不存在。计算机很少或根本不存在。4.多指令流多数据流多指令流多数据流(MIMD)计算机系统计算机系统典型的典型的 MIMD 计算机系统由多台处理器计算机系统由多台处理器(包括指令包括指令控制部件和处理器控制部件和处理器)和多个存储器组成,并有一个和多个存储器组成,并有一个互联网络实现各处理器和各存储器之间的通信。每互联网络实现各处理器和各存储器之间的通信。每台处理器执行各自的指令,存取各自的数据台处理器执行各自的指令,存取各自的数据(各不各不相同相同)。11.1.2 提高计算机系统运算速度的方法提高计算机系统运算速度的方法提高计算机系统的运算速度的方法可归纳为两种:提高计算机系统的运算速度的方法可归纳为两种:(1)改进器件工艺,减少芯片线宽,提高集成度与改进器件工艺,减少芯片线宽,提高集成度与工作频率。工作频率。(2)改进计算机系统结构,并使各部件之间的速度改进计算机系统结构,并使各部件之间的速度匹配。匹配。针对单机系统已介绍过改进系统结构的方法有:针对单机系统已介绍过改进系统结构的方法有:(1)采用多个通用寄存器来暂存运算的中间结果,采用多个通用寄存器来暂存运算的中间结果,以减少访问存储器次数。以减少访问存储器次数。(2)采用多体交叉存储器和采用多体交叉存储器和cache,以协调,以协调CPU和存和存储器之间的速度匹配。储器之间的速度匹配。(3)CPU 和输入输出设备并行工作,以减少和输入输出设备并行工作,以减少 CPU 等待和空闲时间。等待和空闲时间。(4)操作重叠的流水线工作方式。操作重叠的流水线工作方式。这些方法开始都用在大型计算机上,现已推广到中、这些方法开始都用在大型计算机上,现已推广到中、小型机甚至微机上。小型机甚至微机上。在本章中,我们将介绍多种计算机系统,其发展的在本章中,我们将介绍多种计算机系统,其发展的最终目的是增强计算机处理能力和提高运算速度。最终目的是增强计算机处理能力和提高运算速度。11.1.3 开放系统开放系统1.专有系统与开放系统专有系统与开放系统(1)专有系统。硬件和软件都由一家公司提供,并专有系统。硬件和软件都由一家公司提供,并不向外提供技术,从历史上看,一些有名的大计算不向外提供技术,从历史上看,一些有名的大计算机公司,如机公司,如 IBM、DEC 都是靠独家专利的计算机都是靠独家专利的计算机发迹的。发迹的。(2)开放系统。硬件和软件可由多家公司提供,计开放系统。硬件和软件可由多家公司提供,计算机系统的所有部分,如计算机体系结构、系统总算机系统的所有部分,如计算机体系结构、系统总线、操作系统、窗口系统、数据库、图形用户接口、线、操作系统、窗口系统、数据库、图形用户接口、计算机网络和通信服务等都是开放的,符合与制造计算机网络和通信服务等都是开放的,符合与制造商无关的国际标准。这样厂商之间很容易进行分工,商无关的国际标准。这样厂商之间很容易进行分工,用户可以选用市场上最好的、适合应用的软件、硬用户可以选用市场上最好的、适合应用的软件、硬件组成计算机系统或信息系统。件组成计算机系统或信息系统。2.开放系统的特点开放系统的特点(1)遵循标准接口,使得计算机系统之间有遵循标准接口,使得计算机系统之间有“可移可移植性植性”和和“互操作性互操作性”。可移植性是指将操作系统。可移植性是指将操作系统或应用软件放在不同厂家的各种不同型号的计算机或应用软件放在不同厂家的各种不同型号的计算机上使用。互操作性是指不同厂家在不同平台上开发上使用。互操作性是指不同厂家在不同平台上开发的多种应用软件具有共享数据和协同工作的能力。的多种应用软件具有共享数据和协同工作的能力。(2)开放系统可由制造商、增值转销商或最终用户开放系统可由制造商、增值转销商或最终用户从不同公司购买设备进行扩充或升级,并能保护他从不同公司购买设备进行扩充或升级,并能保护他们在软件上的投资们在软件上的投资(即原有软件仍能运行即原有软件仍能运行)。(3)有大量第三方软件公司或用户的软件产品可在有大量第三方软件公司或用户的软件产品可在开放系统上运行。开放系统上运行。(4)开放接口应有一个公开的技术规格说明,即标开放接口应有一个公开的技术规格说明,即标准,有国际标准、国家标准及事实上的标准准,有国际标准、国家标准及事实上的标准(工业工业标准标准),前面二种标准应经相应的标准化组织通过,前面二种标准应经相应的标准化组织通过,而工业标准是由于产品的巨大销量而成为实际的标而工业标准是由于产品的巨大销量而成为实际的标准。准。11.1.4 计算机系统的性能评测计算机系统的性能评测1.评测性能的几种方法评测性能的几种方法计算机的时钟频率在一定程度上反映了机器速度,计算机的时钟频率在一定程度上反映了机器速度,一般来讲,主频越高,速度越快,但是相同频率,一般来讲,主频越高,速度越快,但是相同频率,不同体系结构的机器,其速度可能会相差很多倍,不同体系结构的机器,其速度可能会相差很多倍,因此还需要有其他方法来测试速度。因此还需要有其他方法来测试速度。早期的计算机速度是通过计算得来的,当时根据各早期的计算机速度是通过计算得来的,当时根据各类指令的执行频率按一定的比例估算,得到平均运类指令的执行频率按一定的比例估算,得到平均运算速度。这种方法很不精确,因为在不同程序中,算速度。这种方法很不精确,因为在不同程序中,不同指令的使用频率是不同的,而且数据长度、指不同指令的使用频率是不同的,而且数据长度、指令系统功能、令系统功能、cache、流水线等与机器的性能有很、流水线等与机器的性能有很大关系,在计算时不能得到充分反映。大关系,在计算时不能得到充分反映。另外有一种通过另外有一种通过“计算处理速率计算处理速率”(processing data rate,简称简称PDR)值的方法来衡量机器性能。值的方法来衡量机器性能。PDR 值大机器性能好。值大机器性能好。PDR 是指令操作数的平均是指令操作数的平均位数和指令平均速度的比值位数和指令平均速度的比值(加权加权)、其计算公式如、其计算公式如下:下:PDRLRL0.85G0.15H0.4J0.15KR0.85M0.09N0.06P式中:式中:G是每条定点指令的位数;是每条定点指令的位数;M是定点加法平是定点加法平均时间;均时间;H是每条浮点指令的位数;是每条浮点指令的位数;N是浮点加法平均时间;是浮点加法平均时间;J是定点操作数的位数;是定点操作数的位数;P是浮点乘法平均时间。是浮点乘法平均时间。K是浮点操作数的位数;是浮点操作数的位数;PDR 值主要对值主要对 CPU 和主存储器的速度进行度量,和主存储器的速度进行度量,与真正的机器运行速度有不少差别,它曾是美国政与真正的机器运行速度有不少差别,它曾是美国政府确定计算机出口许可证的限制性指标。府确定计算机出口许可证的限制性指标。等效乘法速率等效乘法速率(equivalent multiply rate,简称简称EMR)曾是美国政府确定计算机出口许可证浮点性能的限曾是美国政府确定计算机出口许可证浮点性能的限制性指标。制性指标。核心程序法是把程序中应用得最频繁的那部分核心核心程序法是把程序中应用得最频繁的那部分核心程序作为评价计算机性能的标准程序。但因程序短,程序作为评价计算机性能的标准程序。但因程序短,以致访存的局部性大,以致访存的局部性大,cache 命中率偏高。命中率偏高。基准程序法基准程序法(benchmark)是目前一致承认的较好的是目前一致承认的较好的测试方法。在下面我们将讲到各种基准测试程序,测试方法。在下面我们将讲到各种基准测试程序,测试的结果:通常整数性能用测试的结果:通常整数性能用 MIPS(百万次整数运百万次整数运算指令秒算指令秒)、浮点性能用、浮点性能用 MFLOPS(百万次浮点运百万次浮点运算指令秒算指令秒)等表示。通常将等表示。通常将 VAX11780 的运算的运算速度定为速度定为1 MIPS。2.基准测试程序基准测试程序基准测试程序往往是为了测试计算机系统某一部分基准测试程序往往是为了测试计算机系统某一部分性能而人为地选择一些典型指令组成的,也可能是性能而人为地选择一些典型指令组成的,也可能是从实际的应用程序中选择一部分作为测试程序。常从实际的应用程序中选择一部分作为测试程序。常用的有:用的有:(1)整数测试程序整数测试程序Dhrystone 基准测试程序主要用于测试编译器和基准测试程序主要用于测试编译器和 CPU 处理整数指令和控制功能的有效性。当今已处理整数指令和控制功能的有效性。当今已很少使用。很少使用。(2)浮点测试程序浮点测试程序Linpack 基准测试程序是一组求解密集线性代数方基准测试程序是一组求解密集线性代数方程组的程序包,初创于程组的程序包,初创于70年代,在以后的年代,在以后的20多年中多年中不断完善和更新,至今仍是计算机性能测试的主要不断完善和更新,至今仍是计算机性能测试的主要标准之一。标准之一。Whetstone 基准测试程序主要由执行浮点运算、整基准测试程序主要由执行浮点运算、整数算术运算、功能调用、数组变址、条件转移和超数算术运算、功能调用、数组变址、条件转移和超越函数的程序组成。当今已很少使用。越函数的程序组成。当今已很少使用。(3)计算机综合测试程序计算机综合测试程序 SPEC随着计算机技术的飞速发展,厂商和用户都希望有随着计算机技术的飞速发展,厂商和用户都希望有一个标准、客观和公正的评测工具。在此背景下,一个标准、客观和公正的评测工具。在此背景下,一个非营利性组织一个非营利性组织美国标准性能评价协会美国标准性能评价协会(Standard Performance Evaluation Corporation,简简称称SPEC)于于1988年成立。年成立。SPEC发表的第一组标准发表的第一组标准化测试程序是化测试程序是SPEC 89,后来在,后来在1992年和年和1995年相年相继推出了继推出了SPEC 92和和SPEC 95,并取代了老的版本。,并取代了老的版本。SPEC的基准测试程序全部选自实际的应用程序。的基准测试程序全部选自实际的应用程序。以下讨论以下讨论SPEC 95测试程序。测试程序。SPEC 95由两组基准程序组成:由两组基准程序组成:SPEC CINT 95用用C语言写成的整数语言写成的整数/非浮点计算非浮点计算基准程序。由基准程序。由8个基准程序组成。个基准程序组成。SPEC CFP 95用用FORTRAN语言写成的浮点计算语言写成的浮点计算基准程序。由基准程序。由10个基准程序组成。个基准程序组成。SPEC 95重点测试计算机的处理器、存储结构和编重点测试计算机的处理器、存储结构和编译器的性能,对译器的性能,对I/O、网络和图形部件的测试未加、网络和图形部件的测试未加考虑。考虑。SPEC组织采用组织采用SUN SPARC Station 10/40工作站作工作站作为为SPEC 95的参考机的参考机(SPEC 89和和SPEC 92的参考机的参考机为为VAX-11/780),CINT 95和和CFP 95两组基准程序两组基准程序在参考机上大约需要运行在参考机上大约需要运行48小时。每个基准程序经小时。每个基准程序经参考机的运行和测试得到相应的参考时间,将用于参考机的运行和测试得到相应的参考时间,将用于被测试机器的被测试机器的SPEC 95性能指标的计算。性能指标的计算。SPEC规规定在定在SPEC 95参考机上测试每个基准程序的得分为参考机上测试每个基准程序的得分为1,在被测机进行,在被测机进行SPEC 95测试时,测试时,CINT 95和和CFP 95中的每个基准程序单独计算得分,然后再用这些中的每个基准程序单独计算得分,然后再用这些得分计算各项合成指标得分计算各项合成指标(取几何平均值取几何平均值)。假定被测。假定被测计算机系统的得分为计算机系统的得分为10,则表示该系统的相应能力,则表示该系统的相应能力是参考机的是参考机的10倍。倍。SPEC 95的主流版本是用于的主流版本是用于UNIX操作系统的版本。操作系统的版本。为了保证测试结果的公正性和可比性,所有的测试为了保证测试结果的公正性和可比性,所有的测试必须在必须在SPEC提供的工具环境中完成,包括配置文提供的工具环境中完成,包括配置文件的生成、程序的编译、运行环境的建立和实施、件的生成、程序的编译、运行环境的建立和实施、测试报告结果的生成等。整个测试是在严格的规则测试报告结果的生成等。整个测试是在严格的规则下自动完成的,绝对禁止任何手工干预。下自动完成的,绝对禁止任何手工干预。SPEC 95和和SPEC 92的基准程序、运行规则和使用的基准程序、运行规则和使用的的SPEC工具等都不相同,因此无法提供这两类测工具等都不相同,因此无法提供这两类测试结果指标之间的相互转换关系。试结果指标之间的相互转换关系。事务处理性能测试委员会事务处理性能测试委员会(Transaction Process performance Council,简称简称TPC)是一个专门负责制是一个专门负责制定计算机事务处理能力测试标准并监督其执行的组定计算机事务处理能力测试标准并监督其执行的组织。织。20世纪世纪80年代初出现了一种新的在线计算模式,年代初出现了一种新的在线计算模式,它通过在线数据库系统进行简单的事务处理,拥有它通过在线数据库系统进行简单的事务处理,拥有良好的在线事务处理良好的在线事务处理(online transaction process,简简称称OLTP)系统的厂家就可以赢得更多的客户;因此系统的厂家就可以赢得更多的客户;因此制定有关的测试标准就提到日程上来了。制定有关的测试标准就提到日程上来了。TPC于于1988年成立,年成立,1989年发布了其成立后的第一个标准:年发布了其成立后的第一个标准:TPC-A。20世纪世纪90年代,年代,TPC又发表了两个新的标准:又发表了两个新的标准:OLTP测试标准测试标准TPC-C和决策支持系统测试标准和决策支持系统测试标准TPC-D。这两个标准在各自领域内得到承认,但是。这两个标准在各自领域内得到承认,但是随着系统能力的增加,新的随着系统能力的增加,新的TPC-C和和TPC-D计划在计划在1999年发布。年发布。1998年,年,TPC发布了新的基于发布了新的基于Web商业的测试标准商业的测试标准TPC-W,用来测试一些通过,用来测试一些通过Internet进行的商业行进行的商业行为,如零售店、机票预定等。为,如零售店、机票预定等。事务吞吐量事务吞吐量(每分钟可完成多少个任务每分钟可完成多少个任务)和性能价格和性能价格比是比是TPC的两个重要测试指标。的两个重要测试指标。(5)行业基准测试行业基准测试国内外一些重要行业,如核能、航天、气象、石油国内外一些重要行业,如核能、航天、气象、石油行业等,深感通用基准测试程序的不足,他们根据行业等,深感通用基准测试程序的不足,他们根据自己行业应用的特点而开发了一批基准测试程序,自己行业应用的特点而开发了一批基准测试程序,其成功者,再逐步推广到其他行业,成为公共的基其成功者,再逐步推广到其他行业,成为公共的基准测试程序。准测试程序。3.基准测试的公正性和准确性基准测试的公正性和准确性所有基准测试组织都是中立的,一般是非赢利的。所有基准测试组织都是中立的,一般是非赢利的。测试结果一般来说是公正的,但是外界的干扰可能测试结果一般来说是公正的,但是外界的干扰可能会冲击基准测试的公正性。会冲击基准测试的公正性。测试结果是否能准确反映计算机实际使用的效果,测试结果是否能准确反映计算机实际使用的效果,这就是准确性问题。计算机系统性能是软硬件有机这就是准确性问题。计算机系统性能是软硬件有机结合的整体的综合性能,而基准测试则是由若干个结合的整体的综合性能,而基准测试则是由若干个局部测试程序组成的,不能全面反映综合性能,尤局部测试程序组成的,不能全面反映综合性能,尤其是尚未解决如何检测系统的瓶颈问题;再加上厂其是尚未解决如何检测系统的瓶颈问题;再加上厂家大肆宣传对其有利的测试结果,而掩盖其缺点,家大肆宣传对其有利的测试结果,而掩盖其缺点,因此对基准测试的结果也不能迷信。另外有些重要因此对基准测试的结果也不能迷信。另外有些重要性能,如系统的可靠性、可用性和可维护性很难测性能,如系统的可靠性、可用性和可维护性很难测试。因此基准测试所获得的局部结论是基本可信的,试。因此基准测试所获得的局部结论是基本可信的,但不足以准确反映实际使用效果。但不足以准确反映实际使用效果。11.2 微机系统微机系统11.2.1 Intel微处理器及个人计算机微处理器及个人计算机Intel微处理器及个人计算机微处理器及个人计算机20世纪世纪80年代微机的兴年代微机的兴起促进了计算机的大普及。微机的核心是微处理器。起促进了计算机的大普及。微机的核心是微处理器。当前世界上影响最大的半导体器件生产厂家是当前世界上影响最大的半导体器件生产厂家是 Intel 公司。公司。微处理器沿着增加字长、提高主频、提高集成度的微处理器沿着增加字长、提高主频、提高集成度的方向发展。表方向发展。表11.1列出了列出了Intel微处理器芯片的有关微处理器芯片的有关参数。参数。表表11.1 Intel微处理器性能微处理器性能 芯片型号地址总线/位内部数据总线/位外部数据总线/位物理地址空间时钟频率/MHz集成度/工艺80862016161MB5,82.9万/3m8088201681MB5,88028624161616MB12,16,20,2513.4万/1.5m80386DX3232324GB25,33,4027.5万/1m80386SX24321616MB20,25,33,4080486DX3232324GB33,50,60120万/0.6m,1m80486SX32321664GB20,33,50185.5万/1mPentium32643264GB60,66,75,90,100,120,133,166310万/0.8mPentium MMX32643264GB166,200,233450万/0.35mPentium Pro6464324TB150,180,200550万/0.6mP6464324TB233,266,300,333750万/0.35mP6464324TB350,400,450750万/0.25m表表11.1中列出的中列出的8086是同一系列的微处理器,是同一系列的微处理器,其时钟频率其时钟频率(主频主频)已从已从8086的的5MHz提高到提高到P的的450MHz,集成度从,集成度从2.9万个管子发展到万个管子发展到750万个管万个管子,相应的工艺子,相应的工艺(线宽线宽)从从3m减少到减少到0.25m。但是。但是以上的指标反映的是芯片的性能,还不能完全代表以上的指标反映的是芯片的性能,还不能完全代表微机系统的性能,影响系统性能的还有微处理器与微机系统的性能,影响系统性能的还有微处理器与内存之间的总线速度,地址总线宽度,数据总线宽内存之间的总线速度,地址总线宽度,数据总线宽度,芯片内部是否设置浮点协处理器,是否设置度,芯片内部是否设置浮点协处理器,是否设置cache(一级和二级一级和二级)等。等。(1)内存总线速度内存总线速度开始时芯片内部的时钟频率与总线频率一致,后来开始时芯片内部的时钟频率与总线频率一致,后来出现了倍频技术,使内部时钟频率可以高于总线频出现了倍频技术,使内部时钟频率可以高于总线频率。率。(2)地址总线宽度地址总线宽度确定了处理器可访问的内存容量,其宽度已从确定了处理器可访问的内存容量,其宽度已从20位位(支持支持1MB容量容量)发展到发展到64位。位。(3)数据总线宽度数据总线宽度表表11.1中列出的内部数据宽度是指处理器芯片内部中列出的内部数据宽度是指处理器芯片内部传送数据的总线宽度,外部数据宽度是指处理器与传送数据的总线宽度,外部数据宽度是指处理器与内存内存(或或I/O接口接口)之间交换数据的宽度。之间交换数据的宽度。(4)浮点处理器浮点处理器(5)cache存储器存储器随着微机主频和集成度的提高,在片内设置随着微机主频和集成度的提高,在片内设置cache具有必要性和可能性,而且更进一步从一级具有必要性和可能性,而且更进一步从一级cache(L1)发展到两级发展到两级cache(L1和和L2)。个别的甚至。个别的甚至发展到三级发展到三级cache(Alpha 21164)。在。在80486微处理器微处理器中,内置有代码中,内置有代码(程序程序)和数据共用的容量为和数据共用的容量为8KB/16KB的的L1 cache。而在。而在Pentium微处理器中,微处理器中,使用了两个容量各为使用了两个容量各为8KB的的L1 cache,一个用于代,一个用于代码,一个用于数据。码,一个用于数据。Pentium Pro进一步将进一步将CPU和和L2 cache封装在一起封装在一起(容量为容量为256KB或或512KB),并且让,并且让L2 cache通过专通过专用总线用总线(64位宽位宽)以主频速度与微处理器中的以主频速度与微处理器中的CPU进进行通信行通信(图图11.1),提高了微处理器性能,并解决了,提高了微处理器性能,并解决了外部数据总线外部数据总线(系统总线系统总线)带宽受限的瓶颈问题。带宽受限的瓶颈问题。(6)MMX技术技术新的通信、游戏、娱乐和教育等应用要求新的通信、游戏、娱乐和教育等应用要求PC具有具有视频、视频、3D图形、动画、音频等多媒体功能,图形、动画、音频等多媒体功能,Pentium MMX将多媒体扩展将多媒体扩展(MultiMedia eXtention,简称简称MMX)技术结合到技术结合到Pentium芯片中,芯片中,具有以下特点:具有以下特点:图图11.1 双重独立总线双重独立总线(5)cache存储器存储器 增加了增加了4种数据类型,即紧缩字节种数据类型,即紧缩字节(8位位位位)、紧缩字紧缩字(4位位16位位)、紧缩双字、紧缩双字(2位位32位位)和紧缩和紧缩4字字(1位位64位位)。其目的是紧缩组合定点整数,将多个。其目的是紧缩组合定点整数,将多个整数字组成一个整数字组成一个64位数据,用一条指令对位数据,用一条指令对64位数据位数据进行处理。进行处理。增加了增加了8个个64位位MMX寄存器。寄存器。增加了增加了57条指令,用来完成音频、视频图形图像条指令,用来完成音频、视频图形图像处理等。它涉及的操作有:算术操作、比较操作、处理等。它涉及的操作有:算术操作、比较操作、逻辑操作、新数据类型之间的转换逻辑操作、新数据类型之间的转换(紧缩数据及解紧缩数据及解压压),MMX寄存器之间的数据传送寄存器之间的数据传送(MOV)等。等。(7)Pentium(P)P是是Pentium Pro级的级的MMX处理器。具有以下特处理器。具有以下特点:点:双重独立总线。二级双重独立总线。二级cache总线与处理器到内存总线与处理器到内存的系统总线分别独立,缓解了对系统总线带宽的要的系统总线分别独立,缓解了对系统总线带宽的要求。二级求。二级cache的容量为的容量为512KB。动态执行技术。指令预取,对多分支指令进行预动态执行技术。指令预取,对多分支指令进行预测,按优化顺序执行指令,提高了处理速度。测,按优化顺序执行指令,提高了处理速度。内置内置MMX技术,增加了技术,增加了57条条MMX指令。指令。新的单边接触式新的单边接触式SEC(single edge contact,简称简称SEC)封装,其插槽被命令为封装,其插槽被命令为Slot1,并申请了专利,并申请了专利,这是这是Intel为甩掉其竞争对手而采取的措施,在此之为甩掉其竞争对手而采取的措施,在此之前前Intel及其他厂商的芯片的引出端都采用网格阵列及其他厂商的芯片的引出端都采用网格阵列(pin grid array,简称简称PGA)封装,其插槽命名为封装,其插槽命名为Socket 7。Pentium 将微处理器和将微处理器和L2 cache封装在一个长方封装在一个长方形的匣中,其体积虽然很大,但由于采用形的匣中,其体积虽然很大,但由于采用SEC封装,封装,其外形更像一个插卡而不是集成块,因此在主板上其外形更像一个插卡而不是集成块,因此在主板上所占的面积比所占的面积比Socket 7小得多。另外小得多。另外P采用了双重采用了双重独立总线结构,其优点不再重述。独立总线结构,其优点不再重述。0.25m的的P采用采用Slot 2技术,将技术,将L2 cache由由512KB提高到提高到2MB,并适用于,并适用于8处理器多重处理,采用处理器多重处理,采用Slot 1技术的技术的P只支持双处理器多重处理。只支持双处理器多重处理。Intel公司于公司于1998年年3月推出了一款低价无月推出了一款低价无L2 cache的的Pentium 微处理器称为微处理器称为Celeron(中文名为赛扬中文名为赛扬),这是靠牺牲性能而获得的低价产品,不被业界看,这是靠牺牲性能而获得的低价产品,不被业界看好。同年好。同年8月,月,Intel推出了新一代的推出了新一代的Celeron处理器,处理器,称之为称之为Celeron A或新赛扬。与赛扬相比,新赛扬或新赛扬。与赛扬相比,新赛扬有以下改进:有以下改进:内置内置128KB L2 cache。在。在CPU芯片内置有芯片内置有L2 cache,这不同于以往的,这不同于以往的Pentium 处理器。在处理器。在P的集成电路封装盒内实际上有两片独立的的集成电路封装盒内实际上有两片独立的L2 cache芯片分别置于芯片分别置于CPU芯片的两边,在片内用线相连;芯片的两边,在片内用线相连;而新赛扬则是将而新赛扬则是将L2 cache与与CPU设计在同一芯片中,设计在同一芯片中,更有利于提高数据的传输速度。更有利于提高数据的传输速度。Celeron A的的L2 cache能以能以CPU频率操作,而以频率操作,而以往的往的P cache(L2)只能以只能以CPU频率的二分之一操作。频率的二分之一操作。1999年年1月,月,Intel又发表了其即将推向市场的又发表了其即将推向市场的P处处理器。理器。P和和P的最大区别是增加了的最大区别是增加了71条指令来提条指令来提高浮点运算以及其他性能,而且在一个指令周期内高浮点运算以及其他性能,而且在一个指令周期内可以同时处理可以同时处理4条单精度浮点数据;另外还可以让条单精度浮点数据;另外还可以让浮点和浮点和MMX的数据同时访问处理器内的寄存器,的数据同时访问处理器内的寄存器,这些措施大大地提高了这些措施大大地提高了P的性能。其他诸如的性能。其他诸如L1 cache和和L2 cache的容量等仍与的容量等仍与P处理器相同。处理器相同。1997年年10月在每年一度的硅谷月在每年一度的硅谷“微处理器论坛微处理器论坛”上,上,Intel公司和公司和HP公司向同行们讲述了他们合作开发公司向同行们讲述了他们合作开发的最新的高档微处理器的最新的高档微处理器Merced的设计技术。他们用的设计技术。他们用显性并行指令计算显性并行指令计算(explicitly parallel instruction computing,简称简称EPIC)来描述来描述Merced的设计原理,的设计原理,这种设计使单个这种设计使单个Merced能够起到一群处理器的角色能够起到一群处理器的角色,有可能同时处理十几个运算操作。专家们推测其,有可能同时处理十几个运算操作。专家们推测其时钟频率可能达到时钟频率可能达到900MHz。Merced可运行在可运行在Windows或或Unix操作系统环境下,操作系统环境下,Windows是微软是微软公司为公司为Intel微处理器设计的操作系统,而微处理器设计的操作系统,而Unix(HP-UX)是是HP公司运行在公司运行在HP-PA RISC微处理器上的操微处理器上的操作系统。作系统。为了保持与为了保持与Windows程序的兼容性,芯片的一部分程序的兼容性,芯片的一部分包含包含Pentium微处理器的部分内核;为了保证微处理器的部分内核;为了保证HP-UX程序能够运行,芯片的另一部分包含程序能够运行,芯片的另一部分包含PA-RISC电路;电路;Merced的其他部分安放新的的其他部分安放新的EPIC电路,包电路,包括一组括一组64位位RISC处理单元,这些单元使处理单元,这些单元使Merced可可以并行运行许多操作。以并行运行许多操作。Merced的编译器的编译器(将软件开将软件开发者编写的程序翻译成机器语言发者编写的程序翻译成机器语言)除了把程序翻译除了把程序翻译成成Merced的指令代码外,还能分析程序,并提取不的指令代码外,还能分析程序,并提取不依赖于其他顺序操作结果的指令构成依赖于其他顺序操作结果的指令构成“独立指令独立指令”等。等。这些指令可以按任意次序运行,并且可以让芯片任这些指令可以按任意次序运行,并且可以让芯片任何可用的部分执行。再则,何可用的部分执行。再则,Merced已经设计成可以已经设计成可以让几百个芯片结合起来处理传统上是大型机或服务让几百个芯片结合起来处理传统上是大型机或服务器领域处理的运算任务。器领域处理的运算任务。1.AMD公司和公司和Cyrix公司的兼容芯片公司的兼容芯片AMD公司和公司和Cyrix公司生产与公司生产与Intel 8086兼容的芯兼容的芯片,在同样性能的情况下,他们的产品的价格比片,在同样性能的情况下,他们的产品的价格比Intel便宜。由于他们参与竞争,刺激了微处理器硬便宜。由于他们参与竞争,刺激了微处理器硬件技术的迅猛发展。表件技术的迅猛发展。表11.2列出列出AMD,Cyrix和和Intel三家公司的产品的有关特征。三家公司的产品的有关特征。表表11.2 AMD,Cyrix和和Intel公司产品有关特征公司产品有关特征芯片型号L1 cacheL2 cache插座时钟/MHz总线频率/MHz每时钟执行指令数支持MMX流水线FPU乱序执行集成度/万AMDK516KB指令16KB数据外部Socket 7100,11660662NNY430K632KB指令32KB数据外部Socket 7166,200,233662YYY880K6-232KB指令32KB数据内置Socket 7266,300,350 366,388,4001002YYY930Cyrix68616KB(1个)外部Socket 7110,133,15055752NNY300686MX64KB(1个)外部Socket 7150,166,18860752YNY650IntelPentiumPentium8KB指令8KB数据外部Socket 7100,133,16660662NYN330MMX16KB指令16KB数据外部Socket 7166,200,23360662YYN450Pro8KB指令8KB数据内置Socket 8150,166,180,20060663NYY550P16KB指令16KB数据内置Slot 1233,266,300,333663YYY750P16KB指令16KB数据内置Slot 2350,400,4501003YYY7502.微机的主板结构微机的主板结构主板是主板是PC机硬件系统集中管理的核心载体。几乎机硬件系统集中管理的核心载体。几乎集中了全部系统功能,能够根据系统和程序的需要,集中了全部系统功能,能够根据系统和程序的需要,调度调度PC机各个子系统配合工作,并为实现系统的机各个子系统配合工作,并为实现系统的管理提供充分的硬件保证。管理提供充分的硬件保证。现在的主板有两种设计模式:现在的主板有两种设计模式:一种是一种是IBM公司提出公司提出的的AT结构标准,其布局不够理想,通常适用于结构标准,其布局不够理想,通常适用于Pentium级以下的级以下的PC机系统;另一种是机系统;另一种是Intel公司提公司提出的出的ATX结构标准,布局合理,同时推出了结构标准,布局合理,同时推出了ATX电电源,可以用操作系统进行关机控制。源,可以用操作系统进行关机控制。主板的主要构成主板的主要构成 CPU插座。随着插座。随着CPU功能的加强,功能的加强,CPU管脚数管脚数量不断增加,量不断增加,Socket 7是一种符合工业标准的插座,是一种符合工业标准的插座,采用零插拔力采用零插拔力(zero-insertion force,简称简称ZIF)设计,设计,以便于以便于CPU的安装的安装(插拔插拔)。Socket 8是是Pentium Pro的专用插座形式,其缺点是占主板的面积太大。的专用插座形式,其缺点是占主板的面积太大。Slot 1是是Intel为为P所设计的插槽形式。所设计的插槽形式。内存插槽。主板