计算机系统结构复习要点(共8页).doc
精选优质文档-倾情为你奉上计算机系统结构复习要点计算机系统结构是研究软件、硬件和固件的功能分配,确定软件和硬件的分界面,即哪些功能用硬件实现,哪些功能用软件实现。计算机组成(Computer Organization):也称计算机组织,是在明确计算机系统结构分配给硬件的功能与概念性结构之后,研究硬件系统各组成部分的内部构造和相互联系,以实现机器语言级指令的功能与特性。计算机组成是计算机系统结构的逻辑实现,包括机器级内部数据流和控制流的组成及其逻辑设计等。计算机实现(Computer Implementation):是计算机组成的物理实现。目前,计算机实现所涉及的主要内容包括: (1)处理机、主存等部件的物理结构(2)器件的集成度和速度(3)器件、模块、插件、底板的划分与连接(4)专用器件的设计、微组装技术(5)信号传输、电源、冷却及整机装配技术以及有关的制造工艺和技术等系列机指基本指令系统相同、基本体系结构相同的一系列不同型号的计算机。系列机的概念就是指先设计好一种系统结构,而后就按这种系统结构设计它的系统软件,按器件状况和硬件技术研究这种结构的各种实现方法。并按照速度、价格等不同要求,分别提供不同速度、不同配置的各档机器。系列机必须保证用户看到的机器属性一致。冯·诺依曼计算机的主要特点如下:(1) 机器以运算器为中心。(2) 采用存储程序原理。(3) 存储器是按地址访问的、线性编址的空间。(4) 控制流由指令流产生。(5) 指令由操作码和地址码组成。(6) 数据以二进制编码表示,采用二进制运算。冯·诺依曼结构两个最重要特征:Ø 指令驱动计算机内部的信息流动Ø 计算机应用主要面向数值计算和数据处理Flynn分类法把计算机系统的结构分为4类:Ø 单指令流单数据流(SISD)Ø 单指令流多数据流(SIMD)Ø 多指令流单数据流(MISD)Ø 多指令流多数据流(MIMD)四种定量分析技术的概念,及其相关计算:运用Amdahl定量的计算,CPI的计算大概率事件优先原则 :对于大概率事件(最常见的事件),赋予它优先的处理权和资源使用权,以获得全局的最优结果。Amdahl:优化某部件所获得的系统性能的改善程度,取决于该部件被使用的频率,或所占总执行时间的比例。T0为改进前的系统的总执行时间;Fe表示可改进部分比例;Se表示改进部分的加速比。【例1.2】若将计算机系统中某一部件的处理速度提高8倍,该部件处理时间占整个系统运行时间的60%。试问该部件的处理速度提高后,整个系统的性能提高了多少?解:根据题意,Se =8,Fe =60%,则CPI = 执行程序所需的时钟周期数ICIC:所执行的指令条数CPU时间 = IC ×CPI ×时钟周期时间 三数据表示:能由机器硬件直接识别、可以被指令系统直接调用的数据类型。 通常是最常用,相对比较简单的、用硬件实现相对比较容易数据类型。数据结构:面向系统软件、应用领域所需要处理的各种数据类型。 研究这些数据类型的逻辑结构和物理结构之间的关系,并给出相应的算法。 数据表示和数据结构都是数据类型的子集。浮点数:sm:是尾数的符号位,占用一位;se:是阶码的符号位,占用一位;e:是阶码的值,占用q位;m:是尾数的值,占用p位。指令格式优化设计标准:(1) 节省程序的存储空间。(2) 指令字格式具有规整性,对相似的操作做相同的规定。(3) 指令格式的对称性。(4) 指令的高效性。指令格式(组成):操作码+地址码指令分类:零地址指令、一地址指令、二地址指令、三地址指令。操作码的设计方法:固定操作码、Huffman编码,扩展编码RISC计算机的特点:(1) 大量使用通用寄存器。(2) 精简指令书目并简化其结构。(3) 优化的编译系统。(4) 芯片大量使用硬布线逻辑。(5) 为了保证指令可以不间断地传送给cpu,很多采用RISC技术的系统都设置有高速缓存。 四单级存储器的主要矛盾:速度越快,每位价格就越高。容量越大,每位价格就越低。容量越大,速度越慢。采取多级存储层次方法来解决。从用户的角度来看,存储器的三个主要指标是:容量、速度和价格。评价不同存储层次的性能:存储层次的平均每位价格C、命中率H、等效访问时间T存储器是计算机的核心部件,其性能关系到整个计算机系统性能的高低虚拟存储器的工作原理:把程序分割成若干较小的段或页,用映像表指明该程序的某段或页是否已装入主存。程序执行时,查映像表将程序虚地址变换成实际主存地址。针对页式虚拟存储器判断页面的失效情况,并能够计算出虚-实地址的对应关系页式虚拟存储器的性能分析提高虚拟存储器性能关键在于主存的命中率H的提高。对于某道程序来说,影响主存命中率H的主要因素包括:a程序在执行过程中的页地址流的分布情况;b所采用的页面替换算法;c页面的大小:当页大小增加到一定值时,命中率反而降低,这是因为页数减少了。d主存容量:当主存容量增加到一定时,主存容量对命中率H的提高影响不大了。e:页面调度算法 调度方式:(1)分页方式:一次装入运行,命中率为100%,但主存的利用率会降低。(2)请求页式:当需要时才从硬盘装入主RAM。这种方法RAM的利用率高,但命中率不太高。 (3)预取式请求页相结合的调度方法。 页式管理:把主存空间和程序空间都机械的等分成固定大小的页,按页顺序编号。页式管理的优点:主存储器的空间利用率比较高。页表比较简单,大大简化了映像表的硬件,节省了页表的存储量地址映象与地址转换速度比较快。页式管理缺点:页表很长,占用很大的存储空间。 程序的模块化性能不好。 程序和数据的保护不方便。页面替换算法:随机替换算法,先进先出替换算法、近期最少使用算法、最久没用使用算法。Cache存储系统的工作原理及其与虚拟存储器之间的区别工作原理:在高速缓冲存储器中把Cache和主存机械的分成大小相同的块(或行)。每一块由若干个字(或字节)组成。Cache与虚拟存储器之间的区别: Cache与主存之间以块为单位进行数据交换,Cache中块的大小通常以一个主存存储周期能对主存访问到的数据量为限,一般是几个到几十个主存存储字之间。虚拟存储系统的页的大小在1K到几十K存储字之间。 两级存储器间的速度比不同。Cache存储系统中,Cache的工作速度是主存工作速度的310倍。虚拟存储系统中,主存的工作速度是通常磁盘存储器工作速度的105倍。根据Cache存储系统的映射关系,计算出主存块号对应的Cache块号CPU与Cache存储器和主存之间有直接通路,若CPU对Cache存储器中的块访问未命中,则CPU可直接访问主存。但在虚拟存储系统中,若CPU对主存中的页访问未命中,则CPU需要等待要访问的虚页从磁盘存储器调入主存后才能进行访问。Cache系统以提高存储系统的速度为目标,因此,Cache系统中的各项管理功能需要采用硬件实现;而虚拟存储系统以扩大存储系统的容量为目标,虚拟存储系统中的管理功能更多地依靠软件实现。 Cache系统对系统程序员和应用程序员都是透明的,虚拟存储系统仅对应用程序员是透明的。Cache存储系统的性能分析地址映像及变换方式/组织方式:1. 全相联映像及其变换 2. 直接映象及其变换 3. 组相联映象及其变换4. 段相联映象Cache系统加速比:tc为Cache的访问时间,tm为主存周期,H为访Cache的命中率,则Cache存储器的等效存储周期为te=Htc+(1-H)tm,Cache系统的加速比为:Cache与主存不一致性引起的原因和解决方法原因:(1)CPU写Cache,但没有写Memory。此时,若直接将Mem中的数据写入HD,就出问题。(2)I/O处理机>RAM,但没有到Cache,在这种情况下,若直接访问Cache中的数据也将出问题。解决方法:(1)写回法(Write-back) 执行“写”操作时,被写数据只写入Cache,不写入主存。仅当Cache中相应的块被替换时,才写回主存。 (设置“修改位”,当修改为为“1”时,替换时必须写回主存;当修改位为“0”时,不必写回。)(2)写直达法(Write-through)执行“写”操作时,必须把数据同时写入Cache和主存。 五中断处理过程现行指令结束,且没有更紧急的服务请求关CPU中断保存断点,主要保存PC中的内容撤消中断源的中断请求保存硬件现场,主要是PSW及SP等识别中断源改变设备的屏蔽状态进入中断服务程序入口保存软件现场,在中断服务程序中使用的通用寄存器等开CPU中断,可以响应更高级别的中断请求中断服务,执行中断服务程序关CPU中断恢复软件现场恢复屏蔽状态恢复硬件现场开CPU中断返回到中断点根据中断屏蔽码求出中断的实际处理顺序常用的通道种类,及其通道流量的计算选择通道: 又称高速通道,在物理上它可以连接多个设备,在某一段时间内通道只能选择一个设备进行工作,传输完成后才为其他外围设备传输数据。TS:设备选择时间Di:通道正在为第i台设备服务, i1,2, pTDi:通道传送第i个数据所用的时间, i1,2,nTselect:总共所需要的时间:TSn TD)·P·n字节多路通道: 以字节交叉方式轮流为多个外设服务,以提高通道的利用率TS:设备选择时间TD:传送一个字节的时间Di j:第i台设备的第j个数据,i1,2,p;j1,2,n。Tbyte:共所需要的时间(TSTD)·P·n数组多路通道: 以数组(数据块)为单位在若干高速传输操作之间进行交叉复用。TS:设备选择时间TDi:传送第i个数据所用的时间(i1,2,n)Di:通道正在为第i台设备服务(i1,2,p)Tblock:总共所需要的时间为:(TSk TD)·P·n 六一次重叠和二次重叠的定义,并根据其定义求出给定任务的完成时间一次重叠:第i条指令的执行阶段和第i+1条指令的取指令阶段同时进行二次重叠:第i条指令的执行阶段、第i+1条指令的分析阶段和第i+2条指令的取指令阶段同时进行。先行控制处理机结构、技术和原理先行控制技术:缓冲技术和预处理技术的结合。1. 二次重叠方式,指令执行的三个阶段的执行时间不相等2. 先行控制方式中,指令执行的三个阶段的执行时间不相等原理:指令执行过程中,只要前一条指令完成第一个功能段,就可以读取下一条指令,而前一条指令进入第二个功能段,以此类对,前面的指令一级一级地往后移动,后面的指令不断地流入,便形成了标量流水线工作方式。流水线的分类按照流水线的级别来分:(1) 功能部件级流水线也称为运算操作流水线(2) 处理机级流水线又称指令流水线(3) 处理机间级流水线又称宏流水线按照是否有反馈回路来分(1) 线性流水线(2) 非线性流水线按照功能的多少来分(1) 单功能流水线(2) 多功能流水线按同一时间内各段之间的连接方式来分(1) 静态流水线(2)动态流水线流水线的性能分析:时空图、吞吐率、加速比和效率时空图:描述流水线工作过程的二维坐标吞吐率:在单位时间内流水线所完成的任务数量或输出结果的数量。TP=N/Tk n:任务数Tk:处理完成n个任务所用的时间TP:吞吐率加速比:完成同样一批任务,不使用流水线(顺序执行方式下)所用的时间与使用流水线所用的时间之比。S=T0/Tk效率: 流水线中的设备实际使用时间与整个运行时间的比值,即流水线设备的利用率。标量处理机中的相关性、数据相关的判断资源相关、数据相关和控制相关。资源相关:多条指令进入流水线后,同一时间争用同一功能部件,从而发生的冲突数据相关: 又称局部相关,仅涉及到相关指令的前后一条或几条指令的执行,即指令在流水线中执行时,使得原来对操作数的访问顺序发生变化,对数据的读写操作顺序不同于指令在顺序方式下执行时的顺序,从而导致对数据的访问发生错误。(1)先写后读(RAW:Read After Write) (2)先读后写(WAR:Write After Read) (3)写后写(WAW:Write After Write) 解决数据相关有两种方法:推迟处理和设置专用路径。 控制相关: 又称全局相关,由程序执行转移类指令而引起的相关。影响范围比较大,会引起程序执行方向的改变。在流水线中,对流水线的吞吐率和效率的影响很大。非线性流水线的预约表、禁止向量、初始冲突向量、启动距离预约表:一个二维表,用于描述一个任务在非线性流水线中对各个功能段的使用情况。启动距离:指向一条非线性流水线的输入端连续输入两个任务之间的时间间隔,它通常用时钟周期数表示。 禁止向量:把预约表的每一行中任意两个“×”之间的距离都计算出来,去掉重复的,将这些数组成一个数列。 初始冲突向量: 初始冲突向量用一个m位的二进制数表示,其中m表示禁止向量中的最大值。对于一张k列的预约表,有m k-1。通常初始向量用C = (CmCm-1C1)来表示,如果i在禁止向量中,则Ci为1,否则Ci为0。超标量处理机、超流水线处理机、超标量超流水线和超长指令处理机的定义。超标量处理机:在一个时钟周期内能够同时发射两条或两条以上指令的处理机。单发射、多发射超流水线处理机:在一个时钟周期内分时发射多条指令的处理机。超标量超流水线:是超标量技术和超超处理机技术的结合,即在一个时钟周期中分时发射n条指令,每次同时发射n条。超长指令处理机:指由编译程序在编译时找出指令潜在的并行性,并进行适当的调度,将多个可以并行执行的操作组合在一起,成为一条具有多个操作段的超长指令去控制处理机中多个互相独立工作的功能部件,每个操作段控制一个功能部件,相当于同时执行多条指令。向量处理机结构向量处理机:将向量数据表示和流水线技术的结合,提高面向向量数组计算应用的计算机性能。把两个向量的对应分量进行计算,产生一个结果向量。结构: 1. 存储器存储器结构 2. 寄存器寄存器结构 向量处理机中多功能部件并行工作的前提条件两个前提条件:(1)不存在向量寄存器的使用冲突。 例如,V1+V2V3和V2×V4V5 (2)不存在功能部件的冲突。例如,V1+V2V3和V4+V5V6 链接技术的定义和前提条件。定义:指利用向量指令间存在的先写后读的数据相关性来加快向量指令序列执行速度的技术。前提条件:(1)无向量寄存器使用冲突和无功能部件使用冲突(2)只有在前一条指令的第一个结果元素送入结果向量寄存器的那一个时钟周期才可以进行链接。(3)当一条向量指令的两个源操作数分别是两条先行指令的结果寄存器时,要求先行的两条指令产生运算结果的时间必须相等,即要求有关功能部件的通过时间相等。(4)要进行链接执行的向量指令的向量长度必须相等。专心-专注-专业