大学计算机组成原理 第3章 存储系统2.ppt
《大学计算机组成原理 第3章 存储系统2.ppt》由会员分享,可在线阅读,更多相关《大学计算机组成原理 第3章 存储系统2.ppt(111页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 第第3 3章章 存储系统存储系统3.5 3.5 并行存储器并行存储器由于由于CPU和主存储器之间在速度上是不匹配和主存储器之间在速度上是不匹配的,这种情况便成为限制高速计算机设的,这种情况便成为限制高速计算机设计的主要问题。为了提高计的主要问题。为了提高CPU和主存之和主存之间的数据传输率,除了主存采用更高速间的数据传输率,除了主存采用更高速的技术来缩短读出时间外,还可以采用的技术来缩短读出时间外,还可以采用并行技术的存储器。并行技术的存储器。高速存储器高速存储器郑州大学 1/16/2023 4:38 PM信息工程学院 双端口存储器双端口存储器:是指同一个存储器具有两组相是指同一个存储器具有
2、两组相互互独立的读写控制线路独立的读写控制线路,是一种高速工作的存储器。是一种高速工作的存储器。它提供了两个相互独立的端口,即左端口和它提供了两个相互独立的端口,即左端口和右端右端口。两个端口分别具有各自的地址线、数据线和控制口。两个端口分别具有各自的地址线、数据线和控制线,可以对存储器中任何位置上的数据进行独立的存线,可以对存储器中任何位置上的数据进行独立的存取操作。取操作。1.双端口存储器的逻辑结构双端口存储器的逻辑结构高速存储器高速存储器郑州大学 1/16/2023 4:38 PM信息工程学院双端口存储器双端口存储器IDT7133的介绍的介绍IDT7133IDT7133为为为为2K 2K
3、 16 16位的双端口位的双端口位的双端口位的双端口SRAMSRAM 两个端口有各自的地址线两个端口有各自的地址线两个端口有各自的地址线两个端口有各自的地址线A A1010-A-A0 0,IOIO0 0-IO-IO1515,控制线(控制线(控制线(控制线(R/WR/W,CECE,OEOE,BUSYBUSY)郑州大学 1/16/2023 4:38 PM信息工程学院当两个端口的地址不相同时,在两个端口当两个端口的地址不相同时,在两个端口上进行读写操作,一定不会发生冲突。上进行读写操作,一定不会发生冲突。当任一端口被选中驱动时,就可对整个存储器当任一端口被选中驱动时,就可对整个存储器进行存取,每一个
4、端口都有自己的片选控进行存取,每一个端口都有自己的片选控制制(CE)和输出驱动控制和输出驱动控制(OE)。读操作时,。读操作时,端口的端口的OE(低电平有效低电平有效)打开输出驱动器,打开输出驱动器,由存储矩阵读出的数据就出现在由存储矩阵读出的数据就出现在I/O线上。线上。2.无冲突读写控制无冲突读写控制高速存储器高速存储器郑州大学 1/16/2023 4:38 PM信息工程学院表表3.5无冲突读写控制无冲突读写控制左端口或右端口左端口或右端口功能 R/WLb R/WUb CEOEI/O0-7I/O8-1511ZZ端口不用端口不用000数据入数据入数据入数据入低位和高位字节数据写入低位和高位字
5、节数据写入存储器存储器0100数据入数据入数据出数据出低位字节数据写入存储器,低位字节数据写入存储器,存储器中数据输出至高位存储器中数据输出至高位字节字节1000数据出数据出数据入数据入存储器中数据输出至低位存储器中数据输出至低位字节,高位字节数据写入字节,高位字节数据写入存储器存储器0101数据入数据入Z低位字节写入存储器低位字节写入存储器1001Z数据入数据入高位字节写入存储器高位字节写入存储器1100数据出数据出数据出数据出存储器中数据输出至低位存储器中数据输出至低位字节号高位字节字节号高位字节1101ZZ高阻抗输出高阻抗输出高速存储器高速存储器郑州大学 1/16/2023 4:38 P
6、M信息工程学院v有冲突读写控制有冲突读写控制当两个端口同时存取存储器同一存储单元时,当两个端口同时存取存储器同一存储单元时,便发生读写冲突。便发生读写冲突。为解决此问题,特设置了为解决此问题,特设置了BUSY标志标志。在这种情况下,片上的判断逻。在这种情况下,片上的判断逻辑可以决定对哪个端口优先进行读写操作,辑可以决定对哪个端口优先进行读写操作,而对另一个被延迟的端口置而对另一个被延迟的端口置BUSY标志标志(BUSY变为低电平变为低电平),即暂时关闭此端口。,即暂时关闭此端口。郑州大学 1/16/2023 4:38 PM信息工程学院 仲裁原则仲裁原则:1.CE1.CE判断判断:如果地址匹配且
7、在如果地址匹配且在CECE之前有效,则:片之前有效,则:片上的控制逻辑在上的控制逻辑在CECEL L和和CECER R之间进行判断来选择端之间进行判断来选择端口,谁先有效,谁就优先获得对存储器的读写控口,谁先有效,谁就优先获得对存储器的读写控制权。制权。2.2.地址有效判断地址有效判断:如果如果CECE在地址匹配之前先有效,在地址匹配之前先有效,则:片上的控制逻辑在左、右地址间进行判断来则:片上的控制逻辑在左、右地址间进行判断来选择获得优先权的端口。谁先有效,谁就优先获选择获得优先权的端口。谁先有效,谁就优先获得对存储器的读写控制权。得对存储器的读写控制权。3.有冲突的读写控制有冲突的读写控制
8、解决方法解决方法:设置设置BUSY标志,采用仲裁逻辑。标志,采用仲裁逻辑。由芯片上的判断逻辑决定由哪个端口优先进行由芯片上的判断逻辑决定由哪个端口优先进行读写操作,而暂时关闭另一个被延迟的端口。读写操作,而暂时关闭另一个被延迟的端口。1.1.存储器的模块化组织存储器的模块化组织 通常,一个由若干个模块组成的主存储器是线性通常,一个由若干个模块组成的主存储器是线性编址的。这些地址在各模块有两种安排方式:一编址的。这些地址在各模块有两种安排方式:一种是种是顺序方式顺序方式,一种是,一种是交叉方式交叉方式。顺序方式顺序方式:模块中的地址是连续的。高位:模块中的地址是连续的。高位地址选地址选择不同的模
9、块择不同的模块,低位地址指向模块内存储字。低位地址指向模块内存储字。某个模块进行存取时,其他模块不工作;某个模块进行存取时,其他模块不工作;某一模块出现故障时,其他模块可以照常工作;某一模块出现故障时,其他模块可以照常工作;通过增添模块来扩充存储器容量比较方便。通过增添模块来扩充存储器容量比较方便。但由于各模块串行工作,存储器的带宽受到了限制。但由于各模块串行工作,存储器的带宽受到了限制。3.4.2多模块交叉存储器多模块交叉存储器 高速存储器高速存储器郑州大学 1/16/2023 4:38 PM信息工程学院一、顺序方式一、顺序方式如如,M0M3共四个模块,则每个模块共四个模块,则每个模块8个字
10、个字顺序方式顺序方式M0:07M1:815M2:1623M3:24315位地址组织如下:位地址组织如下:XXXXX高位选模块,低位选块内地址高位选模块,低位选块内地址郑州大学 1/16/2023 4:38 PM信息工程学院地址按顺序分配给各模块,与字扩展相同,地址按顺序分配给各模块,与字扩展相同,32各各单元,共单元,共4个模块,每块个模块,每块8个单元。个单元。交叉方式交叉方式特点特点:连续地址分布在相邻的不同模块内,连续地址分布在相邻的不同模块内,同一个模块内的地址都是不连续的。同一个模块内的地址都是不连续的。地址码的低位字段经过译码选择不同地址码的低位字段经过译码选择不同的模块的模块,而
11、高位字段指向相应模块内的存而高位字段指向相应模块内的存储字。储字。这种方式对连续字的成块传送可实现这种方式对连续字的成块传送可实现多模块流水式并行存取,因而可大大提高多模块流水式并行存取,因而可大大提高存储器的带宽。存储器的带宽。高速存储器高速存储器郑州大学 1/16/2023 4:38 PM信息工程学院每个模块各自以等同的方式与每个模块各自以等同的方式与CPUCPU传送信息。传送信息。CPUCPU同时访问同时访问4 4个模块,由存储器控制部件控制它们分时使用数据总线进个模块,由存储器控制部件控制它们分时使用数据总线进行信息传递。是一种并行存储器结构。行信息传递。是一种并行存储器结构。2.多模
12、块交叉存储器的基本结构多模块交叉存储器的基本结构高速存储器高速存储器CPU存储器控制部件 M0M1M2M3四模块交叉存储器结构框图四模块交叉存储器结构框图0 1 2 30 1 2 34 5 6 74 5 6 7 定量分析定量分析:设模块字长等于数据总线宽度,模设模块字长等于数据总线宽度,模块块存取一个字的存储周期为存取一个字的存储周期为T,总线传送周期为总线传送周期为,存储器的存储器的交叉模块数为交叉模块数为m,为了实现流水线方为了实现流水线方式存取,应当满足式存取,应当满足:T=m(m=T/称为称为交叉存取度交叉存取度)交叉存储器要求其实际模块数交叉存储器要求其实际模块数m必须大于或等必须大
13、于或等于于m,以保证启动某模块后经以保证启动某模块后经m时间再次启动该时间再次启动该模块时,它的上次存取操作已经完成。这样,连模块时,它的上次存取操作已经完成。这样,连续读取续读取m个字所需的时间为:个字所需的时间为:t1=T+(m-1)而顺序方式存储器连续读取而顺序方式存储器连续读取m个字所需时间个字所需时间为为t2=mT。可见,交叉存储器的带宽大大提高了。可见,交叉存储器的带宽大大提高了。高速存储器高速存储器郑州大学 1/16/2023 4:38 PM信息工程学院m=4m=4的流水线方式存取示意图的流水线方式存取示意图 【例例5】设:存储器容量为设:存储器容量为32字,字长字,字长64位,
14、模块数位,模块数m=4,分别用顺序方式和分别用顺序方式和交叉方式进行组织。存储周期交叉方式进行组织。存储周期T=200ns,数据总线宽度为数据总线宽度为64位,总线传送周期位,总线传送周期=50ns。问顺序存储器和交叉存储器的问顺序存储器和交叉存储器的带宽各是多少带宽各是多少?高速存储器高速存储器 【解解】:顺序和交叉存储器连续读出顺序和交叉存储器连续读出m=4个字的个字的信息总量都是:信息总量都是:q=64位位4=256位位 顺序和交叉存储器连续读出顺序和交叉存储器连续读出4个字所需的时间分别个字所需的时间分别是:是:t2=mT=4200ns=800ns=810-7s;t1=T+(m-1)=
15、200ns+350ns=350ns=3.510-7s顺序存储器和交叉存储器的带宽分别是:顺序存储器和交叉存储器的带宽分别是:W2=q/t2=256(810-7)=32107位位/s;W1=q/t1=256(3.510-7)=73107位位/s高速存储器高速存储器 DRAM存储器读存储器读/写周期时,在行选通信号写周期时,在行选通信号RAS有效下输入行地址,在列选通信号有效下输入行地址,在列选通信号CAS有效有效下输入列地址。下输入列地址。如果是读周期,此位组内容被读出;如果是读周期,此位组内容被读出;如果是写周期,将总线上数据写入此位组。如果是写周期,将总线上数据写入此位组。刷新周期是在刷新周
16、期是在RAS有效下输入刷新地址,此地有效下输入刷新地址,此地址指示的一行所有存储元全部被再生。址指示的一行所有存储元全部被再生。A20A3的的18位地址用于模块位地址用于模块中中256K个存储字的选择。个存储字的选择。A2用模块选择用模块选择,连续的存储字交错分布在两个模,连续的存储字交错分布在两个模块上,偶地址在模块块上,偶地址在模块0,奇地址在模块,奇地址在模块1。3.二模块交叉存储器举例二模块交叉存储器举例高速存储器高速存储器郑州大学 1/16/2023 4:38 PM信息工程学院DRAMDRAM芯片芯片256K4256K43 18 1 23 18 1 2二模块交叉存储器方框图二模块交叉
17、存储器方框图“存储体存储体-块块-字字”寻址寻址 DRAMDRAM存储器需要逐行定时刷新,而且存储器需要逐行定时刷新,而且,DRAM,DRAM芯片芯片的读出是一种的读出是一种破坏性读出破坏性读出,因此在读取之后要立即按,因此在读取之后要立即按读出信息予以充电再生。读出信息予以充电再生。这样,若这样,若CPUCPU先后两次读取先后两次读取的存储字使用同一的存储字使用同一RASRAS选通信号的话,选通信号的话,CPUCPU在接收到第在接收到第一个存储字之后必须插入等待状态,直至前一存储字一个存储字之后必须插入等待状态,直至前一存储字再生完毕才开始第二个存储字的读取。再生完毕才开始第二个存储字的读取
18、。由于采用由于采用m=2m=2的交叉存取度的成块传送,两个连的交叉存取度的成块传送,两个连续地址字的读取之间不必插入等待状态(续地址字的读取之间不必插入等待状态(无等待存无等待存 取取)。)。高速存储器高速存储器郑州大学 1/16/2023 4:38 PM信息工程学院无等待状态成块存取示意图无等待状态成块存取示意图3.6 cache3.6 cache存储器存储器3.6.1 3.6.1 cachecache基本原理基本原理3.6.2 3.6.2 主存与主存与cachecache的地址映射的地址映射3.6.3 3.6.3 替换策略替换策略3.6.4 3.6.4 cachecache的写操作策略的写
19、操作策略3.6.5 3.6.5 奔腾奔腾PCPC机的机的cachecachecache存储器存储器郑州大学 1/16/2023 4:38 PM信息工程学院性能:速度、容量、每位价格性能:速度、容量、每位价格存储系统设计目标存储系统设计目标希望访问速度近似等于存储周期中最小者希望访问速度近似等于存储周期中最小者容量与最大者相近容量与最大者相近每位价格接近最便宜者每位价格接近最便宜者存储体系的基本要求和性能评价存储体系的基本要求和性能评价郑州大学 1/16/2023 4:38 PM信息工程学院存储层次的设计依据(局部性原则)存储层次的设计依据(局部性原则)程序的局部性(程序的局部性(Localit
20、y)原则)原则 在一段时间内,典型程序所需的地址在一段时间内,典型程序所需的地址趋向于集中在一个较小的范围内,在给定的趋向于集中在一个较小的范围内,在给定的主存内容被处理后,下一个要处理的指令或主存内容被处理后,下一个要处理的指令或数据极大可能的在该主存单元附近区域,即数据极大可能的在该主存单元附近区域,即程序的执行时的地址不是随机分布的,而是程序的执行时的地址不是随机分布的,而是自然的簇集成自然的簇集成“块块”和和“页页”。郑州大学 1/16/2023 4:38 PM信息工程学院空间的局部性空间的局部性(Spatial locality)当处理机访问某个单元时,该单元附近的存储单当处理机访问
21、某个单元时,该单元附近的存储单元最有可能被随后访问。元最有可能被随后访问。时间的局部性时间的局部性(Temporal locality)处理机访问某个单元后,该单元最有可能再次被处理机访问某个单元后,该单元最有可能再次被访问。访问。处理机在某段时间经常使用的空间范围被称作处理机在某段时间经常使用的空间范围被称作工作集合工作集合(working set)。)。在几乎所有的程序中,在几乎所有的程序中,工作集合的改变是非常缓慢的,有时甚至是不变的工作集合的改变是非常缓慢的,有时甚至是不变的。3.5.1 cache基本原理基本原理1.cache的功能的功能 cache是介于是介于CPU和主存之间的小和
22、主存之间的小容量存储器,存取速度比主存快容量存储器,存取速度比主存快(一般一般可达可达510倍以上)。它能高速地向倍以上)。它能高速地向CPU提供指令和数据,加快程序的执行速度。提供指令和数据,加快程序的执行速度。它是为了解决它是为了解决CPU和主存之间速度和主存之间速度不匹配而采用的一项重要技术。不匹配而采用的一项重要技术。cache存储器存储器郑州大学 1/16/2023 4:38 PM信息工程学院cache与与CPU的关系的关系 为追求高速,包括管理在内的全部功能为追求高速,包括管理在内的全部功能由硬件实现。对程序员是透明的。由硬件实现。对程序员是透明的。2.cache2.cache的基
23、本原理的基本原理 CPU与与cache之间的数据交换之间的数据交换以以字字为单位,为单位,cache与主存之间的与主存之间的数据交换是以数据交换是以块块为单位。为单位。一个块由一个块由通常若干定长的字组成。通常若干定长的字组成。cache存储器存储器郑州大学 1/16/2023 4:38 PM信息工程学院2.cache2.cache的基本原理的基本原理 基本原理基本原理:当当CPU要读取主存中一个要读取主存中一个字时,将内存地址字时,将内存地址同时发给同时发给cache和主存和主存。cache控制逻辑依据地址,判断该字当前是控制逻辑依据地址,判断该字当前是否已在否已在 cache中:中:若是若
24、是,将此字立即传送给,将此字立即传送给CPU,无需再访无需再访问主存(让主存访问失效);问主存(让主存访问失效);若非若非,用主存读周期把此字从主存读出送,用主存读周期把此字从主存读出送到到CPU,与此同时,把含有这个字的数据块与此同时,把含有这个字的数据块从主存读出并装入到从主存读出并装入到cache中,将中,将Cache中中较旧的内容(块)替换掉较旧的内容(块)替换掉。替换控制由管理替换控制由管理cache使用情况的硬件使用情况的硬件逻辑电路来实现,最常用的替换算法逻辑电路来实现,最常用的替换算法为为LRU。郑州大学 1/16/2023 4:38 PM信息工程学院LRU管理逻辑相联存储器C
25、PU主存cache原理图原理图存放Cache地址Cache16字的容量郑州大学 1/16/2023 4:38 PM信息工程学院相联存储器按内容寻址的存储器按内容寻址的存储器 把存储单元所存内容的某一部分作为检索把存储单元所存内容的某一部分作为检索项,去检索该存储器,并对存储器中与该检项,去检索该存储器,并对存储器中与该检索项符合的存储单元内容进行读出或写入索项符合的存储单元内容进行读出或写入3.cache的命中率的命中率 增增加加cache的的目目的的,就就是是希希望望在在性性能能上上使使主主存存的的平平均均读读出出时时间间尽尽可可能能接接近近cache的的读读出出时时间间。因因此此,cach
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大学计算机组成原理 第3章 存储系统2 大学计算机 组成 原理 存储系统
限制150内