Cache基本知识实用.PPTx
《Cache基本知识实用.PPTx》由会员分享,可在线阅读,更多相关《Cache基本知识实用.PPTx(46页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、5.2.1 映象规则1.全相联映象 全相联:全相联:主存中的任一块可以被放置到主存中的任一块可以被放置到 CacheCache中的任意一个位置。中的任意一个位置。举例举例 对比:对比:阅览室位置阅览室位置 随便坐随便坐 特点:特点:空间利用率最高,冲突概率最低,空间利用率最高,冲突概率最低,实现最复杂。实现最复杂。2Cache和主存分块5.2 Cache 基本知识第1页/共46页第2页/共46页2.直接映象 直接映象:直接映象:主存中的每一块只能被放置到主存中的每一块只能被放置到 CacheCache中唯一的一个位置。中唯一的一个位置。举例举例 (循环分配循环分配)对比:对比:阅览室位置阅览室
2、位置 只有一个位置可只有一个位置可 以坐以坐 特点:特点:空间利用率最低,冲突概率最高,空间利用率最低,冲突概率最高,实现最简单。实现最简单。对于主存的第对于主存的第i i 块,若它映象到块,若它映象到CacheCache的第的第 j j 块,则块,则:j ji i mod(mod(M M)(M M为为CacheCache的块数)的块数)5.2 Cache 基本知识第3页/共46页第4页/共46页 组相联:组相联:主存中的每一块可以被放置到主存中的每一块可以被放置到CacheCache 中唯一的一个组中的任何一个位置。中唯一的一个组中的任何一个位置。举例举例 组相联是直接映象和全相联的一种折衷
3、组相联是直接映象和全相联的一种折衷 设设M M2 2m m,则当表示为二进制数时,则当表示为二进制数时,j j 实际实际 上就是上就是i i 的低的低m m 位:位:3.组相联映象m位ji:5.2 Cache 基本知识第5页/共46页第6页/共46页 上述的上述的j j 和和k k 通常称为通常称为索引索引 组的选择常采用位选择算法组的选择常采用位选择算法 若主存第若主存第i i 块映象到第块映象到第k k 组,则组,则:k ki i modmod(G G)(G G为为CacheCache的组数)的组数)设设G G2 2g g,则当表示为二进制数时,则当表示为二进制数时,k k 实实 际上就是
4、际上就是i i 的低的低 g g 位:位:g 位ki:5.2 Cache 基本知识第7页/共46页 绝大多数计算机的绝大多数计算机的Cache:Cache:n n 44 想一想:相联度一定是越大越好?想一想:相联度一定是越大越好?n n 路组相联:路组相联:每组中有每组中有n n 个块个块(n nM M/G G)n n 称为称为相联度。相联度。相联度越高,相联度越高,CacheCache空间的利用率就越高,空间的利用率就越高,块冲突概率就越低,失效率也就越低。块冲突概率就越低,失效率也就越低。全相联全相联直接映象直接映象组相联组相联n n (路数路数)G G (组数组数)M MM M1 11
5、11 1n nM M1 1G GM M5.2 Cache 基本知识第8页/共46页5.2.2 查找方法1.如何确定Cache中是否有所要访问的块?若有的话如何确定其位置?若有的话如何确定其位置?答案答案5.2 Cache 基本知识第9页/共46页 目录表的结构目录表的结构第10页/共46页 只需查找只需查找候选位置候选位置所对应的目录表项所对应的目录表项第11页/共46页 并行查找与顺序查找并行查找与顺序查找第12页/共46页 提高性能的提高性能的重要思想:重要思想:主候选位置主候选位置(MRU(MRU块块)前瞻执行前瞻执行第13页/共46页 并行查找的实现方法:并行查找的实现方法:5.2 C
6、ache 基本知识举例:举例:路组相联并行标识比较路组相联并行标识比较 (比较器的个数及位数)(比较器的个数及位数)l 相联存储器相联存储器l 单体多字存储器比较器单体多字存储器比较器 第14页/共46页第15页/共46页 路路组组相联相联CacheCache的查找过程的查找过程第16页/共46页 直接映象直接映象CacheCache的查找过程的查找过程第17页/共46页5.2.3 替换算法 所要解决的问题:当新调入一块,而所要解决的问题:当新调入一块,而CacheCache又已被占满时,替换哪一块?又已被占满时,替换哪一块?2.FIFO3.LRU 优点:优点:失效率低失效率低 LRULRU和
7、随机法的失效率的比较和随机法的失效率的比较1.随机法 优点:优点:实现简单实现简单5.2 Cache 基本知识第18页/共46页第19页/共46页5.2.4 写策略1.“写”操作所占的比例 LoadLoad指令:指令:2626 StoreStore指令:指令:9 9 “写写”在所有访存操作中所占的比例:在所有访存操作中所占的比例:9 9/(100/(10026269 9)7)7 “写写”在访问在访问CacheCache操作中所占的比例:操作中所占的比例:9 9/(26/(269 9)25)253“写”访问有可能导致Cache和主存内容的不一致2.“写”操作必须在确认是命中后才可进行5.2 Ca
8、che 基本知识第20页/共46页4两种写策略 写直达法写直达法 执行执行“写写”操作时,不仅写入操作时,不仅写入CacheCache,而且,而且 也写入下一级存储器。也写入下一级存储器。写回法写回法 执行执行“写写”操作时,只写入操作时,只写入CacheCache。仅当。仅当 CacheCache中相应的块被替换时,才写回主存。中相应的块被替换时,才写回主存。(设置设置“污染位污染位”)5.2 Cache 基本知识第21页/共46页5 5两种写策略的比较两种写策略的比较 写回法的写回法的优点:优点:速度快,所使用的存储器频速度快,所使用的存储器频 带较低;带较低;写直达法的写直达法的优点:优
9、点:易于实现,一致性好。易于实现,一致性好。第22页/共46页6.写缓冲器8.写策略与调块 写回法写回法 按写分配按写分配 写直达法写直达法 不按写分配不按写分配7.“写”操作时的调块 按写分配按写分配(写时取写时取)写失效时,先把所写单元所在的块调入写失效时,先把所写单元所在的块调入 CacheCache,再行写入。,再行写入。不按写分配不按写分配(绕写法绕写法)写失效时,直接写入下一级存储器而不调块。写失效时,直接写入下一级存储器而不调块。5.2 Cache 基本知识第23页/共46页5.2.5 Cache的结构例子:例子:DECDEC的的Alpha AXP21064Alpha AXP21
10、064中的内部数据中的内部数据 CacheCache。1.简介 容量:容量:8KB8KB 块大小:块大小:32B32B 块数:块数:256256 采用采用不按写分配不按写分配 映象方法:映象方法:直接映象直接映象 “写写”策略:策略:写直达写直达 写缓冲器大小:写缓冲器大小:4 4个块个块5.2 Cache 基本知识第24页/共46页2.结构图第25页/共46页3.工作过程 “读读”访问访问命中命中第26页/共46页 “写写”访问访问命中命中第27页/共46页5.混合Cache与分离Cache (1)(1)优缺点优缺点 (2)(2)失效率的比较失效率的比较 5.2 Cache 基本知识 失效情
11、况下的操作失效情况下的操作第28页/共46页16 KB16 KB容量1 KB1 KB2 KB2 KB4 KB4 KB8 KB8 KB32 KB32 KB指令 Cache3.06%失 效 率 的 比 较64 KB64 KB128 KB128 KB数据 Cache混合 Cache2.26%1.78%1.10%0.64%0.39%0.15%0.02%24.61%20.57%15.94%10.19%6.47%4.82%3.77%2.88%13.34%9.78%7.24%4.57%2.87%1.99%1.36%0.95%第29页/共46页(3)(3)分离分离CacheCache平均失效率的计算:平均失效
12、率的计算:访问指令访问指令CacheCache的百分比的百分比指令指令CacheCache的失效率的失效率访问数据访问数据CacheCache的百分比的百分比数据数据CacheCache的失效率的失效率5.2.6 Cache性能分析2.平均访问时间 平均访问时间命中时间失效率平均访问时间命中时间失效率失效开销失效开销1.失效率第30页/共46页例5.15.1 假设假设CacheCache的命中时间为的命中时间为1 1个时钟周期,失效个时钟周期,失效开销为开销为50 50 个时钟周期,在混合个时钟周期,在混合CacheCache中一次中一次loadload或或storestore操作访问操作访问
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Cache 基本知识 实用
限制150内