欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    内存系统对性能的影响精选PPT.ppt

    • 资源ID:87561075       资源大小:913.50KB        全文页数:16页
    • 资源格式: PPT        下载积分:18金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要18金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    内存系统对性能的影响精选PPT.ppt

    内存系统对性能的影响第1页,此课件共16页哦内存系统对性能的影响 n对于很多应用而言,瓶颈在于内存系统,而不是CPUn内存系统的性能包括两个方面:延迟和带宽nLatency is the time from the issue of a memory request to the time the data is available at the processor.nBandwidth is the rate at which data can be pumped to the processor by the memory system.第2页,此课件共16页哦延迟和带宽的区别 n理解延迟与带宽的区别非常重要。n考虑消防龙头的情形。如果打开消防龙头后2秒水才从消防水管的尽头流出,那么这个系统的延迟就是2秒。n当水开始流出后,如果水管1秒钟能流出5加仑的水,那么这个水管的“带宽”就是5加仑/秒。n如果想立刻扑灭火灾,那么更重要是减少延迟的时间。n如果是希望扑灭更大的火,那么需要更高的带宽。第3页,此课件共16页哦内存延迟示例n考虑某一处理器以1GHz(1纳秒时钟)运行,与之相连的DRAM有100纳秒的延迟(没有高速缓存)。假设处理器有两个multiply-add部件,在每1纳秒的周期内能执行4条指令。q处理器的峰值是4GFLOPS。q由于内存延迟是100个周期,并且块大小为一个字(word),每次处理内存访问请求时,处理器必须要等待100个周期,才能够获得数据。第4页,此课件共16页哦内存延迟示例n在以上平台上,考虑计算两个向量点积的问题。q计算点积对每对向量元素进行一次乘法-加法运算,即每一次浮点运算需要取一次数据。q此计算的峰值速度的限制是,每100纳秒才能够进行一次浮点计算,速度为10MFLOPS,只是处理器峰值速度的每小一部分。第5页,此课件共16页哦使用高速缓存改善延迟 n高速缓存是处理器与DRAM之间的更小但更快的内存单元。n这种内存是低延迟高带宽的存储器。n如果某块数据被重复使用,高速缓存就能减少内存系统的有效延迟n由高速缓存提供的数据份额称为高速缓存命中率(hit ratio)n高速缓存命中率严重影响内存受限程序的性能。第6页,此课件共16页哦高速缓存第7页,此课件共16页哦缓存效果示例 继续考虑前一示例。在其中加入一个大小为32KB,延迟时间为1纳秒(或1个周期)的高速缓存。使用此系统来计算矩阵乘法,两个矩阵A和B的维数为32 32。之所以选择这个大小,是为了能够将A、B两个矩阵以及结果矩阵都放入高速缓存中。第8页,此课件共16页哦缓存效果示例n结果如下q将两个矩阵取到高速缓存中等同于取2K个字,需要大约200 s。q两个n n 的矩阵乘需要2n3 步计算。在本例中,需要64K步计算,如果每个周期执行4条指令,则需要16K个周期,即 16 s。q总计算时间大约是加载存储时间以及计算时间之和,即200+16 s。q峰值计算速度为64K/216=303 MFLOPS。第9页,此课件共16页哦缓存的效果n对相同数据项的重复引用相当于“时间本地性(temporal locality)”n对于高速缓存的性能来说,数据的重复使用至关重要。第10页,此课件共16页哦内存带宽的影响n内存带宽由内存总线的带宽和内存部件决定。可以通过增加内存块的大小来提高带宽。n底层系统在 L时间单位内(L为系统的延迟)存取B单位的数据(B为块大小)第11页,此课件共16页哦内存带宽的影响示例n继续上一示例,将块大小由1个字改为4个字。同样考虑点积计算:q假定向量数据在内存中线性排列,则在200个周期内能够执行8FLOPs(4次乘法-加法)q这是因为每一次内存访问取出向量中4个连续的字q因此,两次连续访问能够取出每个向量中的4个元素。q这就相当于每25ns执行一次FLOP,即峰值速度为40MFLOPS。第12页,此课件共16页哦内存带宽的影响n需要注意的是,增加块的大小,并不能改变系统的延迟。n物理上讲,本例中的情形可以认为是与多个存储区相连接的宽的数据总线(4个字,或者128位)n实际上,构建这样的宽总线的代价是昂贵的。n在更切实可行的系统中,得到第一个字后,连续的字在紧接着的总线周期里被送到内存总线。第13页,此课件共16页哦内存带宽的影响示例n以上示例清楚地说明了增加带宽对于提高峰值计算速度的影响。n对数据布局的假设是,连续的数据字被连续的指令所使用(空间本地性,spatial locality)n如果以数据布局为中心,那么计算的步骤应该确保连接的计算使用连接的数据第14页,此课件共16页哦小结 n以上示例说阐述了如下概念:q利用应用程序的空间本地性与时间本地性对于减少内存延迟及提高有效内存带宽非常重要。q计算次数与内存访问次数的比是一个很好的预测内存带宽的承受程序的指标。q内存的布局以及合理组织计算次序能对空间本地性和时间本地性产生重大影响。第15页,此课件共16页哦实际测试2.93GHz Intel 处理器,1M高速缓存,512M主存(533MHz)第16页,此课件共16页哦

    注意事项

    本文(内存系统对性能的影响精选PPT.ppt)为本站会员(石***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开