欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    [精选]现代计算机体系结构--CPU(英文版)35565.pptx

    • 资源ID:91047805       资源大小:573.17KB        全文页数:31页
    • 资源格式: PPTX        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    [精选]现代计算机体系结构--CPU(英文版)35565.pptx

    1本资料来源2CPU(1)3KEY POINTS1.CISC&RISC2.Instruction pipeline3.Instruction-level parallelism4.Dynamic scheduling5.Scoreboard6.Loop unrolling7.Register renaming8.Tomasulos approach41 CISC&RISCWhy CISC(1)?Compiler simplification?DisputedComplex machine instructions harder to exploitOptimization more difficultSmaller programs?Program takes up less memory butMemory is now cheapMay not occupy less bits,just look shorter in symbolic formMore instructions require longer op-codesRegister references require fewer bits51 CISC&RISCWhy CISC(2)?Faster programs?Bias towards use of simpler instructionsMore complex control unitMicroprogram control store largerthus simple instructions take longer to executeIt is far from clear that CISC is the appropriate solution61 CISC&RISCRISC CharacteristicsOne instruction per cycleRegister to register operationsFew,simple addressing modesFew,simple instruction formatsHardwired design(no microcode)Fixed instruction formatMore compile time/effort71 CISC&RISCNot clear cutMany designs borrow from both philosophiese.g.PowerPC and Pentium II81 CISC&RISCRISC发展过程1964年CDC公司推出的CDC 6600是第一台超级计算机,具备了RISC的一些基本特征CDC 6600的设计者认识到为了实现有效的流水技术,需要简化体系结构Load-Store结构记分板(Score-Boarding)动态流水线调度乱序执行(Out-of-Order)技术1976年的Cray-1向量机使用了与CDC 6600类似的想法Cray是CDC 6600的主要设计者之一上述简化结构以高效实现的想法在60-70年代没有受到小型机和微处理器设计者的重视91 CISC&RISC1968年John Cocke在IBM的San Jose研究中心开始ASC(Advanced Scientific Computer)项目的研究基本思想是让编译器做更多的指令调度以减少硬件复杂度还提出了每个周期发射多条指令的思想ASC计划后来被取消,Cocke在1971年到Future System1975年Cocke到IBM的Yorktown研究中心开始研制IBM 801,801是最早开始设计的RISC处理器Cocke获得了Eckert-Mauchly和Turing奖801是PowerPC的前身比801稍晚开始的有Patterson在Berkeley的RISC-I及RISC-II与Hennessy在Standford的MIPS项目这两个大学的研究生曾参与801项目的研究,后来返回大学RISC-II是SPARC的前身,MIPS项目是MIPS处理器前身101 CISC&RISC801的项目经理Joel Birnbaum到HP创立了PA-RISCDEC在推出Alpha之前曾经使用MIPS处理器三年1994年Intel和HP宣布使用相同的系统结构从上述发展过程不难解释刚开始时五个RISC处理器的相似性后来每个RISC处理器有了不同的发展如Alpha的指令简单,超流水结构,流水级多,主频高PowerPC指令功能强,灵活,甚至有点象CISC112 Instruction pipelineMost instructions are register to registerTwo phases of executionI:Instruction fetchE:ExecuteALU operation with register input and outputFor load and storeI:Instruction fetchE:ExecuteCalculate memory addressD:MemoryRegister to memory or memory to register operation12Effects of Pipelining13Optimization of PipeliningDelayed branchDoes not take effect until after execution of following instructionThis following instruction is the delay slot14Normal and Delayed BranchAddressNormal BranchDelayed BranchOptimized Delayed Branch100LOADX,rALOADX,rALOADX,rA101ADD1,rAADD1,rAJUMP105102JUMP105JUMP106ADD1,rA103ADDrA,rBNOOPADDrA,rB104SUBrC,rBADDrA,rBSUBrC,rB105STORE rA,ZSUBrC,rBSTORE rA,Z106STORE rA,Z15Use of Delayed Branch16ControversyQuantitativecompare program sizes and execution speedsQualitativeexamine issues of high level language support and use of VLSI real estateProblemsNo pair of RISC and CISC that are directly comparableNo definitive set of test programsDifficult to separate hardware effects from complier effectsMost comparisons done on“toy”rather than production machinesMost commercial devices are a mixture17General pipeline18Pipeline dependencyWhat does mean dependency?在流水线中,如果某指令的某个阶段必须等到它前面另一条指令的某个阶段后才能开始,则这两条指令存在相关相关的指令要隔开足够远,否则后面的指令就必须等待19Pipeline dependencyData dependencesResource conflictsControl dependences20指令流水线的相关数据相关:使用同一个寄存器引起的相关如后面的指令用到前面指令的结果控制相关:与PC有关的相关每条指令取指用到PC,转移指令修改PC结构相关:资源冲突多条指令同时使用一个功能部件相关引起流水线阻塞21Example 1取指和取数都要访存22Resource conflicts23Data dependencesRAW(Read After Write)后面指令用到前面指令所写的数据WAW(Write After Write)两条指令写同一个单元在简单流水线中没有此类相关,因为不会乱序执行WAR(Write After Read)后面指令覆盖前面指令所读的单元在简单流水线中没有此类相关在动态流水线中会有WAR和WAW相关24Instr.OrderTime(clock cycles)add r1,r2,r3sub r4,r1,r3and r6,r1,r7or r8,r1,r9xor r10,r1,r11IFID/RFEXMEMWBData dependences25解决RAW相关的Forwarding技术Instr.OrderTime(clock cycles)add r1,r2,r3sub r4,r1,r3and r6,r1,r7or r8,r1,r9xor r10,r1,r1126Forwarding27Data dependences with ForwardingInstr.OrderTime(clock cycles)lw r1,0(r2)sub r4,r1,r6and r6,r1,r7or r8,r1,r928Pipeline stop by dependencyInstr.OrderTime(clock cycles)lw r1,0(r2)sub r4,r1,r6and r6,r1,r7or r8,r1,r929static scheduling如下程序段的优化和非优化代码如下程序段的优化和非优化代码a=b+c;d=e-f;Slow code:LW Rb,bLW Rc,cADD Ra,Rb,RcSW a,Ra LW Re,e LW Rf,fSUB Rd,Re,RfSWd,RdFast code:LW Rb,bLW Rc,cLW Re,e ADD Ra,Rb,RcLW Rf,fSW a,Ra SUB Rd,Re,RfSWd,Rd30Control dependencesPC dependences演讲完毕,谢谢观看!

    注意事项

    本文([精选]现代计算机体系结构--CPU(英文版)35565.pptx)为本站会员(muj****520)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开