欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    计算机系统结构.pptx

    • 资源ID:17445387       资源大小:436.30KB        全文页数:90页
    • 资源格式: PPTX        下载积分:12金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要12金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    计算机系统结构.pptx

    n关于本门课程:关于本门课程:n你热爱你的专业吗?你热爱你的专业吗?n你都学会了哪些专业知识和技能?你都学会了哪些专业知识和技能?n本课程在专业体系中的地位?本课程在专业体系中的地位?n如何学习?如何学习?n关于教育关于教育n什么是真正的学习?什么是真正的学习?n本门课学习特点:本门课学习特点:难(理论性强,深度分析,计算。)难(理论性强,深度分析,计算。)n我的要求:我的要求:态度!思考!态度!思考!(分析,理解,真诚,不敷衍)(分析,理解,真诚,不敷衍)n怎样考核?怎样考核?n平时平时n期中期中n研究报告研究报告n期末测试期末测试n分组:分组:n35人自由组队。人自由组队。n主题:主题:n专业相关,任选。专业相关,任选。n研究方式:研究方式:n查阅资料,实验,讨论等。查阅资料,实验,讨论等。n研究成果:研究成果:n研究报告(研究报告(Word文档),演示文档),演示PPT。n汇报及评分。汇报及评分。n第九周开始逐一汇报。同学参与评分。第九周开始逐一汇报。同学参与评分。1.计算机系统结构的基本概念计算机系统结构的基本概念2.计算机指令集结构计算机指令集结构3.流水线技术流水线技术4.指令级并行指令级并行5.存储系统存储系统6.输入输出系统输入输出系统7.互连网络互连网络8.多处理机多处理机9.机群系统机群系统10.多核系统架构与编程多核系统架构与编程n第第1章章 计算机系统结构的基本概念计算机系统结构的基本概念n1.1 引言引言n1.2 计算机系统结构的概念计算机系统结构的概念n1.3 定量分析技术定量分析技术n1.4 计算机系统结构的发展计算机系统结构的发展n1.5 计算机系统结构中并行性的发展计算机系统结构中并行性的发展n1.1 引言引言n第一台通用电子计算机诞生于第一台通用电子计算机诞生于19461946年年 n计算机技术的飞速发展受益于两个方面计算机技术的飞速发展受益于两个方面 n 计算机制造技术的发展计算机制造技术的发展n 计算机系统结构的创新计算机系统结构的创新n经历了四个发展过程经历了四个发展过程 时 间原 因每年的性能增长19461946年起的年起的2525年年 两种因素都起着主要的作用两种因素都起着主要的作用 25% 25% 2020世纪世纪7070年代末年代末8080年代初年代初 大规模集成电路和微处理器大规模集成电路和微处理器出现出现, ,以集成电路为代表的制以集成电路为代表的制造技术的发展造技术的发展 约约35% 35% 8080年代中开始年代中开始 RISCRISC结构的出现,系统结构不断更结构的出现,系统结构不断更新和变革,制造技术不断发展新和变革,制造技术不断发展50%50%以上以上维持了约维持了约1616年年 20032003年以来年以来 大功耗问题;大功耗问题; 可以进一步有效地开发的指令可以进一步有效地开发的指令级并行性已经很少;级并行性已经很少; 存储器访问速度的提高缓慢。存储器访问速度的提高缓慢。 约约20%20%n体系结构与组织方式的发展一起促成了计算机体系结构与组织方式的发展一起促成了计算机性能以超过性能以超过50%的年增长率持续增长的年增长率持续增长17年(年(19862003),这一飞速发展共有四重效果:),这一飞速发展共有四重效果:n显著增强了可供计算机用户使用的功能显著增强了可供计算机用户使用的功能n性价比的大幅度提高导致了新型计算机的出现。性价比的大幅度提高导致了新型计算机的出现。n根据摩尔定律的预测,半导体制造业的持续发展已根据摩尔定律的预测,半导体制造业的持续发展已经使基于微处理器的计算机在整个计算机设计领域经使基于微处理器的计算机在整个计算机设计领域中占据了主导地位。中占据了主导地位。n对软件开发的影响,允许今天的程序员以性能换取对软件开发的影响,允许今天的程序员以性能换取生产效率。生产效率。n从从2003年开始,由于风冷芯片最大功耗和无法有效地年开始,由于风冷芯片最大功耗和无法有效地开发更多指令级并行这两大孪生瓶颈,单处理器的性开发更多指令级并行这两大孪生瓶颈,单处理器的性能提高速度下降到每年不足能提高速度下降到每年不足22%。事实上,。事实上,Intel在在2004年取消了自己的高性能单核处理器项目,转而和年取消了自己的高性能单核处理器项目,转而和其他公司一起宣布:为了获得更高性能的处理器,应其他公司一起宣布:为了获得更高性能的处理器,应当提高一个芯片上集成的核心数目,而不是加快单核当提高一个芯片上集成的核心数目,而不是加快单核处理器的速度。处理器的速度。n这是一个标着历史性这是一个标着历史性转折转折的里程碑信号,处理器性能的里程碑信号,处理器性能的提高从单纯依赖指令级并行转向数据级并行和线程的提高从单纯依赖指令级并行转向数据级并行和线程级并行甚至请求级并行。级并行甚至请求级并行。n结论:计算机系统结构在计算机的发展中有着极其重结论:计算机系统结构在计算机的发展中有着极其重要的作用。要的作用。n计算机的分类:计算机的分类:特征特征个人移动个人移动设备设备台式机台式机服务器服务器机群机群/ /仓库级仓库级计算机计算机嵌入式嵌入式系统系统价格价格$100$100$1000$1000$300$2500$300$2500$5000$5000$10 000 000$10 000 000$100 000$100 000$200 000 000$200 000 000$10$10$100 000$100 000微处理微处理器价格器价格$10$100$10$100$50500$50500$200$2000$200$2000$50$250$50$250$0.01$100$0.01$100关键的关键的系统设系统设计问题计问题成本;成本;能耗;能耗;媒体性能媒体性能响应率。响应率。性价比;性价比;能耗;能耗;图形性能。图形性能。吞吐量;吞吐量;可用性;可用性;可扩展性;可扩展性;能耗。能耗。性价比;性价比;吞吐量;吞吐量;能耗均衡性。能耗均衡性。价格;价格;能耗;能耗;应用的特有应用的特有性能。性能。n1.2 计算机系统结构的概念计算机系统结构的概念n1.2.1 计算机系统的层次结构计算机系统的层次结构n计算机系统硬件计算机系统硬件/固件软件固件软件n计算机语言从低级向高级发展计算机语言从低级向高级发展 高一级语言的语句相对于低一级语言来高一级语言的语句相对于低一级语言来说功能更强,更便于应用,但又都以低级语说功能更强,更便于应用,但又都以低级语言为基础。言为基础。 n从计算机语言的角度,把计算机系统按功从计算机语言的角度,把计算机系统按功能划分成能划分成多级层次结构多级层次结构。n 每一层以一种语言为特征每一层以一种语言为特征 第第 6 级级:应应用用语语言言虚虚拟拟机机 第第 5 级级:高高级级语语言言虚虚拟拟机机 第第 4 级级:汇汇编编语语言言虚虚拟拟机机 第第 3 3 级级:操操作作系系统统虚虚拟拟机机 第第 2 2 级级:机机器器语语言言( (传传统统机机器器级级) ) 第第 1 1 级级:微微程程序序机机器器级级 软件软件硬件或固件硬件或固件演示演示n物理机物理机: 用硬件用硬件/固件实现的机器固件实现的机器n固件固件:具有软件功能的硬件。:具有软件功能的硬件。 n虚拟机虚拟机:由软件实现的机器:由软件实现的机器n各机器级的实现主要靠翻译或解释,或两者的结合。各机器级的实现主要靠翻译或解释,或两者的结合。 n翻译:翻译:先用转换程序把高一级机器上的程序转换为低一级先用转换程序把高一级机器上的程序转换为低一级机器上等效的程序,然后再在这低一级机器上运行,实现机器上等效的程序,然后再在这低一级机器上运行,实现程序的功能。程序的功能。 n解释:解释:对于高一级机器上的程序中的每一条语句或指令,对于高一级机器上的程序中的每一条语句或指令,都是转去执行低一级机器上的一段等效程序。执行完后,都是转去执行低一级机器上的一段等效程序。执行完后,再去高一级机器取下一条语句或指令,再进行解释执行,再去高一级机器取下一条语句或指令,再进行解释执行,如此反复,直到解释执行完整个程序。如此反复,直到解释执行完整个程序。 解释执行比编译后再执行所花的时间多,但占用的存储空间较少。解释执行比编译后再执行所花的时间多,但占用的存储空间较少。 n1.2.2 计算机系统结构的定义计算机系统结构的定义n计算机系统结构的经典定义计算机系统结构的经典定义 传统机器程序员所看到的计算机属性,即概念性结构与功能传统机器程序员所看到的计算机属性,即概念性结构与功能特性。特性。(19641964年年 AmdahlAmdahl在介绍在介绍IBM360IBM360系统时提出的)系统时提出的)n按照计算机系统的多级层次结构,不同级程序员所看到的计算按照计算机系统的多级层次结构,不同级程序员所看到的计算机具有不同的属性。机具有不同的属性。n透明性透明性n在计算机技术中,把这种本来存在的事物或属性,但从某在计算机技术中,把这种本来存在的事物或属性,但从某种角度看又好像不存在的概念称为透明性。种角度看又好像不存在的概念称为透明性。nAmdahl提出的系统结构提出的系统结构 传统机器语言级程序员所看到的计算机属性。传统机器语言级程序员所看到的计算机属性。n广义的系统结构定义:指令集结构、组成、硬件广义的系统结构定义:指令集结构、组成、硬件 (计算机设计(计算机设计的的3个方面)个方面)n对于通用寄存器型机器来说,这些属性主要是指:对于通用寄存器型机器来说,这些属性主要是指:n指令系统指令系统 包括机器指令的操作类型和格式、指令间的排序和包括机器指令的操作类型和格式、指令间的排序和控制机构等。控制机构等。n数据表示数据表示 硬件能直接识别和处理的数据类型。硬件能直接识别和处理的数据类型。n寻址规则寻址规则 包括最小寻址单元、寻址方式及其表示。包括最小寻址单元、寻址方式及其表示。 n寄存器定义寄存器定义 (包括各种寄存器的定义、数量和使用方式)(包括各种寄存器的定义、数量和使用方式) n中断系统中断系统(中断的类型和中断响应硬件的功能等)(中断的类型和中断响应硬件的功能等) n机器工作状态的定义和切换机器工作状态的定义和切换(如管态和目态等)(如管态和目态等) n存储系统存储系统 (主存容量、程序员可用的最大存储容量等)(主存容量、程序员可用的最大存储容量等) n信息保护信息保护(包括信息保护方式和硬件对信息保护的支持)(包括信息保护方式和硬件对信息保护的支持)n I/O结构结构包括包括I/OI/O连接方式、处理机连接方式、处理机/ /存储器与存储器与I/OI/O设备之间设备之间数据传送的方式和格式以及数据传送的方式和格式以及I/OI/O操作的状态等操作的状态等n1.2.3 计算机组成和计算机实现计算机组成和计算机实现n计算机系统结构:计算机系统结构:计算机系统的软、硬件的界面计算机系统的软、硬件的界面 即机器语言程序员所看到的传统机器级所具有的属性。即机器语言程序员所看到的传统机器级所具有的属性。 n计算机组成:计算机组成:计算机系统结构的逻辑实现计算机系统结构的逻辑实现n包含物理机器级中的数据流和控制流的组成以及逻辑设包含物理机器级中的数据流和控制流的组成以及逻辑设计等。计等。n着眼于:着眼于:物理机器级内各事件的排序方式与控制方式、物理机器级内各事件的排序方式与控制方式、各部件的功能以及各部件之间的联系。各部件的功能以及各部件之间的联系。n计算机实现:计算机实现:计算机组成的物理实现计算机组成的物理实现n包括处理机、主存等部件的物理结构,器件的集包括处理机、主存等部件的物理结构,器件的集 成度和速度,模块、插件、底板的划分与连接,成度和速度,模块、插件、底板的划分与连接, 信号传输,电源、冷却及整机装配技术等。信号传输,电源、冷却及整机装配技术等。n着眼于:着眼于:器件技术(起主导作用)、微组装技术。器件技术(起主导作用)、微组装技术。 一种体系结构可以有多种组成。一种体系结构可以有多种组成。 一种组成可以有多种物理实现。一种组成可以有多种物理实现。n1.2.4 计算机系统的分类计算机系统的分类常见的计算机系统分类法:常见的计算机系统分类法: FlynnFlynn分类法、冯氏分类法分类法、冯氏分类法nFlynn分类法分类法 n按照指令流和数据流的多倍性进行分类。按照指令流和数据流的多倍性进行分类。n指令流指令流:计算机执行的指令序列:计算机执行的指令序列n数据流数据流:由指令流调用的数据序列,包括输入数据和:由指令流调用的数据序列,包括输入数据和中间结果。中间结果。n多倍性多倍性:在系统性能瓶颈部件上处于同一执行阶段的:在系统性能瓶颈部件上处于同一执行阶段的指令或数据的最大可能个数。指令或数据的最大可能个数。n据此把计算机系统分为据此把计算机系统分为4类:类:n单指令流单数据流单指令流单数据流SISDn单指令流多数据流单指令流多数据流SIMDn多指令流单数据流多指令流单数据流MISDn多指令流多数据流多指令流多数据流MIMDn单指令流单数据流(单指令流单数据流(SISD)n传统的单处理器计算机。每次指令部件对一条传统的单处理器计算机。每次指令部件对一条指令进行译码并只对一个操作部件分配数据。指令进行译码并只对一个操作部件分配数据。CU-控制部件;PU处理机;MM主存模块;SM共享主存;IS指令流;CS控制流;DS数据流n单指令流多数据流(单指令流多数据流(SIMD)n阵列处理机和相联处理机。阵列处理机和相联处理机。CU-控制部件;PU处理机;MM主存模块;SM共享主存;IS指令流;CS控制流;DS数据流在同一控制部件的控制下,多个处理部件同时执行同一条指令所规定的操作,分别对各自的数据进行处理。这些数据来自不同的地方,分别构成各自的数据流。n多指令流单数据流(多指令流单数据流(MISD)n按不同指令的要求对同一数据流及其中间结果进行不同按不同指令的要求对同一数据流及其中间结果进行不同的处理,一个处理单元的输出作为另一个处理单元的输的处理,一个处理单元的输出作为另一个处理单元的输入。(只是人为划分,目前没有实际的计算机。)入。(只是人为划分,目前没有实际的计算机。)CU-控制部件;PU处理机;MM主存模块;SM共享主存;IS指令流;CS控制流;DS数据流n多指令流多数据流多指令流多数据流n能实现作业、任务、指令、数组各级全面并行能实现作业、任务、指令、数组各级全面并行的多机系统。(多处理机)的多机系统。(多处理机)CU-控制部件;PU处理机;MM主存模块;SM共享主存;IS指令流;CS控制流;DS数据流n冯氏分类法冯氏分类法按数据处理的并行度进行分类。按数据处理的并行度进行分类。n1、字串位串(、字串位串(WSBS)n位串处理方式,每次只处理一个字中的一位,早期的位串位串处理方式,每次只处理一个字中的一位,早期的位串行计算机。行计算机。n2、字串位并(、字串位并(WSBP)n字(字片)处理方式,每次处理一个字中的字(字片)处理方式,每次处理一个字中的n位,位并行位,位并行单处理机。单处理机。n3、字并位串(、字并位串(WPBS)n位(位片)处理方式,每次处理位(位片)处理方式,每次处理m个字中的一位,相联处个字中的一位,相联处理机,阵列处理机。理机,阵列处理机。n4、字并位并(、字并位并(WPBP)n全并行处理方式,一次处理全并行处理方式,一次处理m个字,其每个字为个字,其每个字为n位,相联位,相联处理机,阵列处理机,多处理机。处理机,阵列处理机,多处理机。n1.3 定量分析技术定量分析技术4个定量原理:个定量原理:n以经常性事件为重点以经常性事件为重点nAmdahlAmdahl定律定律nCPUCPU性能公式性能公式n程序的局部性原理程序的局部性原理1.以经常性事件为重点以经常性事件为重点n对经常发生的情况采用优化方法的原则进对经常发生的情况采用优化方法的原则进行选择,以得到更多的总体上的改进。行选择,以得到更多的总体上的改进。n优化优化是指分配更多的资源、达到更高的性是指分配更多的资源、达到更高的性能或者分配更多的电能等。能或者分配更多的电能等。 如,处理器的取指令和译码器比乘法器用得如,处理器的取指令和译码器比乘法器用得更频繁,所以应该先对取值指令和译码器进更频繁,所以应该先对取值指令和译码器进行优化设计。行优化设计。2.Amdahl定律定律n该定律是该定律是1967年年IBM公司的公司的Amdahl在设计在设计IBM360系列机时首先提出的。该定律可用系列机时首先提出的。该定律可用于确定对系统中性能瓶颈部件采取措施提于确定对系统中性能瓶颈部件采取措施提高速度后能得到的系统性能改进的程度。高速度后能得到的系统性能改进的程度。n加快某部件执行速度所能获得的系统性能加快某部件执行速度所能获得的系统性能加速比,受限于该部件的执行时间占系统加速比,受限于该部件的执行时间占系统中总执行时间的百分比。中总执行时间的百分比。n系统性能加速比:系统性能加速比:改进后改进前改进前改进后总执行时间总执行时间系统性能系统性能加速比加速比依赖于两个因素加速比依赖于两个因素n可改进比例:可改进比例:在改进前的系统中,可改进部分的执行时在改进前的系统中,可改进部分的执行时间在总的执行时间中所占的比例。间在总的执行时间中所占的比例。 它总是小于等于它总是小于等于1 1。例如:例如:一个需运行一个需运行6060秒的程序中有秒的程序中有2020秒的运算可以加速,秒的运算可以加速, 那么这个比例就是那么这个比例就是20/6020/60。n部件加速比:部件加速比:可改进部分改进以后性能提高的倍数。它可改进部分改进以后性能提高的倍数。它是改进前所需的执行时间与改进后执行时间的比。是改进前所需的执行时间与改进后执行时间的比。 一般情况下部件加速比是大于一般情况下部件加速比是大于1 1的。的。例如:例如:若系统改进后,可改进部分的执行时间是若系统改进后,可改进部分的执行时间是2 2秒,秒, 而改进前其执行时间为而改进前其执行时间为5 5秒,则部件加速比为秒,则部件加速比为5/25/2。n改进后程序的总执行时间:改进后程序的总执行时间:间不可改进部分的执行时总执行时间改进后行时间可改进部分改进后的执改进前改进后总执行时间可改进比例总执行时间)1 (部件加速比总执行时间可改进比例改进前改进前总执行时间部件加速比可改进比例可改进比例)1(n系统加速比系统加速比改进后改进前总执行时间总执行时间系统加速比部件加速比可改进比例可改进比例 )1 (1SeFeFeAmdahl)1 (1Sn定律的符号表示:n在多个部件可改进的情况下,在多个部件可改进的情况下, Amdahl定理的定理的扩展:扩展:iiinSFFS)1 (1其中:其中:Sn为系统加速比,为系统加速比,Fi为第为第i个部件的可改进比例,个部件的可改进比例,Si为第为第i个部件的部件加速比。个部件的部件加速比。 例例1.1 1.1 将计算机系统中某一功能的处理速度加快将计算机系统中某一功能的处理速度加快1515倍,但倍,但该功能的处理时间仅占整个系统运行时间的该功能的处理时间仅占整个系统运行时间的40%40%,则采用此增强,则采用此增强功能方法后,能使整个系统的性能提高多少?功能方法后,能使整个系统的性能提高多少? 解解 由题可知:可改进比例由题可知:可改进比例Fe= 40% = 0.4 Fe= 40% = 0.4 部件加速比部件加速比Se = 15Se = 15 根据根据AmdahlAmdahl定律可知:定律可知: 采用此增强功能方法后,能使整个系统的性能提高到原采用此增强功能方法后,能使整个系统的性能提高到原来的来的1.61.6倍倍。 6 . 1154 . 0)4 . 01 (1Sn 例例1.2 1.2 某计算机系统采用浮点运算部件后,使浮点运算速某计算机系统采用浮点运算部件后,使浮点运算速度提高到原来的度提高到原来的2525倍,而系统运行某一程序的整体性能提高到倍,而系统运行某一程序的整体性能提高到原来的原来的4 4倍,试计算该程序中浮点操作所占的比例。倍,试计算该程序中浮点操作所占的比例。 解解 由题可知:由题可知: 部件加速比部件加速比Se= 25 Se= 25 系统加速比系统加速比SnSn = 4 = 4 根据根据AmdahlAmdahl定律可知:定律可知: 由此可得:可改进比例由此可得:可改进比例 = 78.1% = 78.1% 即程序中浮点操作所占的比例为即程序中浮点操作所占的比例为78.1%78.1%。25114FeFe 例例1.3 1.3 计算机系统中有三个部件可以改进,这三个部件的部件加计算机系统中有三个部件可以改进,这三个部件的部件加速比为:速比为: 部件加速比部件加速比1=301=30; 部件加速比部件加速比2=202=20; 部件加速比部件加速比3=103=10 如果部件如果部件1 1和部件和部件2 2的可改进比例均为的可改进比例均为30%30%,那么当部件,那么当部件3 3的可改的可改进比例为多少时,系统加速比才可以达到进比例为多少时,系统加速比才可以达到1010?解:(解:(1)在多个部件可改进情况下,)在多个部件可改进情况下,Amdahl定理的扩展:定理的扩展: iiinSFFS)1 (1已知已知S130,S220,S310,Sn10,F10.3,F20.3,得:,得:)()(10/20/0.330/0.30.30.3-111033FF得得F30.36,即部件,即部件3的可改进比例为的可改进比例为36%。nAmdahlAmdahl定律定律:一种性能改进的递减规则一种性能改进的递减规则n如果仅仅对计算任务中的一部分做性能改进,则改进得如果仅仅对计算任务中的一部分做性能改进,则改进得越多,所得到的总体性能的提升就越有限。越多,所得到的总体性能的提升就越有限。n如果让部件减速比趋于如果让部件减速比趋于,则系统的加速比趋于,则系统的加速比趋于1/(1-可可改进比例改进比例)。这就是。这就是Amdahl定律的一个重要推论:如果定律的一个重要推论:如果只针对整个任务的一部分进行改进和优化,那么所获得只针对整个任务的一部分进行改进和优化,那么所获得的加速比不超过的加速比不超过1/(1-可改进比例可改进比例)。n以例以例1.1来说,如果部件加速比由来说,如果部件加速比由15增大到增大到100,则在可,则在可改进比例仍为改进比例仍为0.4的条件下,系统加速比只约为的条件下,系统加速比只约为1.66。nAmdahl定律告诉我们,改进效果好的高性能系统应是一定律告诉我们,改进效果好的高性能系统应是一个各部分性能均能平衡地得到提高的系统,不能只是其个各部分性能均能平衡地得到提高的系统,不能只是其中某一个功能部件的性能得到提高。中某一个功能部件的性能得到提高。3.CPU性能公式性能公式n执行一个程序所需的执行一个程序所需的CPUCPU时间时间CPUCPU时间时间 = 执行程序所需的时钟周期数执行程序所需的时钟周期数时钟周期时间时钟周期时间其中:时钟周期时间是系统时钟频率的倒数。其中:时钟周期时间是系统时钟频率的倒数。n每条指令执行的平均时钟周期数每条指令执行的平均时钟周期数CPICPI (Cycles Per InstructionCycles Per Instruction) CPICPI = 执行程序所需的时钟周期数执行程序所需的时钟周期数ICIC IC IC:所执行的指令条数:所执行的指令条数n程序执行的程序执行的CPUCPU时间可以写成时间可以写成 CPUCPU时间时间 = IC IC CPICPI 时钟周期时间时钟周期时间 nCPUCPU的性能取决于三个参数的性能取决于三个参数n时钟周期时间:时钟周期时间:取决于硬件实现技术和计算机组成;取决于硬件实现技术和计算机组成;nCPICPI:取决于计算机组成和指令系统的结构;取决于计算机组成和指令系统的结构;nICIC:取决于指令系统的结构和编译技术。取决于指令系统的结构和编译技术。n对对CPUCPU性能公式进行进一步细化性能公式进行进一步细化 假设:计算机系统有假设:计算机系统有n n种指令;种指令; CPICPIi i :第第i i种指令的处理时间;种指令的处理时间; ICICi i :在程序中第在程序中第i i种指令出现的次数;种指令出现的次数;则:则: CPUCPU时钟周期数时钟周期数 = = (CPI (CPIi i Ic Ici i) )n ni=1i=1i=1n时钟周期数IC(CPIiICi)i=1nIC(CPIi )i=1nICiIC 例例1.4 假设浮点数指令假设浮点数指令FP的比例为的比例为25%,其中,浮点数平方根,其中,浮点数平方根指令指令FPSQR占全部指令的比例为占全部指令的比例为2%,FP操作的操作的CPI为为4,FPSQR操作的操作的CPI为为20 ,其他指令的平均,其他指令的平均CPI为为1.33。现有两种。现有两种改进方案,第一种是把改进方案,第一种是把FPSQR操作的操作的CPI减至减至2,第二种是把所,第二种是把所有的有的FP操作的操作的CPI减至减至2,试比较两种方案对系统性能的提高程,试比较两种方案对系统性能的提高程度。度。 解解 没有改进之前,每条指令的平均时钟周期没有改进之前,每条指令的平均时钟周期CPI为:为: 2%7533. 1%2541niiiICICCPICPI (1)采用第一种方案)采用第一种方案 FPSQR操作的操作的CPI由由CPIFPSQR20减至减至CPIFPSQR2,则整个系统的指令平均时钟周期数为(从原则整个系统的指令平均时钟周期数为(从原CPI中减去节省中减去节省的周期数):的周期数): CPI1CPI(CPIFPSQRCPIFPSQR)2% 2(202) 2%1.64 (2)采用第二种方案)采用第二种方案 所有所有FP操作的操作的CPI由由CPIFP4减至减至CPIFP2,则整个,则整个系统的指令平均时钟周期数为:系统的指令平均时钟周期数为: CPI2CPI(CPIFPCPIFP)25% 2(42) 25%1.5 从降低整个系统的指令平均时钟周期数的程度来看,第从降低整个系统的指令平均时钟周期数的程度来看,第二种方案优于第一种方案。二种方案优于第一种方案。例例1.5 1.5 考虑条件分支指令的两种不同设计方法:考虑条件分支指令的两种不同设计方法: (1 1)CPUCPUA A:通过比较指令设置条件码,然后测试条件通过比较指令设置条件码,然后测试条件码进行分支。码进行分支。 (2 2)CPUCPUB B:在分支指令中包括比较过程。在分支指令中包括比较过程。 在这两种在这两种CPUCPU中,条件分支指令都占用中,条件分支指令都占用2 2个时钟周期,个时钟周期,而所有其它指令占用而所有其它指令占用1 1个时钟周期。对于个时钟周期。对于CPUCPUA A,执行的指令,执行的指令中分支指令占中分支指令占20%20%;由于每条分支指令之前都需要有比较指;由于每条分支指令之前都需要有比较指令,因此比较指令也占令,因此比较指令也占20%20%。由于。由于CPUCPUA A在分支时不需要比较,在分支时不需要比较,因此假设因此假设CPUCPUB B的时钟周期时间是的时钟周期时间是CPUCPUA A的的1.251.25倍。问:哪一个倍。问:哪一个CPUCPU更快?如果更快?如果CPUCPUB B的时钟周期时间只是的时钟周期时间只是CPUCPUA A的的1.11.1倍,哪一倍,哪一个个CPUCPU更快呢?更快呢?解解 我们不考虑所有系统问题,所以可用我们不考虑所有系统问题,所以可用CPUCPU性能公式。性能公式。占用占用2 2个时钟周期的分支指令占总指令的个时钟周期的分支指令占总指令的20%20%,剩下的,剩下的指令占用指令占用1 1个时钟周期。所以个时钟周期。所以 CPICPIA A = 0.2 = 0.2 2 + 0.80 2 + 0.80 1 = 1.2 1 = 1.2则则CPUCPUA A性能为性能为 总总CPUCPU时间时间A A = IC = ICA A 1.2 1.2 时钟周期时钟周期A A根据假设,有根据假设,有 时钟周期时钟周期B B = 1.25 = 1.25 时钟周期时钟周期A A 在在CPUCPUB B中没有独立的比较指令,所以中没有独立的比较指令,所以CPUCPUB B的程序量的程序量为为CPUCPUA A的的80%80%,分支指令的比例为,分支指令的比例为 20%/80% = 25%20%/80% = 25%这些分支指令占用这些分支指令占用2 2个时钟周期,而剩下的个时钟周期,而剩下的75%75%的指令占用的指令占用1 1个时钟个时钟周期,因此周期,因此 CPICPIB B = 0.25 = 0.25 2 + 0.75 2 + 0.75 1 = 1.25 1 = 1.25因为因为CPUCPUB B不执行比较,故不执行比较,故 ICICB B = 0.8 = 0.8 IC ICA A因此因此CPUCPUB B性能为性能为 总总CPUCPU时间时间B B = IC = ICB B CPI CPIB B 时钟周期时钟周期B B = 0.8 = 0.8 ICICA A 1.25 1.25 (1.25 1.25 时钟周期时钟周期A A) = 1.25 = 1.25 ICICA A 时钟周期时钟周期A A 在这些假设之下,尽管在这些假设之下,尽管CPUCPUB B执行指令条数较少,执行指令条数较少,CPUCPUA A因为有因为有着更短的时钟周期,所以比着更短的时钟周期,所以比CPUCPUB B快。快。 如果如果CPUCPUB B的时钟周期时间仅仅是的时钟周期时间仅仅是CPUCPUA A的的1.11.1倍,则倍,则 时钟周期时钟周期B B = 1.10 = 1.10 时钟周期时钟周期A ACPUCPUB B的性能为的性能为 总总CPUCPU时间时间B B = IC = ICB B CPICPIB B 时钟周期时钟周期B B = 0.8 = 0.8 ICICA A 1.25 1.25 (1.10 1.10 时钟周期时钟周期A A) = 1.10 = 1.10 IC ICA A 时钟周期时钟周期A A 因此因此CPUCPUB B由于执行更少指令条数,比由于执行更少指令条数,比CPUCPUA A运行更快。运行更快。4.程序的局部性原理程序的局部性原理 程序执行时所访问的存储器地址分布不是随机的,而是程序执行时所访问的存储器地址分布不是随机的,而是相对地簇聚。这种簇聚同时存在于指令访问和数据访问中。相对地簇聚。这种簇聚同时存在于指令访问和数据访问中。n常用的一个经验规则常用的一个经验规则程序执行时间的程序执行时间的90%90%都是在执行程序中都是在执行程序中10%10%的代码。的代码。n程序的时间局部性程序的时间局部性程序即将用到的信息很可能就是目前正在使用的信息。程序即将用到的信息很可能就是目前正在使用的信息。n程序的空间局部性程序的空间局部性 程序即将用到的信息很可能与目前正在使用的信程序即将用到的信息很可能与目前正在使用的信息在空间上相邻或者临近。息在空间上相邻或者临近。程序的这种局部性原理是计算机系统多层存储体系的基本程序的这种局部性原理是计算机系统多层存储体系的基本原理依据,特别是高速缓冲存储器原理依据,特别是高速缓冲存储器Cache。n计算机系统设计者的主要任务计算机系统设计者的主要任务n计算机系统设计者的任务计算机系统设计者的任务包括:指令系统的设计、数据表包括:指令系统的设计、数据表示的设计、功能的组织、逻辑设计以及其物理实现等。示的设计、功能的组织、逻辑设计以及其物理实现等。n设计一个计算机系统大致要完成设计一个计算机系统大致要完成3个方面的工作。个方面的工作。1.确定用户对计算机系统的功能、价格和性能的要求确定用户对计算机系统的功能、价格和性能的要求n计算机系统设计者的目标计算机系统设计者的目标 设计出能满足用户的功能需求、有较长的生命周设计出能满足用户的功能需求、有较长的生命周期、且又具有很高的性能价格比的系统。期、且又具有很高的性能价格比的系统。2.软硬件功能分配软硬件功能分配n考虑如何优化设计?考虑如何优化设计? 必须考虑软硬件功能的合理分配。必须考虑软硬件功能的合理分配。 n软件和硬件在实现功能上是等价的软件和硬件在实现功能上是等价的n用软件实现用软件实现的优点:设计容易、修改简单,而且可以减少硬件成的优点:设计容易、修改简单,而且可以减少硬件成本。但是所实现的功能的速度较慢。本。但是所实现的功能的速度较慢。n用硬件实现用硬件实现的优点:速度快、性能高,但它修改困难,灵活性差。的优点:速度快、性能高,但它修改困难,灵活性差。n在软硬件之间进行折中和取舍。在软硬件之间进行折中和取舍。3.设计出生命周期长的系统结构设计出生命周期长的系统结构n特别注意特别注意计算机应用计算机应用和和计算机技术计算机技术的发展趋势的发展趋势n设计出具有一定前瞻性的系统结构,以使得它具有较长的设计出具有一定前瞻性的系统结构,以使得它具有较长的生命周期。生命周期。 n1.3.2 计算机系统的性能评测计算机系统的性能评测n执行时间和吞吐率执行时间和吞吐率 如何评测一台计算机的性能,与测试者看问如何评测一台计算机的性能,与测试者看问题的角度有关。题的角度有关。n用户关心的是:用户关心的是:单个程序的单个程序的执行时间执行时间(执行(执行单个程序所花的时间很少)单个程序所花的时间很少)n数据处理中心的管理员关心的是:数据处理中心的管理员关心的是:吞吐率吞吐率(在单位时间里能够完成的任务很多(在单位时间里能够完成的任务很多 )假设两台计算机为假设两台计算机为X和和Y,X X比比Y Y快快的意思是:的意思是: 对于给定任务,对于给定任务,X X的执行时间比的执行时间比Y Y的执行时间少。的执行时间少。X的性能是的性能是Y的的n n倍:倍:执行时间与性能成反比:执行时间与性能成反比: 执行时间Y执行时间X= nn= = =执行时间Y执行时间X性能Y1性能X1性能X性能Yn执行时间可以有多种定义:执行时间可以有多种定义:n计算机完成某一任务所花费的全部时间,包括磁盘计算机完成某一任务所花费的全部时间,包括磁盘访问、存储器访问、输入访问、存储器访问、输入/输出、操作系统开销等。输出、操作系统开销等。nCPU时间:时间:CPUCPU执行所给定的程序所花费的时间,不执行所给定的程序所花费的时间,不包含包含I/OI/O等待时间以及运行其它程序的时间。等待时间以及运行其它程序的时间。n用户用户CPUCPU时间:时间:用户程序所耗费的用户程序所耗费的CPUCPU时间。时间。n系统系统CPUCPU时间:时间:用户程序运行期间操作系统耗费用户程序运行期间操作系统耗费的的CPUCPU时间。时间。1.4.2 基准测试程序基准测试程序 n用于测试和比较性能的基准测试程序的最佳选择是用于测试和比较性能的基准测试程序的最佳选择是真真实应用程序。实应用程序。 (例如编译器)(例如编译器) n以前常采用简化了的程序,例如:以前常采用简化了的程序,例如: n核心测试程序:核心测试程序:从真实程序中选出的关键代码段构从真实程序中选出的关键代码段构成的小程序。成的小程序。n小测试程序:小测试程序:简单的只有几十行的小程序。简单的只有几十行的小程序。n合成的测试程序:合成的测试程序:人工合成出来的程序。人工合成出来的程序。WhetstoneWhetstone与与DhrystoneDhrystone是最流行的合成测试程序。是最流行的合成测试程序。 从测试性能的角度来看,上述测试程序不可信了从测试性能的角度来看,上述测试程序不可信了。 原因:原因:p这些程序比较小,具有片面性;这些程序比较小,具有片面性;p系统结构设计者和编译器的设计者可以系统结构设计者和编译器的设计者可以“合谋合谋”把把他们的机器面向这些测试程序进行优化设计,使得他们的机器面向这些测试程序进行优化设计,使得该机器显得性能更高。该机器显得性能更高。n性能测试的结果除了和采用什么测试程序有性能

    注意事项

    本文(计算机系统结构.pptx)为本站会员(知****量)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开