计算机系统结构-习题课及答案全套ppt课件.ppt
《计算机系统结构-习题课及答案全套ppt课件.ppt》由会员分享,可在线阅读,更多相关《计算机系统结构-习题课及答案全套ppt课件.ppt(126页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 习题课习题课我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物目录目录 返回总目录我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物基本要求:基本要求:)计算机系统结构的基本概念,定量原理,指令的格式设计,CISC与RISC,虚拟存储页面替换算法,Cache映象,通道流量分析,数据相关,线性与非线性流水线技术及性能分析,互连网络基本概念;学习重点:学习重点:)定量原理,指令格式设计,RISC,页面替换算法,Cache映象,
2、流水线性能分析;我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物1 1计算机系统结构的基本概念计算机系统结构的基本概念1.11.1名词解释名词解释 返回目录1. 1. 计算机体系结构计算机体系结构的定义:的定义:程序员所看到的计算机程序员所看到的计算机的属性,即概念性结构与功能特性。的属性,即概念性结构与功能特性。 Amdahl提出的体系结构:是指传统机器级的体系提出的体系结构:是指传统机器级的体系结构。即一般所说的机器语言程序员所看到的传统机结构。即一般所说的机器语言程序员所看到的传统机器级所具有的属性。
3、器级所具有的属性。 2. 2. 透明性透明性 在计算机技术中,对这种本来是存在的在计算机技术中,对这种本来是存在的 事物或属性,但从某种角度看又好象不存在。事物或属性,但从某种角度看又好象不存在。大概率事件优先原则大概率事件优先原则:即对于大概率事件(最常见事:即对于大概率事件(最常见事件),赋予它优先的处理权和资源使用权,以获得全局的件),赋予它优先的处理权和资源使用权,以获得全局的最优结果。最优结果。Amdahl定律定律:加快某部件执行速度所获得的系统性能加:加快某部件执行速度所获得的系统性能加速比,受限于该部件在系统中所占的重要性。速比,受限于该部件在系统中所占的重要性。程序的局部性原理
4、程序的局部性原理:程序在执行时所访问地址的分布不:程序在执行时所访问地址的分布不是随机的,而是相对地簇聚;这种簇聚包括指令和数据两是随机的,而是相对地簇聚;这种簇聚包括指令和数据两部分。程序局部性包括程序的部分。程序局部性包括程序的时间局部性时间局部性和和空间局部性空间局部性。时间局部性时间局部性:程序即将用到的信息很可能就是目前正在:程序即将用到的信息很可能就是目前正在使用的信息使用的信息空间局部性空间局部性:程序即将用到的信息很可能与目前正在使:程序即将用到的信息很可能与目前正在使用的信息相邻或临近。用的信息相邻或临近。 1 1计算机系统结构的基本概念计算机系统结构的基本概念1.11.1名
5、词解释名词解释我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物系统加速比:系统改进前与改进后总执行时间之比系统加速比:系统改进前与改进后总执行时间之比CPI:指令周期数(:指令周期数(Cycles of Instruction)并行性:在同一时刻或同一时间间隔内完成两种或两种并行性:在同一时刻或同一时间间隔内完成两种或两种以上的性质相同或不同的工作。以上的性质相同或不同的工作。翻译:先把翻译:先把N1级程序全部变换成级程序全部变换成N级程序之后,再去级程序之后,再去执行执行N级程序,在执行过程中,级程序,在
6、执行过程中,N1级程序不再被访问级程序不再被访问(基于层次结构)(基于层次结构)解释:每当一条解释:每当一条N1级指令被译码后,就直接去执行一级指令被译码后,就直接去执行一串等效的串等效的N级指令,然后再去取下一条级指令,然后再去取下一条N1级指令,依级指令,依此重复进行。此重复进行。1 1计算机系统结构的基本概念计算机系统结构的基本概念1.11.1名词解释名词解释例例:设某程序中设某程序中FPFP操作占操作占20%20%,其平均,其平均CPI=4.0, CPI=4.0, FPSQRFPSQR操作的比例占操作的比例占4%4%,其平均,其平均CPI=20.0, CPI=20.0, 其它指令平均其
7、它指令平均CPI=1.20CPI=1.20,现采用两种方法进行优化,现采用两种方法进行优化: : a. a. 将将FPFP操作的操作的CPICPI减为减为2;2;b. b. 将将FPSQRFPSQR操作的操作的CPICPI减少为减少为12;12;问问1 1:哪一种方法更优哪一种方法更优? ?问问2 2:若同时采用若同时采用a a、b b方法,系统的加速比为多少?方法,系统的加速比为多少?1 1计算机系统结构的基本概念计算机系统结构的基本概念1.21.2问问1 1解解:比较:比较2方案的方案的CPI即可即可 CPIa =(1-20%-4%)CPI其他其他+(20%CPIFP ) +(4%CPIF
8、PSQR) = 76%1.20 + 20% 2+ 4% 20 =2.11CPIb =(1-20%-4%)CPI其他其他+(20%CPIFP ) +(4%CPIFPSQR) = 76% 1.20 + 20% 4 +4% 12 =2.3 所以,采用方法所以,采用方法a更优。更优。1 1计算机系统结构的基本概念计算机系统结构的基本概念1.21.2问问2 2解解: 加速比:加速比:4 . 112%42%2020. 1%7620%44%2020. 1%76%4%20%)4%201 (%4%20%)4%201 ()()()()()()( ICICURFPQSPFFPQSRFPCPICPICPICPICPI
9、CPICPICPICPICPICPCPUS其它其它新原时钟周期长新时钟周期长原新时间原时间1 1计算机系统结构的基本概念计算机系统结构的基本概念1.21.2我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物例例:假设我们考虑条件分支指令的两种不同设计方法如下:假设我们考虑条件分支指令的两种不同设计方法如下: (1) CPU(1) CPUA A:通过比较指令设置条件码,然后测试条件码进行分支:通过比较指令设置条件码,然后测试条件码进行分支(2)(2) CPUCPUB B:在分支指令中包括比较过程:在分支指令中包
10、括比较过程在两种在两种CPUCPU中,条件分支指令都占用中,条件分支指令都占用2 2个时钟周期而所有其它指令个时钟周期而所有其它指令占用占用1 1个时钟周期,对于个时钟周期,对于CPUCPUA A,执行的指令中分支指令占,执行的指令中分支指令占20%20%;由于;由于每个分支指令之前都需要有比较指令,因此比较指令也占每个分支指令之前都需要有比较指令,因此比较指令也占20%20%。由。由于于CPUCPUB B在分支时需要比较,因此假设它的时钟周期时间是在分支时需要比较,因此假设它的时钟周期时间是CPUCPUA A的的1.251.25倍。倍。问问1 1:哪一个哪一个CPUCPU更快?更快?1 1计
11、算机系统结构的基本概念计算机系统结构的基本概念1.31.3我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物我们不考虑所有系统问题,所以可用我们不考虑所有系统问题,所以可用CPUCPU性能公式。占用性能公式。占用2 2个时钟周期的分支指令占总指令的个时钟周期的分支指令占总指令的20%20%,剩下的指令占用,剩下的指令占用1 1个时钟周期。所以个时钟周期。所以 CPICPIA A = 20% = 20% 2 + 80% 2 + 80% 1 = 1.2 1 = 1.2则则CPUCPU性能为:性能为: 总总CPUC
12、PU时间时间A A = IC= ICA A 1.2 1.2 时钟周期时钟周期A A解解1:1 1计算机系统结构的基本概念计算机系统结构的基本概念1.31.3我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物根据假设,有:根据假设,有: 时钟周期时钟周期B B = 1.25 = 1.25 时钟周期时钟周期A A在在CPUCPUB B中没有独立的比较指令,所以中没有独立的比较指令,所以CPUCPUB B的程序量为的程序量为CPUCPUA A的的80%80%,分支指令的比例为:,分支指令的比例为: 20%/80%
13、= 25%20%/80% = 25%这些分支指令占用这些分支指令占用2 2个时钟周期,而剩下的个时钟周期,而剩下的75%75%的指令的指令占用占用1 1个时钟周期,因此:个时钟周期,因此: CPICPIB B = 0.25 = 0.25 2 + 0.75 2 + 0.75 1 = 1.25 1 = 1.25因为因为CPUCPUB B不执行比较,故:不执行比较,故: ICICB B = 0.8 = 0.8 IC ICA A解解1:1 1计算机系统结构的基本概念计算机系统结构的基本概念1.31.3我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我
14、的猜测没有错:表里边有一个活的生物因此因此CPUCPUB B性能为:性能为: 总总CPUCPU时间时间B B = IC = ICB B CPI CPIB B 时钟周期时钟周期B B = 0.8 = 0.8 IC ICA A 1.25 1.25 (1.25 (1.25 时钟周期时钟周期A A) ) = 1.25 = 1.25 IC ICA A 时钟周期时钟周期A A在这些假设之下,尽管在这些假设之下,尽管CPUCPUB B执行指令条数较少,执行指令条数较少,CPUCPUA A因为有着更短的时钟周期,所以比因为有着更短的时钟周期,所以比CPUCPUB B快。快。解解1:1 1计算机系统结构的基本概
15、念计算机系统结构的基本概念1.31.3我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物 例例:我们分析一个用于:我们分析一个用于WebWeb服务器系统的处理器的性能。服务器系统的处理器的性能。假定采用某增强方式使新的假定采用某增强方式使新的CPUCPU处理处理WebWeb服务器应用程序的服务器应用程序的运行速度是原来处理器中的运行速度是原来处理器中的1010倍,同时假定此倍,同时假定此CPUCPU有有40%40%的的时间用于计算,另外时间用于计算,另外60%60%的时间用于的时间用于I/OI/O操作。那么增
16、强性操作。那么增强性能后总的加速比是多少?能后总的加速比是多少? 解解:增强比例:增强比例 = 0.4= 0.4 增强加速比增强加速比 = 10= 10总加速比总加速比 = = 1 10.6 +0.6 +0.40.41010= =0.640.64= 1.56= 1.561 11 1计算机系统结构的基本概念计算机系统结构的基本概念1.41.4我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物例例:设某计算机系统执行程序中,可向量化部分最大可达:设某计算机系统执行程序中,可向量化部分最大可达70%70%。一种实现
17、方法是采用陈列多处理机即硬件方式实现,使一种实现方法是采用陈列多处理机即硬件方式实现,使60%60%的的向量化指令执行速度加快到原来的向量化指令执行速度加快到原来的1010倍,另一种方法是采用优倍,另一种方法是采用优化编译系统的方法实现,使向量化程序可达化编译系统的方法实现,使向量化程序可达70%70%,且速度可增,且速度可增加加3 3倍。请比较这两种方案哪种更优。倍。请比较这两种方案哪种更优。解:解:通过计算加速比知,硬件方案较优!通过计算加速比知,硬件方案较优!53. 013/7 . 0%)701 (146. 0110/6 . 0%)601 (1编译硬件SS1 1计算机系统结构的基本概念计
18、算机系统结构的基本概念1.51.5Assume a simple load/store machine with the following instruction frequency:Instruction typeFrequencyCyclesLoads25%2Stores15%2Branches20%2ALU40%1conditional branches currently use simple test against 0Should we add complex comparison/branch combination (BEQ Rn,Rm,LOC orBNE Rn,Rm,LOC
19、) -25% of branches can use the complex scheme and save(节省了)节省了) the preceding ALU instruction -The CPU cycle time(CCT) of the machine has to be 10% longer -Will this increase CPU performance?1 1计算机系统结构的基本概念计算机系统结构的基本概念1.61.61 1计算机系统结构的基本概念计算机系统结构的基本概念1.61.6使用使用40MHz时钟速率的处理机执行一个测试程序,时钟速率的处理机执行一个测试程序,
20、它的主要指令类型所执行的指令数及所需的时钟周期它的主要指令类型所执行的指令数及所需的时钟周期数如下,试计算执行此程序的有效数如下,试计算执行此程序的有效CPI,MIPS速率速率及总的及总的CPU时间。(时间。(p33习题习题1.19)指令类型指令数时钟周期数整数算术450001数据传送320002浮点150002控制转移800021 1计算机系统结构的基本概念计算机系统结构的基本概念1.71.7 p33p33习题习题1.19 1.19 总时钟周期数总时钟周期数=45000*1+32000*2+15000*2+8000*2=155000总指令数总指令数=45000+32000+15000+800
21、0=100000CPI=总时钟周期数总时钟周期数/总指令数总指令数=1.55总总CPU执行时间执行时间=155000/40* 10-6=0.003875sMIPS=总指令数总指令数*10-6/总时间总时间=0.1/0.003875=25.81 1计算机系统结构的基本概念计算机系统结构的基本概念1.71.7 p33p33习题习题1.19 1.19 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物1 1计算机系统结构的基本概念计算机系统结构的基本概念1.81.8 p33p33习题习题1.20 1.20 某工作站
22、采用时钟频率为某工作站采用时钟频率为15MHz,处理速率为,处理速率为10MIPS的处理机来执行一个已知混合程序。假定的处理机来执行一个已知混合程序。假定每次存储器存取为每次存储器存取为1周期延迟,试问:周期延迟,试问:(1)此计算机的有效)此计算机的有效CPI是多少?是多少?(2)时钟提高到)时钟提高到30MHz,但存储器子系统速率不,但存储器子系统速率不变。这样,每次存储器存取需要变。这样,每次存储器存取需要2个时钟周期。如个时钟周期。如果果30%指令每条只需要指令每条只需要1次存储存取,而另外次存储存取,而另外5%每条需要每条需要2次存储存取,还假定已知混合程序的指次存储存取,还假定已知
23、混合程序的指令数不变,并与原工作站兼容,试求改进后的处理令数不变,并与原工作站兼容,试求改进后的处理机性能。机性能。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物1 1计算机系统结构的基本概念计算机系统结构的基本概念1.81.8 p33p33习题习题1.20 1.20 解:解:(1)设该程序执行时间为)设该程序执行时间为t,则,则CPI=总时钟周期数总时钟周期数/总指令数总指令数=(t*15M)/(t*10M) = 1.5(2) 公式:公式: CPUtime=IC*CPI*CCT 即有:即有: CPUti
24、me=指令数指令周期数指令数指令周期数cpu周期时间周期时间我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物1 1计算机系统结构的基本概念计算机系统结构的基本概念1.81.8 p33p33习题习题1.20 1.20 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物1 1计算机系统结构的基本概念计算机系统结构的基本概念1.91.9 p34p34习题习题1.21 1.21 24. 21 . 0812. 0418. 026 .
25、 01CPI86.171024. 2104010666CPIfMIPS 解:解:我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物2 2指令系统指令系统2.12.1名词解释名词解释 CISC:CISC:复杂指令集计算机(复杂指令集计算机(Complex Instruction Complex Instruction Set ComputerSet Computer)。)。强化指令功能,设置一些功能复强化指令功能,设置一些功能复杂的指令,把一些原来由软件实现的、常用的功能杂的指令,把一些原来由软件实现的、常用的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机系统 结构 习题 答案 全套 ppt 课件
限制150内