清华第2版《计算机系统结构》习题解答.doc
《清华第2版《计算机系统结构》习题解答.doc》由会员分享,可在线阅读,更多相关《清华第2版《计算机系统结构》习题解答.doc(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流清华第2版计算机系统结构习题解答.精品文档.计算机系统结构习题解答目录第一章(P33)1.7-1.9(透明性概念),1.12-1.18(Amdahl定律),1.19、1.21、1.24(CPI/MIPS)第二章(P124)2.3、2.5、2.6(浮点数性能),2.13、2.15(指令编码)第三章(P202)3.3(存储层次性能),3.5(并行主存系统),3.15-3.15加1题(堆栈模拟),3.19中(3)(4)(6)(8)问(地址映象/替换算法-实存状况图)第四章(P250)4.5(中断屏蔽字表/中断过程示意图),4.8(通道流量计算/通道
2、时间图)第五章(P343)5.9(流水线性能/时空图),5.15(2种调度算法)第六章(P391)6.6(向量流水时间计算),6.10(Amdahl定律/MFLOPS)第七章(P446)7.3、7.29(互连函数计算),7.6-7.14(互连网性质),7.4、7.5、7.26(多级网寻径算法),7.27(寻径/选播算法)第八章(P498)8.12(SISD/SIMD算法)第九章(P562)9.18(SISD/多功能部件/SIMD/MIMD算法)(注:每章可选1-2个主要知识点,每个知识点可只选1题。有下划线者为推荐的主要知识点。)第一章(P33)1.7(1)从指定角度来看,不必要了解的知识称为
3、透明性概念。(2)见下表,“”为透明性概念,“P”表示相关课文页数。模m交叉,浮点数据,P4通道与I/O处理机,P4总线宽度,阵列运算部件,结合型与独立型通道,单总线,访问保护,中断,指令控制方式,堆栈指令,最小编址单位,Cache存储器,1.8见下表,“”为透明性概念,“P”表示相关课文页数。指令地址寄存器,指令缓冲器,时标发生器,条件码寄存器,乘法器,主存地址寄存器,磁盘,先行进位链,移位器,通用寄存器 ,中断字寄存器,1.9见下表,“”表示都透明,“应”表示仅对应用程序员透明,“”表示都不透明。数据通路宽度,虚拟存储器,应,Cache存储器,程序状态字,“启动I/O”指令,应,“执行”指
4、令,指令缓冲寄存器,Sn20 1 01 Fe1.12 已知Se=20 , 求作Fe-Sn关系曲线。 将Se代入Amdahl定律得1.13 上式中令Sn=2,解出Fe=10/190.5261.14 上式中令Sn=10,解出Fe=18/190.9471.15 已知两种方法可使性能得到相同的提高,问哪一种方法更好。(1)用硬件组方法,已知Se=40,Fe=0.7,解出Sn=40/12.73.1496(两种方法得到的相同性能)(2)用软件组方法,已知Se=20,Sn=40/12.7,解出Fe=27.3/380.7184(第二种方法的百分比)(3)结论:软件组方法更好。因为硬件组需要将Se再提高100%
5、(2040),而软件组只需将Fe再提高1.84%(0.70.7184)。1.17 1.18 记f 时钟频率,T=1/f 时钟周期,B 带宽(Byte/s)。方案一:方案二:1.19 由各种指令条数可以得到总条数,以及各百分比,然后代公式计算。(1)(2)(3)1.21(1)(2)1.24 记Tc 新方案时钟周期,已知CPI = CPIi = 1原时间 = CPI IC 0.95Tc = 0.95ICTc新时间 = (0.32/3+0.7) IC Tc = 0.9ICTc二者比较,新时间较短。第二章(P124)2.3(忽略P124倒1行 P125第8行文字,以简化题意)已知2种浮点数,求性能指标
6、。 此题关键是分析阶码、尾数各自的最大值、最小值。 原图为数据在内存中的格式,阶码的小数点在其右端,尾数的小数点在其左端,遵守规格化要求。 由于尾数均为原码,原码的绝对值与符号位无关,所以最大正数与最小负数的绝对值相同,可用“最大绝对值”回答;最小正数与最大负数的绝对值相同,可用“最小绝对值”回答。 第1小问中,阶码全部位数为8,作无符号数看待真值为0255,作移-127码看待真值为-127+128;尾数(不计符号位)有23位小数,另加1位整数隐藏位,所以尾数绝对值为1.02.0 2-23,有效位数p=24; 第2小问中,阶码全部位数为11,作无符号数看待真值为02047,作移-1023码看待
7、真值为-1023+1024;尾数(不计符号位)有52位小数,另加1位整数隐藏位,所以尾数绝对值为1.02.0 2-52,有效位数p=53。 最大绝对值为最大阶码与最大尾数绝对值的组合,最小绝对值为最小阶码与最小尾数绝对值的组合。代入相关公式后得最终结果如下表。32位64位最大绝对值(1-2-24)2129(1-2-53)21025最小绝对值2-1272-1023表数精度2-242-53表数效率100%100%2.5(1) rm = 2,re = 2,p = 24(隐藏最高位),q = 7。(2) Nmax = 1.71038,-|N|min = -1.4710-39 5.9610-8 10-7
8、.22, = 100%2.61位7位6位00111111333333(1) 0.2 = 0.333333H160 设阶码为移-63码(即-26+1,原题未指明)0.2 = 0.110011001100110011001101B2-2 1位8位23位00111110110011001100110011001101(其中最高有效位需隐藏)阶码为移-127码(即-27+1)(2) 符号位不变,(阶码 63)4 + 127;尾数左规,除去最高位;(3) 符号位不变,(阶码 127)/ 4 + 63;尾数补最高位,按除法余数右移若干位,左补0。2.13 已知10条指令使用频度,求3种编码方法的平均码长与
9、信息冗余量。(1)此问中的“最优Huffman编码法”实际是指码长下限,即信源的平均信息量熵,代公式得H=2.9566。(2)Huffman编码性能如下表;(3)2/8扩展编码是8/64/512法的变种,第一组2条指令,码长为2(1位扩展标志,1位编码),第二组8条指令,码长为4(1位扩展标志,与第一组区别,加3位编码),编码性能如下表;(4)3/7扩展编码是15/15/15法的变种,第一组3条指令,码长为2(共有4种组合,其中3种组合分别代表3条指令,留1种组合作为扩展前缀标志),第二组7条指令,码长为5(2位固定的前缀扩展标志,与第一组区别,加3位编码,只用其中7种组合),编码性能如下表。
10、Huffman编码2/8扩展编码3/7扩展编码平均码长L2.993.13.2信息冗余量R1.10%4.61%7.59%2.15(1) 15条/63条/64条(2) 14条/126条/128条第三章(P202)3.3 直接代公式计算存储层次性能指标。(1)74ns,38ns,23.6ns(2)0.258,0.315,0.424(3)T256K T128K c128K c64K(4)19.092,11.97,10.0064。答案是256K方案最优。3.5 已知,其中g=0.1依题意有整理得0.9n0.2,解出,向下取整,得15;按另一种题意理解是向上取整,得16,也对。3.15 欲知可能的最高命中
11、率及所需的最少主存页数,较好的办法是通过“堆栈模拟法”,求得命中次数随主存页数变化的函数关系。下图就是“堆栈模拟图”,其中“”表示命中。P=453251323513命中次数4532513235134532513235145325112354432551224444444n=10n=21n=33n=47n=57(1)Hmax=7/1258.3%(2)n=4(3)当1次页面访问代表连续1024次该页内存储单元访问时,后1023次单元访问肯定是命中的,而第1次单元访问的命中情况与这1次页面访问的命中情况相同。根据上图中最高命中情况,共有7次页命中(折算为71024次单元命中),5次页不命中(折算为5
12、1023次单元命中,也可写为51024-5),单元访问总次数为121024,故有:Hcell=(121024-5)/(121024)=12283/1228899.96%3.15加1题 一个二级存储层次,采用全相联映象和最久没有使用算法,实存共5页,为2道程序分享,页地址流分别如下P1 = 1 2 3 4 1 3 2 1P2 = 1 2 3 4 2 2 3 3试作2个实存分配方案,分别使2道程序满足(1)命中率相同;(2)命中次数之和最大。P1 =12341321命中次数N(1)12341321123413212341312244n1= 10n1= 20n1= 32n1= 44解:分别为2道程序
13、作“堆栈模拟图”,其中“”表示命中。P2 =12342233命中次数N(2)12342233123442212334411111n2= 12n2= 22n2= 34n2= 4465 N(1)+N(2)432 N(1) N(2)1 1+4 2+3 3+2 4+1将两图结果综合,得到4个分配方案的命中率情况表如下n11234N(1)0024n24321N(2)4422N(1)+N(2)4446结论如下(1)命中率相同的方案是n1= 3而n2= 2;(2)命中次数之和最大的方案是n1= 4而n2= 1。3.19中(3)(4)(6)(8)问 虚存 实页0123虚组0 00 1 实存1虚组1 20 实组
14、02 31虚3虚组2 42 实组1页4 535虚组3 66 77(a) 虚页集合与实页集合的对应关系 (b) 对应关系表(为有关系)(3)(4)通过作“实存状况图”模拟各虚块的调度情况,可获得Cache的块地址流序列。P=624146304573C044*4444*44*4*4*C111*1*1*00*555C266*6*6*6*66*6*6*6*77*C322222*33333*3入入入入中中替替中替替中C=230102310123此问最容易出错的地方是忽略“组相联”地址约束,将虚页装错实组。另外没有及时标注“*”号也容易导致淘汰对象错误。(6)H=4/1233%(8)做法同3.15题(3)
15、问,Hcell=(1216-8)/(1216)95.8%第四章(P250)时间 中断请求主程序1级 2级 3级 4级 D1,D2 D3,D44.5 已知中断服务次序为3-2-4-1,。(1)中断屏蔽字表如下图;D1D2D3D4D10111D20010D30000D40110(2)中断过程示意图如右图。4.8(1)f=2105字节/秒,T=5us(2)Ts+Td=5us,通道时间图如下。作图时注意:至少要画到最慢设备的第二次请求出现,才能确定是否丢失数据(因为响应优先级低的设备较易丢失数据)。设优备先号级D1 1D2 4D3 2D4 3时间(us) 0 10 20 30 40 50 60 70
16、80 90 100 110 120 130 140 150 160 170(3)5,160,20,40;(4)D2丢失第一次请求的数据;(5)参见P245。第五章(P343)5.9 为了缩短运算时间,首先应考虑“最少切换算法”,即先执行完所有乘法(任务编号1-6)再执行加法(任务编号7-11),其次在加法中采用“最少相关算法”(即二叉树算法)。 记c1=A1B1,c6=A6B6,下图(a)是加法的计算顺序二叉树,注意任务10应该用前一级最早完成的任务7和8的结果,如果用任务9的结果则要推迟1拍启动,使总时间增加1拍。F=c1+c2+c3+c4+c5+c66 1 2 3 4 5 6 7 8 9
17、10 115 1 2 3 4 5 6 7 8 94 1 2 3 4 5 63 7 8 9 10 11 102 7 8 9 10 111 1 2 3 4 5 6 7 8 9 10 11 11 0 1 2 3 4 5 6 7 8 9 12 14 15 18 22(a)(b)根据时空图(b)得TP = 11/(22t) = 1/(2t)S = (64t + 54t)/(22t) = 2E = (64t + 54t)/(622t) = 1/35.15 t=10ns=10-8秒(1)F=1,2,5,C=(10011)(2)状态转移图如下图(a)所示。(3)最小启动循环=(3),最小平均启动距离=3t。(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机系统结构 清华 计算机系统 结构 习题 解答
限制150内