计算机体系结构课后习题课后答案.pdf
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《计算机体系结构课后习题课后答案.pdf》由会员分享,可在线阅读,更多相关《计算机体系结构课后习题课后答案.pdf(28页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第 4 章 指 令 级 并 行 4.1解 释 下 列 术 语 指 令 级 并 行:简 称 ILP。是 指 指 令 之 间 存 在 的 一 种 并 行 性,利 用 它,计 算 机 可 以 并 行 执 行 两 条 或 两 条 以 上 的 指 令。指 令 调 度:通 过 在 编 译 时 让 编 译 器 重 新 组 织 指 令 顺 序 或 通 过 硬 件 在 执 行 时 调 整 指 令 顺 序 来 消 除 冲 突。指 令 的 动 态 调 度:是 指 在 保 持 数 据 流 和 异 常 行 为 的 情 况 下,通 过 硬 件 对 指 令 执 行 顺 序 进 行 重 新 安 排,以 提 高 流 水 线 的
2、 利 用 率 且 减 少 停 顿 现 象。是 由 硬 件 在 程 序 实 际 运 行 时 实 施 的。指 令 的 静 态 调 度:是 指 依 靠 编 译 器 对 代 码 进 行 静 态 调 度,以 减 少 相 关 和 冲 突。它 不 是 在 程 序 执 行 的 过 程 中、而 是 在 编 译 期 间 进 行 代 码 调 度 和 优 化 的。保 留 站:在 采 用 Tomasulo算 法 的 M IPS处 理 器 浮 点 部 件 中,在 运 算 部 件 的 入 口 设 置 的 用 来 保 存 一 条 已 经 流 出 并 等 待 到 本 功 能 部 件 执 行 的 指 令(相 关 信 息)。CDB
3、:公 共 数 据 总 线。动 态 分 支 预 测 技 术:是 用 硬 件 动 态 地 进 行 分 支 处 理 的 方 法。在 程 序 运 行 时,根 据 分 支 指 令 过 去 的 表 现 来 预 测 其 将 来 的 行 为。如 果 分 支 行 为 发 生 了 变 化,预 测 结 果 也 跟 着 改 变。BHT:分 支 历 史 表。用 来 记 录 相 关 分 支 指 令 最 近 一 次 或 几 次 的 执 行 情 况 是 成 功 还 是 失 败,并 据 此 进 行 预 测。分 支 目 标 缓 冲:是 一 种 动 态 分 支 预 测 技 术。将 执 行 过 的 成 功 分 支 指 令 的 地 址
4、 以 及 预 测 的 分 支 目 标 地 址 记 录 在 一 张 硬 件 表 中。在 每 次 取 指 令 的 同 时,用 该 指 令 的 地 址 与 表 中 所 有 项 目 的 相 应 字 段 进 行 比 较,以 便 尽 早 知 道 分 支 是 否 成 功,尽 早 知 道 分 支 目 标 地 址,达 到 减 少 分 支 开 销 的 目 的。前 瞻 执 行:解 决 控 制 相 关 的 方 法,它 对 分 支 指 令 的 结 果 进 行 猜 测,然 后 按 这 个 猜 测 结 果 继 续 取 指、流 出 和 执 行 后 续 的 指 令。只 是 指 令 执 行 的 结 果 不 是 写 回 到 寄 存
5、 器 或 存 储 器,而 是 放 到 一 个 称 为 R O B的 缓 冲 器 中。等 到 相 应 的 指 令 得 到“确 认”(即 确 实 是 应 该 执 行 的)后,才 将 结 果 写 入 寄 存 器 或 存 储 器。ROB:ReOrder Buffer。前 瞻 执 行 缓 冲 器。超 标 量:一 种 多 指 令 流 出 技 术。它 在 每 个 时 钟 周 期 流 出 的 指 令 条 数 不 固 定,依 代 码 的 具 体 情 况 而 定,但 有 个 上 限。超 流 水:在 一 个 时 钟 周 期 内 分 时 流 出 多 条 指 令。超 长 指 令 字:一 种 多 指 令 流 出 技 术。
6、VLIW处 理 机 在 每 个 时 钟 周 期 流 出 的 指 令 条 数 是 固 定 的,这 些 指 令 构 成 一 条 长 指 令 或 者 一 个 指 令 包,在 这 个 指 令 包 中,指 令 之 间 的 并 行 性 是 通 过 指 令 显 式 地 表 示 出 来 的。循 环 展 开:是 一 种 增 加 指 令 间 并 行 性 最 简 单 和 最 常 用 的 方 法。它 将 循 环 展 开 若 干 遍 后,通 过 重 命 名 和 指 令 调 度 来 开 发 更 多 的 并 行 性。4.2 简 述 Tomasulo算 法 的 基 本 思 想。答:核 心 思 想 是:记 录 和 检 测 指
7、令 相 关,操 作 数 一 旦 就 绪 就 立 即 执 行,把 发 生 RAW冲 突 的 可 能 性 减 小 到 最 少;通 过 寄 存 器 换 名 来 消 除 W AR冲 突 和 WAW冲 突。寄 存 器 换 名 是 通 过 保 留 站 来 实 现,它 保 存 等 待 流 出 和 正 在 流 出 指 令 所 需 要 的 操 作 数。基 本 思 想:只 要 操 作 数 有 效,就 将 其 取 到 保 留 站,避 免 指 令 流 出 时 才 到 寄 存 器 中 取 数 据,这 就 使 得 即 将 执 行 的 指 令 从 相 应 的 保 留 站 中 取 得 操 作 数,而 不 是 从 寄 存 器
8、中。指 令 的 执 行 结 果 也 是 直 接 送 到 等 待 数 据 的 其 它 保 留 站 中 去。因 而,对 于 连 续 的 寄 存 器 写,只 有 最 后 一 个 才 真 正 更 新 寄 存 器 中 的 内 容。一 条 指 令 流 出 时,存 放 操 作 数 的 寄 存 器 名 被 换 成 为 对 应 于 该 寄 存 器 保 留 站 的 名 称(编 号)。4.3 根 据 需 要 展 开 下 面 的 循 环 并 进 行 指 令 调 度,直 到 没 有 任 何 延 迟。指 令 的 延 迟 如 表 4.4。LOOP:L.DFO,O(R1)MUL.D F0,F0,F2L.D F4,0(R2)A
9、DD.D F0,F0,F4S.D F0,0(R2)DSUBI RI,RI,#8DSUBI R2,R2,#8BNEZ RI,LOOP解:将 循 环 展 开 两 次,进 行 指 令 调 度,即 可 以 消 除 延 迟,代 码 如 下 LOOP:L.D F0,0(R I)L.D F10,-8(R I)MUL.D F0,F0,F2MUL.D F10,F10,F2L.D F4,0(R2)L.D F14,-8(R2)ADD.D F0,F0,F4ADD.D F10,F10,F14DSUBI RI,R I,16S.D 0(R2),F0DSUBI R2,R2,16BNEZ RI,LOOPS.D 8(R2),F1
10、04.4 假 设 有 一 条 长 流 水 线,仅 仅 对 条 件 转 移 指 令 使 用 分 支 目 标 缓 冲。假 设 分 支 预 测 错 误 的 开 销 为 4 个 时 钟 周 期,缓 冲 不 命 中 的 开 销 为 3 个 时 钟 周 期。假 设:命 中 率 为 9 0%,预 测 精 度 为 9 0%,分 支 频 率 为 1 5%,没 有 分 支 的 基 本 C P I为 1。(I)求 程 序 执 行 的 CPI。(2)相 对 于 采 用 固 定 的 2 个 时 钟 周 期 延 迟 的 分 支 处 理,哪 种 方 法 程 序 执 行 速 度 更 快?解:(1)程 序 执 行 的 C P
11、I=没 有 分 支 的 基 本 CPI(1)+分 支 带 来 的 额 外 开 销 分 支 带 来 的 额 外 开 销 是 指 在 分 支 指 令 中,缓 冲 命 中 但 预 测 错 误 带 来 的 开 销 与 缓 冲 没 有 命 中 带 来 的 开 销 之 和。分 支 带 来 的 额 外 开 销=15%*(90%命 中 X 10%预 测 错 误 义 4+10%没 命 中 X 3)=0.099所 以,程 序 执 行 的 CPI=1+0.099=1.099(2)采 用 固 定 的 2 个 时 钟 周 期 延 迟 的 分 支 处 理 CPI=1+15%X2=1.3由(1)(2)可 知 分 支 目 标
12、 缓 冲 方 法 执 行 速 度 快。4.5 假 设 分 支 目 标 缓 冲 的 命 中 率 为 9 0%,程 序 中 无 条 件 转 移 指 令 的 比 例 为 5%,没 有 无 条 件 转 移 指 令 的 程 序 C P I值 为 1。假 设 分 支 目 标 缓 冲 中 包 含 分 支 目 标 指 令,允 许 无 条 件 转 移 指 令 进 入 分 支 目 标 缓 冲,则 程 序 的 C P I值 为 多 少?解:设 每 条 无 条 件 转 移 指 令 的 延 迟 为 X,则 有:l+5%X x=l.lx=2当 分 支 目 标 缓 冲 命 中 时,无 条 件 转 移 指 令 的 延 迟 为
13、 0。所 以 程 序 的 CPI=1+2 X 5%x(l-9 0%)=1.014.6 下 面 的 一 段 M IPS汇 编 程 序 是 计 算 高 斯 消 去 法 中 的 关 键 一 步,用 于 完 成 下 面 公 式 的 计 算:Y=a x X+Y其 浮 点 指 令 延 迟 如 表 4.3所 示,整 数 指 令 均 为 1个 时 钟 周 期 完 成,浮 点 和 整 数 部 件 均 采 用 流 水。整 数 操 作 之 间 以 及 与 其 它 所 有 浮 点 操 作 之 间 的 延 迟 为 0,转 移 指 令 的 延 迟 为 0。X中 的 最 后 一 个 元 素 存 放 在 存 储 器 中 的
14、地 址 为 DONE。FOO:L.D F2,O(R1)MUT.D F4,F2,F0L.D F6,0(R2)ADD.D F6,F4,F6S.D F6,0R2DADDIU RI,RI,#8DADDIU R2,R2,#8DSUBIU R3,R1,#DONEBNEZ R3,FOO(1)对 于 标 准 的 M IPS单 流 水 线,上 述 循 环 计 算 一 个 Y 值 需 要 多 少 时 间?其 中 有 多 少 空 转 周 期?(2)对 于 标 准 的 M IP S单 流 水 线,将 上 述 循 环 顺 序 展 开 4 次,不 进 行 任 何 指 令 调 度,计 算 一 个 Y 值 平 均 需 要 多
15、 少 时 间?加 速 比 是 多 少?其 加 速 是 如 何 获 得 的?(3)对 于 标 准 的 M IP S单 流 水 线,将 上 述 循 环 顺 序 展 开 4 次,优 化 和 调 度 指 令,使 循 环 处 理 时 间 达 到 最 优,计 算 一 个 Y 值 平 均 需 要 多 少 时 间?加 速 比 是 多 少?(4)对 于 采 用 如 图 4.8前 瞻 执 行 机 制 的 M IPS处 理 器(只 有 一 个 整 数 部 件)。当 循 环 第 二 次 执 行 到 BNEZ R3.FOO时,写 出 前 面 所 有 指 令 的 状 态,包 括 指 令 使 用 的 保 留 站、指 令 起
16、 始 节 拍、执 行 节 拍 和写 结 果 节 拍,并 写 出 处 理 器 当 前 的 状 态。(5)对 于 2 路 超 标 量 的 M IPS流 水 线,设 有 两 个 指 令 流 出 部 件,可 以 流 出 任 意 组 合 的 指 令,系 统 中 的 功 能 部 件 数 量 不 受 限 制。将 上 述 循 环 展 开 4 次,优 化 和 调 度 指 令,使 循 环 处 理 时 间 达 到 最 优。计 算 一 个 Y 值 平 均 需 要 多 少 时 间?加 速 比 是 多 少?(6)对 于 如 图 4.13结 构 的 超 长 指 令 字 M IPS处 理 器,将 上 述 循 环 展 开 4
17、次,优 化 和 调 度 指 令,使 循 环 处 理 时 间 达 到 最 优。计 算 一 个 Y 值 平 均 需 要 多 少 时 间?加 速 比 是 多 少?解:(1)L.D F2,O(R1)1StallMUT.D F4,F2,F0 2L.D F6,0(R2)3StallStallADD.D F6,F4,F6 4StallStallS.D F6,0R2 5DADDIU R I,R I,#8 6DADDIU R2,R2,#8 7DSUBIU R3,R1,#DONE 8BNEZ R3,FOO 9所 以,共 有 1 4个 时 钟 周 期,其 中 有 5 个 空 转 周 期。(2)循 环 顺 序 展 开
18、 4 次,不 进 行 任 何 指 令 调 度,则 指 令 1 5 及 其 间 的 s ta ll都 是 必 要 的,只 是 指 令 6 9 只 需 执 行 一 次,因 此,共 有 10 X 4+4=4 4 个 时 钟 周 期,计 算 出 4 个 Y 值,所 以 计 算 一 个 Y 值 需 要 1 1个 时 钟 周 期,加 速 比 为:14/11=1.2 7。加 速 主 要 是 来 自 减 少 控 制 开 销,即 减 少 对 R I、R 2 的 整 数 操 作 以 及 比 较、分 支 指 令 而 来 的。(3)循 环 顺 序 展 开 4 次,优 化 和 调 度 指 令,如 下:L.D F2,O(
19、R1)L.D F8,8(R1)L.D F14,16(R1)L.D F20,24(R1)MUT.D F4,F2,F0MUT.D F10,F8,F0MUT.D F16,F14,F0MUT.D F22,F20,F0L.D F6,0(R2)L.D F12,8(R2)L.D F18,16(R2)L.D F24,24(R2)ADD.D F6,F4,F6ADD.D F12,F10,F12ADD.D F18,F16,F18ADD.D F24,F22,F24S.D F6,0R2S.D F12,8R2S.D Fl 8,16R2S.D F24,24R2DADDIU R1,R1,#32DADDIU R2,R2,#32
20、DSUBIU R3,R1,#DONEBNEZ R3,FOO共 用 了 2 4 个 时 钟 周 期,则 计 算 一 个 Y 值 平 均 需 要 24/4=6 个 时 钟 周 期,加 速 比:14/6=2.33(4)指 令 指 令 执 行 时 钟 流 出 执 行 写 结 果 确 认 L.D F2,0(R I)1 2 3 4MUL.D F4,F2,FO 2 4 5 6L.D F6,0(R2)3 4 6 7ADD.D F6,F4,F6 4 8 9 10S.D F6,0(R2)5 1 1 12 13DADDIU R I,R I,#8 6 7 8DADDIU R2,R2,#8 7 8 9DSUBIU R3
21、,R1,#DONE 8 9 10BNEZ R3,FOO 9 10L.D F2,0(R I)10 11 13 14MUL.D F4,F2,FO 11 13 14 15L.D F6,0(R2)12 13 15 16ADD.D F6,F4,F6 13 17 18 19S.D F6,0(R2)14 20 21 22DADDIU R I,R I,#8 15 16 17DADDIU R2,R2,#8 16 17 18DSUBIU R3,R1,#DONE 17 18 19BNEZ R3,FOO 18名 称 保 留 站 BusyOp VjVkQ iQk Dest AAddl yes ADD.D RcgsF4
22、RegsF6 Add2 noAdd3 noMulti yesMult2 no项 号 ROBBusy 指 令 状 态 目 的 ValueROBBusy 指 令 状 态 目 的 Value1 yes ADD.D F6,F4,F6 执 行 F6 RegsF4+RegsF62 yes S.D F6,0(R2)流 出 Mem0+RegsR2#2(5)字 段 浮 点 寄 存 器 状 态 FO F2 F4 F6 F8 F10 F30RO B项 编 号 1Busy yes整 数 指 令 浮 点 指 令 时 钟 周 期 数 L.D F2,O(R1)1L.D F8,8(R1)2L.D F14,16(R1)MUT.
23、D F4,F2,FO 3L.D F20,24(R1)MUT.D F10,F8,F0 4L.D F6,0(R2)MUT.D F16,F14,F0 5L.D Fl 2,8(R2)MUT.D F22,F20,FO 6L.D F18,16(R2)ADD.D F6,F4,F6 7L.D F24,24(R2)ADD.D F12,F10,F12 8DADDIUR1,RL#32 ADD.D F18,F16,F18 9S.D F6,0(R2)ADD.D F24,F22,F24 10S.D Fl 2,8(R2)11S.D F18,16(R2)12S.D F24,24(R2)13DADDIU R2,R2,#32 1
24、4DSUBIU R3,R1,#DONE 15BNEZ R3,FOO 16计 算 一 个 Y 值 需 要 16/4=4 个 时 钟 周 期,加 速 比=14/4=3.5(6)访 存 1 访 存 2 浮 点 指 令 1 浮 点 指 令 2 整 数 指 令 时 钟 周 期 L.DF2,0(R1)L.D F8,8(R1)1L.DF14,16(R1)L.DF20,24(R1)L.DF6,0(R2)L.DF12,8(R2)MUT.DF4,F2,FOMUT.DFIO,F8,FO3L.DF18,16(R2)L.DF24,24(R2)MUT.DF16,F14,FOMUT.DF22,F20,FO4ADD.DF6,
25、F4,F6ADD.DF12,F10,F125ADD.DF18,F16,F18ADD.DF24,F22,F24DADDIU RI,RI,#326DADDIU R2,R2,#32 7DSUBIUR3,RI,8计 算 一 个 Y 值 需 要 1 1/4个 时 钟 周 期,加 速 比=14/(11/4)=56/11#DONEBNEZ R3,FOO 9S.DF6,-32(R2)S.DF12,-24(R2)10S.DF18,-16(R2)S.DF24,-8(R2)114.7 对 于 两 路 超 标 量 处 理 器,从 存 储 器 取 数 据 有 两 拍 附 加 延 迟,其 它 操 作 均 有 1拍 附 加
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机体系结构 课后 习题 答案
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内