指令系统的设计和优化.ppt
指令系统的设计和优化 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望内容n指令系统设计的基本原则n指令操作码的优化n指令字格式的优化 指令设计的步骤n根据应用,初拟出指令的分类和具体的指令;n试编出用该指令系统设计的各种高级语言的编译程序;n对各种算法白那些大量测试程序进行模拟测试,看指令系统的操作码和寻址方式效能是否都比较高;n将程序中高频出现的指令串复合改成一条强攻能新指令,即改用硬件方式实现;而将频度很低的指令的操作改成基本的指令组成的指令串来完成,即用软件方式实现;指令类型n非特权型:主要供应应用程序员使用,也可供系统程序员使用,包括算术逻辑运算、数据传送、浮点运算、字符串、十进制运算、控制转移及系统控制等;n特权型:系统程序员使用,用户无权使用,有启动I/O(多用户环境下)、停机等待、存储管理保护、控制系统状态、诊断等;指令系统的设计n设计的原则:如何支持编译系统能高效、简易地将源程序翻译成目标代码。n规整性n对称性n独立性和全能性n正交性n可组合性n可扩充性系统设计人员希望n指令码密度适中n高密度指令:强功能符合指令n优点:减少程序长度、访存次数、Cache、虚存访问调度次数、程序运行时间;n缺点:指令系统复杂,硬件实现困难;n兼容性n适应性指令系统的设计包含的内容n指令的格式n指令的类型n操作功能n操作数的访问方式-寻址方式指令的组成n一般的指令主要由两部分组成:操作码和地址码n操作码主要包括两部分内容:n操作种类:加、减、乘、除、数据传送、移位、转移、输入输出n操作数描述n数据的类型:定点数、浮点数、复数、字符、字符串、逻辑数、向量n进位制:2进制、10进制、16进制n数据字长:字、半字、双字、字节n地址码通常包括三部分内容:n地址:直接地址、间接地址、立即数、寄存器编号、变址寄存器编号n地址的附加信息:偏移量、块长度、跳距n寻址方式:直接寻址、间接寻址、立即数寻址、变址寻址、相对寻址、寄存器寻址指令设计要考虑的问题n操作数的存储形式n存储器nCPU内什么地方n每条指令中显式说明的操作数个数n操作数的位置n操作类型n操作数的类型和长短指令的分类指令格式的优化 n指令=操作码+地址码n指令格式的优化:如何用最短的位数来表示 指令的操作信息和地址信息,使程序中指 令的平均字长最短。n主要目标:n节省程序的存储空间n指令格式尽量规整,便于译码操作码的优化表示n 操作码的三种编码方法:n固定长度:规整性好,解码简单,空间大。nIBM公司的大中型机:最左边8位为操作码nIntel公司的Intanium处理机:14位定长操作码n许多RISC处理机采用定长操作码nHuffman编码:空间小,规整性不好,解码复杂。n扩展编码:折衷方案。固定长度4Huffman编码2.12扩展编码3.12信息源熵2.09n改进操作码编码方式能够节省程序存储空间n例如:Burroughs公司的B-1700机操作码编码方式整个操作系统所用指令的操作码总位数改进的百分比8位定长编码4-6-10扩展编码Huffman编码301,248184,966172,34603943哈夫曼(Huffman)压缩n当各种事件发生的概率不均等时,采用优化技术对发生概率最高的事件用最短的位数(时间)来表示(处理),而对出现概率较低的允许用较长的位数(时间)来表示(处理),以达到平均位数减少的目的。n用于代码压缩、程序压缩、空间压缩和时间压缩 操作码的优化表示 n信息源熵:信息源包含的平均信息量。n信息冗余量:举例 n七条指令,频度如下 I1 I2 I3 I4 I5 I6 I70.4 0.3 0.15 0.05 0.04 0.03 0.03 信息源熵H=2.17 信息冗余量=0.28=28%1.000.600.300.150.060.030.030.040.050.150.300.400.0911111100000(11111)(11110)(11101)(11100)(110)(10)(0)I7I6I1I2I3I4I50扩展编码 nHuffman操作码的主要缺点:n操作码长度很不规整,硬件译码困难n与地址码共同组成固定长的指令比较困难n扩展编码法:由固定长操作码与Huffman编码法相结合形成n减少平均长度n方便译码n上例:Huffman用四种长度 0,10,110,11100,11101,11110,11111 I1、I2、I3用两位:00、01、10 I4、I5、I6、I7用四位:1100、1101、1110、1111 平均码长=2.30 信息冗余量=0.0565=5.65%Huffman编码方法 n写出每个事件出现频度n找出两个时间出现频度最低的数字,相加形成新的频度n重复(2),直到出现频度为1,建立Huffman树n确定Huffman代码表 说明 n目的:平均码长减少。nHuffma代码不唯一n0,1对换n合并次序 n 假设一台模型计算机共有7种不同的操作码,如果采用固定长操作码需要3位。已知各种操作码在程序中出现的概率如下表,计算采用Huffman编码法的操作码平均长度,并计算固定长操作码和Huffman操作码的信息冗余量。利用Huffman树进行操作码编码的方法,又称为最小概率合并法。指令I1概率 0.45I20.30I30.15I40.05I50.03I60.01I70.01举例1n把所有指令按照操作码在程序中出现的概率,自左向右从排列好。n选取两个概率最小的结点合并成一个概率值是二者之和的新结点,并把这个新结点与其它还没有合并的结点一起形成新结点集合。n在新结点集合中选取两个概率最小的结点进行合并,如此继续进行下去,直至全部结点合并完毕。n最后得到的根结点的概率值为1。n每个结点都有两个分支,分别用一位代码“0”和“1”表示。n从根结点开始,沿尖头所指方向,到达属于该指令的概率结点,把沿线所经过的代码组合起来得到这条指令的操作码编码。n解:采用Huffman编码法所得到的操作码的平均长度0.4510.3020.1530.0540.0350.0160.0161.97(位)n熵H0.451.1520.301.7370.152.7370.054.3220.035.0590.016.6440.016.6441.95(位)0.450.300.150.050.030.010.011.000.550.250.100.050.02010101010101指令序号概率Huffman编码法操作码长度I10.4501位I20.30102位I30.151103位I40.0511104位I50.03111105位I60.011111106位I70.0111111116位采用3位固定长操作码的信息冗余量为:n例如:把上例改为1-2-3-5扩展编码法,其操作码最短平均长度为:H=0.4510.3020.153(0.050.030.010.01)5=2.00信息冗余量为:n又例如:把上例改为2-4等长扩展编码法,其操作码最短平均长度为:H=(0.45+0.30+0.15)2+(0.05+0.03+0.01+0.01)4=2.20信息冗余量为:序号概率1-2-3-5扩展编码I10.450I20.3010I30.15110I40.0511100I50.0311101I60.0111110I70.01111112-4等长扩展编码0001101100110111101111平均长度2.02.2信息冗余量2.5%11.4%7条指令的操作码扩展编码法 举例2:二十进制代码压缩 n2位二十进制代码可表示099a b c d e f g h 0 0 0 00 0 0 00 0 0 10 0 0 10 0 1 00 0 1 00 0 1 10 0 1 10 1 0 00 1 0 00 1 0 10 1 0 10 1 1 00 1 1 00 1 1 10 1 1 11 0 0 01 0 0 01 0 0 11 0 0 1写出概率表nae=00,g=0.8*0.8=0.64nae=01,g=0.2*0.8=0.16nae=10,g=0.8*0.2=0.16nae=11,g=0.2*0.2=0.04画出Huffman代码树,写出代码表ae状态概率Huffman代码0 00.6401 00.161 10 10.161 0 01 10.041 0 1写出压缩代码表ae=000 b c d f g hae=10 b=c=01 1 x d f g hae=01 f=g=01 0 0 d b c hae=11 b=c=f=g=0 1 0 1 d x x h操作码等长扩展编码法 指令字格式的优化 n为了不降低访存取指令的速度,按整数边界存储。n操作数地址的位数n从寻址范围看:越大越好 n用各种方法,压缩操作码的位数n通过采用多种不同的寻址方式、地址制、地址形式和地址码长度以及多种指令字长,将它们与可变长操作码的优化表示相结合,可构成冗余度尽可能少的指令字。等长地址码发挥不出操作码优化表示的作用limax地址码地址码地址码空白浪费空白浪费liminli在定长指令字内实现多种地址制地址码地址码地址码地址码地址码地址码操作码操作码操作码n基础:初步设计的指令集。n目标:减少指令长度,提高指令性能。n优化原则:n采用高概率优先思想,对高频率指令,缩短指令长度,提高效率,对低频率指令,主要满足功能要求;n地址码长度富裕时,采用不同的寻址方式或不同的地址制,增加功能;n地址码长度紧张时,采用特定的寻址方式或增加指令字长,满足功能。n寻址方式中必须支持使用频率较高的寻址方式,相关参数必须满足90%以上的使用频率。地址码的优化表示n地址码个数的选择n地址码个数通常有3个、2个、1个及个等4种情况n评价指令中地址码个数应该取多少的标准主要有两个:n程序存储容量,包括操作码和地址码n程序执行速度,以程序执行过程中访问主存的信息量代表举例:计算一个典型的算术表达式 n用三地址指令编写的程序如下nMUL X,A,B;X(A)(B)nADD X,X,C;X(X)(C)nSUB X,X,D;分子的计算结果在中nADD Y,E,F;计算分母,存入nYDIV X,X,Y;最后结果在X单元中n用普通二地址指令编写的程序nMOVE X,A;复制临时变量到X中nMUL X,BnADD X,CnSUB X,D;X中存放分子运算结果nMOVE Y,E;复制临时变量到Y中nADD Y,F;Y中存放分母运算结果nDIV X,Y;最后结果在X单元中n用多寄存器结构的二地址指令编写程序nMOVE R1,A;操作数a取到寄存器R1中nMUL R1,BnADD R1,CnSUB R1,D;R1中存放分子运算结果nMOVE R2,EnADD R2,F;R2中存放分母运算结果nDIV R1,R2;最后结果在R1中nMOVE X,R1;最后结果存入X中n用一地址指令编写的程序nLOAD E;先计算分母,n ;取一个操作数到累加器中nADD F;分母运算结果在累加器中nSTORE X;保存分母运算结果到X中nLOAD A;开始计算分子nMUL BnADD CnSUB D;累加器中是分子运算结果nDIV X;最后运算结果在累加器中nSTORE X;保存最后运算结果到X中n用0地址指令编写程序:ab*c+d-ef+/nPUSH A;操作数a压入堆栈nPUSH B;操作数b压入堆栈nMUL;栈顶两数相乘,结果压回堆顶nPUSH CnADDnPUSH DnSUB;栈顶是分子运算的结果nPUSH EnPUSH FnADDnDIV;栈顶是最后运算的结果nPOP X;保存最后运算结果关于地址码个数结论n对于一般商用处理机,采用多寄存器结构的二地址指令是最理想的。n如果强调硬件结构简单,并且以连续运算(如求累加和等)为主,宜采用一地址结构。n对于以向量、矩阵运算为主的处理机,最好采用三地址结构。RISC处理机采用三地址指令n对于解决递归问题为主的处理机,宜采用零地址结构。编程容易、节省程序存储量。缩短地址码长度的方法n用一个短地址码表示一个大地址空间n用间址寻址方式缩短地址码长度方法:n在主存储器的低端开辟一个专门存放间接地址的区域n用变址寻址方式缩短地址码长度n变址寻址方式中的地址偏移量比较短,n用寄存器间接寻址方式缩短地址码长度n例如:16个间址寄存器,用4位地址码就能表示很长的逻辑地址空间。