编译原理课程实验指导书.doc
《编译原理课程实验指导书.doc》由会员分享,可在线阅读,更多相关《编译原理课程实验指导书.doc(25页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、编译原理课程实验指导书(Compiler Principle)计算机科学与技术专业04级吴臣 杨跃武 编写佛山科学技术学院2009年3月目录序言1一、实验安排2第一阶段:编译器的词法分析2第二阶段:编译器的语法分析2第三阶段:编译器的代码生成3二、考核方式及评定标准4三、参考资料与编译器分析4第一部分 PL语言及其编译器41. PL语言介绍41.1 PL语言的语法图52. PL语言编译器82.1 词法分析92.2 语法分析92.3 语义分析112.4 代码生成112.5 代码执行132.6 错误诊断处理152.7 符号表管理172.8 其他18第二部分 上机实验要求19第三部分 PL语言编译器
2、源程序与示例211示例与结果表示211.1 PL语言源程序211.2 生成的代码(片段)232. PL语言编译器源程序23序言本编译原理实验,其目的是让大家动手设计和实现一个规模适中的语言的编译器,该编译器不仅涉及编译程序的各个阶段,而且也强调了编译的总体设计、各个阶段的接口安排等等。通过上机实践,来设计这个相对完整的编译器,一方面可以使同学们增加对编译程序的整体认识和了解巩固编译原理课程所学知识,另一方面,通过上机练习,学生也可以学到很多程序调试技巧和设计大型程序一般的原则,如模块接口的协调,数据结构的合理选择等等。为了使学生能尽早动手实践,我们建议把实践分成三部分,首先阅读本教程第一部分,
3、在这部分就PL语言的语法及其编译程序的各个阶段作了简单介绍,以便对PL编译程序有个初步的印象。其次要认真阅读理解第三部分所给出的PL编译器源程序及示例,使上一阶段的初步印象得以加深、具体化。最后按照第二部分的实验要求扩充PL语言的功能并加以实现。具体操作时分成三个阶段:词法分析、语法分析及代码生成。最后再统一组装成一个完整的PL编译器,并适当进行改进、补充。一、实验安排第一阶段:编译器的词法分析学时:2(一)、实验目的:通过阅读PL的语法图,设计、编制并调试一个PL词法分析程序,加深学生对词法分析原理的理解。(二)、实验内容:PL的词法分析器将要完成以下工作:(1) 跳过分隔符(如空格,回车,
4、制表符);(2) 识别诸如begin,end,if,while等保留字;(3) 识别非保留字的一般标识符,此标识符值(字符序列)赋给全局量id,而全局量sym赋值为SYM_IDENTIFIER。(4) 识别数字序列,当前值赋给全局量NUM,sym则置为SYM_NUMBER;(5) 识别:=,=之类的特殊符号,全局量sym则分别被赋值为SYM_BECOMES,SYM_LEQ,SYM_GEQ等。相关过程(函数)有getsym(),getch(),其中getch()为获取单个字符的过程,除此之外,它还完成:(1) 识别且跳过行结束符;(2) 将输入源文件复写到输出文件;(3) 产生一份程序列表,输出
5、相应行号或指令计数器的值。第二阶段:编译器的语法分析学时:4(一)、实验目的:掌握PL语言编译器的语法分析程序设计与LL(1)文法应用的实现方法。(二)、实验内容:采用递归下降的方法来设计PL/0编译器,证明PL/0语言属于LL(1)文法。然后结合语法图编写(递归下降)语法分析程序的一般方法,具体方面有:(1) 用合适的替换将语法约化成尽可能少的单个图;(2) 将每一个图按下面的规则(3)-(7)翻译成一个过程说明;(3) 顺序图对应复合语句:(4) 选择:(5) 循环(6) 表示另一个图A的图:(7) 表示终结符的单元图:相关过程有:block(), constdeclaration(),
6、vardeclaration(), statement(), condition(), expression(), term(), factor()等。并画出它们之间依赖关系图,并在此基础上实现程序的编制。并适当进行语义分析的相关检查:(1) 是否存在标识符先引用未声明的情况;(2) 是否存在己声明的标识符的错误引用;(3) 是否存在一般标识符的多重声明。第三阶段:编译器的代码生成学时:2(一)、实验目的:掌握PL语言编译器的中间代码生成的程序分析与实现方法,并能对错误进行分析与处理。(二)、实验内容:为了使我们的编译程序保持适当简单的水平,不致陷入与本课程无关的实际机器的特有性质的考虑中去,
7、我们假想有台适合PL程序运行的计算机,我们称之为PL处理机。PL处理机顺序解释生成的目标代码。PL处理机的指令集根据PL语言的要求而设计,它包括以下的指令:(1)LIT /* 将常数置于栈顶 */(2)LOD /* 将变量值置于栈顶 */(3)STO /* 将栈顶的值赋与某变量 */(4)CAL /* 用于过程调用的指令 */(5)INT /* 在数据栈中分配存贮空间 */(6)JMP, JPC /* 用于if, while语句的条件或无条件控制转移指令 */(7)OPR /* 一组算术或逻辑运算指令 */上述指令的格式由三部分组成:FLA其中,f, l, a的含义见下表:FLaINT常 量L
8、IT常 量LOD层次差数据地址STO层次差数据地址CAL层次差程序地址JMP程序地址JPC程序地址OPR运算类别表1 PL 处理机指令PL的编译程序为每一条PL源程序的可执行语句生成后缀式目标代码。另一方面,发现错误,并给出合适的诊断信息且继续编译下去从而发现更多的错误,对于编译程序而言是完全必要的。结合关键字规则、镇定规则,采用策略:先用一些明显的关键符号给它赋初值,然后随着分析子目标的层次深入,逐步补充别的合法符号。并编写子程序去验证之。二、考核方式及评定标准上机实验要求对PL语言及其编译器进行实现及扩充、修改。每个扩充或修改方式可得到不同的分数,满分为100分。完成上机作业后,必须提交下
9、列文档:(1) 修改后的PL语言文本。包含词法分析(正规式),语法分析(BNF)。(2) 有关修改后的PL编译/解释器的说明。详细说明编译器是如何编译新的PL语言程序的。指出程序中最精彩的部分,以及为什么这样做,如何控制和恢复语义错误的。(3) 给出改动后的编译器源程序清单,并标记出所修改的部分。比较你的编译器和原来的编译器之间的差别。(4) 说明你的编译器中可能存在的错误。(5) 总结经验与教训,如果重做一遍,会有哪些新的改进?对现存的PL编译程序可做如下修改或扩充,其中(1)、(2)、(11)和(12)必须完成,剩余的均可任意选择,但总分必须超过40分。(1) 注释(5分)(2) 布尔类型
10、的数据(10分)(3) 布尔表达式的短路计算(5分)(4) 数组(10分)为了便于解释执行,可能要增加新的PL机器操作指令。(5) 参数(10分) 语法同Pascal(不用var声明)。(6) 函数(10分)语法同Pascal。 (7) else子句和repeat语句(5分)(8) for语句,语法参照Pascal或C语言(5分)(9) exit语句和break语句(5分)(10) 记录(结构),语法同Pascal语言(10分)。(11) 更有力的语法错误恢复机制(20分)(12) 分离解释和编译器(5分)三、参考资料与编译器分析第一部分 PL语言及其编译器1. PL语言介绍PL程序设计语言是
11、一个较简单的语言,它以赋值语句为基础,构造概念有顺序、条件和重复(循环)三种。PL有子程序概念,包括过程定义(可以嵌套)与调用且有局部变量说明。PL中唯一的数据类型是整型,可以用来说明该类型的常量和变量。当然PL也具有通常的算术运算和关系运算。具体的PL语法图如下。1.1 PL语言的语法图程序.程序体程序体=identnumberconst,;varident,;identprocedure;程序体语句语句序列语句;语句:=表达式ident语句序列条件if语句thendowhile条件语句identcallendbegin条件表达式odd表达式=表达式表达式+项-+-项项/因子因子*因子ide
12、ntnumber)(表达式2. PL语言编译器本书所提供的PL语言编译器的基本工作流程如图1-1所示:语法分析词法分析语义分析代码生成代码执行源程序执行结果符号表管理错误诊断处理图1-1 PL编译器基本工作流程2.1 词法分析PL的语言的词法分析器将要完成以下工作:(1) 跳过分隔符(如空格,回车,制表符);(2) 识别诸如begin,end,if,while等保留字;(3) 识别非保留字的一般标识符,此标识符值(字符序列)赋给全局量id,而全局量sym赋值为SYM_IDENTIFIER。(4) 识别数字序列,当前值赋给全局量NUM,sym则置为SYM_NUMBER;(5) 识别:=,=之类的
13、特殊符号,全局量sym则分别被赋值为SYM_BECOMES,SYM_LEQ,SYM_GEQ等。相关过程(函数)有getsym(),getch(),其中getch()为获取单个字符的过程,除此之外,它还完成:(1) 识别且跳过行结束符;(2) 将输入源文件复写到输出文件;(3) 产生一份程序列表,输出相应行号或指令计数器的值。2.2 语法分析我们采用递归下降的方法来设计PL编译器。以下我们给出该语言的FIRST和FOLLOW集合。非终结符(S)FIRST(S)FOLLOW(S)程序体const var procedure ident call if begin while. ;语句ident c
14、all begin if while. ; end条件odd + - ( ident numberthen do表达式+ - ( ident number. ; ) R end then do项ident number (. ; ) R + - end then do因子ident number (. ; ) R + - * / end then do注:表中R代表六个关系运算符。不难证明,PL语言属于LL(1)文法。(证明从略。)以下是我们给出如何结合语法图编写(递归下降)语法分析程序的一般方法。假定图S所对应的程序段为T(S),则:(1) 用合适的替换将语法约化成尽可能少的单个图;(2)
15、将每一个图按下面的规则(3)-(7)翻译成一个过程说明;(3) 顺序图对应复合语句:SnS1S2对应:begin T(S1); T(S2); .; T(Sn) end(4)选择:S1S2S3对应:case语句或者条件语句:case ch of if ch in L1 then T(S1) else L1: T(S1); if ch in L2 then T(S2) else L2: T(S2); 或 . if ch in Ln then T(Sn) elseLn: T(Sn); error其中LiFIRST(Si),ch为当前输入符号。(下同)(5) 循环S对应:while ch in L d
16、o T(S)(6) 表示另一个图A的图:A对应:过程调用A。(7) 表示终结符的单元图:x对应:if ch = x then read(ch) else error相关过程有:block(), constdeclaration(), vardeclaration(), statement(), condition(), expression(), term(), factor()等。它们之间依赖关系如图1-2:程序程序体语句条件表达式项因子图1-2 语法分析过程依赖关系2.3 语义分析PL的语义分析主要进行以下检查:(1) 是否存在标识符先引用未声明的情况;(2) 是否存在己声明的标识符的错误
17、引用;(3) 是否存在一般标识符的多重声明。2.4 代码生成PL编译程序不仅完成通常的词法分析、语法分析,而且还产生中间代码和“目标”代码。最终我们要“运行”该目标码。为了使我们的编译程序保持适当简单的水平,不致陷入与本课程无关的实际机器的特有性质的考虑中去,我们假想有台适合PL程序运行的计算机,我们称之为PL处理机。PL处理机顺序解释生成的目标代码,我们称之为解释程序。注意:这里的假设与我们的编译概念并不矛盾,在本课程中我们写的只是一个示范性的编译程序,它的后端无法完整地实现,因而只能在一个解释性的环境下予以模拟。从另一个角度上讲,把解释程序就看成是PL机硬件,把解释执行看成是PL的硬件执行
18、,那么我们所做的工作:由PL源语言程序到PL机器指令的变换,就是一个完整的编译程序。PL处理机有两类存贮,目标代码放在一个固定的存贮数组code中,而所需数据组织成一个栈形式存放。PL处理机的指令集根据PL语言的要求而设计,它包括以下的指令:(1)LIT /* 将常数置于栈顶 */(2)LOD /* 将变量值置于栈顶 */(3)STO /* 将栈顶的值赋与某变量 */(4)CAL /* 用于过程调用的指令 */(5)INT /* 在数据栈中分配存贮空间 */(6)JMP, JPC /* 用于if, while语句的条件或无条件控制转移指令 */(7)OPR /* 一组算术或逻辑运算指令 */上
19、述指令的格式由三部分组成:FLA其中,f, l, a的含义见下表: FLaINT常 量LIT常 量LOD层次差数据地址STO层次差数据地址CAL层次差程序地址JMP程序地址JPC程序地址OPR运算类别表2-1 PL 处理机指令上表中,层次差为变量名或过程名引用和声明之间的静态层次差别,程序地址为目标数组code的下标,数据地址为变量在局部存贮中的相对地址。PL的编译程序为每一条PL源程序的可执行语句生成后缀式目标代码。这种代码生成方式对于表达式、赋值语句、过程调用等的翻译较简单。如赋值语句X := Y op Z(op为某个运算符),将被翻译成下面的目标代码序列:(设指令计数从第100号开始)N
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 编译 原理 课程 实验 指导书
限制150内