《编译原理》实验任务书.doc
《《编译原理》实验任务书.doc》由会员分享,可在线阅读,更多相关《《编译原理》实验任务书.doc(27页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、编译原理实验指导书上机实习一:词法分析目的与要求:通过编写并上机调试一个词法分析程序,掌握在对程序设计语言的源程序进行扫描的过程中,将其分解后各类单词的词法分析方法。实验内容:输入:据教学要求和学生具体情况,从具有代表性的高级程序设计语言中,选取一个适当大小的子集,例如可以选取一类典型单词,也可以尽可能使各种类型的单词都能兼顾到。输出:单词串的输出形式,所输出的每一单词均按形如(CLASS,VALUE)的二元式编码。对于变量和常数,CLASS字段为相应的类别码,VALUE字段则是该标识符、常数的具体值或在其符号表中登记项的序号(要求在变量名表登记项中存放该标识符的字符串;常数表登记项中则存放该
2、常数的二进制形式)。对于关键字和分隔符,采用一词一类的编码形式。由于采用一词一类的编码方式,所以仅需在二元式的CLASS字段上放置相应的单词的类别码,VALUE字段则为“空”。不过,为便于查看由词法分析程序所输出的单词串,要求在CLASS字段上直接放置单词符号串本身。示例:词法分析是编译程序的第一个处理阶段,可以通过两种途径来构造词法分析程序。其一是根据对语言中各类单词的某种描述或定义(如BNF),用手工的方式构造词法分析程序。例如,可根据文法或状态转换图构造相应的状态矩阵,该状态矩阵同控制程序便组成了编译程序的词法分析程序;也可以根据文法或状态转换图利用某种语言(汇编语言或高级语言)直接编写
3、词法分析程序。构造词法分析程序的另外一种途径是所谓的词法分析程序的自动生成,即首先用正规式对语言中的各类单词符号进行词型描述,并分别指出在识别单词时,词法分析程序所应进行的语义处理工作,然后由一个所谓词法分析程序的构造程序对上述信息进行加工。如美国BELL实验室研制的LEX就是一个被广泛使用的词法分析程序的自动生成工具。(1)题目:试用手工方式构造具有以下单词的某一语言的词法分析程序。1 BEGIN2 END3 IF4 THEN5 ELSE6 7 =8 =9 10 11 =12 标识符13 无符号常数其中标识符和无符号数的BNF定义如下:(2)处理过程:在扫描源程序字符串时,一旦识别出关键字、
4、分隔符、标识符、无符号常数中之一,即以单词形式(各类单词均采用相同的结构,即二元式编码形式)输出。每次调用词法分析程序,它均能自动继续扫描下去,形成下一个单词,直至整个源程序全部扫描完毕,并形成相应的单词串形式的源程序。具体方法如下:(一)单词的分类:构造上述语言中的各类单词符号及其分类码表如下:表 语言中的单词符号及其分类码表(二)构造状态转换图(以无符号常数为例):由描述无符号常数的正规文法构造状态转换图如下:其中:非终结符号、及分别用编号0,1,2,6代表,并用1,2和6代表终态。在一个程序设计语言中,一般都含有若干类单词符号,我们可首先为每类单词都建立一张状态转换图,然后将这些状态转换
5、图合并成一张统一的状态图,最后再据此构造词法分析程序。在计算机内实现状态转换图的方法之一,是以状态图中的各个状态为行,以可能输入的各个输入符号为列,组成一个状态矩阵。其中,矩阵的元素用来指明下一个状态和扫描器应完成的语义动作(如拼接字符、数制转换、查填符号表以及输出单词的内部表示等)。由于在一个状态矩阵中,通常有许多状态都是出错状态,为了节省存放状态矩阵的存储空间,在具体实现时,常常采用更为紧凑和有效的数据结构。例如,对于文法G的状态转换图,可按下表的形式来存放其状态矩阵。表中,第一列为各状态Si的偏号,第二列分别列出了在每一状态下可能扫视到的输入符号aj(其中“other”是一个符号集合,用
6、来表示在相应状态所属的那一栏中,除其前所列字符之外的全部其它字符),第三列指出当(Si,aj)出现时应执行的语义动作(通常用若干个语句来实现,若其后空,则表示不进行任何处理),最后一栏用来指明下一状态的偏号(若其后NULL或“结束”则表示无后继状态)。(三)利用有限自动机:对于给定的包括五个有代表性的关键字、六种关系运算符、标识符及无符号常数组成的语言,还可以通过构造有限自动机的方法实现词法分析程序的设计。在此为了使词法分析程序结构比较清晰,且尽量避免某些枝节的纠缠,我们现价定要编译的语言中,全部关键字都是保留字,程序员不得将它们作为源程序钟的标识符;在源程序的输入文本中,关键字、标识符、无符
7、号数以关系运算的六重符号之间,至少需用一个空白字符加以分隔。显然,如果程序员恪守以上这些规定,那么程序中的单词总能得到正确的区分。另外,由于对语言作了上述限制,因此我们就可以把关键字和标识符的识别统一进行处理。即每当开始识别一个单词时,若扫视到的第一个字符为字母,则把后继输入的字母或数字字符一次性拼接,直至扫视到非字母、数字字符为止,以期获得一个尽可能长的字母数字字符串,然后以此字符串查表,若查到此字符串,则取出相应的类别码;反之,则表明该字符串为一标识符。采用上述策略后,可以得到一个如下图所示的有限自动机(以状态转换图表示),并在图中添加了当进行状态转移时,词法分析程序所应执行的语义动作。(
8、注:为了防止实习量过大,达不到实习的目的,在此将无符号常数简化为无符号整常数)。据此,可用C语言编出符合以上几项要求的一个相应的词法分析程序,如以下程序所示。(3)提示:程序所用的若干函数以及主程序有待于具体编写。另外,事先需建立好保留字表,以备查询。变量各表和常数表则在词法分析过程中建立。(4)要求:A. 上机前的准备。根据实习目的和要求,用C语言编写一个规模适当的词法分析程序以及程序流图,并选择相应的数据结构。B. 调试。将各个模块连接成一个整体程序。C. 测试。用于调试的例子应有词法正确的,也有错误的字符串。D. 输出结果。主要将调试例子与词法分析结果以对照形式输出,必要时给出正误信息。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 编译原理 编译 原理 实验 任务书
限制150内