编译原理大作业2.pdf
《编译原理大作业2.pdf》由会员分享,可在线阅读,更多相关《编译原理大作业2.pdf(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、.塔里木大学信息工程学院课程论文基于 c 语言的简单词法分析器的设计课程名称编译原理所属学院信息工程学院班级计算机 16-6学生鹏宇学号 二零一四年十二月二零一四年十二月.目目录录一、引言.1二、基于 c 语言词法分析器的设计.12.1 词法分析器的设计原则.12.2 词法分析器的设计对象.22.3 词法分析器的任务及功能.22.3.1 词法分析器的任务.22.3.2 词法分析程序的功能:.22.4 各种单词符号对应的种别码:.2三、基于 c 语言词法分析器的实现.33.1 词法分析程序的算法思想:.33.2 主程序示意图:.33.3 函数定义说明.43.4 程序设计实现及功能说明.43.4.
2、1 关键字的定义.43.4.2 符合的关键字的查找.4四、词法分析程序的 C 语言程序源代码.5五、结果分析:.10六、结束语.11参考文献.7.摘要:摘要:词法分析器构造技术起源于编译器前端的词法分析需求,是编译的第一阶段。其主要任务是读入输入字符,产生记号序列,并提交给语法分析使用。词法分析器技术也经常应用于其他领域,如查询语言与信息检索系统。在每个应用中,最基本的问题是如何设计与说明一种特殊的程序,它能够完成由字符串的模式触发的动作。本文通过实际构造 FineC 语言(作者设计的一个 C 语言的轻量子集)的词法分析器对词法分析器的构造原理做了基于实践的探讨。关键字:关键字:词法分析器,双
3、缓冲区,符号表,正则表达式,状态转换图一、引言一、引言词法分析顾名思义,就是分词。它是用程序设计语言编制出的源程序作为输入,以单词的序列作为输出。分词的过程可以通过编制程序让其自动完成,我们通常把这个分词程序称为词法分析器。词法分析器分析的源程序可以是现有的各类程序设计语言源程序也可以是人为给定的模型语言的源程序。它一般有五个阶段:词法分析,语法分析,语义分析和中间代码产生及优化,目标的代码生成。完成计算机翻译过程的重要阶段,它为以后的语义分析、语法分析打好基础,做好准备,以便高效的、高质量的生成目标语言的程序。所以词法分析,是编译过程的基础。二、基于二、基于 c c 语言词法分析器的设计语言
4、词法分析器的设计2.12.1 词法分析器的设计原则词法分析器的设计原则在编译程序的词法分析,语法分析,语义分析和中间代码的产生及优化阶段中,每个阶段都要遵守功能相等的原则。一个语言的语法的形成是词法规则和语法分析依据的语法规则组成的,衡量一个语法是不是合法要从“形”的角度去出发。因此在词法分析的阶段,重要的研究对象也就变成了词法规则。词法分析程序的输入数据是词法分析器处理的对象,其实是源程序经过了编译预处理,去掉多余的符号后,形成的代码,这样给词法分析较为方便。词法分析的过程是线性的从头到尾扫描一遍,复杂程度较低,易实现。2.22.2 词法分析器的任务及功能词法分析器的任务及功能 2.2.1
5、2.2.1 词法分析器的任务词法分析器的任务从左到右所有字符逐个的对源程序进行扫描,产生一个一个单词的符号,字.符串的源程序转换成单词符号串中的中间程序。组成语言的基本元素是词法分析程序输出的结果,也就是单词,在实际的处理过程中,输出不一定是单词,而是每个单词相对应的二元式,形为。编码的方式由编译系统的开发者决定。故经过词法分析,在输出结果中并没有单词本身。2.2.2 2.2.2 词法分析程序的功能:词法分析程序的功能:输入:所给文法的原程序字符串。输出:二元组(syn,token 或 sum)构成的序列。其中:Syn:“单词种别码”;Token:“存放的单词自身字符串”;Sum:“整型常数”
6、。例如:对源程序 begin x:=9:if x9 then x:=2*x+1/3;end#的源文件,经过词法分析后输出如下序列:(1,begin)(10,x)(18,:=)(11,9)(26,;)(2,if)2.32.3 各种单词符号对应的种别码:各种单词符号对应的种别码:表表 2.32.3 各种单词符号对应的种别码各种单词符号对应的种别码单词符号+*/dight dight*bginIfThenwiledoendlettet(letter|digit)*.种别码131415161112345610单词符号;()#=:=种别码26272802517182021222324.三、基于三、基于
7、c c 语言词法分析器的实现语言词法分析器的实现基于 c 语言的词法分析器,是它本身程序由 c 语言编写而且它识别的源程序单词串是用 c 语言编写的。本程序编写环境是 Touboc 2.0,在 TC 默认途径下编辑一个 c 语言源程序再调用本程序,取名 eample.c 方便程序的调用和分析,输出结果是二元式码。3.13.1 词法分析程序的算法思想:词法分析程序的算法思想:算法的基本任务是从字符串表示的源程序中识别出具有独立意义的单词符号,其基本思想是根据扫描到单词符号的第一个字符的种类,拼出相应的单词符号。3.23.2 主程序示意图:主程序示意图:主程序示意图如图 3-1,3-2 所示。其中
8、初始包括以下两个方面:主函数主函数Y读取文件读取文件读取文件读取文件判断能否判断能否打开文件打开文件N所取字符所取字符是否为是否为 N取单词取单词返回返回扫描一个字符扫描一个字符调用调用读取文件读取文件结束结束图图 3-13-1 主程序示意图主程序示意图 关键字表的初值。关键字作为特殊标识符处理,把它们预先安排在一表格中(称为关键字表),.当扫描程序识别出标识符时,查关键字表。如能查到匹配的单词,则该单词为关键字,否则为一般标识符。关键字表为一个字符串数组,其描述如下:Char*rwtab6=“begin”,“if”,“then”,“while”,“do”,“end”,;输入需要扫输入需要扫描
9、的文件名描的文件名输入扫描结果另输入扫描结果另存为的文件名存为的文件名否否跳转到扫描其跳转到扫描其他符号他符号p p处处判断文件是否判断文件是否为空为空否否返回,结束程返回,结束程序序ChCh是否为引是否为引号号否否ChCh是否为是否为“/”否否ChCh是否为数是否为数字或“”字或“”是是跳转到扫描引跳转到扫描引号号预读一为预读一为ChCh是是跳转到扫描注跳转到扫描注释释ChCh是否为空格是否为空格否否是是计数器自行加计数器自行加1 1是是跳转到扫描数跳转到扫描数字字否否跳转到扫描头跳转到扫描头文件单词及保文件单词及保留字留字是是ChCh是是否为字是是否为字母或下划线母或下划线图图 3-23-
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 编译 原理 作业
限制150内