最新2一个简单语言的词法分析器.docx
精品资料2一个简单语言的词法分析器.辽宁师范大学计算机与信息技术学院综合性实验报告课程名称: 编译原理 实验题目: 一个简单语言的词法分析器 学生姓名: 专业: 计算机科学与技术 学号: 实验日期: 【实验目的】 1. 理解正规式和有限自动机的作用;进一步理解自动机理论。2. 用状态图和状态矩阵表示有限自动机; 3. 以程序实现有限自动机的运行过程; 4. 掌握正规式转换成自动机的技术及有穷自动机实现的方法。 【实验内容】 利用正规表达式和自动机手段,设计各类单词的自动机表示及组合自动机表示,生成并调试程序,实现词法分析。 【实验要求】 1. 待分析的简单的词法(1)关键字: begin if then while do end所有的关键字都是小写。(2)运算符和界符: = + - * / < <= <> > >= = ; ( ) #(3)其他单词是标识符(ID)和整型常数(SUM),通过以下正规式定义:ID = letter (letter | digit)*NUM = digit digit*(4)空格有空白、制表符和换行符组成。空格一般用来分隔ID、SUM、运算符、界符和关键字,词法分析阶段通常被忽略。 2. 各种单词符号对应的种别码:3. 词法分析程序的功能:输入:所给文法的源程序字符串。输出:二元组(syn,token或sum)构成的序列。其中:syn为单词种别码; token为存放的单词自身字符串; sum为整型常数。例:对源程序begin x := 9; if x>9 then x:=2*x+1/3; end #的源文件,经过词法分析后输出如下序列:(1,begin)(10,x)(18,:=)(11,9)(26,:)(2,if)(10,x)(23,>)(11,9)(3,then)(10,x)(18,:=)(11,2)(15,*)(10,x)(13,+)(11,1)(16,/)(11,3)(26,;)(6,end)(0,#)【实验过程】程序思路:首先定义关键字数组,把题目设置的关键字存入;读入源程序,对其进行词法分析;从input串中一个字符一个字符的赋值给ch,并对其进行分析:当为空格符时跳过;为字母时将其存入token数组;继续判断它的下一个字符,若为字符或数字则存入token数组,直至出现空格符;当为数字时,存入token数组,并判断其下一字符;当为字符“+”、“-”、“/”、“;”、“(”、“)”、“#”时,则直接对应的种别码;然而当碰到字符“:”“<”“>”时,则需要判断它的下一字符是否为“=”“>”,因为有可能是“:=”“<>”“<=”“>=”。程序代码如下:#include<stdio.h>#include<string.h>#include<iostream.h>char *keyword6="begin","if","then","while","do","end"/关键字char input80;/输入串char token8;/单词自身字符串char ch;int syn;/单词种别码int sum=0;/整型常数int p;/input下标int m=0;/token下标int n,i;void automata()/自动机for(i=0; i<8; i+)tokeni=NULL;ch=inputp+;while(ch=' ') ch=inputp+;/跳过空格/标识符:字母 或 以字母开头和数字组成的ID = letter (letter | digit)*if(ch>='a' && ch<='z')|(ch>='A' && ch<='Z')m=0;while( (ch>='0' && ch<='9')|(ch>='a' && ch<='z')|(ch>='A' && ch<='Z') )tokenm+ = ch;ch = inputp+;/识别出一个标识符tokenm+='0'p-;/回退一位syn=10;/单纯的标识符(自定义的)for(i=0; i<6; i+)/将识别出来的字符和关键字做比较if(strcmp(token,keywordi)=0)syn=i+1;/关键字种别码break;/数字NUM = digit digit*else if( ch>='0' && ch<='9' )sum=0;while( ch>='0' && ch<='9' )sum=sum*10+ch-'0'ch=inputp+;/读取下一个字符p-;/回退一下syn=11;/11标识数值类型/符号else switch(ch)/其他字符case'#':syn=0; token0=ch; break;case'+':syn=13; token0=ch; break;case'-':syn=14; token0=ch; break;case'*':syn=15; token0=ch; break;case'/':syn=16; token0=ch; break;case':':m=0;tokenm+=ch;/读取下一个字符ch=inputp+;if(ch='=')syn=18;/:=tokenm+=ch;/读取下一个字符elsesyn=17;/:p-;break;case '<':m=0; tokenm+=ch;ch=inputp+;/读取下一个字符if(ch='>')syn=21;/ <>tokenm+=ch;/读取下一个字符else if(ch='=')syn=22;/ <=tokenm+=ch;/读取下一个字符 elsesyn=20;/ <p-; break;case'>':m=0; tokenm+=ch;/读取下一个字符ch=inputp+;if(ch='=')syn=24;/ >=tokenm+=ch;/读取下一个字符elsesyn=23;/ >p-;break;case'=':syn=25; token0=ch; break;case'':syn=26; token0=ch; break;case'(':syn=27; token0=ch; break;case')':syn=28; token0=ch; break;case'n': break;default: break;void main()cout<<"Please input string:"<<endl;cin.getline(input,80);p=0;doautomata();/自动机if(syn=11)cout<<"("<<syn<<","<<sum<<")"<<endl;/常数else cout<<"("<<syn<<","<<token<<")"<<endl; /符号while(syn!=0);/#运行结果截屏:【实验结果分析】