实验一-编写词法分析程序(共20页).doc
精选优质文档-倾情为你奉上编译原理实验报告实验名称: 编写词法分析程序_实验类型: 设计型实验 指导教师: 专业班级: 姓 名: 学 号: 实验地点: 实验成绩: 日期: 2017年 4月 15日实验一 编写语法分析程序一、 实验目的1) 通过设计、调试词法分析程序,掌握词法分析程序的设计工具,即有穷自动机,进一步理解自动机理论;2) 掌握正则文法和正则表达式转换成有穷自动机的方法及有穷自动机的实现方法;3) 会确定词法分析程序的输出形式及标识符与关键字的区分方法;4) 加深对课堂教学的理解,提高词法分析方法的实践能力,掌握使用实验环境的技能技巧以及程序的调试方法。二、实验设计1、写出TEST语言每条词法规则对应的正则文法或者正则表达式1) 标识符:字母打头,后接任意字母或数字。正则表达式:( a|b|z|A|B|Z )( 0|1|9| a|b|z|A|B|Z )*2) 保留字:标符的子集,包括:if, else, for, while, do, int, write, read。正则表达式: if | else | for | while | do | int | write | read3) 无符号整数:由数字组成,但最高位不能为0,允许一位的0。正则表达式:( (1|9 )( 0|1|9)* )|04) 分界符:(、)、;、正则表达式:( | ) | ; | | 5) 运算符:+、-、*、/、=、<、>、>=、<=、!=、=正则表达式:+ | - | * | / | = | < | > | >= | <= | != | =6) 注释符:/* */正则表达式:/*(没有连续的*/的任意字符串|)*/2、对每个文法或者正则表达式分别构造NFA1) 标识符: ( a|b|z|A|B|Z )( 0|1|9| a|b|z|A|B|Z )*2) 无符号整数:( (1|2|9 )( 0|1|9)* )|03) 分界符:( | ) | ; | | 4) 运算符:+ | - | * | / | = | < | > | >= | <= | != | =5) 注释符:/*(没有连续的*/的任意字符串|)*/3、将NFA合并,确定化,化简得到最终的DFA。NFA:DFA:三、实验过程1、完成整个实验的先后步骤a) 根据TEST语言的词法规则,分别写出每条规则的正则文法或者正则表达式;b) 将每一个正则文法或者正则表达式转换为NFA;c) 将多个NFA合并后进行确定化并化简;d) 根据化简后的DFA画出流程图;e) 参阅教材PP.69-71的TEST语言语法规则,确定单词分类、单词输出方案;f) 编写词法分析程序;g) 对下面的TEST语言源程序进行词法分析,将合法单词存入lex.txt,并报告词法错误及其位置。注:不能修改源程序/*This a test program.*/int abc;int 123;int A$;int i;int n;int b,c;int 2a;int a2;read n;n = ;for (i=1;i<=n; i= i+1) abc=abc+i;if(i!=n) n = n+i;if (!n) b = b+c;/*The loop endedwrite abc;2、实验调试记录(问题表现,分析原因,解决方案,解决结果)a) 问题表现:1 不能处理除号2 不能处理不完整的注释符3 对于”0123” 这类字符串的处理不正确,我之前处理为直接报错说一位以上的数字首位不能为0b) 分析原因:问题1,2的原因都是在“/”符号处理时出现的问题导致的,程序中出现bug使得一遇到/就会进入死循环。问题3 ,不应该直接报错说一位以上的数字首位不能为0,遇到0应该直接输出0这个单词,再接着读数字。c) 解决方案:d) 对于问题1,2,重新梳理逻辑,一步一步对照流程图和DFA来调试修改代码。对于问题3,遇到0应该直接输出0这个单词,再接着读数字。e) 解决结果:成功解决了程序遇到/进入死循环问题和“0123”这类字符串的处理。三、实验结果列出实验结果并进行分析(含分步测试结果)。lex.txt文件(存放编译的合法内容)内容:12/*This a test program.*/*This a test program.*/3intint3IDabc3;4intint4NUM1234;5intint5IDA5;6intint6IDi6;7intint7IDn7;8intint8IDb8IDc8;9intint9NUM29IDa9;10intint10IDa210;11readread11IDn11;12IDn12=12NUM012NUM1234512;13forfor13(13IDi13=13NUM113;13IDi13<=<=13IDn13;13IDi13=13IDi13+13NUM113)1415IDabc15=15IDabc15+15IDi15;1617ifif17(17IDi17!=!=17IDn17)17IDn17=17IDn17+17IDi17;18ifif18(18IDn18)18IDb18=18IDb18+18IDc18;四、讨论与分析1. 你的编写词法分析程序满足最长匹配原则吗?如果满足请给出你的实现方案。如果不满足请给出改进方案。答:不满足,我的处理先后顺序是:标识符或保留字、数字、分界符、运算符(除开/)、除或者注释,我应该吧注释放在前面,因为一般来说注释都比其它类型符号长些。改进措施便是将注释这一条词法规则最早处理。2. 给出你的单词分类方案,并说明理由。答:根据TEST语言可将单词分为六类:a) 标识符:字母打头,后接任意字母或数字。b) 保留字:标识符的子集,包括:if, else, for, while, do, int, write, read。c) 无符号整数:由数字组成,但最高位不能为0,允许一位的0。d) 分界符:(、)、;、e) 运算符:+、-、*、/、=、<、>、>=、<=、!=、=f) 注释符:/* */3. 构建词法分析程序一般过程是怎样的?答:构建词法分析程序的一般过程:1、 根据词法规则写出正则文法或者正则文法。2、 为每一个正则表达式构造一个NFA,然后将多个NFA合并为一个NFA3、 将NFA转化成DFA,并且化简最小化DFA4、 确定单词的输出形式5、 根据化简后的DFA和单词输出程序构造词法分析程序(主要部分:通过实验对课程知识点的理解;回答实验指导书的实验思考提出的问题等)五、附录:关键代码(给出适当注释,可读性高)# include <iostream># include <fstream># include <stdio.h># include <stdlib.h># include <string>using namespace std;const int KWN=8; /关键字的个数const int MAXSIZE=400; /标识符最长个数char kwordKWN10 = /关键字"if", "else","for","while","do","int","read","write" int line = 1; /行号int errors = 0; /记录错误个数ofstream fout; /输出文件流ifstream fin; /输入文件流ofstream lexout; /存放合法单词的文件流char type630="ID","保 留 字","NUM","分 界 符","运 算 符","注 释 符"int main()int TEST(); /函数声明TEST();if(errors=0)cout<<"编译成功。"<<endl;elsecout<<"编译失败。共发现"<<errors<<"个错误!"<<endl;return 0;/判断是否为字母int is_Char(char ch)if (ch>='a'&&ch<='z')|(ch>='A'&&ch<='Z')return 1;return 0;/判断是否为无符号整数int is_Uint(char ch)if('0'<=ch&&ch<='9')return 1;return 0;/判断是否为分界符int is_Deli(char ch)if(ch='('|ch=')'|ch=''|ch=''|ch='')return 1; return 0;/判断是否为操作符int is_Oper(char ch)char Operater10="+-*!=><"/没有考虑/号for(int i=0;i<8;i+)if(ch=Operateri)return 1;return 0;/输入控制int in(char &ch)fin.get(ch);if('n'=ch)line+;if(fin.eof()ch=EOF;return 1;/输出控制void out(char *type,char *buf)if(strcmp(type,"ID")=0|strcmp(type,"NUM")=0)lexout<<line<<""<<type<<""<<buf<<endl;elselexout<<line<<""<<buf<<""<<buf<<endl;/cout<<type<<":"<<buf<<endl;/编译程序主要的函数int TEST()int event=0; /用于判断输入是否为文件末/char filename300; /存储文件的路径/打开文件的操作/打开编译程序存放合法单词的文件lexout.open("lex.txt");/打开用户的文件/cout<<"请输入要编译的文件的路径:"<<endl;reinput_in:/cin.get(filename,300,'n');/char filename300="D:SoftwareMicrosoft Visual C+ 6.0Microsoft Visual StudioMyProjects编译原理实验一in.txt"fin.open("in.txt");if(fin=NULL)cout<<"文件打开失败,请重新输入文件路径:"<<endl;goto reinput_in;/cout<<"请输入词法分析结果文件存储路径:"<<endl;reinput_out:cin.clear(); /清理输出缓冲cin.sync(); /清空流/cin.get(filename,300,'n');/char filename300="D:SoftwareMicrosoft Visual C+ 6.0Microsoft Visual StudioMyProjects编译原理实验一out.txt"fout.open("out.txt");if(fout=NULL)cout<<"文件打开失败,请重新输入文件路径:"<<endl;goto reinput_out;/开始判断char buf300;char ch;cin.clear(); /清理输出缓冲cin.sync(); /清空流in(ch);while (!fin.eof()while(ch=' '|ch='n'|ch='t'|ch='r')in(ch);/判断是否为标识符或保留字if(is_Char(ch)int t=0;while(is_Char(ch)buft+=ch;in(ch);buft='0'/判断保留字int j=0;for(;j<KWN;j+)if(strcmp(kwordj,buf)=0)out(type1,buf);break;/ID 标识符if(j>=KWN)while(is_Char(ch)|is_Uint(ch)buft+=ch;in(ch);buft='0'out(type0,buf);/判断是否为数字 else if(is_Uint(ch)int t=0;while(is_Uint(ch)buft+=ch;in(ch);buft='0'if(t=1)out(type2,buf);else if(buf0='0')int i=-1;while(i<t&&buf+i='0')out(type2,&"0");out(type2,buf+i);elseout(type2,buf);/判断是否为分界符 else if(is_Deli(ch)buf0=ch;buf1='0'out(type3,buf);in(ch);/判断是否为运算符(除开/) else if(is_Oper(ch)if(ch='+'|ch='-'|ch='*')buf0=ch;buf1='0'out(type4,buf);in(ch);else if(ch='!')buf0=ch;in(ch);if(ch='=')buf1=ch;buf2='0'out(type4,buf);in(ch);elsecout<<"error"<<+errors<<" line"<<line<<":'!'不合法的符号!"<<endl;else if(ch='>'|ch='<'|ch='=')buf0=ch;in(ch);if(ch='=')buf1=ch;buf2='0'out(type4,buf);in(ch);elsebuf1='0'out(type4,buf);else if(ch='/')/判断是除还是注释int t=0;buft+=ch;char ch0 ;in(ch0);while(1)if(ch0 = EOF)cout<<"error"<<+errors<<" line"<<line<<": 匹配错误,缺少*/"<<endl;break;ch = ch0;buft+=ch;in(ch0);if(ch ='*' && ch0 = '/')buft+=ch0;buft='0'out(type5,buf);break;in(ch);elsecout<<"error"<<+errors<<" line"<<line<<": '"<<ch<<"'未知符号"<<endl;in(ch);fin.close();fout.close();lexout.close();return errors;/*D:SoftwareMicrosoft Visual C+ 6.0Microsoft Visual StudioMyProjects编译原理实验一in.txtD:SoftwareMicrosoft Visual C+ 6.0Microsoft Visual StudioMyProjects编译原理实验一out.txt/*This a test program./*The loop endedwrite abc;*/*char ch1 = getc(fin);while(true)if(ch1 = EOF)printf("Line %dt%st没有匹配!n", line,"错误:" );break;ch = ch1;ch1 = getc(fin);if(ch ='*' && ch1 = '/')break;ch = getc(fin); /*The loop endedwrite abc;*/六、实验者自评(主要从实验态度、方法、效果上给一个客观公正的自我评价)我自认为实验态度很好,只是实验的方法不太好,实验的效果一般。我是看着DFA图来敲的代码,而不是看流程图来写的代码,这导致我敲到后面出现好几个难以发现的bug,这两个bug花了我相当多的时间,后来为了解决这个问题,我画出流程图再来一点一点对照我的代码,最终终于发现了bug,过程相当艰辛,光只是敲代码画了足足两天时间。实验效果一般,实验所花的总时长太长,效率不高。专心-专注-专业