词法分析的实验报告(共11页).doc
精选优质文档-倾情为你奉上词法分析实验报告目录1 实验目的1、学会针对DFA转换图实现相应的高级语言源程序。2、深刻领会状态转换图的含义,逐步理解有限自动机。3、掌握手工生成词法分析器的方法,了解词法分析器的内部工作原理。2 实验内容2.1 TINY计算机语言描述TINY计算机语言的编译程序的词法分析部分实现。从左到右扫描每行该语言源程序的符号,拼成单词,换成统一的内部表示(token)送给语法分析程序。为了简化程序的编写,有具体的要求如下:1、数仅仅是整数。2、空白符仅仅是空格、回车符、制表符。3、代码是自由格式。4、注释应放在花括号之内,并且不允许嵌套语言的单词保留字特殊符号其他if+标识符(一个或更多的字母)then-else*end/repeat=数(一个或更多的数字)until<readwrite;2.2 实验要求l 要求实现编译器的以下功能1、按规则拼单词,并转换成二元式形式2、删除注释行3、删除空白符 (空格、回车符、制表符)4、列表打印源程序,按照源程序的行打印,在每行的前面加上行号,并且打印出每行包含的记号的二元形式5、发现并定位错误l 词法分析进行具体的要求1、记号的二元式形式中种类采用枚举方法定义;其中保留字和特殊字符是每个都一个种类,标示符自己是一类,数字是一类;单词的属性就是表示的字符串值。2、词法分析的具体功能实现是一个函数GetToken(),每次调用都对剩余的字符串分析得到一个单词或记号识别其种类,收集该记号的符号串属性,当识别一个单词完毕,采用返回值的形式返回符号的种类,同时采用程序变量的形式提供当前识别出记号的属性值。这样配合语法分析程序的分析需要的记号及其属性,生成一个语法树。3、标示符和保留字的词法构成相同,为了更好的实现,把语言的保留字建立一个表格存储,这样可以把保留字的识别放在标示符之后,用识别出的标示符对比该表格,如果存在该表格中则是保留字,否则是一般标示符。 3 此法分析器的程序实现3.1 状态转换图图1 TINY语言的确定有限自动机(DFA)3.2 程序源码#include<iostream>using namespace std;#include<fstream>#include<string>#include<iomanip>class CApublic:void getToken(); /识别标识符void preDo(char ); /预处理源程序void display(); /打印出CA()m=n=0;private:long count2;char ID1010; /符号表int m; /设m为符号表中已有的标识符的个数char Cons1010; /常数表int n; /设n为常数表中已有的常数的个数char buffer199999;bool isDigit(char);/检查是否为数字bool isLetter(char);/检查是否为字符int InsertID(char *strToken);/添加符号int InsertConst(char *strToken);/添加符号int Search(char a10,const char *,int ); /二分查找;/enum variety标识符,数字,关键字1,关键字2,关键字3,关键字4,关键字5,关键字6,关键字7,关键字8,特殊符号1,/ 特殊符号2,特殊符号3,特殊符号4,特殊符号5,特殊符号6,特殊符号7,特殊符号8,特殊符号9,特殊符号10;/关键字bi编码 1 2 3 4 5 6 7 8char K1810="else","end","if","read","repeat","then","until","write","%","*","+","-","/",":","","<","=",">"bool CA:isDigit(char c)if(c<='9'&&c>='0') return true;else return false;bool CA:isLetter(char c)if(c>='a'&&c<='z'|c>='A'&&c<='Z') return true;else return false;int CA:Search(char a1810,const char *b,int n) int left=0;int right=n-1;int mid=0;while(left<=right)mid=(left+right)/2;if(strcmp(amid,b)=0) return mid;else if(strcmp(amid,b)<0) left=mid+1;else right=mid-1;return -1;int CA:InsertID(char *strToken)int i=0;while (i<m) /设m为符号表中已有的标识符的个数 if (!strcmp(IDi, strToken)return i;i+;strcpy(IDi,strToken);m+;return i;int CA:InsertConst(char *strToken)int i=0; while (i<n) /设n为常数表中已有的常数的个数 if (!strcmp(Consi, strToken)return i;i+;strcpy(Consi,strToken);n+;return i;void CA:display() char filename30;/输入的时候一定要是.:/./.格式cout<<"请输入源程序代码.cpp 文件的绝对路径:"<<endl; cin>>filename;ifstream infile(filename,ios:in);if(!infile)cerr<<"open error!"<<endl;abort();char ch;int count1=1;count2=0;cout<<"第 "<<count1<<" 行 "while(infile.get(ch) preDo(ch);cout<<ch; /逐行打印出源程序if(ch='n')count1+;cout<<"第 "<<count1<<" 行 "buffer1count2+1='0'cout<<endl;/对buffer1中的字符进行扫描getToken();infile.close();cout<<endl;cout<<"符号表:"for (int i=0;i<m;i+)cout<<IDi<<" "cout<<endl;cout<<"数字表:"for (int j=0;j<n;j+)cout<<Consj<<" "cout<<endl;void CA:preDo(char c) char *p=buffer1;buffer10='#' /赋#给扫描缓冲区的第一个元素count2+;*(p+count2)=c;if(buffer1count2-1='') /删除注释 if(c='') cout<<"注释不允许嵌套! " /注释不允许嵌套if(c!='') count2-;else count2=count2-2;else if(buffer1count2-1=' '&&c=' ') count2-; /若干相继的空白符结合成一个if(c='r') count2-;if(c='t') count2-;void CA:getToken() int n=1;cout<<"第1行: "for(int i=1;i<strlen(buffer1);i+) if(buffer1i='n')n+;cout<<"n第"<<n<<"行:" ; else if(isLetter(buffer1i)string tok = ""tok +=buffer1i;while(isLetter(buffer1+i)tok +=buffer1i;int r=Search(K,tok.c_str(),8); i-;if(r!=-1)cout<<"(关键字"<<r+1<<","<<tok<<") " /关键字编码else cout<<"(标识符,"<<tok<<") " /标识符编码 r = InsertID(char *)tok.c_str();else if(isDigit(buffer1i)string tok = ""tok +=buffer1i;while(isDigit(buffer1+i)tok +=buffer1i;int y = InsertConst(char *)tok.c_str();cout<<"(数字,"<<tok<<") "i-; /数字编码else if (buffer1i=' ') elsestring tok = ""tok +=buffer1i;int q=Search(K,tok.c_str(),18);if(q!=-1) cout<<"(特殊符号,"<<tok<<") " else cout<<"非法符号! " /*main函数*/int main()CA ca;ca.display();cout<<endl;return 0;3.3 实验运行效果截图4 实验体会本次实验是编译技术的第一次实验,按理说也应该是最简单的一次实验验,但是在具体的实现过程中还是遇到了这样或那样的问题,比如对原输入串进行分析的预处理是在注释的嵌套判断上出现了问题,调试了几次才发现是出现注释时计数值本来应该减2结果减了1。类似的错误还有,但好在最后都解决了。除了提升了自己的动手能力外本次实验最大的收获应该是对词法分析器的运行机制有了更深入的理解了,再画状态转换的过程中也激发了我的一些关于那些复杂的语言(如c+)的词法分析器是怎样书写的联想,希望在今后的学习实践中能有更深入的学习。最后感谢老师的悉心指导,谢谢老师!专心-专注-专业