C_minus语言词法分析器实验报告.pdf
装订线编译原理实验报告:C_minus 语言词法分析器学院计算机科学与技术专业xxxxxxxxxxxxxxxx学号xxxxxxxxxxxx姓名xxxx指导教师xxxx20 xx 年 xx 月 xx 日题目C_minusC_minus 语言词法分析器语言词法分析器一、实验目的一、实验目的1.理解词法分析器的设计方法:利用DFA编写相应的程序。2.掌握手工编写词法分析程序的方法。3.复习熟悉以前学过的编程语言4.通过实验了解编译器词法分析的工作原理二、实验原理二、实验原理 1.文法的概念,DFA的表示方法。2.词法分析程序的输出和输入:词法分析程序的功能是读入源程序,输出单词符号。单词符号是程序设计语言的比本语法符号,程序设计语言的单词符号一般分为如下几种:关键字,标示符,常数,运算符,界符,单词的输出是二元式的形式,需要知道二元式的表示方法,把得到的二元式写入输出文件。转化图如下:源程序词法分析程序记号文件 3.熟悉单词的描述工具,如正规文法,正规式,以及知道正规文法和正规式的等价性以及他们之间的互相转化。熟悉把正规文法转化为正规式,把正规式转化为NFA以及把 NFA转为相应的 DFA,最后再把DFA简化,DFA的状态转化为相应的子程序,最后得到词法分析器4.C 语言的基本语法。三、实验要求三、实验要求 1、该个词法分析器要求至少能够识别以下几类单词:关键字:else if int return void while 共 6 个,所有的关键字都是保留字,并且必须是小写;标识符:识别与C 语言词法规定相一致的标识符,通过下列正则表达式定义:ID=letter(letter|digit)*;常数:NUM=digit digit*(.digit digit*|)(e(+|-|)digit digit*|),letter=a|.|z|A|.|Z|,digit=0|.|9,包括整数,如 123 等;小数,如 123.45 等;科学计数法表示的常数,如 1.23e3,2.3e-9 等;专用符号:+-*/=!=,()/*/;2、分析器的输入为由上述几类单词构成的程序,输出为该段程序的机内表示形式,即关键字、运算符、界限符变为其对应的机内符,常数使用二进制形式,标识符使用相应的标识符表指针表示。3、词法分析器应当能够指出源程序中的词法错误,如不可识别的符号、错误的词法等。四、实验结果(程序)及分析#include#include#include#define N 100typedef struct char name30;int code;int addr;token;/存储刚从文件中读取的字符typedef struct char name30;int code;Keyword;typedef struct char name30;int code;int addr;symbol;Keyword key6=else,1,if,2,int,3,return,4,void,5,where,6;char ch;/接受字符FILE*source;/源文件FILE*keytxt;/关键字输出文件FILE*badgetxt;/标识符输出文件FILE*othertxt;/其他单词输出文件FILE*number;int error_count;/错误的个数int addr_count;/标识符表的指针int lineof;/行号token current;/暂时存放读入的字符token zancun;symbol currentsymbol;symbol symboltableN;/标识符表void error(int i);void main()void scan();error_count=0;addr_count=0;error_count=0;lineof=0;scan();void scan()int i=0;void iskeyword();/判断关键字void isOthers()/判断其他单词void output_1();/关键字输出文件void output_2();/标识符输出文件void output_others();/其他单词输出文件void Iszhushi();void isnumber();if(source=fopen(Source.txt,r)=NULL)/打开源文件printf(file open error/n);exit(0);if(keytxt=fopen(key.txt,w)=NULL)/打开关键字文件printf(file open error/n);exit(0);if(badgetxt=fopen(badge.txt,w)=NULL)/打开标识符文件 printf(file open error/n);exit(0);if(othertxt=fopen(others.txt,w)=NULL)printf(file open errorn);exit(0);if(number=fopen(number.txt,w)=NULL)printf(file open errorn);exit(0);ch=fgetc(source);while(ch!=EOF)for(i=0;i=a&ch=A&ch=0&ch=a)&(ch=A)&(ch0&ch9)current.namei=ch;i+;ch=fgetc(source);zancun=current;for(i=0;i6;i+)for(j=0;j30;j+)if(current.namej=keyi.namej)h=0;else h=1;break;if(h=0)break;if(h=0)current.code=keyi.code;output_1();else strcpy(symboltableaddr_count.name,current.name);symboltableaddr_count.code=10;symboltableaddr_count.addr=addr_count;addr_count+;output_2();void isOthers()char ch1;int i;for(i=0;i30;i+)current.namei=0;switch(ch)case+:current.name0=+;current.code=13;current.addr=-1;output_others();break;case-:current.name0=-;current.code=14;current.addr=-1;output_others();break;case*:current.name0=*;current.code=15;current.addr=-1;output_others();break;case/:current.name0=/;current.code=16;current.addr=-1;output_others();break;case:ch1=fgetc(source);if(ch1=)current.name0=;current.name1=;current.code=17;output_others();break;else fseek(source,-1,1);current.name0=:ch1=fgetc(source);if(ch1=)current.name0=;current.name1=;current.code=19;output_others();break;elsefseek(source,-1,1);current.name0=;current.code=20;output_others();break;case=:ch1=fgetc(source);if(ch1=)current.name0=;current.name1=;current.code=21;current.addr=-1;output_others();break;else current.name0=;current.code=22;current.addr=-1;output_others();fseek(source,-1,1);break;case!:ch1=fgetc(source);if(ch1=)current.name0=!;current.name1=;current.code=23;current.addr=-1;output_others();break;elsefseek(source,-1,1);current.name0=!;current.code=24;current.addr=-1;output_others();break;case;:current.name0=;current.code=25;current.addr=-1;output_others();break;case,:current.name0=,;current.code=26;current.addr=-1;output_others();case(:int i=ftell(source);char ch1=ch;char ch2;while(ch!=)ch=fgetc(source);if(ch=)current.name0=ch1;current.name1=ch;current.code=27;current.addr=-1;output_others();fseek(source,i,0);ch2=fgetc(source);ch2=fgetc(source);break;else error_count+;error(1);fseek(source,i,0);ch2=fgetc(source);ch2=fgetc(source);break;case:current.name0=;current.code=28;current.addr=-1;output_others();break;case:current.name0=;current.code=28;current.addr=-1;output_others();break;case:current.name0=;current.code=29;current.addr=-1;output_others();break;case:current.name0=;current.code=29;current.addr=-1;output_others();break;case10:lineof+;break;void Iszhushi()char ch1;ch1=ch;ch=fgetc(source);if(ch=*)for(;)ch=fgetc(source);if(ch=EOF)error(2);break;if(ch=*)ch1=ch;ch=fgetc(source);if(ch=)ch=fgetc(source);break;elseerror_count+;error(2);void isnumber()int k=0;void output_number();while(ch=0&ch=9)current.namek+=ch;ch=fgetc(source);current.code=11;output_number();void output_1()printf(关键字:,current.name,current.code);putchar(10);fprintf(keytxt,current.name,current.code);void output_2()printf(标识符地址:,current.name,addr_count);putchar(10);fprintf(badgetxt,current.name,addr_count);void output_others()printf(其它单词:,current.name,current.code);putchar(10);fprintf(othertxt,current.name,current.code);void error(int i)switch(i)case 1:printf(界符发生错误,发生在第%d 行/n,lineof);case 2:printf(注释发生错误,发生在第%d 行/n,lineof);void output_number()printf(常数n,current.name,current.code);fprintf(number,current.name,current.code);实验结果分析,程序运行结果截图:关键字输出文件:标识符输出文件:数字的输出文件其它单词输出文件: