词法分析器的设计(共10页).docx
精选优质文档-倾情为你奉上学 生 实 验 报 告 册2017 2018 学年第1学期 学院:信息与电气工程学院专业:计算机科学与技术 姓名:李金 学号:班级:计算机2班实验一词法分析器的设计一、实验目的1、 通过设计编制一个调试一个具体的此法分析程序,理解词法分析在编译程序中的作用。2、 加深对有穷自动机模型的理解。3、 掌握词法分析程序的实现方法和要求。4、 用C语言,对一个简单语言 的子集编制一个一遍扫描的程序,以加深对编译原理的理解,掌握编译程序的实现方法和技术。编制一个读单词过程,从输入的源程序中,识别出各个具有独立意义的单词,即基本保留字、标识符、常数、运算符、分隔符五大类,并依次输出各个单词的内部编码及单词符号自身值(遇到错误时课显示“Error”,然后跳过错误部分继续显示)一、 程序要求程序输入/输出示例如源程序为C语言,输入如下一段:Main()int a,b;a = 10;b = a + 20;要求输出如下图(2,main) (4,=) (5,()(3,10)(5,)(5,;)(5,)(2,b)(1,int)(4,=)(2,a)(2,a)(5,)(4,+)(2,b)(3,20)(5,;)(5,;)(2,a)(5,) 要求:1、 识别保留字:if,int,for,while,do,return,break,continue; 单词识别码为1;2、 其他的都识别为标识符;单词识别码为2;3、 常数为无符号整数;单词识别码为3;4、 运算符包括:+,-,*,/,=,<,<=,!=;单词识别码为4;5、 分隔符包括:,、;、(、);单词识别码为5;二、 实验步骤1、 定义部分:定义常亮、变量、数据结构。2、 初始化:从文件源程序全部输入到字符缓冲区中。3、 取单词前后去掉多余空格和回车空行。4、 取单词:读出单词的每一个字符,组成单词,分析类型。(1) 识别标识符(包括保留字) 关键字作为特殊标识符处理,把他们预先安排在一张表格中(保留字表),当扫描程序识别标识符时,查找关键字,否则一般标识符,识别保留字:if,int,for,while,do,return,break,continue; 单词识别码为1;其他的都识别为标识符;单词识别码为2。 (2)识别常数: 注意:常数的有效范围,如果产生溢出则设置syn的值,与主函数的代码呼应。常数为无符号整数;单词识别码为3。(3)识别运算符 区分运算符<和<=,>和>=,+和+,-和-。 运算符包括:+,-,*,/,=,<,=,<=,!=;单词识别码为4; (4)识别分隔符 分隔符包括:,、;、(、)单词识别码为5;5、 流程图 初始化 文件结束 忽略空格返回是 否 拼字符串 字母数字运算符界符等符号 其他报错拼数对应不同符号给出相应的syn Syn=3是否是关键字否返回对应SynSyn=2是三、 程序代码#include<stdio.h>#include<string.h>char program80,token8;char ch;int syn,p,m,n,row;long int sum;char *key8="if","int","for","while","do","return","break","continue"void scaner()for(n=0;n<8;n+)tokenn=NULL;m=0;ch=programp+;while(ch=' ')|(ch='n') ch=programp+; if(ch<='z')&&(ch>='a')|(ch<='Z')&&(ch>='A') /标识符判断 while(ch<='z')&&(ch>='a')|(ch<='Z')&&(ch>='A')|(ch>='0')&&(ch<='9') tokenm+=ch; ch=programp+; p-; syn=2; for(n=0;n<8;n+) if(strcmp(token,keyn)=0) syn=1; break; else if(ch>='0')&&(ch<='9') /无符号常数的判断 sum = 0; while(ch>='0')&&(ch<='9') sum=sum*10+ch-'0' ch=programp+; p-; syn=3; else switch(ch) case '<': tokenm+=ch; ch=programp+; if(ch='=') syn=4; tokenm+=ch; else syn=4; p-; break; case '>': tokenm+=ch; ch=programp+; if(ch='=') syn=4; tokenm+=ch; else syn=4; p-; break; case '+': tokenm+=ch; ch=programp+; if(ch='+') syn=4; tokenm+=ch; else syn=4; p-; break; case '-': tokenm+=ch; ch=programp+; if(ch='-') syn=4; tokenm+=ch; else syn=4; p-; break; case '!': ch=programp+; if(ch='=') syn=4; tokenm+=ch; else syn=4; p-; break; case '=': tokenm+=ch; ch=programp+; if(ch='=') syn=4; tokenm+=ch; else syn=4; p-; break; case '*': case '/': syn=4; tokenm+=ch; case '(': case ')': case '': case '': case '': case ':': case ',': syn=5; tokenm+=ch; break; case '#': syn=-2; tokenm+=ch; break; default: syn=-1; break; tokenm+='0'main()p=0;row=1;printf("n please input string:n");doch=getchar();programp+=ch;while(ch!='#');p=0;doscaner();switch(syn)case 3:printf("n(%d,%d)",syn,sum);break;case -1:printf("nFOUND ERROR IN ROW %d",row); return 0;break;case -2:row=row+;break;default:printf("n(%d,%s)",syn,token);break;while(syn!=0);/getch();return 0;四、 运行结果专心-专注-专业