语言词法分析器和C语言语法分析器编译原理课程设计.doc
《语言词法分析器和C语言语法分析器编译原理课程设计.doc》由会员分享,可在线阅读,更多相关《语言词法分析器和C语言语法分析器编译原理课程设计.doc(48页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流语言词法分析器和C语言语法分析器编译原理课程设计.精品文档.编译原理课程设计课程报告题目 C语言词法分析器和C-语言语法分析器 学生姓名 学生学号 指导教师 提交报告时间 2019 年 6 月 8 日C语言词法分析器1 实验目的及意义1. 熟悉C语言词法2. 掌握构造DFA的过程3. 掌握利用DFA实现C语言的词法分析器4. 理解编译器词法分析的工作原理2 词法特点及正则表达式2.1词法特点2.1.1 保留字AUTO, BREAK , CASE , CHAR , CONST , CONTINUE , DEFAULT , DO , DOUBLE
2、 , ELSE, ENUM , EXTERN , FLOAT , FOR , GOTO, IF , INT , LONG , REGISTER , RETURN, SHORT , SIGNED , SIZEOF , STATIC , STRUCT , SWITCH , TYPEDEF , UNION , UNSIGNED , VOID, VOLATILE , WHILE,2.1.2 符号 2.2 正则表达式 whitespace = (newline|blank|tab|comment)+ digit=0|.|9 nat=digit+ signedNat=(+|-)?nat NUM=signe
3、dNat(“.”nat)? letter = a|.|z|A|.|Z ID = letter(letter|digit|“_”)+ CHAR = other+ STRING = “other+”3 Token定义3.1 token类型保留字auto break case char const continue default do double elseenum extern float for gotoif int long redisterreturnshort signed sizeof static struct switch typedef union unsignedvoid vo
4、latile while特殊符号+ - * / + - += -= *= = = != = ; , ( ) /* */ :文件结束、错误EOF ERROR其它tokenNUM ID CHARACTER STRINGtypedef enum /错误、结束 ENDFILE,ERROR, /保留字 AUTO,BREAK,CASE,CHAR,CONST,CONTINUE ,DEFAULT , DO ,DOUBLE, ELSE, ENUM, EXTERN , FLOAT ,FOR , GOTO,IF, INT, LONG,REGISTER , RETURN, SHORT, SIGNED ,SIZEOF
5、,STATIC, STRUCT ,SWITCH, TYPEDEF ,UNION, UNSIGNED , VOID,VOLATILE , WHILE, /其他token ID,NUM,CHARACTER,STRING,/特殊符号 /+、-、*、/、+、-、+=、-=、*=、=、=、!=、=、;、,、(、)、/、/*、*/、:PLUS,MINUS,TIMES,OVER,SELFPLUS,SELFMINUS,PLUSASSIGN,MINUSASSIGN,TIMESASSIGN,LT,LEQ,GT,GEQ,EQ,NEQ,ASSIGN,SEMI,COMMA,LPAREN, MINUSASSIGN,TIM
6、ESASSIGN,LT,LEQ,GT,GEQ,EQ,NEQ,ASSIGN,SEMI,COMMA,LPAREN, RPAREN,LBRACKET,RBRACKET, LCBRACKET,RCBRACKET,LCOMMENT,RCOMMENT,COLON TokenType;3.2 tokenType类型代码4 DFA设计4.1 注释的DFA设计注释的DFA如下所示,一共分为5个状态,在开始状态1时,如果输入的字符为/,则进入状态2,此时有可能进入注释状态,如果在状态2时,输入的字符为*,则进入注释状态,状态将转到3,如果在状态3时,输入的字符为*,则有可能结束注释状态,此时状态将转到状态4,如果
7、在状态4时输入的字符为/,则注释状态结束,状态转移到结束状态。4.2 词法分析的DFA设计词法分析的DFA如下所示,一共分为10个状态:START、INNUM、INNUM1、INNUM2、INID、INCOMPARE、INOPERATE、INSTRING、INCHAR、DONE。状态START表示开始状态,状态INNUM,INNUM1,INNUM2表示数字类型(NUM)Token的状态,状态INID表示标示符(ID)类型Token的状态,状态INOPERATE表示算数运算符型Token的状态,状态INOCOMPARE表示比较运算符型Token的状态,INSTRING表示字符串(STRING)类
8、型Token的状态,INCHAR表示字符(CHARACTER)类型Token的状态,状态DONE表示接收状态。l 在开始状态START时 如果输入的字符为空白符,如空格换行等,则仍在START状态 如果输入的字符为digit,则进入状态INNUM,即可能是数字类型(NUM)Token的状态 如果输入的字符为letter,则进入状态INID,即可能是标识符类型Token的状态 如果输入的字符为、=2) b+=0.1 a+;6.2 测试结果6.3结果分析test.c文件中包括注释,保留字,整数和小数,标识符,特殊符号,字符串以及错误输入。本程序成功对test.c文件进行了词法分析,对注释进行了忽略
9、,输出了相应的行号、类型、取值,对于错误的输入显示ERROR。7 小结通过编写C语言词法分析器,我对编译器的基本原理有了更深的认识,同时掌握了DFA的设计与实现。在最开始的编写过程中,我总是把词法和语法分析混淆,比如一些错误应该在语法分析中判断,我却写进了词法分析中,后来我逐步认识到词法分析的作用就是提取源代码中的Token。在DFA的实现过程中,我主要参考了书后tiny语言DFA的实现方法,将它扩展到C语言。另外C语言词法比较复杂,因为时间关系我省略了一些,比如位运算符,转义字符等等,希望今后能完善。C-语言语法分析器1 实验目的及意义用C语言编制Tiny/C-语言的语法分析程序,实现对词法
10、分析程序所提供的Token序列的语法检查和结构分析。 2 文法规则(EBNF)programdeclaration-listdeclaration_list declaration declaration declarationvar-declaration|fun-declarationvar_declaration type-specifier ID; | type-specifier ID NUM;type - specifier int | voidfun-declatationtype-specifier ID (params) | compound-stmtparamsparam_
11、list | voidparam_listparam, paramparam type-specifier ID compound-stmt local-declaration statement-listlocal-declarations empty var- declarationstatement-liststatementstatementexpression-stmt | compound-stmt | selection-stmt | iteration-stmt | return-stmtexpression-stmt expression;selection-stmtif (
12、expression) statement else statementiteration-stmtwhile (expression)statementreturn-stmtreturn expression;expression var = expression | simple-expressionrelop = | | = | = = | ! =varID | ID expressionsimple-expressionadditive-expression relop additive-expression additive-expressiontermaddop term addo
13、p + | -termfactormulop factor mulop * | /factor(expression) | var | call | NUMcallID( args )argsarg-list | emptyarg-list expression, expression3 节点类型及定义3.1节点类型节点类型描述子节点IntKInt型变量或返回值无VoidKvoid型变量或返回值无IdK标示符id无ConstK数值无Var_DeclK变量声明变量类型+变量名Var_DeclK数组声明数组名+数组大小FunK函数声明返回类型+函数名+参数列表+函数体ParamsKFunK的参数列
14、表参数(如果有多个参数,则之间为兄弟节点)ParamKFunK的参数参数类型+参数名CompK复合语句体变量声明列表+语句列表Selection_StmtKif条件表达式+IF体+ELSE体Iteration_StmtKwhile条件表达式+循环体Return_StmtKreturn表达式AssignK赋值被赋值变量+赋值变量OpK运算运算符左值+运算符右值Arry_ElemK数组元素数组名+下标CallK函数调用函数名+参数列表ArgsKCallK的参数列表表达式UnkownK未知节点无3.2节点定义typedef struct treeNodestruct treeNode * child
15、4;struct treeNode * sibling;int lineno;NodeKind nodekind;union TokenType op; int val; const char * name; attr; ExpType type; TreeNode;4 代码结构分析文法programdeclaration-list分析函数TreeNode * parse(void)说明C-程序由一个声明序列组成,parse(void)函数首先执行getToken()然后直接调用declaration_list()返回树节点代码TreeNode * parse(void)TreeNode *
16、t;token = getToken();t = declaration_list();if(token!=ENDFILE) syntaxError(endfile error);return t;文法declaration_list declaration declaration 分析函数TreeNode * declaration_list(void)说明声明序列是由若干声明构成,declaration_list(void)函数中直接调用declaration()函数返回树节点,当前token为INT或VOID时,调用declaration()返回之前树节点的兄弟节点。代码TreeNode
17、 * declaration_list(void)TreeNode * t = declaration();TreeNode * p =t;/程序以变量声明开始 while(token!=INT)&(token!=VOID)&(token!=ENDFILE) syntaxError(开始不是类型声明); token = getToken(); if(token=ENDFILE) break; while(token=INT|token=VOID)TreeNode * q;q = declaration();if (q!=NULL)if (t=NULL)t=p=q;elsep-sibling=q
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语言 词法 分析器 语法 编译 原理 课程设计
限制150内