第四章语法分析优秀课件.ppt
《第四章语法分析优秀课件.ppt》由会员分享,可在线阅读,更多相关《第四章语法分析优秀课件.ppt(99页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章语法分析第四章语法分析1第1页,本讲稿共99页4.5 自底向上分析自底向上分析q移进归约分析法(Shift-reduce parsing)q一般的移进归约法LR parsingLR(0)SLRLR(1)LALRq自动的语法分析器的生成器(YACC)2第2页,本讲稿共99页4.5.1 归约归约例4.21考虑文法S aABe A Abc|bB d句子abbcde的归约步骤如下:abbcde aAbcdeaAdeaABeS 对应最右推导的逆过程:S rm aABe rm aAde rm aAbcde rm abbcdeSa A B edA b cb3第3页,本讲稿共99页句柄句柄(handle
2、s)q句柄是最左直接短语。q右句型的句柄是产生式A 和中的子串,且用A 代替得到的仍是右句型 qi.e.A is a handle of w at the location immediately after the end of,if:q句柄的右边仅含终结符。SAw4第4页,本讲稿共99页短语和句柄短语和句柄q设有上下文无关文法G=(VT,VN,S,P),串是文法G的句型,若有A+,且串A也是文法G的句型,则称是句型中关于非终结符号A的短语短语。q若A ,则称为直接短语直接短语。q最左直接短语称为句柄句柄(handle)。5第5页,本讲稿共99页ExampleS aABe aAde aAbc
3、de abbcde考虑文法S aABe A Abc|bB dIt follows that:A b is a handle of abbcde in location 2.rmrmrmrmSa A B edA b cb6第6页,本讲稿共99页ExampleS aABe aAde aAbcde abbcdeIt follows that:A Abc is a handle of aAbcde in location 2.rmrmrmrmSa A B edA b c考虑文法S aABe A Abc|bB d7第7页,本讲稿共99页ExampleS aABe aAde aAbcde abbcdeIt
4、 follows that:B d is a handle of aAde in location 3.rmrmrmrmSa A B ed考虑文法S aABe A Abc|bB d8第8页,本讲稿共99页ExampleS aABe aAde aAbcde abbcdeIt follows that:S aABe is a handle of aABe in location 1.rmrmrmrmSa A B e考虑文法S aABe A Abc|bB d9第9页,本讲稿共99页 例例4.22E E+E|E*E|(E)|idq如果文法二义,那么句柄可能不唯一。q在句型E+E*id3中,句柄不唯一。
5、E rm E+E rm E+E*E rm E+E*id3 rm E+id2*id3 rm id1+id2*id3E rm E*E rm E*id3 rm E+E*id3 rm E+id2*id3 rm id1+id2*id3 10第10页,本讲稿共99页4.5.2 句柄剪枝句柄剪枝(Handle Pruning)qA rightmost derivation in reverse can be obtained by“handle-pruning.”q从被分析的终结符号串w开始,如果w是文法的句子,那么记w=n,其中n是最右推导的第n步句型:q构造最右推导的逆过程,在n中找句柄进行归约得到右句
6、型n-1。11第11页,本讲稿共99页例例4.23右句型句柄归约产生式id1 id2*id3E id2*id3E E*id3E E*E E EEid1id2id3E*EE+E E id E id E id E E*E E E+E12第12页,本讲稿共99页分析过程的特点分析过程的特点从输入串的开头依次读入(移进移进)单词。一旦发现可归约串可归约串(在上例中是句柄句柄)就立即归约归约。根据句柄对分析树进行修剪子树,剪去子树的叶子。若最终能归约成文法的开始符号,则分析成功。由于总是将句型的最左边的可归约串最左边的可归约串替换成非终结符号,该归约方法通常得到是最右推导的逆过程最右推导的逆过程。13第
7、13页,本讲稿共99页4.5.3 用栈实现移进归约分析用栈实现移进归约分析q必须解决两个问题确定右句型中将要归约的子串(句柄)如何确定选择哪一个产生式q一般方法用栈保存文法符号输入缓冲区存放待分析的串移进(shift)输入符号入栈,直至栈顶出现句柄归约(reduce)句柄,用产生式左部的非终结符替代栈中的句柄14第14页,本讲稿共99页栈 输 入 动 作$id1+id2*id3$移进$id1 +id2*id3$按E id归约$E +id2*id3$移进$E+id2*id3$移进$E+id2 *id3$按E id归约$E+E *id3$移进$E+E*id3$移进$E+E*id3$按E id归约$
8、E+E*E$按E E*E归约$E+E$按E E+E归约$E$接受 例例4.2415第15页,本讲稿共99页q初始状态格局栈输入$w$q接受状态格局栈输入$S$16第16页,本讲稿共99页动作动作q有四种动作移进:把下一个输入符号移进栈顶归约:在栈中确定句柄,选择正确的非终结符替代句柄接受报错17第17页,本讲稿共99页q句柄总会出现在栈顶,而不会在栈的里面。q考察任意最右推导中连续两步的可能形式:18第18页,本讲稿共99页q假设当前状态格局为:栈输入$yz$q把句柄归约为B,达到状态格局:栈输入$B yz$q移进y入栈中,达到格局:栈输入$By z$q栈顶形成句柄By,归约为A,达到状态格局
9、:栈输入$A z$SAz B y19第19页,本讲稿共99页q假设当前状态格局为:栈输入$xyz$q把句柄归约为B,达到状态格局:栈输入$B xyz$q移进x,y入栈中,达到格局:栈输入$Bxy z$q栈顶句柄y归约为A,达到状态格局:栈输入$Bx z$SzB x Ay20第20页,本讲稿共99页4.5.4 活前缀活前缀(Viable prefix)q出现在移进归约分析器栈中的右句型的前缀集合称为活前缀。q活前缀是右句型的前缀,不含右句柄之后的任何符号。q活前缀后加上终结符可以得到右句型。q只有输入串中已分析过的那部分能归约成活前缀,就没有语法错误。21第21页,本讲稿共99页4.5.5 冲突
10、冲突(Conflicts)q如果形成这样的格局:根据栈中的内容和下一个输入符号不能决定是移进还是归约(移进归约冲突),或不能决定用那一条产生式进行归约(归约归约冲突)。22第22页,本讲稿共99页移进移进 归约冲突归约冲突例4.25 stmt if expr then stmt|if expr then stmt else stmt|other存在移进归约冲突。一般地,任何二义性文法都不是LR(k)文法。假设当前状态格局为:栈输入 if expr then stmtelse$23第23页,本讲稿共99页归约归约 归约冲突归约冲突例4.26 关于过程调用和数组引用的下标的文法stmt id(pa
11、rameter_list)|expr:=exprparameter_list parameter_list,parameter|parameterparameter idexpr id(expr_list)|idexpr_list expr_list,expr|expr24第24页,本讲稿共99页例例4.26 关于过程调用和数组引用的下关于过程调用和数组引用的下标的文法标的文法q考察输入串A(I,J),对应记号流形式id(id,id)。q假设当前状态格局为:栈输入 id(id,id$qReduce/Reduce Conflict what to do?(it really depends on
12、 what is A,an array?or a procedure?25第25页,本讲稿共99页4.6 LR语法分析器语法分析器q本节介绍LR(k)分析技术“L”:left-to-right scanning 自左向右扫描“R”:rightmost derivation in reverse 最右推导的逆“k”:the number of input symbols of lookahead,when(k)is omitted,k is assumed to be 126第26页,本讲稿共99页LR分析器的特点分析器的特点q通用通用q适用面广适用面广q效率高效率高27第27页,本讲稿共99页
13、LR分析器的特点分析器的特点q通用通用一般的移进归约法q适用面广适用面广适合大多数的上下文无关文法q效率高效率高实用28第28页,本讲稿共99页4.6.2 LR(0)项目(项目(Item)q在产生式右部加上,表示分析过程中的状态,指示产生式右部符号已经被识别了多少之前的子串已经出现在栈中之后的子串是下一步将看到的q在文法产生式右部某个位置标有 的产生式,称为文法的一个LR(0)项目。形如 A 的项目称为归约项目;形如 A B 的项目称为待约项目(基本项目);形如 A a 的项目称为移进项目。29第29页,本讲稿共99页LR(0)项目项目例如,产生式AXYZ对应四个项目:A XYZA XYZA
14、XYZA XYZ注意,产生式A只对应一个项目:A 30第30页,本讲稿共99页LR(0)项目集族项目集族q对文法G,构造一个有限自动机,它能识别G的所有活前缀。在这个基础上,把自动机转变成LR分析表。NFA/DFAq首先构造一个NFA,它能识别G的所有活前缀。qNFA的状态是下面定义的一个“项目”。31第31页,本讲稿共99页增广文法增广文法q对文法GS增加S SS S 是唯一动作为accept的状态。32第32页,本讲稿共99页闭包运算闭包运算closureq项目闭包:设I是文法G的一个LR(0)项目集合,I的项目闭包closure(I)定义如下:I closure(I)若项目A B clo
15、sure(I),且 B 是G的产生式,则项目B closure(I)closure(I)仅包含上述两条规则确定的LR(0)项目。33第33页,本讲稿共99页function closure(I)begin j:=I;repeat for each A B in J and each production B of G such that B is not in J do ADD B to J until no more items can be added to J return Jendclosure的计算34第34页,本讲稿共99页E EE E+T|TT T*F|FF (E)|id如果 I
16、 是项目集合E E,那么closure(I)包括下列项目:E EE E+T E TT T*F T FF (E)F id例例 4.26 考虑拓广的表达式文法:考虑拓广的表达式文法:35第35页,本讲稿共99页核心项目和非核心项目核心项目和非核心项目q可以把项目集中的项目分为两类:核心项目(Kernel items):初始项S S和所有点不在左端的项目非核心项目(Non-kernel items):点在左端的非初始项目非核心项目可以通过求核心项目集的闭包得到。36第36页,本讲稿共99页转移函数转移函数gotoq若I是文法G的一个LR(0)项目集,X是G中的文法符号,定义转移函数 goto(I,X
17、)=closure(J)其中 J=A X|A X I q项目A X 称为项目A X的后继。q如果I是对某个活前缀的有效项目集,那么goto(I,X)是对活前缀X的有效项目集。37第37页,本讲稿共99页例例 4.27q若项目集 I=E E,E E +T,计算 goto(I,+)得到以下项目集:E E+TT T*F T F F (E)F id 38第38页,本讲稿共99页function goto(I,X)begin let J be the set of items A X such that A X is in I;return closure(J)end goto的计算的计算39第39页,
18、本讲稿共99页procedure items(G)begin C:=closureS S repeat for C 的每个项目集 I 和每个文法符号 X 若 goto(I,X)is not empty and not in Cdo add goto(I,X)to C until no more sets of items can be added to CendThe sets-of-Items construction构造构造LR(0)项目集规范族项目集规范族40第40页,本讲稿共99页例例4.28 设文法设文法G的产生式为的产生式为拓广文法G:E EE E+T|TT T*F|FF (E)|
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 语法分析 优秀 课件
限制150内