第四章(1)自上而下语法分析.ppt
《第四章(1)自上而下语法分析.ppt》由会员分享,可在线阅读,更多相关《第四章(1)自上而下语法分析.ppt(82页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章第四章 自顶向下语法分析方法自顶向下语法分析方法v 自顶向下分析的一般过程和问题 v FIRST和FOLLOW集定义和计算 v LL(1)文法定义v LL(1)分析程序实现4.1 语法分析概述语法分析概述v语法分析是编译过程的核心,其任务是在词法分析识别出正确的单词符号串的基础上,分析并判定程序的语法结构是否符合语法规则。v高级语言的语法结构适合用上下文无关文法来描述,上下文无关文法是语法分析的基础。语法分析在编译系统中所处的位置语法分析在编译系统中所处的位置语法分析器的输入语法分析器的输入Token序列:词法分析的输出,是各个单词都正确的源程序的变换形式,是一个有限序列语法分析器的输出
2、语法分析器的输出分析树:表示方法?见教材 P89错误处理信息:定位、继续编译语法分析的接口设计语法分析的接口设计v语法分析器的功能语法分析器的功能按照语言的语法构成规则,识别输入的符号输入的符号串串能否构成一个句子。这些规则是用文法的产生式来定义的。v问题问题对给定的一个输入串,如何判定它是不是一个句子?v方法方法根据文法的产生式规则,从开始符号出发,从开始符号出发,看能否推导出与这个输入串匹配的句子看能否推导出与这个输入串匹配的句子。这就需要建立与输入串匹配的语法分析树。G=(E,i,+,*,(,),P,E)P:E E+E E E*E E (E)E i 解:使用最左推导:E E*E (E)*
3、E (E+E)*E (i+E)*E (i+i)*E (i+i)*i例1:判定输入串(i+i)*i是否是下述文法的句子?结论结论:能够从开始符号出发推导出给定的输入串,因此,是句子。7 7 7 7例例2:已知符号串:已知符号串S=cad 文法文法GZ:ZcAd Aab|a 求证:求证:S L(GZ)分析过程分析过程是设法建立一棵语法树是设法建立一棵语法树,使语法树的末端结点与使语法树的末端结点与给定符号串相匹配给定符号串相匹配.1.1.开始开始开始开始:令令令令Z Z为根结点为根结点为根结点为根结点Z Z2.2.用用用用Z Z的右部的右部的右部的右部,符号串去匹配输入串符号串去匹配输入串符号串去
4、匹配输入串符号串去匹配输入串 Z Zc cA Ad d完成一步推导完成一步推导完成一步推导完成一步推导Z ZcAdcAd 检查检查检查检查 c-cc-c匹配匹配匹配匹配 A A是非终结符是非终结符是非终结符是非终结符,将匹配任务交给将匹配任务交给将匹配任务交给将匹配任务交给A A8 8 8 83.3.选用选用选用选用A A的右部符号串匹配输入串的右部符号串匹配输入串的右部符号串匹配输入串的右部符号串匹配输入串 A A有两个右部有两个右部有两个右部有两个右部,选第一个选第一个选第一个选第一个 c cA Ad da ab bZ Z完成进一步推导完成进一步推导完成进一步推导完成进一步推导A Aaba
5、b 检查检查检查检查,a-a,a-a匹配匹配匹配匹配,b-d,b-d不匹配不匹配不匹配不匹配(失败失败失败失败)但是还不能冒然宣布但是还不能冒然宣布但是还不能冒然宣布但是还不能冒然宣布S S L(GZ)L(GZ)4.4.回溯回溯回溯回溯 即砍掉即砍掉即砍掉即砍掉A A的子树的子树的子树的子树 改选改选改选改选A A的第二右部的第二右部的第二右部的第二右部 Z Zc cA Ad da aA Aa a 检查检查检查检查 a-aa-a匹配匹配匹配匹配 d-dd-d匹配匹配匹配匹配建立语法树建立语法树建立语法树建立语法树,末端结点为末端结点为末端结点为末端结点为cadcad与与与与输入输入输入输入ca
6、dcad相匹配相匹配相匹配相匹配,建立了推导序列建立了推导序列建立了推导序列建立了推导序列 Z ZcAdcAdcadcad cadcad L(G(ZL(G(Z)S=cad GZ:S=cad GZ:ZcAdZcAd Aab|aAab|a分析工作要部分析工作要部分析工作要部分析工作要部分地或全部地分地或全部地分地或全部地分地或全部地退回去重做叫退回去重做叫退回去重做叫退回去重做叫回溯回溯回溯回溯常用的语法分析方法:常用的语法分析方法:自顶向下分析法自顶向下分析法:从文法的开始符号出发,向下推导(使用最左推导),尽可能使用各种产生式,推导出与输入串匹配的句子,从而建立语法树。自底向上分析法自底向上分
7、析法:从输入符号串开始,逐步进行归约(最右推导的逆过程),直至归约到文法的开始符号,从而建立语法树。具体分类具体分类:自顶向下分析 递归下降分析预测分析(LL)自底向上分析 算符优先分析 LR分析4.2 自顶向下语法分析自顶向下语法分析v自上而下分析主要是:对任何输入串,试图用一切可能的办法,从文法的开始符号出发,自上而下地为输入串建立一个语法树。v从推导的角度看,从开始符号出发,使用最左推导,试图推导出与输入符号串相同的句子。v从语法树的角度看,从根节点出发,反复使用所有可能的产生式,谋求输入串的匹配,试图向下构造一棵语法树,其末端节点正好与输入符号串相同。v需要反复试探。句型的句型的推导推
8、导v 最左(最右)推导:在推导的任何一步,其中、是句型,都是对中的最左(右)非终结符进行替换 最右推导被称为规范推导。由规范推导所得的句型称为规范句型。复习自顶向下分析方法特点1.分析过程是分析过程是带有预测带有预测的,对输入符号串要预测属于什么的,对输入符号串要预测属于什么 语法成分,然后根据该语法成分的文法建立语法树。语法成分,然后根据该语法成分的文法建立语法树。2.分析过程是一种分析过程是一种试探试探过程,是尽一切办法过程,是尽一切办法(选用不同规则选用不同规则)设法建立语法树的过程,由于是试探过程,故难免有失败,设法建立语法树的过程,由于是试探过程,故难免有失败,所以分析过程需进行所以
9、分析过程需进行回溯回溯,因此我们也称这种方法是带,因此我们也称这种方法是带 回溯的自顶向下分析方法。回溯的自顶向下分析方法。例1:设有文法(1)S xAy(2)A|=现有输入串:x=y 其分析过程如右:SxAy*失败,需要退回,重新选取失败,需要退回,重新选取A A的侯选式,这时使得分析的侯选式,这时使得分析器的动作不稳定器的动作不稳定思考:产生回溯的原因?X=y输入符号串:问题问题1:回溯:回溯真正原因是:文法的产生式有问题。回溯问题14141414什么是回溯什么是回溯?分析工作要部分地或全部地退回去重做叫分析工作要部分地或全部地退回去重做叫回溯回溯造成回溯的条件:造成回溯的条件:文法中,对
10、于某个非终结符号的规则其右部文法中,对于某个非终结符号的规则其右部 有多个选择,并根据所面临的输入符号不能准确有多个选择,并根据所面临的输入符号不能准确 的确定所要选择时,就可能出现回溯。的确定所要选择时,就可能出现回溯。回溯带来的问题:回溯带来的问题:严重的效率低,只有在理论上的意义而无实际意义严重的效率低,只有在理论上的意义而无实际意义U:=1|2|3 左递归左递归:文法中存在存在某个AVn,有A A。直接左递归直接左递归:有产生式A A间接左递归间接左递归:例2:设有文法G(E):(1)E E+T|T (2)T T*F|F (3)F (E)|i现有输入串i*i+i,分析过程是:EE+TE
11、+TE+T失败:对左递归文法使用失败:对左递归文法使用最左推导,出现死循环。最左推导,出现死循环。思考:产生左递归的原因?问题问题2:左递归:左递归真正原因是:文法的产生式有问题。结论结论1.左递归和回溯问题的产生直接与描述语言的文法有关2.应该改造文法,使其不含左递归和回溯,才能进行确定的自顶向下分析4.3 问题的解决方法问题的解决方法v消除左递归消除左递归v消除回溯消除回溯4.3.1 消除左递归消除左递归(1)(1)直接左递归的消除:直接左递归的消除:假定产生式为:PP|PP|,将其替换为形式等价的产生式组:例2:文法 E E+T|T T T*F|F F(E)|i消去左递归后为:T FTT
12、*FT|PP P P E TEE+TE|F (E)|iv证明的关键步骤:证明的关键步骤:P-P|P-|P-(|)P-P,P-|P-P,P-|P 一般而言,若产生式形式为:一般而言,若产生式形式为:AAA1 1|A|A2 2|A|An n|1 1|2 2|m m 将其替换为:将其替换为:A1 B|2 B|m BB1 B|2 B|n B|练练 习习v消去文法GS的左递归S(T)|a+S|aT T,S|SS (T)|a+S|aT STT ,ST|答案:例:给定间接左递归文法,请消除左递归 1)1)代入代入 2)2)消除直接左递归消除直接左递归S Qc|cQ Rb|bR Sa|a解:第解:第1步步:为
13、R、S、Q排序 第第2步步:代入:将R代入Q,Q代入S,得到新的文 法产生式组:R Sa|a Q Sab|ab|b S Sabc|abc|bc|c 第第3步步:消去S的直接左递归,得到S abcS|bcS|cSS abcS|(2)(2)间接左递归的消除方法间接左递归的消除方法v方法方法是是:反复“提取公共左因子提取公共左因子”,使得文法的每个非终结符号的各个候选式的首终结符集两两不相交,来避免回溯。设产生式为设产生式为:A1 1|2 2|n n AAA 1|2|n替换为:4.3.2消除回溯消除回溯v例3:有如下两个产生式:if E then S1 else S2;if E then S1;提取
14、左因子后:if E then S1 B;B else S2|;练习练习v提取下述文法的左因子S (T)|a+S|aT ST T ,ST|S (T)|aS S +S|T STT ,ST|S答案:问题问题:如果希望没有回溯,对文法如果希望没有回溯,对文法有什么要求?有什么要求?v回溯产生的真正原因真正原因是:某非终结符对应多个侯选式,它们右部的第一个终结符相同,从而导致语法分析器选择了错误的侯选式。v如果希望没有回溯,对文法有什么要求?对不含左递归的文法G,对某非终结符的侯选式侯选式:First()=a|a,aVT 若 ,则 First()*4.4.1 4.4.1 侯选式的首终结符集的定义侯选式的
15、首终结符集的定义即,由该候选式推导出的所有符号串中的第一个终结符的集合。4.4 LL(1)文法文法例:对右边的文法G,每个候选式的First集为:SApAa|AcAAa aAFirst(Ap)=a,c,pFirst(a)=aFirst()=First(cA)=cFirst(aA)=a解:解:SApSBqAaAcABbBdB 练习:练习:求给定文法的每个候选式的First集First(S1)=First(Ap)a,c First(S2)=First(Bq)=b,d First(A1)=aFirst(A2)=cFirst(B1)=bFirst(B2)=d解:解:(1)S xAy(2)A =|v在右
16、边给定的文法中,A的候选式有两个,其首终结符集为:First(A1)=First(A2)=相交,就会产生回溯 因此,因此,只要存在某个非终结符的多个候选式的的多个候选式的首终结符集相交首终结符集相交,就会在推导的某时刻产生回溯。从而导致语法分析器选择了错误的侯选式。v因此,不产生回溯的条件不产生回溯的条件就是:对非终结符A的任意两个不同的侯选式ai 和aj,都有:First(ai)FirstFirstFirstFirst(aj)=v当要求用A进行匹配时,就能根据所面临的输入字符,准确地选取一个A的侯选式。32323232例子例子设有文法设有文法GS:S-Aa|BbA-d|cAB-b|aB对对S
17、:FIRST(Aa)=d,c,FIRST(Bb)=a,b,FIRST(Aa)FIRST(Bb)=对对A:FIRST(d)=d,FIRST(CA)=c,FIRST(d)FIRST(Ca)=对对B:FIRST(b)=b,FIRST(aB)=a,FIRST(b)FIRST(aB)=若给定若给定 w=abb则自顶而下分析对应的推导为则自顶而下分析对应的推导为:S=Bb=aBb=abb求非终结符求非终结符A A的的FirstFirst集的算法集的算法 求某一非终结符A的首终结符集First(A)的算法为:v1.若有产生式Aa,aVT,把a加到First(A)中;v2.若有产生式A,把加到First(A)
18、中;v3.若有产生式AX,XVN,把First(X)中非元素加到First(A)中;v4.若有产生式AX1X2X3.Xk,其中X1X2.XkVN。则当X1X2X3.Xi=(1ik)时,把First(Xi+1.Xk)的非元素加到 First(A)中;当X1X2X3.Xk=时,把First()加入First(A)中v5.重复执行上述过程,直到First(A)不再增大*SApSBqAaAcABbBdB 例:用算法求下述文法的每个非终结符的First集First(A)=a,cFirst(B)=b,dFirst(S)=First(A)First(B)=a,c,b,d 解解:vE TEE +TEE T F
19、TT *FTT F (E)F i First(F)=(,i First(T)=*,First(E)=+,First(T)=First(F)=(,i First(E)=First(T)=(,i 练练 习习求下列文法的每个非终结符的First集 是否满足:没有左递归,每个侯选式的首终结符集不相交这两个条件,就一定能进行有效的自顶向下分析呢?思考题思考题确定的自上而下的分析v举例1:对于文法G1S:SpA SqB AcAd Aa对输入串pccadd,自上而下的推导过程是:S=pA=pcAd=pccAdd=pccadd对应的分析树:v例2:对于文法G2S:SAp SBqAa AcA Bb BdB输入串
20、ccap,自上而下的推导过程是:S=Ap=cAp=ccAp=ccap4.4.2 4.4.2 后随符号集的定义后随符号集的定义v假定S是文法的开始符号,对于 AN N:Follow(AFollow(A)=a|S)=a|SAaAa,aaT T 特别,若 S SAA,则,则,#FOLLOW(A)FOLLOW(A)v当非终结符A面临a时,a不属于A的任何侯选首终结符集,但A的某个候选首终结符集中含,只有当a FOLLOW(A)FOLLOW(A)时才能自动进行匹配。*注:注:FOLLOW集合中不能有集合中不能有v对右边给定的文法,求A的后随符号集follow(A)SApAa|AcAAa aAfollow
21、(A)=p求非终结符求非终结符A A的的FollowFollow集的算法集的算法 1.1.如果如果A A是开始符号,是开始符号,Follow(AFollow(A)2.2.若有产生式若有产生式B BAa,aAa,aVVT T,则则把把a a加入到加入到Follow(AFollow(A)中;中;3.3.若有产生式若有产生式B BAXAX,X XVVN N,则则把把First(XFirst(X)中非中非元素加入元素加入Follow(AFollow(A)中;中;4.4.若若B BAA 或或 B BAA,=,则则把把Follow(BFollow(B)加入到加入到Follow(AFollow(A)中;中;
22、5.5.连续使用上述规则,直到连续使用上述规则,直到Follow(AFollow(A)不再增大。不再增大。*例:求下题的Follow集 SApSBqAaAcABbBdB 解:Follow(S)=#Follow(A)=p Follow(B)=q规则1规则2规则2练练 习习1.E TE2.E +TE3.E 4.T FT5.T *FT6.T 7.F(E)8.F i follow(E)=#,)follow(E)=follow(E)=#,)follow(T)=(first(E)-)follow(E)=#,),+follow(T)=follow(T)=#,),+follow(F)=(first(T)-)f
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 自上而下 语法分析
限制150内