【教学课件】第二章文法和语言的基本知识.ppt





《【教学课件】第二章文法和语言的基本知识.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第二章文法和语言的基本知识.ppt(94页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章第二章 文法和语言的基本知识文法和语言的基本知识 形式语言理论是编译的重要理论基础。本章主要介绍编译理论中用到的有关形式语言理论的最基本概念最基本概念,重点介绍如何采用形式化的方法描述程序设计语言。第二章第二章 文法和语言的基本知识文法和语言的基本知识q字母表和符号串字母表和符号串q文法和语言的形式定义文法和语言的形式定义q短语、直接短语和句柄短语、直接短语和句柄q语法树和文法的二义性语法树和文法的二义性q文法和语言的分类文法和语言的分类2.0 概概 述述 对程序设计语言的描述是从语法、语义和语用三个因素来考虑。语法是对语言结构的定义。语用则是从使用的角度去描述语言。语义是描述了语言的含
2、义。2.0 概概 述述例如例如 赋值语句赋值语句s s2*3.1416*r*(r+h)2*3.1416*r*(r+h)的的 非形式化的描述为:非形式化的描述为:语法:赋值语句由一个变量,后随一个赋 值号“”,再在其后面跟一个表达式构成。语义:首先计算语句右部表达式的值,然后把所得结果送给左部变量中。语用:赋值语句可用来计算和保存表达式的值。2.0 概 述 这种非形式化的描述,不够清晰和准确,为了精确定义和描述程序设计语言,需采用形式化的方法。所谓形式化的方法,是用一整套带有严格规定的符号体系来描述问题的方法。形式语言理论是编译的重要理论基础。重点介绍如何采用形式化的方法描述程序设计语言。2.1
3、 字母表和符号串元素的非空有穷集合。例如,=a,b,c 1.字母表 根据字母表的定义,是字母表,它由a、b、c三个元素组成。2.1 字母表和符号串 是一个字母表,由0、1两个元素组成。注意:例如,=0,1 (2)字母表中的元素,可以是字母、数字或其他符号。(1)字母表中至少包含一个元素。2.1 字母表和符号串 字母表中的元素称为符号或称为字符。例如,前述例子中2.符号(字符)a、b、c 是字母表中的符号;0、1 是字母表中的符号。2.1 字母表和符号串 例如,设有字母表=a,b,c 符号的有穷序列称为符号串。符号串总是建立在某个特定字母表上的且只由字母表上的有穷多个符号组成。则有符号串 a,b
4、,ab,ba,cba,abc 3.符号串(字)2.1 字母表和符号串说明说明:不包含任何符号的符号串,称为空符号串,用表示。符号串中符号的顺序是很重要的。ab和ba是字母表上的两个不同的符号串。空符号串由0个符号组成,其长度|=0|=02.2 符号串的运算符号串的运算 设x和y是符号串,则串xy称为它们的连结。则XYABC10A,YX10AABC。注意:对任意一个符号串x,1.符号串的连结符号串的连结例如,设XABC,Y10A我们有 xxx。2.2 符号串的运算符号串的运算2.集合的乘积集合的乘积 设A和B是符号串的集合,则A和B的乘积定义为:集合的乘积是满足于 xA,yB的所有符号串 xy
5、所构成的集合。AB=xy|xA,yBA=A=A2.2 符号串的运算符号串的运算例如:设A=a,b,B=c,d 则AB=ac,ad,bc,bd 由于对任意的符号串x,总有x=x=x所以,对任意集合A,我们有:2.2 符号串的运算符号串的运算 特别指出的是,是符号串,不是集合,而表示由空符号串 所组成的集合,但这样的集合不是空集合=。2.2 符号串的运算符号串的运算 3.符号串的幂运算符号串的幂运算 设x是符号串,则x的幂运算定义为:x0=x1=x x2=xx x3=xxx xn=xx x=x xn-1(n0)n注意:x0 12.2 符号串的运算符号串的运算例如,设 xabc 则x0=x1=abc
6、x2=xx=abcabc 2.2 符号串的运算符号串的运算 4.集合的幂运算集合的幂运算 设A是符号串的集合,则集合A的幂运算定义为:A0=A1=AA2=AA An=AA A=AAn-1(n0)n2.2 符号串的运算符号串的运算例如,设A=a,b,则A0=A1=A=a,b A2=AA=aa,ab,ba,bb A3=AAA=A2A=aaa,aab,aba,abb,baa,bab,bba,bbb 2.2 符号串的运算符号串的运算5.集合集合A的正闭包的正闭包A与闭包与闭包A*设A是符号串的集合,则A的正闭包A和A的闭包A*的定义为:A+=A1A2 An A*=A0 A1A2 An=A+2.2 符号
7、串的运算符号串的运算 可见,集合A的正闭包表示A上元素a,b构成的所有符号串的集合,集合A的闭包比集合A的正闭包多含一个空符号串。例如,设A=a,b,则:A+=a,b,aa,ab,ba,bb,aaa,aab,A*=,a,b,aa,ab,ba,bb,aaa,aab,2.3 2.3 文法和语言的形式定义文法和语言的形式定义 每个形式语言都是某个字母表上按某种规则构成的所有符号串的集合。反之,任何一个字母表上符号串的集合均可定义为一个形式语言。形式语言形式语言序列的集合称为形式语言。2.3 2.3 文法和语言的形式定义文法和语言的形式定义 对每个具体语言,都有语法和语义两个方面,形式语言是指不考虑语
8、言的具体意义,即不考虑语义。2.3 2.3 文法和语言的形式定义文法和语言的形式定义形式语言的描述形式语言的描述 对形式语言的描述有两种方法,一种方法是当语言为有穷集合时,用枚举法来表示语言。2.3 2.3 文法和语言的形式定义文法和语言的形式定义 均表示字母表A上的一个形式语言。由于这三个语言均是有限符号串的集合,因此,可枚举出其全部句子来表示该语言。例如,设有字母表A=a,b,c,则L1=a,b,c L2=a,aa,ab,ac L3=c,cc 2.3 2.3 文法和语言的形式定义文法和语言的形式定义例如,设字母表=0,1,则+=123=0,1,00,10,11,01,000,100,当语言
9、为无穷集合时,用文法来描述语言。2.3 2.3 文法和语言的形式定义文法和语言的形式定义 下面用A表示+,用式子A0表示符号串0A或A生成符号串0,符号“”读作“生成”或“由组成”。则集合A可表示成:A0A1AA0AA1+=123=0,1,00,10,11,01,000,100,2.3.1 2.3.1 文法的形式定义文法的形式定义 规则是一个符号与一个符号串的有序对(A,),通常写作:A(或A)1.1.规则规则 也称产生式也称产生式 规则的作用是告诉我们如何用规则中的符号串生成语言中的序列。2.3.1 2.3.1 文法的形式定义文法的形式定义 例如,前述例中一组规则 描述的语言序列只可能是由0
10、和1组成的符号串。A0A1AA0AA12.3.1 2.3.1 文法的形式定义文法的形式定义 规则中出现的符号分为两类,一类是终结符号,另一类是非终结符号。非终结符号是出现在规则左部能派生出符号或符号串的那些符号,即每个非终结符号表示一定符号串的集合,用大写字母表示或用尖括号把非终结符号括起来。例如,上例中的A。2.3.1 2.3.1 文法的形式定义文法的形式定义 终结符号是不属于非终结符号的那些符号,它是组成语言的基本符号,是一个语言的不可再分的基本符号,通常用小写字母表示。例如,上例中的0和1。2.3.1 2.3.1 文法的形式定义文法的形式定义 规则的非空有穷集合,通常表示成四元组VN是规
11、则中非终结符号的集合。VT是规则中终结符号的集合。P 是文法规则的集合。2.文法文法G=VN,VT,P,S 2.3.1 2.3.1 文法的形式定义文法的形式定义 S 是一个非终结符号,称为文法的开始符号或文法的识别符号,它至少要在一条规则中作为左部出现。由它开始,识别出我们所定义的语言。由文法定义可知,文法是对语言结构的定义和描述,文法四大要素中关键是规则的集合。2.3.1 2.3.1 文法的形式定义文法的形式定义将它们缩写为:A1|2|nA1A2An 其中每个i有时也称为是A的一个候选式。为了书写方便,对于若干个左部相同的规则,如2.3.1 2.3.1 文法的形式定义文法的形式定义我们约定:
12、第一条规则的左部是识别符号。对文法G不用四元式显式表示,仅 只将规则写出。2.3.1 2.3.1 文法的形式定义文法的形式定义 G=(VN,VT,P,S)VN=AVT=0,1P:A 0|1|A0|A1S=A前例中描述+的文法是:2.3.1 2.3.1 文法的形式定义文法的形式定义 例1 设字母表=a,b,试设计一个文法,描述语言 L=a2n,b2n|n1 分析 设计一个文法来描述一个语言,关键是设计一组规则生成语言中的符号串。因此,为设计该语言文法,必须分析这个语言是由怎样一些符号串组成的,即首先分析语言中串的结构特征:2.3.1 2.3.1 文法的形式定义文法的形式定义当n1 L=aa,bb
13、 L=aa,bb,aaaa,bbbb,aaaaaa,bbbbbb,即语言L是由偶数个a,偶数个b这样的符号串组成的集合。L=a2n,b2n|n1当n2 L=aaaa,bbbb当n3 L=aaaaaa,bbbbbb2.3.1 2.3.1 文法的形式定义文法的形式定义因此,定义语言L的文法 G=(VN,VT,P,S)其中:VN=A,B,DVT=a,bP=Aaa S=ABaa Dbb|bbD|bb|bbD注意:VTaa,bb|aaB|aaB2.3.1 2.3.1 文法的形式定义文法的形式定义 提出问题:描述该语言的文法是否唯一呢?显然,G不同于G。由此可见,对于一个给定的语言,描述该语言的文法是不唯
14、一的。P:AB|DBaa|aBaDbb|bDb 若G和G是两个不同的文法,如果它们描述的语言相同,那么,称G和G 为等价文法。2.3.1 2.3.1 文法的形式定义文法的形式定义描述该语言的文法是否G?2.3.1 2.3.1 文法的形式定义文法的形式定义 对此例,我们提出下面这样一个问题:G=(A,a,b,P,A)P=Aaa|bb|Aaa|Abb 对于文法G来说,它所产生的有些符号串,如aabb,bbaa,不属于语言L,即设计的文法超出了所定义语言的范围。2.3.1 2.3.1 文法的形式定义文法的形式定义P=Aaa|bb|Aaa|Abb 2.3.1 2.3.1 文法的形式定义文法的形式定义
15、例2 试设计一个表示所有标识符的文法 分析 题意是用文法定义标识符,必须确定P中规则。为了设计出一组规则,首先应搞清楚集合中串的结首先应搞清楚集合中串的结构特征构特征。2.3.1 2.3.1 文法的形式定义文法的形式定义 用I代表标识符;L代表字母;D代表数字;则定义标识符的文法为:字母 字母或数字串标识符的结构可用下图表示:2.3.1 2.3.1 文法的形式定义文法的形式定义 G=(VN,VT,P,S)其中:VN=I,L,DVT=a,b,c,x,y,z,0,1,2,9P=IL S=ILa|b|c|x|y|zD0|1|2|3|9|I L|I D2.3.1 2.3.1 文法的形式定义文法的形式定
16、义 若将定义标识符的文法设计成:其中 VN,VT,S 同上 G=(VN,VT,P,S)P=IL|I DLa|b|c|x|y|zD0|1|2|3|9 2.3.1 2.3.1 文法的形式定义文法的形式定义 该文法不能定义ab,abc 仅由字母串组成的标识符,缩小了所定义语言的范围。P=IL|I DLa|b|c|x|y|zD0|1|2|3|9 2.3.1 2.3.1 文法的形式定义文法的形式定义 用I代表标识符;L代表字母;D代表数字;T代表字母数字串;则定义标识符的文法还可写为:字母 字母或数字串2.3.1 2.3.1 文法的形式定义文法的形式定义P:IL|LT TL|D|LT|DT La|b|c
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学课件 教学 课件 第二 文法 语言 基本知识

限制150内