形式语言与自动机语言及文法幻灯片.ppt
《形式语言与自动机语言及文法幻灯片.ppt》由会员分享,可在线阅读,更多相关《形式语言与自动机语言及文法幻灯片.ppt(47页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、形式语言与自动机语言及文法College of Computer Science&Technology,BUPT第1页,共47页,编辑于2022年,星期六College of Computer Science&Technology,BUPT引言n复习:复习:n什么是形式语言?什么是文法?什么是自动机?n形式语言的定义方式?n研究形式语言与自动机的意义?n问题的提出?本章关注问题的提出?本章关注 语言与文法语言与文法n如何描述(产生)左右括号匹配的语言?n如何描述(产生)数学表达式?第2页,共47页,编辑于2022年,星期六College of Computer Science&Technolo
2、gy,BUPT引言n知识点:知识点:n形式语言所研究的问题:产生语言,根据语言中的基本句子和其它句子的形成“规则”,得到(产生)语言所包含的所有句子。第3页,共47页,编辑于2022年,星期六College of Computer Science&Technology,BUPT第一节第一节 语言的定义与运算语言的定义与运算一、一、语言的一些术语:语言的一些术语:n 字母表:字符的有限集合,记为T。n字符串:由字母表T中的字符构成的序列称字母表T上的字符串(句子)。n 常记为u,v,w,x,y,z;n 常用a,b,c,d 标识单个字符。第4页,共47页,编辑于2022年,星期六College o
3、f Computer Science&Technology,BUPT字字 母母 表表 (AlphabetAlphabet)概念概念 形式符号的集合形式符号的集合 记号记号 常用常用 T、表示表示 举例举例-英文字母表英文字母表 a,b,z,A,B,Z -英文标点符号表英文标点符号表 ,;:.?!“”()-汉字表汉字表 ,自自,动动,机机,-化学元素表化学元素表 H,He,Li,-T=a,n,y,任任,意意 第5页,共47页,编辑于2022年,星期六College of Computer Science&Technology,BUPT字字 符符 串串 (stringstring)概念概念 字母表
4、字母表 T 上的一个上的一个字符串字符串(简称(简称串串),或称为),或称为 字字(word),为),为 T 中字符构成的一个有限序列。中字符构成的一个有限序列。空串空串(empty string),用用 表示,不包含任何表示,不包含任何 字符。字符。举例举例 设设 T=a,b ,则,则 ,a,ba,bbaba 等都是串等都是串 字符串字符串 w 的的长度长度,记为,记为 w ,是包含在,是包含在 w 中字符的个数中字符的个数 举例举例 =0,bbaba =5 ai 表示含有表示含有i个个a的字符串的字符串 第6页,共47页,编辑于2022年,星期六College of Computer Sc
5、ience&Technology,BUPT 连接(连接(concatenation)设设 x,y为串为串,且且 x a1a2 am,y b1b2 bn,则则 x 与与 y 的连接的连接 x y a1a2 am b1b2 bn 连接运算的性质连接运算的性质 -(x y)z x(y z)-x x x-x y x+y 关关 于于 字字 符符 串串 的的 运运 算算第7页,共47页,编辑于2022年,星期六College of Computer Science&Technology,BUPT 其它其它 如如 取头字符取头字符,取尾部取尾部,子串匹配子串匹配 等等n 设设1,2,3是字母表是字母表T上的
6、字符串,称:上的字符串,称:n1是字符串是字符串12的的前缀前缀,n2是字符串是字符串12的的后缀后缀,n2是字符串是字符串123的的子串子串。n 空串是任何字符串的前缀,后缀及子串。空串是任何字符串的前缀,后缀及子串。n 例例:abc的前缀的前缀 a ab abc.后缀后缀 c bc abc.子串子串 a b c ab bc abc ,即一个字符串可以看作是多个字符串的连接。即一个字符串可以看作是多个字符串的连接。关关 于于 字字 符符 串串 的的 运运 算算第8页,共47页,编辑于2022年,星期六College of Computer Science&Technology,BUPTn 字
7、符串字符串的逆用的逆用 表示。表示。是字符是字符串串的倒置。的倒置。=b1b2bn =bnbn-1b2b1n 空串空串的逆还是的逆还是第9页,共47页,编辑于2022年,星期六College of Computer Science&Technology,BUPT字字 母母 表表 的的 幂幂 运运 算算 幂运算幂运算 Tn 用来表示用来表示 该字母表长度为该字母表长度为n的所有串的集合。的所有串的集合。设设 T 为字母表,为字母表,n 为任意自然数,为任意自然数,定义(定义(1)T0=(2)设)设 x Tn-1,a T,则则a x Tn (3)Tn 中的元素只能由(中的元素只能由(1)和)和(2
8、)生成)生成 闭包闭包 T*=T0 T1 T2 闭包闭包 T+=T1 T2 T3 T*=T+,T+=T*第10页,共47页,编辑于2022年,星期六College of Computer Science&Technology,BUPT闭包的物理意义闭包的物理意义 T的星号闭包的星号闭包T*:字母表T上的所有字符串和空串的集合。T的正闭包的正闭包T+:字母表T上的所有字符串构成的集合。T*=T+举例举例 设设 T=0,1 ,则,则 T0=,T1=0,1 ,T2=00,01,10,11 ,T*=,0,1,00,01,10,11,T+=0,1,00,01,10,11,第11页,共47页,编辑于202
9、2年,星期六College of Computer Science&Technology,BUPT 概念概念 设设 T 为字母表,则任何集合为字母表,则任何集合 L T*是是字母表字母表T上的上的一个语言(一个语言(language)。)。隐含的概念:如何表述子集的隐含的概念:如何表述子集的“特性和规则特性和规则”,举例举例-左右括号的匹配。左右括号的匹配。-英文单词集英文单词集 ,English,words,-C 语言程序集语言程序集 字母表?字母表?-汉语成语集汉语成语集 ,马到成功马到成功,-化学分子式集化学分子式集 ,H2O,NaCl,-any,任意任意 语 言(Languages)第
10、12页,共47页,编辑于2022年,星期六College of Computer Science&Technology,BUPT语 言(Languages)举例举例:设:设T=a,b 则则 L1 =anbn|n1 L3=bk|k 是质数是质数 L2 =只有一个空句子的语言只有一个空句子的语言 L4=空语言空语言 均为字母表均为字母表T上的语言。上的语言。由语言的定义知语言是集合,对于集合的运算可应用由语言的定义知语言是集合,对于集合的运算可应用于对于语言的计算。如并,交,补,差。于对于语言的计算。如并,交,补,差。第13页,共47页,编辑于2022年,星期六College of Compute
11、r Science&Technology,BUPT语言的基本运算 语言的积:语言的积:两个语言L1 和L2的积L1 L2是由L1和L2中的字符串连接所构成的字符串的集合。即L1中所有字符串分别与L2中的字符串连接得到的集合。设T=a,b,L1和 L2是T上的语言。L1=ab,ba L2=aa,bb则 L1 L2=abaa,abbb,baaa,babb L2 L1=aaab,aaba,bbab,bbban L1 L2 L2 L1 语言的积不可交换。语言的积不可交换。第14页,共47页,编辑于2022年,星期六College of Computer Science&Technology,BUPT语
12、言的基本运算 语言的幂:语言的幂:语言的幂可归纳定义如下语言的幂可归纳定义如下:L0=Ln=L Ln-1=Ln-1 L n 1上例中,上例中,L12=abab,abba,baab,baba L22=aaaa,aabb,bbaa,bbbb 第15页,共47页,编辑于2022年,星期六College of Computer Science&Technology,BUPT语言举例例例1:括号匹配的语言及产生:括号匹配的语言及产生该语言指所有左右括号相匹配的字符串如何“产生”这个语言?规则?递归定义提供了集合的定义方式。构造规律。1.基础:定义该集合的最基本的元素,“()”2.递归:若S是合法串,则:
13、(S)是合法串;SS 是合法串;第16页,共47页,编辑于2022年,星期六College of Computer Science&Technology,BUPT语言举例例例2:程序设计语言中算数表达式的语言:程序设计语言中算数表达式的语言运算符运算符A:+、-、*、/利用递归定义方式。重点是构造规律。1.基础:单个变量是最基本的串,i,2.递归:若S是合法串,则:SAS 是合法串;(S)是合法串;第17页,共47页,编辑于2022年,星期六College of Computer Science&Technology,BUPT语言举例例例3:标识符语言及产生:标识符语言及产生该语言指所有字母开
14、头后接字母或数字的字符串如何“产生”这个语言?规则?递归定义提供了集合的定义方式。构造规律。1.基础:单个字母是最基本的元素,2.递归:若S是合法串,则:SL 是合法串;SD 是合法串;L:字母;D:数字。第18页,共47页,编辑于2022年,星期六College of Computer Science&Technology,BUPT第二节 文法本节提纲本节提纲1.文法的作用文法的作用2.文法的形式定义文法的形式定义3.推导与句型推导与句型4.文法产生语言文法产生语言第19页,共47页,编辑于2022年,星期六College of Computer Science&Technology,BUP
15、T2.1 文法的作用n定义:所谓文法是用来定义语言的一个数学模型:所谓文法是用来定义语言的一个数学模型n表示语言的方法:n若语言L是有限集合,可用列举法n若L是无限集合(集合中的每个元素有限长度),用其他方法。n方法一:文法产生系统,由定义的文法规则产生出语言的每个句子n方法二:机器识别系统:当一个字符串能被一个语言的识别系统接受,则这个字符串是该语言的一个句子,否则不属于该语言。第20页,共47页,编辑于2022年,星期六College of Computer Science&Technology,BUPT2.12.1文法的作用文法的作用-元语言元语言n元语言定义元语言定义:描述语言的语言描
16、述语言的语言例如:各种各样的程序设计语言n当当人人们们要要解解释释或或讨讨论论程程序序设设计计语语言言本本身身时时,又又需需要要一一种种语语言言,被被讨讨论论的的语语言言叫叫做做对对象象语语言言,即即某某种种程程序序设设计计语语言言,讨讨论论对对象象语语言言的的语言称为元语言语言称为元语言。第21页,共47页,编辑于2022年,星期六College of Computer Science&Technology,BUPTBNFBNF(巴科斯范式)(巴科斯范式)BNF范式通常被作为讨论某种程序设计语言语法的元语言n:=0|1|2|9 :=“定义为”n:=A|B|C|Z|a|b|z :=|.n通过上
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 形式语言 自动机 语言 文法 幻灯片
限制150内