自然语言处理复习课程.ppt
《自然语言处理复习课程.ppt》由会员分享,可在线阅读,更多相关《自然语言处理复习课程.ppt(17页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、自然语言处理 其主要任务是要找出词汇的各个词素,从中获得语言学信息,并确定单词其主要任务是要找出词汇的各个词素,从中获得语言学信息,并确定单词的词义。以英语为例,其词法分析的基本算法如下:的词义。以英语为例,其词法分析的基本算法如下:repeat look for word in dictionary if not found then modify the word until word is found or no further modification possible其中,其中,word是一个变量,其初始值就是当前词。是一个变量,其初始值就是当前词。例例8.1 用上述算法分析用上述算
2、法分析catches。解:其分析过程如下:解:其分析过程如下:catches 词典中查不到词典中查不到 catche 修改修改1:去掉:去掉s catch 修改修改2:去掉:去掉e 可以看出,在修改可以看出,在修改2时就查到了时就查到了catch。当然,这只是一个很简单的例子,。当然,这只是一个很简单的例子,完整的词法分析还应该包括复合词的切分等。完整的词法分析还应该包括复合词的切分等。8.2 词法分析词法分析28.3 句法分析句法分析 句法分析是对句子和短语的结构进行分析,其最大单位是一个句子。分析句法分析是对句子和短语的结构进行分析,其最大单位是一个句子。分析的目的是要找出词、短语等的相互
3、关系,以及他们在句子中的作用等,并用的目的是要找出词、短语等的相互关系,以及他们在句子中的作用等,并用一种层次结构加以表达。这种层次结构可以是句子的成分关系、,也可以是一种层次结构加以表达。这种层次结构可以是句子的成分关系、,也可以是语法功能关系。语法功能关系。8.3.1 句法规则的表示方法句法规则的表示方法8.3.2 自顶向下与自底向上分析自顶向下与自底向上分析38.3.1 句法规则的表示方法句法规则的表示方法句子结构的表示句子结构的表示 一个句子是由各种不同的句子成分组成的。这些成分可以是单词、词组或一个句子是由各种不同的句子成分组成的。这些成分可以是单词、词组或从句。句子成分还可以按其作
4、用分为主语、谓语、宾语、宾语补语、定语、从句。句子成分还可以按其作用分为主语、谓语、宾语、宾语补语、定语、状语、表语等。这种关系可用一棵树来表示,如对句子:状语、表语等。这种关系可用一棵树来表示,如对句子:He wrote a book可用图可用图8.2所示的树形结构来表示所示的树形结构来表示 一个句子又是由若干个词类构成的,如名词、动词、代词、形容词等。若一个句子又是由若干个词类构成的,如名词、动词、代词、形容词等。若从句子的词类来考虑,一个句子也可用一棵树来表示,这种树称为句子的分从句子的词类来考虑,一个句子也可用一棵树来表示,这种树称为句子的分析树,如图析树,如图8.3所示。所示。句子句
5、子主语主语谓语谓语动词动词宾语宾语Hewroteabook句子句子代词代词动词短语动词短语动词动词名词短语名词短语Hewroteabook4 上下文无关文法上下文无关文法(Context-free Grammars)是乔姆斯基提出的一种对自然是乔姆斯基提出的一种对自然语言语法知识进行形式化描述的方法。在这种文法中,语法知识是用重写规语言语法知识进行形式化描述的方法。在这种文法中,语法知识是用重写规则则表示的。作为例子,下面给出了一个表示的。作为例子,下面给出了一个英语的很小的子集(图英语的很小的子集(图8.4)。)。语句语句 句子句子 终标符终标符 句子句子 名词短语名词短语 动词短语动词短语
6、 动词短语动词短语 动词动词 名词短语名词短语 名词短语名词短语 冠词冠词 名词名词 名词短语名词短语 专用名词专用名词 冠词冠词 the 名词名词 professor 动词动词 wrote 名词名词 book 动词动词 trains 专用名词专用名词 Jack 终标符终标符.这就是一个英语子集的上下文无关文法这就是一个英语子集的上下文无关文法 在该文法中,在该文法中,“语句语句”是一个特殊的非终极符,称为起始符。是一个特殊的非终极符,称为起始符。8.3.1 句法规则的表示方法句法规则的表示方法上下文无关文法上下文无关文法(1/2)58.3.1 句法规则的表示方法句法规则的表示方法上下文无关文
7、法上下文无关文法(2/2)例例8.2 利用上述上下文无关文法,给出如下语句的分析树。利用上述上下文无关文法,给出如下语句的分析树。The professor trains Jack.语句语句句子句子终标符终标符动词短语动词短语名词短语名词短语Theprofessor.trains冠词冠词名词名词动词动词专用名词专用名词名词短语名词短语Jack解:解:如图如图8.568.3.1 句法规则的表示方法句法规则的表示方法变换文法变换文法(1/2)上下文无关文法反映的仅是一个句子本身的层次结构和生成过程,而自然上下文无关文法反映的仅是一个句子本身的层次结构和生成过程,而自然语言是上下文有关的。为此,乔姆
8、斯基又提出了变换文法语言是上下文有关的。为此,乔姆斯基又提出了变换文法(Transformational Grammar)。该文法认为,句子的结构有深层和表层两个层次。例如:。该文法认为,句子的结构有深层和表层两个层次。例如:She read me a story 和和 She read a story to me的表层结构不一样,但它们的深层结构则是一样的。再如,主动句和被动句的表层结构不一样,但它们的深层结构则是一样的。再如,主动句和被动句也只是表层结构不同,其深层结构则是相同的。也只是表层结构不同,其深层结构则是相同的。在变换文法中,句子深层结构和表层结构之间的变换是通过变换规则实现在变
9、换文法中,句子深层结构和表层结构之间的变换是通过变换规则实现的,如图的,如图8.6给出了一条把主动句变换为被动句的变换规则。给出了一条把主动句变换为被动句的变换规则。句子句子介词短语介词短语1句子句子名词短语名词短语1动词短语动词短语动词动词名词短语名词短语2名词短语名词短语2动词被动语态动词被动语态动词动词介词介词动词的过去分词动词的过去分词名词短语名词短语1句子句子介词短语介词短语句子句子名词短语名词短语1动词短语动词短语动词动词名词短语名词短语2名词短语名词短语2动词被动语态动词被动语态78.3.1 句法规则的表示方法句法规则的表示方法变换文法变换文法(2/2)助动词助动词介词介词动词的
10、过去分词动词的过去分词名词短语名词短语1句子句子介词短语介词短语句子句子名词短语名词短语1动词短语动词短语动词动词名词短语名词短语2名词短语名词短语2动词被动语态动词被动语态冠词冠词名词名词专用名词专用名词上下文无上下文无关文法关文法变换规则变换规则冠词冠词名词名词TheprofessorJacktrainsJack专用名词专用名词istrainedbytheprofessorprofessor 例例8.3 利用变换文法,将前述主动句变为被动句。利用变换文法,将前述主动句变为被动句。解:解:其变换过程是:先从非终极符其变换过程是:先从非终极符“句子句子”开始产生一个主动句:开始产生一个主动句:
11、The professor trains Jack然后再应用图然后再应用图8.6所示的变换规则把它变为被动句所示的变换规则把它变为被动句(图图8.6):Jack is trained by the professor动词动词冠词冠词名词名词Theprofessor名词短语名词短语2专用名词专用名词trains动词动词冠词冠词名词名词TheprofessorJack名词短语名词短语2专用名词专用名词trains动词动词冠词冠词名词名词Theprofessor88.3.2 自顶向下与自底向上分析自顶向下与自底向上分析自顶向下分析法自顶向下分析法 自顶向下分析,是指从起始符开始应用文法规则,一层一层
12、地向下产生分析树的各自顶向下分析,是指从起始符开始应用文法规则,一层一层地向下产生分析树的各个分支,直至生成与输入语句相匹配的完整的句子结构为止。个分支,直至生成与输入语句相匹配的完整的句子结构为止。例如,图例如,图8-4所示的上下文无关文法,采用自顶向下分析方法对语句:所示的上下文无关文法,采用自顶向下分析方法对语句:The professor trains Jack.进行分析的过程是:进行分析的过程是:首先从起始符首先从起始符“语句语句”开始,正向运用规则:开始,正向运用规则:语句语句 句子句子 终标符终标符把分析树的根节点把分析树的根节点“语句语句”替换为它的两个子节点替换为它的两个子节
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 自然语言 处理 复习 课程
限制150内