概述语言信息处理自然语言理解.ppt
《概述语言信息处理自然语言理解.ppt》由会员分享,可在线阅读,更多相关《概述语言信息处理自然语言理解.ppt(41页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、概述(语言信息处理&自然语言理解)2009-2010学年For 对外汉语方向本科生n甲:听说吴妈打赢了阿Q。n乙:不错,阿Q确实被吴妈打败了。n甲:这个结果有些出人意料。n乙:阿Q是大意失荆州,怪不得别人。n昆仑军分区歌舞团长途跋涉来我部慰问演出n这像是方红画的n人用来交际的人用来交际的“语言语言”具有什么样的性质?具有什么样的性质?n人用来交际的人用来交际的“语言语言”和机器可以理解的语言有什么样的关系?和机器可以理解的语言有什么样的关系?n人是如何运用人是如何运用“语言语言”进行交际的?进行交际的?n人运用人运用“语言语言”进行交际的进行交际的“过程过程”是否可以描述为一个是否可以描述为一
2、个“机械的过程机械的过程”?n什么叫做什么叫做“理解理解”一种语言?一种语言?n如何从如何从“内在的交际意图内在的交际意图”到到“外显的语言表达外显的语言表达”?n对外经贸大学中文学院.对外汉语释名n自然语言自然语言(NaturalLanguage)一种语言,其规则是根据当前流行的用法而不是用明确的形式规定的。自然语言是没有经过加工的或人为干预的语言。n人造语言人造语言(Ruledlanguage)一种语言,其规则在使用前已经明确地规定了。是一种由人为某些特定目的而创造的语言。n语言信息处理语言信息处理自然语言理解自然语言理解自然语言处理自然语言处理人类人类语言技术语言技术计算语言学计算语言学
3、对外经贸大学中文学院.对外汉语释名n计算语言学计算语言学(ComputationalLinguistics)计算语言学是利用电子数字计算机进行的语言分析。虽然许多其他类型的语言分析也可以运用计算机,计算分析最常用于处理基本的语言数据例如建立语音、词、词元素的搭配以及统计它们的频率。(大不列颠百科全书)计算语言学指的是这样一门学科,它通过建立形式化的数学模型来分析、处理自然语言,并在计算机上用程序来实现分析和处理的过程,从而达到以机器来模拟人的全部或者部分语言能力的目的。n人类语言技术人类语言技术(HumanLanguageTechnology,HLT)所有围绕人类语言(而非动物语言或形式语言)
4、所开展的处理技术的研究。对外经贸大学中文学院.对外汉语释名n自然语言理解自然语言理解(NaturalLanguageUnderstanding,NLU)人工智能的分支学科。研究用电子计算机模拟人的语言交际过程,使计算机能理解和运用人类社会的自然语言如汉语、英语等,实现人机之间的自然语言通信,以代替人的部分脑力劳动,包括查询资料、解答问题、摘录文献、汇编资料以及一切有关自然语言信息的加工处理。n自然语言处理自然语言处理(NaturalLanguageProcessing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。实现
5、人机间自然语言通信意味着要使计算机既能理解自然语言文本的意义,也能以自然语言文本来表达给定的意图、思想等。前者称为自然语言理解,后者称为自然语言生成。对外经贸大学中文学院.对外汉语释名n语言信息处理语言信息处理(LanguageInformationProcessing,LIP)是指用计算机对自然语言的音、形、义等信息进行处理。即对字、词、句、篇章的输入、输出、识别、分析、理解、生成等的操作与加工。语言信息处理是一门边缘学科,也是一门交叉学科。它综合了语言学、逻辑学、心理语言学、计算机科学、哲学、人工智能、数学和统计学的研究成果,将它们运用于计算机的语言分析和处理。对外经贸大学中文学院.对外汉
6、语参考文献n自然语言的计算机处理冯志伟上海外语教育出版社n应用语言学刘涌泉湖南教育出版社n汉语计算语言学吴蔚天罗建林电子工业出版社n人工智能原理石纯一清华大学出版社n现代汉语语法信息详解词典俞士汶清华大学出版社n自然语言理解姚天顺清华大学出版社n信息处理用现代汉语分词规范及自动分词方法刘源等,清华大学出版社n计算语言学概论翁富良等中国社会科学出版社n当代西方语法理论俞如珍上海外语教育出版社n语言文字应用,1992年至今各期对外经贸大学中文学院.对外汉语n中文信息处理,傅永和,广东教育出版社n应用语言学综论,冯志伟,广东教育出版社n语料库语言学,黄昌宁,商务印书馆n计算语言学探索,冯志伟,黑龙江
7、教育出版社n计算语言学基础,刘颖,清华大学出版社n计算语言概论,俞士汶主编,商务印书馆n语言文字的信息处理,盛炎n中文信息处理若干重要问题,徐波等,科学出版社nNaturalLanguageUnderstanding,JamesAllen,nFoundationsofStatisticalNaturalLanguageProcessing,ChristopherD.Manning,HinrichSchutze对外经贸大学中文学院.对外汉语n语言信息处理领域主要学术会议及活动语言信息处理领域主要学术会议及活动ACL(AssociationforComputationalLinguistics)美
8、国计算语言学会COLING(InternationalConferenceonComputationalLinguistics)国际计算语言学会议TREC(TextREtrievalConference)CNCCL(全国计算语言学联合学术会议)附件:HLTwebs.html对外经贸大学中文学院.对外汉语考试方式n平时成绩(30%)=课堂作业+课下作业+出勤n期中考试(20%):课程报告(研究报告或读书报告)n期末考试(50%):以填空、名词解释、简答和论述为主对外经贸大学中文学院.对外汉语对外经贸大学中文学院.对外汉语本章内容n语言信息处理的方向n语言信息处理的对象n语言信息处理的学科定位n语
9、言信息处理的目标n语言信息的理解处理所需的知识n自然语言处理的根本问题n语言理解处理系统的评价n自然语言处理的研究方法n自然语言处理的发展历史n自然语言处理系统的总体构成对外经贸大学中文学院.对外汉语语言信息处理的方向n分析(理解)analyze,understandn生成(表达)generateorproduce,express实现人机交互意味着要使计算机既能理解自然语言文本的意义,也能以自然语言文本来表达给定的意图、思想等。后者称为自然语言生成。“矮墙和低墙”对外经贸大学中文学院.对外汉语语言信息处理的对象n文本(文字流)text书面理解用文字输入,使计算机“看懂”文字符号,也用文字输出应
10、答。将文字输入计算机计算机识别和理解文字、词、短语、句子、段落和篇章按指定的目标作出相应的回答或反映n话语(语音流)speech语音理解用口语语音输入,使计算机“听懂”语音信号,用文字或语音合成输出应答。用口语对计算机讲话计算机识别语音输入,把语音流变换为文字流然后按书面语理解最后利用语音合成将回答转换成声音输出对外经贸大学中文学院.对外汉语语言信息处理的学科定位n交叉学科:语言学、计算机科学、认知科学、数学、哲学和逻辑学计算机对自然语言的处理一般应经过三个方面:形式化编写算法程序实现对外经贸大学中文学院.对外汉语n人工智能的分支AI,ArtificialIntelligenceNLU是人工智
11、能的重要内容。自然语言的信息处理是跟计算机的诞生几乎同时开始的一个多学科交叉研究领域。来自计算机科学、语言学、数学等不同学科的研究人员构成了目前这一领域的主要研究力量。随着计算机应用的日益普及,其功能也从主要是数值计算发展到以非数值信息处理为主。因此,语言信息处理处于文科、理科和工科的交叉点上,是建立在语言学、数学和计算机科学这三门学科基础上的边缘性学科。对外经贸大学中文学院.对外汉语语言信息处理的目标语言信息处理的目标-理解的定理解的定义义n最终目标:让电脑像人一样理解语言n“目前学界对于理解的理解、有关概念的概念、赋予语义的语义、界定知识的知识都可能是各不相同甚或互不搭界的。”(张普)符号
12、学人工智能认为:“理解”即是表示,理解的过程关注的是表示的构造和使用Fillmore(格语法)认为:理解一个概念决定于我们拥有的背景环境和这个概念本身的背景框架原型匹配的程度Schank(概念依存理论)认为:“理解”是在概念空间中,但不仅仅是一个被动的操作过程,而部分的受我们预期的驱使。对外经贸大学中文学院.对外汉语关于理解的不同定义n关于自然语言理解,至今尚无一致的、各方可以接受的定义自然语言的复杂性n多义性、上下文有关性、模糊性、非系统性和环境密切相关性、涉及的知识面广与应用目标相关微观与宏观角度不一n从微观上讲,自然语言理解是指从自然语言到机器内部的一个映射n从宏观上看,自然语言是指机器
13、能够执行人类所期望的某些语言功能对外经贸大学中文学院.对外汉语语言信息处理的目标语言信息处理的目标-理解的标理解的标准准n聊天机器人是否具有聊天机器人是否具有AI?接收信息分析特征字检索数据库反馈相应信息n图灵测验图灵测验让一个正常人和电脑分别回答实验者的问题,如果实验者无法分辨出来哪个是人的回答,哪个是机器的回答,那么这台电脑就具有AI。对外经贸大学中文学院.对外汉语语言信息处理的目标语言信息处理的目标-理解的标理解的标准准n对图灵测验的质疑中国屋试验美国哲学家约翰塞尔n语言理解能力的功能定义美国认知心理学家G.M.Olson提出语言理解的四条标志:(1)能成功地回答输入语料中的有关问题:答
14、问(2)在接受一批语料之后,有就此给出摘要的能力:摘要(3)能用不同的词语复述所输入的语料:复述(4)有从一种语言转译成另一种语言的能力:翻译对外经贸大学中文学院.对外汉语语言信息处理的目标语言信息处理的目标-理解的标理解的标准准n理解能力的判定让计算机具有针对自然语言的分析理解与生成表达分析理解与生成表达能力,是自然语言理解/处理的目标。n判定一个自然语言处理系统是否具有理解能力,主要依据两点是否从意义上去处理自然语言处理结果是否正确无误。对外经贸大学中文学院.对外汉语语言信息的理解处理所需的知识语言信息的理解处理所需的知识n要让计算机具有这种能力,就需要从语言学知识角度出发构造关于语言理解
15、和生成的计算模型,并且这些模型还要在特定领域背景下表现良好。n语言学知识:从语言构成角度:词汇、短语、句子、段落、篇章等从语言特征角度:对外经贸大学中文学院.对外汉语语言信息的理解处理所需的知识语言信息的理解处理所需的知识n语音知识语音知识(Phoneticandphonologicalknowledge):研究词语与其发音如何关联。这种知识对于基于语音的系统是至关重要的。n词法知识词法知识(Morphologicalknowledge):包括词语形态学知识,研究词语如何由被称为词素的更基本的意义单位构成。n句法知识句法知识(Syntacticknowledge):研究词语是如何排列以组成正确
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概述 语言 信息处理 自然语言 理解
限制150内