自然语言理解-绪论.ppt
《自然语言理解-绪论.ppt》由会员分享,可在线阅读,更多相关《自然语言理解-绪论.ppt(41页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、自然语言理解上海交通大学计算机系上海交通大学计算机系陈玉泉陈玉泉联系方式联系方式n陈玉泉:陈玉泉:chen-34204406闵行电院闵行电院3-525参考文献参考文献俞士汶主编(俞士汶主编(2003)计算语言学概论计算语言学概论,商务印书馆,商务印书馆刘颖(刘颖(2002)计算语言学计算语言学,清华大学出版社,清华大学出版社James Allen(1995),Natural Language Understanding The Benjamin/Cummings Publishing Company,Inc.翁富良、王野翊(翁富良、王野翊(1998)计算语言学导论计算语言学导论,中国社会科学出
2、版社中国社会科学出版社Christopher D.Manning and Hinrich Schutze(1999),Foundations of Statistical Natural Language Processing,The MIT Press,Cambridge,Massachusetts参考文献参考文献刘开瑛、郭炳炎(刘开瑛、郭炳炎(1991)自然语言处理自然语言处理,科学出版社,科学出版社冯志伟(冯志伟(1991)数学与语言数学与语言,湖南教育出版社,湖南教育出版社冯志伟(冯志伟(1995)自然语言机器翻译新论自然语言机器翻译新论,语文出版社,语文出版社1995年版。年版。姚天
3、顺等(姚天顺等(1995)自然语言理解自然语言理解一种让机器懂得人一种让机器懂得人类语言的研究类语言的研究,清华大学出版社、广西科学技术出版社,清华大学出版社、广西科学技术出版社冯志伟(冯志伟(1997)自然语言的计算机处理自然语言的计算机处理,上海外语教,上海外语教育出版社育出版社俞士汶等(俞士汶等(1998)现代汉语语法信息词典详解现代汉语语法信息词典详解,清华,清华大学出版社、广西科学技术出版社大学出版社、广西科学技术出版社陈小荷(陈小荷(2000)现代汉语自动分析现代汉语自动分析,北京语言文化大,北京语言文化大学出版社学出版社网络资源网络资源ACL主页:主页:http:/www.acl
4、web.orgNLP新闻组:新闻组:comp.ai.nat-langLDC:http:/www.ldc.upenn.edu中文自然语言处理开放平台:中文自然语言处理开放平台:http:/计算所自然语言处理研究组:计算所自然语言处理研究组:http:/北京大学计算语言学研究所:北京大学计算语言学研究所:http:/中国语言文字网:中国语言文字网:http:/www.china-linguitics_links.html期刊期刊计算语言学外文期刊名计算语言学外文期刊名.doc中文期刊:中文期刊:语言文字学语言文字学 语言文字应用语言文字应用 中国语文中国语文 中文信息学报中文信息学报 当代语言学当
5、代语言学 现代外语现代外语 课程说明课程说明上课:上课:1-8周,周,4学时学时/周,周,32学时学时考核:开卷考试考核:开卷考试 致谢致谢本课程讲义(包括后续各节)直接引用本课程讲义(包括后续各节)直接引用了下面几位同行的课程讲义中的部分内了下面几位同行的课程讲义中的部分内容,在此深表感谢!容,在此深表感谢!刘群:刘群:计算语言学计算语言学詹卫东:詹卫东:计算语言学概论计算语言学概论白硕:白硕:计算语言学计算语言学刘颖:刘颖:计算语言学计算语言学冯志伟:冯志伟:机器翻译研究的历史和现状机器翻译研究的历史和现状 依存语法在机器翻译中的应用依存语法在机器翻译中的应用第一章 概论问题驱动的学习问题
6、驱动的学习要要了了解解一一门门学学科科,首首先先要要知知道道这这门门学学科科所所要要解解决决的的问问题题。只只有有了了解解了了一一门门学学科科所所要要解解决决的的问问题题,才才能能真真正正理理解解一一门门学学科科的的内内在在逻逻辑辑,才才能能不不仅仅知知其其然然,而而且且知知其其所所以以然然。在在学学习习一一门门学学科科之之前前,不不妨妨抛抛开开这这门门学学科科的的所所有有知知识识,直直接接面面对对这这门门学学科科所所面面对对的的最最基基本本的的问问题题,想想一一想想如如果果要要你你来来解解决决这这个个问问题题,你你会会用用什什么么办办法法。然然后后在在学学习习的的过过程程中中,不不断断地地用
7、用你你学学到到的的知知识识来来印印证证你你所所要要解解决决的的问问题题,才才能能深深刻刻地地理理解解你你所所学学到到的的知知识识,真真正正做到融会贯通。做到融会贯通。问题之一:自动翻译问题之一:自动翻译 n自动翻译问题自动翻译问题 n人人类类最最古古老老的的问问题题之之一一:圣圣经经上上巴巴比比伦伦塔塔的的传传说说n计计算算机机发发明明以以来来,几几乎乎是是人人类类首首先先想想到到的的计计算算机机的的应用之一应用之一n困困难难比比人人们们想想像像的的大大得得多多,至至今今没没有有找找到到理理想想的的解解决办法决办法n是推动计算语言学研究的永恒动力是推动计算语言学研究的永恒动力n是计算语言学的终
8、极目标是计算语言学的终极目标n自自动动翻翻译译研研究究,几几乎乎触触及及到到计计算算语语言言学学研研究究的的所所有有方方面面方方面面问题之一:自动翻译(续)问题之一:自动翻译(续)n一个经典的例子(早期的英俄翻译系统):一个经典的例子(早期的英俄翻译系统):n源源文文:The spirit is willing,but the flesh is weak.n正确的译文:心有余而力不足正确的译文:心有余而力不足n机器的译文:酒是好的,但肉是馊的机器的译文:酒是好的,但肉是馊的n又一个经典的例子(一个笑话)又一个经典的例子(一个笑话)n源文:源文:How are you?n正确的译文:你好吗?正确
9、的译文:你好吗?n逐字翻译的译文:怎么是你?逐字翻译的译文:怎么是你?n源文:源文:How old are you?n正确的译文:你多大了?正确的译文:你多大了?n逐字翻译的译文:怎么老是你?逐字翻译的译文:怎么老是你?问题之一:自动翻译(续二)问题之一:自动翻译(续二)n演示演示nLight英汉机器翻译系统英汉机器翻译系统nTransEasy汉英机器翻译系统汉英机器翻译系统n目前的水平:目前的水平:nLogMedia:https:/ n图灵测试图灵测试n用于判断用于判断“机器是否具有智能机器是否具有智能”n一个封闭的小屋一个封闭的小屋n屋外一个人屋外一个人n屋内依次进入一个人和一台计算机屋内
10、依次进入一个人和一台计算机n屋外的人并不知道屋内的是人还是计算机屋外的人并不知道屋内的是人还是计算机n屋外的人向屋内的人和计算机提出各种问题屋外的人向屋内的人和计算机提出各种问题n屋外的人根据回答来判断屋内是人还是计算机屋外的人根据回答来判断屋内是人还是计算机n如果判断不出来,那么可以认为计算机具有了智能如果判断不出来,那么可以认为计算机具有了智能交谈 n甲:听说吴妈打赢了阿甲:听说吴妈打赢了阿Q Q。n乙:不错,阿乙:不错,阿Q Q确实被吴妈打败了。确实被吴妈打败了。n甲:这个结果有些出人意料。甲:这个结果有些出人意料。n乙:阿乙:阿Q是大意失荆州,怪不得别人。是大意失荆州,怪不得别人。A.
11、M.Turing n我我们们可可以以期期待待,总总有有一一天天机机器器会会同同人人在在所所有有的的智智能能领领域域里里竞竞争争起起来来。但但是是,如如何何开开始始呢呢?这这是是一一个个很很难难决决定定的的问问题题。许许多多人人以以为为可可以以把把下下棋棋之之类类的的极极为为抽抽象象的的活活动动作作为为最最好好的的出出发发点点,不不过过,还还有有一一种种办办法法也也应应加加以以考考虑虑,就就是是为为机机器器配配备备具具有有智智能能的的、可可用用钱钱买买到到的的意意识识器器官官,然然后后,教教这这种种机机器器理理解解并并且且说说英英语语。这这个个过过程程可可以以仿仿效效通通常常小小孩孩子子学学话话
12、的的方方式式进进行行。我我不不能能确确定到底哪个出发点更好,但应该都值得一试。定到底哪个出发点更好,但应该都值得一试。A.M.Turing,Computing Machinery and Intelligence,Mind Vol.59,1950.阿兰阿兰.图灵(英国数学图灵(英国数学家)计算装置与智能家)计算装置与智能 关于语言,可以问些什么?n人人用用来来交交际际的的“语语言言”具具有有什什么么样样的的性性质质?这这些性质又是如何影响交际过程的?些性质又是如何影响交际过程的?n人人用用来来交交际际的的“语语言言”跟跟机机器器可可以以“理理解解”的的语言有什么样的关系?语言有什么样的关系?n
13、人是如何运用人是如何运用“语言语言”进行交际的?进行交际的?n人人运运用用语语言言进进行行交交际际的的过过程程是是否否可可以以描描述述为为一一个机械的过程?个机械的过程?n什么叫做什么叫做“理解理解”一种语言?一种语言?n其它问题其它问题n音字转换:语音识别、拼音输入音字转换:语音识别、拼音输入n自动文摘:自动给出一篇或多篇文章的摘要自动文摘:自动给出一篇或多篇文章的摘要n信信息息检检索索:在在海海量量的的信信息息准准确确找找到到你你所所需需要要的的信息信息n信信息息过过滤滤:从从信信息息流流中中筛筛选选出出你你所所感感兴兴趣趣的的信信息息n信信息息抽抽取取:从从海海量量的的信信息息中中抽抽取
14、取出出你你所所需需要要的的(结构化)信息(结构化)信息n定义 n计计算算语语言言学学(Computational Computational LinguisticsLinguistics)指指的的是是这这样样一一门门学学科科,它它通通过过建建立立形形式式化化的的数数学学模模型型,来来分分析析、处处理理自自然然语语言言,并并在在计计算算机机上上用用程程序序来来实实现现分分析析和和处处理理的的过过程程,从从而而达达到到以以机机器器来来模模拟拟人人的的部部分分乃乃至至全全部部语语言言能能力力的的目的。目的。NLP/NLU/CIPn计算语言学(计算语言学(Computational Linguisti
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 自然语言 理解 绪论
限制150内