【总结】自然语言处理(NLP)算法:概述与分类.docx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《【总结】自然语言处理(NLP)算法:概述与分类.docx》由会员分享,可在线阅读,更多相关《【总结】自然语言处理(NLP)算法:概述与分类.docx(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、【总结】自然语言处理(NLP)算法:概述与分类NLP界神级人物MichaelColinsCUJasonEisnerJHUDavidYarowsky(JHU)ChrisManningDekangLin奇点机智MichaelColins英国人哥伦比亚大学教授。研究领域包括parsere-ranking,treekernels,semi-supervisedlearning,machinetranslation以及exponentiatedgradientalgorithms。collins/eisner对NLP构造学习领域奉献极大研究parsing并一战成名。非常喜欢MichaelCollins,
2、认为他写的paper看得最舒适最爽犹如沐浴于樱花之中。JasonEisner确实是厉害不过看他paper实在太难看懂写的语言非常抽象我等屌丝实在难以深化理解。经过Collins大侠的一些paper才能对Eisner的paper妙语进展理解。JasonEisner(JHU),约翰霍普金斯大学。DavidYarowsky(JHU)yarowsky早年度研究词义消歧是著名的yarowskyalgorithm的后来做了很多跨语言学习的创始性工作。StanfordNLP掌门ChrisManning以?统计自然语言处理根底?一书和StanfordNLP(toolkit)而出名。DanJurafsky著有?
3、语音与语言处理?一书具有深沉的语言学背景。略微提一下Manning的学生RichardSocher近几年度声名鹊起在dl4nlp领域风头一时无两属年度轻一代翘楚。DekangLin林德康教师前Google高级管理科学家seniorstaffresearchscientist在参加Google之前是加拿大Alberta大学计算机教授发表过逾90篇论文、被引用超过12000次目前做了一家NLP相关的创业公司奇点机智。NLP知识构造1.概述1自然语言处理利用计算机为工具对书面实行或口头形式进展各种各样的处理以及加工的技术是研究人与人交际中和人与计算机交际中的演员问题的一门学科是人工智能的主要内容。2
4、自然语言处理是研究语言才能以及语言应用的模型建立计算机算法框架来实现这样的语言模型并完善、评测、最终用于设计各种实用系统。3研究问题主要信息检索机器翻译文档分类问答系统信息过滤自动文摘信息抽取文本挖掘舆情分析机器写作语音识别4困难所在场景的困难语言的多样性、多变性、歧义性学习的困难困难的数学模型hmm,crf,EM,深度学习等语料的困难什么的语料语料的作用怎样获取语料2.形式语言与自动机1语言按照一定规律构成的句子或字符串的有限或无限的集合2描绘语言的三种途径穷举法文法产生式系统描绘自动机3自然语言不是人为设计而是自然进化的形式语言比方运算符号、化学分子式、编程语言主要研究内部构造形式这类语言
5、的纯粹的语法领域从语言学而来作为一种理解自然语言的句法规律在计算机科学中形式语言通常作为定义编程以及语法构造的根底。4形式语言与自动机根底知识集合论图论5自动机的应用单词自动查错纠正词性消歧什么是词性什么的词性标注为什么需要标注怎样标注6形式语言的缺陷对于像汉语英语这样的大型自然语言系统难以构造准确的文法不符合人类学习语言的习惯有些句子语法正确但在语义上却不可能形式语言无法排出这些句子解决方向基于大量语料采用统计学手段建立模型3.语言模型1语言模型重要通过语料计算某个句子出现的概率概率表示常用的有2-元模型3-元模型2语言模型应用语音识别歧义消除例如给定拼音串tashiyanyanjiusau
6、nfade可能的汉字串踏实烟酒算法的他是研究酸法的他是研究算法的显然最后一句才符合。3语言模型的启示开启自然语言处理的统计方法统计方法的一般步骤采集大量语料对语料进展统计分析得出知识针对场景建立算法模型解释以及应用结果4语言模型性能评价包括评价目的评价的难点常用指标穿插熵困惑度5数据平滑数据平滑的概念为什么需要平滑平滑的方法加一法加法平滑法古德-图灵法J-M法Katz平滑法等6语言模型的缺陷语料来自不同的领域而语言模型对文本类型、主题等特别敏感n与相邻的n-1个词相关假设不是很成立。4.概率图模型生成模型与判别模型贝叶斯网络马尔科夫链与隐马尔科夫模型HMM1概率图模型概述什么的概率图模型参考清
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 总结 自然语言 处理 NLP 算法 概述 分类
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内