深学习在自然语言处理的应用.pptx





《深学习在自然语言处理的应用.pptx》由会员分享,可在线阅读,更多相关《深学习在自然语言处理的应用.pptx(55页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1大纲大纲深度学习简介基础问题:语言表示问题Word Embedding不同粒度语言单元的表示字符/单字/单词/短语/句子/文档值得重点关注的模型RAE/Tensor Network/卷积网络NLP的应用语言模型中文分词知识挖掘情感计算机器翻译ParaphraseIR探讨与思考第1页/共55页2深度学习(表示学习)深度学习(表示学习)第2页/共55页3深度学习(表示学习)深度学习(表示学习)第3页/共55页4Layer-Wise Pre-TrainingLayer-Wise Pre-Training第4页/共55页5Denoising AutoencoderDenoising Autoenco
2、der第5页/共55页6自然语言交互的时代自然语言交互的时代第6页/共55页7大纲大纲深度学习简介基础问题:语言表示问题Word Embedding不同粒度语言单元的表示字符/单字/单词/短语/句子/文档值得重点关注的模型RAE/Tensor Network/卷积网络NLP的应用语言模型中文分词知识挖掘情感计算机器翻译ParaphraseIR探讨与思考第7页/共55页8One-Hot One-Hot 表示表示One Hot表示在传统NLP中很常用Similarity(dog,cat)=0第8页/共55页9Word EmbeddingWord Embedding词向量:单词的分布向量表示(Dis
3、tributional Representation)词向量表征了单词使用上下文中的句法语义特征One-Hot的字面匹配到DR的语义匹配Similarity(dog,cat)Similarity(dog,the)Similarity(“the dog smiles.”,“one cat cries.”)第9页/共55页10无监督训练获得单词的无监督训练获得单词的WE-word2vecWE-word2vec单词:苹果第10页/共55页11无监督训练获得单词的无监督训练获得单词的WE-word2vecWE-word2vec单词:长颈鹿第11页/共55页12无监督训练获得单词的无监督训练获得单词的W
4、E-word2vecWE-word2vec单字:张第12页/共55页13无监督训练获得单词的无监督训练获得单词的WE-word2vecWE-word2vec单字:雯第13页/共55页14无监督训练获得单词的无监督训练获得单词的WE-word2vecWE-word2vec单字:葱第14页/共55页15Word2vecWord2vecCBOW:第15页/共55页16word2vecword2vecSkip-Gram:第16页/共55页17word2vecword2vecCBOW+Hierarchical Softmax第17页/共55页18word2vecword2vecCBOW+Negative
5、 Sampling最大化:st:正例负例第18页/共55页19不同粒度语言单元的表示不同粒度语言单元的表示-字符字符/单字单字字符上下文向量 英文:捕获构词法中文:捕获字搭配 英文拓展:字符N-Gram 中文拓展:单字N-Gram?第19页/共55页20不同粒度语言单元的表示不同粒度语言单元的表示-短语短语/句子句子/文档文档方法一:单词词向量取和(Summrization)很多情况都做此种简化处理过于简单,但是仔细思考有一定道理方法二:单词词向量加权求和Huangs Work权重:类似于IDF方法三:RNN第20页/共55页21不同粒度语言单元的表示不同粒度语言单元的表示-短语短语/句子句子
6、/文档文档方法四:Matrix-Vector NN第21页/共55页22不同粒度语言单元的表示不同粒度语言单元的表示-短语短语/句子句子/文档文档方法五:卷积神经网络第22页/共55页23大纲大纲深度学习简介基础问题:语言表示问题Word Embedding不同粒度语言单元的表示字符/单字/单词/短语/句子/文档值得重点关注的模型RAE/Tensor Network/卷积网络NLP的应用语言模型中文分词知识挖掘情感计算机器翻译ParaphraseIR探讨与思考第23页/共55页24RAE(Recursive AutoEncoders)RAE(Recursive AutoEncoders)推导短
7、语及句子级别的Word Embedding表示第24页/共55页25Neural Tensor NetworksNeural Tensor Networks表达多个实体之间的关系/两个单词之间某种操作第25页/共55页26Neural Tensor NetworksNeural Tensor Networks第26页/共55页27卷积网络(卷积网络(Convolutional Deep Neural Network Convolutional Deep Neural Network)全局特征选择与融合/不定长转换为定长表示第27页/共55页28大纲大纲深度学习简介基础问题:语言表示问题Word
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 学习 自然语言 处理 应用

限制150内