深度学习在自然语言处理的应用.ppt
《深度学习在自然语言处理的应用.ppt》由会员分享,可在线阅读,更多相关《深度学习在自然语言处理的应用.ppt(55页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1深度学习在自然语言处理的应用张俊林畅捷通股份有限公司2大纲深度学习简介基础问题:语言表示问题Word Embedding不同粒度语言单元的表示字符/单字/单词/短语/句子/文档值得重点关注的模型RAE/Tensor Network/卷积网络NLP的应用语言模型中文分词知识挖掘情感计算机器翻译ParaphraseIR探讨与思考3深度学习(表示学习)4深度学习(表示学习)5Layer-Wise Pre-Training6Denoising Autoencoder7自然语言交互的时代8大纲深度学习简介基础问题:语言表示问题Word Embedding不同粒度语言单元的表示字符/单字/单词/短语/句
2、子/文档值得重点关注的模型RAE/Tensor Network/卷积网络NLP的应用语言模型中文分词知识挖掘情感计算机器翻译ParaphraseIR探讨与思考9One-Hot 表示One Hot表示在传统NLP中很常用Similarity(dog,cat)=010Word Embedding词向量:单词的分布向量表示(Distributional Representation)词向量表征了单词使用上下文中的句法语义特征One-Hot的字面匹配到DR的语义匹配Similarity(dog,cat)Similarity(dog,the)Similarity(“the dog smiles.”,“o
3、ne cat cries.”)11无监督训练获得单词的WE-word2vec单词:苹果12无监督训练获得单词的WE-word2vec单词:长颈鹿13无监督训练获得单词的WE-word2vec单字:张14无监督训练获得单词的WE-word2vec单字:雯15无监督训练获得单词的WE-word2vec单字:葱16Word2vecCBOW:17word2vecSkip-Gram:18word2vecCBOW+Hierarchical Softmax19word2vecCBOW+Negative Sampling最大化:st:正例负例20不同粒度语言单元的表示-字符/单字字符上下文向量 英文:捕获构词
4、法中文:捕获字搭配 英文拓展:字符N-Gram 中文拓展:单字N-Gram?21不同粒度语言单元的表示-短语/句子/文档方法一:单词词向量取和(Summrization)很多情况都做此种简化处理过于简单,但是仔细思考有一定道理方法二:单词词向量加权求和Huangs Work权重:类似于IDF方法三:RNN22不同粒度语言单元的表示-短语/句子/文档方法四:Matrix-Vector NN23不同粒度语言单元的表示-短语/句子/文档方法五:卷积神经网络24大纲深度学习简介基础问题:语言表示问题Word Embedding不同粒度语言单元的表示字符/单字/单词/短语/句子/文档值得重点关注的模型R
5、AE/Tensor Network/卷积网络NLP的应用语言模型中文分词知识挖掘情感计算机器翻译ParaphraseIR探讨与思考25RAE(Recursive AutoEncoders)推导短语及句子级别的Word Embedding表示26Neural Tensor Networks表达多个实体之间的关系/两个单词之间某种操作27Neural Tensor Networks28卷积网络(Convolutional Deep Neural Network)全局特征选择与融合/不定长转换为定长表示29大纲深度学习简介基础问题:语言表示问题Word Embedding不同粒度语言单元的表示字符/
6、单字/单词/短语/句子/文档值得重点关注的模型RAE/Tensor Network/卷积网络NLP的应用语言模型中文分词知识挖掘情感计算机器翻译ParaphraseIR探讨与思考30语言模型31语言模型Bilinear-LM32语言模型RNNLM33深度学习用于中文分词-思路134深度学习用于中文分词-思路235深度学习用于中文分词两者思路基本相同基于字的Word Embedding+三层神经网络+BEMS标记序列分类思路2引入全局的Viterbi解码(分类后处理)效果:和主流分词算法效果接近CRF/Maxent+二元特征类似思路同样可以套用到POS/NER/Parser等场景这是利用Word
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 深度 学习 自然语言 处理 应用
限制150内