《收下这12篇最新论文炼丹不愁没灵感.docx》由会员分享,可在线阅读,更多相关《收下这12篇最新论文炼丹不愁没灵感.docx(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、收下这12篇最新论文,炼丹不愁没灵感在碎片化浏览充满眼球的时代越来越少的人会去关注每篇论文背后的探究以及考虑。在这个栏目里你会快速get每篇优选论文的亮点以及痛点时刻紧跟AI前沿成果。点击本文底部的浏览原文即刻参加社区查看更多最新论文推荐。这是PaperDaily的第99篇文章QuAC:QuestionAnsweringinContextguohao916推荐#MachineReadingComprehension本文提出了一个基于上下文的机器浏览理解数据集QuAC该数据集存在两类人群Student以及Teacher。Student依次提出一系列自由式的问题而Teacher进展答复该答复是基于
2、文章内部的片段产生的。不同于以往的机器浏览理解数据集该数据集存在以下特点1.问题是开放式的也就是讲问题的答案不一定存在于文章的片段中。因此Student在提问前不知道是否可以被答复2.Teacher的答复必需基于文章内部的片段不存在自由片段游离于文章内容的片段3.对话终止的条件包括从开场对话到如今(a).已经有12个问题被答复了(b).Student以及Teacher中的某一位主动提出完毕对话(c).有两个问题不可以被答复。论文采用了PretrainedInferSentFeature-richlogisticregressionBiDAF和BiDAFw/x-ctx作为基准算法选用HEQQHE
3、QD以及F1等作为效果度量指标进展了一系列实验。实验结果说明目前的基准算法得到的最好结果相较于人工判断的效果还存在很大提升空间。论文模型点击查看大图论文链接s:/paperweekly.site/papers/2255数据集链接:/quac.ai/DenselyConnectedCNNwithMulti-scaleFeatureAttentionforTextClassificationwangshy推荐#TextClassification本文是清华大学发表于IJCAI2018的工作。针对文本分类任务中卷积神经网络通常无法灵敏学习可变n元特征n-gram的问题论文提出了一种具有适应式注意力机
4、制的密集连接的卷积神经网络。该模型通过建立底层特征以及高层特征之间的跨层连接进而获得了丰富的多尺度特征而注意力模型可以自适应地选择适宜尺度的特征以适用于各种不同的文本分类问题。该法面向六个公开数据集均实现了超过基线的预测精度。论文模型点击查看大图论文链接s:/paperweekly.site/papers/2240源码链接s:/github/wangshy31/Densely-Connected-CNN-with-Multiscale-Feature-AttentionOntheDecisionBoundaryofDeepNeuralNetworkslykaust15推荐#DeepNeural
5、Networks近年度来深度学习在各个领域和工业界都获得了令人瞩目的成功。但是人们一直无法解释为什么深度学习在分类上的performance会比传统的方法要好那么多。尤其是人们无法解释为什么模型复杂度那么高的神经网络没有灾难性的overfitting问题确实存在overfitting问题但是没有严重到过于影响到模型的performance。这是一个非常值得研究的问题。它可以帮助我们更进一步理解深度学习进而进一步提升深度学习的performance。同时它也有可能帮助我们解决一些实际的问题比方adversarialattackingcatastrophicforgetting。在前人的工作根底上
6、本文从理论以及实验上证明了深度学习以及SVM的内在联络。假如训练数据的crossentropyloss趋向于0那么使用SGD训练深度学习会使神经网络的最后一层的参数的方向趋向于SVMsolution的方向。也就是讲假如将深度神经网络划分成两个局部最后一层以及除了最后一层的所有层。我们可以将除了最后一层的所有层当做一个mappingfunction这个mappingfunction将原始的输入映射到一个hiddenrepresentation上。而网络的最后一层实际上是一个linearclassifier。假如使用hiddenrepresentation以及原始的label训练一个SVM我们会发
7、现SGD会使神经网络的最后一层的参数的方向converge到这个SVMsolution的方向上。本文还用大量的实验证明神经网络最后一层classifier的bias也非常接近SVM的bias。本文显示margintheory有可能解释深度学习的generalizationproperty。以及前人的工作不同本文没有对神经网络进展任何的简化研究的模型就是平时常用的模型比方resnetdensenet。本文的结论非常具有实用性。论文模型点击查看大图论文链接s:/paperweekly.site/papers/2252源码链接s:/github/lykaust15/NN_decision_bound
8、aryNextItemRecommendationwithSelf-Attentiondaven88推荐#RecommenderSystem本文提出了一种基于self-attention的基于序列的推荐算法该算法是用self-attention从用户的交互记录中自己的去学惯用的近期的兴趣同时该模型也保存了用户的长久的兴趣。整个网络是在metriclearning的框架下是第一次将self-attention以及metriclearning的结合的尝试。实验结果说明通过self-attention模型可以很好的学惯用户的短期兴趣爱好并且能有效的提升模型效果。通过以及近期的文章得比照发现该方法可以
9、在很大程度上改善序列化推荐的效果。论文模型点击查看大图论文链接s:/paperweekly.site/papers/2246AReinforcedTopic-AwareConvolutionalSequence-to-SequenceModelforAbstractiveTextSummarizationyangdali推荐#AbstractiveSummarization本文是腾讯发表于IJCAI2018的工作文章提出了一种基于卷积神经网络的总结式文本摘要生成方法并结合主题模型的注意力机制利用强化学习方法进展优化在DUC、Gigaword以及LCSTS数据集上到达stateoftheart。
10、论文模型点击查看大图论文链接s:/paperweekly.site/papers/2234FakeSentenceDetectionasaTrainingTaskforSentenceEncodinglunar推荐#SentenceEmbeding本文给出了一个新颖的看法即一些垃圾数据对训练可以以是有用的。人为制造出很多假数据通过随机从文本中丧失一些词以及打乱一些词的顺序训练出一个二分类网络用于判别真假文本这种方式训练出的模型在很多任务上有更好的表现。有点像CV界数据增强的逆向玩法。论文模型点击查看大图论文链接s:/paperweekly.site/papers/2229Dropoutisas
11、pecialcaseofthestochasticdeltarule:fasterandmoreaccuratedeeplearningchlr1995推荐#BayesianDeepLearning本文从数学角度尝试解释Dropout的作用深化探究dropout的本质。论文提出了一种从权重层面引入噪声的方法。实验结果显示这种方法不仅可以进步网络的最终收敛结果可以以加速收敛。论文模型点击查看大图论文链接s:/paperweekly.site/papers/2212源码链接s:/github/noahfl/densenet-sdrBackpropEvolutionlunar推荐#GeneticAl
12、gorithms本文是GoogleBrain发表于ICML2018的工作祈望可以找到一种可以替代反向传播的方法。因此他们设计了一种domain-specificlanguage(DSL)来函数式描绘数学公式例如反向传播然后利用演化算法来发现新的传播算法旨在找到泛化性能比BP更好的算法。最终通过实验他们找到的算法可以在训练前期收敛得更快但是收敛时并没有表现得更好。BP算法固然获得了很大的成就但是近年度学界前沿也指出它的一些局限性本文给这方面的研究探出了一小步。论文模型点击查看大图论文链接s:/paperweekly.site/papers/2211Multi-TurnResponseSelect
13、ionforChatbotswithDeepAttentionMatchingNetworkQfengly推荐#DialogSystem本文是百度发表于ACL2018的工作论文将attention应用于多轮对话打破之前的RNN以及CNN构造在多轮上速度快到达了目前最好效果。其次本文使用self-attention以及cross-attention来提取response以及context的特征。论文模型点击查看大图论文链接s:/paperweekly.site/papers/2250NASH:TowardEnd-to-EndNeuralArchitectureforGenerativeSeman
14、ticHashingEricShen推荐#RecommenderSystems本文在ACL2018上获得了BestPaperHonourableMentionAward。现有的句子表示大多都是基于连续的vectorskip-thoughtvector等而本文考虑用离散的binaryvector来表示句子文档并首次提出用端到端的VariationalAutoencoder来学习binary的句子表示。基于这些binary的向量两个文档的相似度就可以通过他们representations之间的hammingdistance即有多少bit不同来进展判断。相较于连续的vector上的innerprod
15、uct操作这种策略有更快的计算速度这种方法被称为semantichashing。同时离散的向量在storage上也比连续的向量更加节省空间。在informationretrieval的几个benchmark数据集上本文的模型相对于以前的semantichashing方法在搜索准确率上实现了明显的提升。论文模型点击查看大图论文链接s:/paperweekly.site/papers/2225GeometricUnderstandingofDeepLearningpxwluffy推荐#DeepLearning本文从几何的角度理解深度学习为深度学习提供严密的数学论证。深度学习目前还停留在实验科学的阶
16、段其严格的数学解释还未完全建立。论文模型点击查看大图论文链接s:/paperweekly.site/papers/2216AMulti-taskLearningApproachforImprovingProductTitleCompressionwithUserSearchLogDataaforever推荐#Multi-taskLearning本文是阿里发表于AAAI2018的工作论文利用用户搜索日志进展多任务学习以压缩商品标题生成的商品短标题在离线自动评测、人工评测和在线评测中均超过传统抽取式摘要方法。端到端的训练方式防止了传统方法的大量人工预处理和特征工程。多任务学习中的Attention
17、分布一致性设置使得最终生成的商品短标题中能透出原始标题中重要的词尤其是能引导成交的核心词对于其他电商场景也有重要意义。论文模型点击查看大图论文链接s:/paperweekly.site/papers/2253#文末福利#以下是简单粗暴送书环节PaperWeekly图灵教育?Python深度学习?5本热门畅销大神执笔入门必备FrancoisChollet译者张亮30多个代码例如带你全面掌握怎样用深度学习解决实际问题Keras框架速成的明智之选夯实深度学习根底在理论中培养对深度神经网络的良好直觉无须机器学习经历以及高等数学背景由Keras之父、Google人工智能研究员FrancoisChollet执笔美亚4.6星评16开全彩印刷通俗易懂帮助读者建立关于机器学习以及深度学习核心思想的直觉。书中用30多个代码例如步骤讲解详细透彻介绍了用Python以及Keras进展深度学习的探究理论包括计算机视觉、自然语言处理、产生式模型等应用。介入方式请在文末留言共享对于各位初级炼丹师而言应该怎样选择合适自己的深度学习框架小编将随机抽取5位同学送出图灵教育新书截止时间8月31日周五20:00点击以下标题查看往期推荐暑假没人带怎么办还有我们为你推荐论文
限制150内