17篇论文入选CVPR 2019百度AI都在关注什么?(附论文地址).docx
《17篇论文入选CVPR 2019百度AI都在关注什么?(附论文地址).docx》由会员分享,可在线阅读,更多相关《17篇论文入选CVPR 2019百度AI都在关注什么?(附论文地址).docx(20页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、17篇论文入选CVPR 2019,百度AI都在关注什么?(附论文地址) 整理| 阿司匹林 出品 | AI科技大本营 公众号id rgznai100 计算机视觉以及形式识别大会CVPR 2019即将于6月在美国长滩召开 作为人工智能领域计算机视觉方向的重要学术会议 CVPR每年度都会吸引全球最顶尖的学术机构以及公司的研究人员投稿。 CVPR官网显示 今年度有超过5165篇的大会论文投稿 最终录取1299篇 录取率约为25%。据解析 去年度的CVPR 2018共有979篇论文被主会收录 录用率约为29%。相比2018 今年度的竞争更加剧烈。 今年度百度公司有17篇论文被CVPR接收 内容涵盖了语义
2、分割、网络剪枝、ReID、GAN等众多方向 而且很多技术的落地场景都涉及无人驾驶。 1月 营长曾为大众介绍百度被AAAI 2019接收的15篇论文。如今我们就来带大众看下百度入选CVPR 2019的17篇论文。 1 Taking A Closer Look at Domain Shift: Category-level Adversaries for Semantics Consistent Domain Adaptation 论文 Yawei Luo; Liang Zheng; Tao Guan; Junqing Yu; Yi Yang 论文介绍 在虚拟图像集 源域 上训练出的语义分割网络
3、往往在真实图像集 目的域 上表现不佳。网络分割性能下降是由于两个域间存在较大差异 而深度模型泛化才能缺乏。传统方法尝试通过全局对齐源域以及目的域间特征分布的来解决此问题 而该类方法往往忽略了特征间的部分语义一致性。本文首次结合了结合训练以及对抗训练来处理此问题。不同于传统方法 本文根据每一个特征的语义对齐程度 自适应的调整特征对齐的力度。该方法解决了传统方法中特征语义不一致问题以及负迁移的问题。实验结果证明我们的方法能大大进步网络在目的域图像上的分割精度。 应用场景 自动驾驶。本方法将电脑合成图像训练出的网络直接泛化到现实数据集上 大大减少了自动驾驶领域中街景数据收集以及数据标注的工作量。 论
4、文地址 s:/arxiv.org/abs/1809.09478 2 Filter Pruning via Geometric Median for Deep Convolutional Neural Networks Acceleration 论文 Yang He, Ping Liu, Ziwei Wang, Zhilan Hu, Yi Yang 论文介绍 在本文中 我们分析了关于网络剪枝的“小范数 -低重要性的标准。以前的工作利用“小范数 -低重要性的标准来修剪在卷积神经网络中具有较小范数值的滤波器 但出它的有效性取决于两个并不总是知足的要求 1 滤波器的范数的标准差应该很大; 2 滤波器的
5、最小范数应该很小。为解析决这个问题 我们提出了一种新的滤波器修剪方法 即通过 几何平均数 进展滤波器剪枝 以便在不考虑这两个要求的情况下对模型进展压缩 我们称之为FPGM。与之前的方法不同 FPGM通过去掉冗余的滤波器来压缩CNN模型 而不是去掉那些范数小的过滤器。我们在图像分类任务上的两个数据集上 验证了FPGM的有用性。在Cifar-10数据集上 FPGM在ResNet-110上的计算量降低了52 以上 相对准确度进步了2.69 。此外 在ILSVRC-2021数据集上 FPGM还在ResNet-101上减少了超过42 的计算量。 应用场景 本文提出的方法可以有效提升神经网络压缩率。可以将
6、压缩后的网络部署到便携式设备 比方手机、摄像机等 加快处理速度。 论文地址 s:/arxiv.org/abs/1811.00250 GItHub地址 s:/github /he-y/filter-pruning-geometric-median 3 Detailed Human Shape Estimation from a Single Image by Hierarchical Mesh Deformation 论文 Hao Zhu; Xinxin Zuo; Sen Wang; Xun Cao; Ruigang Yang 论文介绍 本文提出了一个新的框架 可以根据单个图像恢复详细的人体形状
7、。由于诸如人体形状、身体姿势以及视角的变化等因素 因此这是一项具有挑战性的任务。现有方法通常尝试使用缺少外表细节的基于参数的模板来恢复人体形状。因此 所得到的身体形状似乎没有衣服。在本文中 我们提出了一种新颖的基于学习的框架 它结合了参数模型的鲁棒性以及自由3D变形的灵敏性。我们使用深度神经网络在层次网格变形 HMD 框架中利用身体关节、轮廓以及每像素着色信息的约束来细化3D形状。我们可以恢复除皮肤模型之外的详细人体形状。实验证明 我们的方法优于先前的最先进方法 在2D IoU数以及3D度量间隔 方面实现了更好的准确性。 论文地址 s:/arxiv.org/abs/1904.10506v1 G
8、ItHub地址 s:/github /zhuhao-nju/hmd.git 4 GA-Net: Guided Aggregation Net for End-to-end Stereo Matching 论文 Feihu Zhang; Victor Adrian Prisacariu; Yang Ruigang; Philip Torr 论文介绍 在立体匹配任务中 为了准确估计差异 匹配本钱聚合在传统方法以及深度神经网络模型中都是至关重要的。我们提出了两个新的神经网络层 分别用于捕获部分以及整个图像的本钱相关性。第一个是半全局聚合层 它是半全局匹配的可微近似 第二个是部分引导聚合层 它遵循传统
9、的本钱过滤策略来细化薄构造。这两层可以用来代替广泛使用的3D卷积层 该层由于具有立方计算/存储器复杂性而计算本钱高且消耗存储器。在实验中 我们说明 具有双层引导聚合块的网络很轻易地超过了具有19个3D卷积层的最先进的GC-Net。我们还训练了深度引导聚合网络 GA-Net 它比场景流数据集以及KITTI基准测试中的最新方法具有更好的准确性。 论文地址 s:/arxiv.org/abs/1904.06587 GitHub地址 s:/github /feihuzhang/GANet 5 Invariance Matters: Exemplar Memory for Domain Adaptive
10、Person Re-identification 论文 Zhun Zhong, Liang Zheng, Zhiming Luo, Shaozi Li, Yi Yang 论文介绍 本论文旨在解决行人再识别中的跨数据集问题 利用有标注的源数据集以及无标注的目的数据集学习一个在目的数据集具有很好的鲁棒性的模型。主流的研究方法主要通过降低源域以及目的域之间的特征分布的差异。然而 这些方法忽略了目的域的域间变化 这些变化中包含了影响目的域测试性能的重要因素。在本文的工作中 我们全面的讨论了目的域中的域间变化 并基于三种潜在的域内不变性 样例不变性 相机不变性以及领域不变性 提出了一个新的模型泛化方法。
11、为了实现这个方法 我们在模型训练经过中引入了一个样例记忆模块用以存储目的数据在训练经过中的中间特征。该样例记忆模块可以使我们快速的计算目的域中部分训练样本以及全局样本的相似性 同时有效的在模型训练中参加提出的三个不变性限制。实验证明本文提出的三个不变性性质对提升领域适应的性能是不可或者缺的。同时 我们的方法在三个行人再识别的目的域中的准确率大大的超过了当前现有的方法。 应用场景 本文提出的方法可以有效提升行人再识别模型在跨场景下的泛化才能。使得我们可以在现有的标注数据情况下 以无监视的方式提升模型在新的场景下的性能。 论文地址 s:/arxiv.org/abs/1904.01990 GitHu
12、b地址 s:/github /zhunzhong07/ECN 6 Searching for A Robust Neural Architecture in Four GPU Hours 论文 Xuanyi Dong, Yi Yang 论文介绍 本论文旨在解决神经网络搜索算法消耗GPU资源过大的问题。目前很多神经网络搜索算法在小数据集CIFAR上 都需要消耗成百上千的GPU/TPU。为了进步神经网络的搜索效率 我们提出了一种利用可微网络构造采样器的基于梯度的搜索方法。我们的方法将整个搜索空间用一个有向无环图来表示 这个图包含了成百万多个子图 每一个子图都代表了一种网络构造。针对这个有向无环图
13、我们设计了一个可微的采样器 利用Gumbel-Softmax技术将离散的采样经过变成可微可导的 在训练经过中 通过验证集上的目的损失函数来优化这个采样器 使得采样器最终能过获得一个性能较好的网络构造。在实验中 我们在一个GPU上 通过几个小时的搜索时间 就可以在CIFAR上找到一个高性能的网络构造。 应用场景 本文提出的方法可以有效地在较短时间利用少量GPU搜索出鲁棒的网络构造 可以广泛地应用在大局部任务里 搜索出对更小更快精度更高的网络模型。 GitHub地址 s:/github /D-X-Y/GDAS 7 DM-GAN: Dynamic Memory Generative Adversar
14、ial Networks for Text-to-image Synthesis 论文 Minfeng Zhu, Pingbo Pan, Wei Chen, Yi Yang 论文介绍 本论文旨在提升基于文本生成的图片的真实性。当前的方法都是先生成比拟粗糙的初始图像 然后再优化图像进而生成高分辨率的真实图像。然而 目前大多数方法仍存在两个问题 (1)当前方法的结果很大程序上取决于初始图像的质量。假如初始图像质量不高 那么第二阶段优化很难将图像优化到令人满意的程度。(2)每个单词对于不同的图片内容都有不同的信息量 但当前方法在两个阶段中仍然保持了一样的单词重要性。 在本文工作中 我们提出动态记忆生
15、成对抗网络(DM-GAN)来生成高质量的图片。我们提出了一个动态记忆模块来优化粗糙的初始图像 即使初始图像生成不良 它可以以生成高质量的图像。详细来讲 动态记忆模块包括一个根据初始图像选择重要文本信息的记忆写入门以及一个自适应交融图片特征以及文本信息的反应门。我们在COCO以及CUB数据集上评估了我们的模型。实验结果说明 我们的方法在FID以及IS指标和真实性上都超过了当前方法。 应用场景 文本提出的方法可以显著提升基于文本生成图片的真实性 我们可以实现文章自动配图等功能 可以大大降低创的配图本钱。 论文地址 s:/arxiv.org/abs/1904.01310 8 Sim-Real Joi
16、nt Reinforcement Transfer for 3D Indoor Navigation 论文 Fengda Zhu, Linchao Zhu, Yi Yang 论文介绍 在室内3D导航中 环境中的机器人根据指令挪动到目的点。但是在物理世界中部署用于导航的机器人 需要大量的培训数据来学习有效的策略。为机器人训练获得足够的真实环境数据是代价昂贵的 因此我们提出通过合成数据渲染环境随后将策略迁移到真实环境中。固然合成环境有利于来促进现实世界中的导航训练 但真实环境与合成环境有两个方面不同。首先 两种环境的视觉表示具有显着的差异。其次 两个环境的房屋方案有很大不同。因此 需要在强化模型中
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 17篇论文入选CVPR 2019,百度AI都在关注什么?附论文地址 17 论文 入选 CVPR 2019 百度 AI 关注 什么 地址
限制150内