南开大学提出目标检测新Backbone网络模块:Res2Net.docx
《南开大学提出目标检测新Backbone网络模块:Res2Net.docx》由会员分享,可在线阅读,更多相关《南开大学提出目标检测新Backbone网络模块:Res2Net.docx(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、南开大学提出目标检测新Backbone网络模块:Res2Net点击上方蓝字关注我们2019Python开发者日购票请扫码咨询|高尚华、程明明等南开大学译者|刘畅编辑|Jane出品|AI科技大本营idrgznai100【导读】去年度AI科技大本营为大众报道过南开大学媒体计算实验室在边缘检测以及图像过分割的工作成果不仅刷新了精度记录算法也已经开源。今天要为大众再介绍该实验室的最新工作Res2Net一种在目的检测任务中新的Backbone网络模块。ResNet大众都很熟悉了由何恺明等人于2021年度提出其强大的表征才能让很多计算机视觉任务的性能得到了极大的提升。而南开大学的这项工作提出的新卷积网络构
2、造方式在多个视觉任务的基准数据集上CIFAR10ImageNet与baseline模型进展了比照优于现有的SOTA方法更多的消融实验结果中也证明了方法的优势之处。此外鉴于Res2Net已经在几个具有代表性的计算机视觉任务表达出了优越性认为网络的多尺度表征才能是非常重要的。下面AI科技大本营就为大众介绍一下这项工作大众可以深化研读后进展尝试摘要在许多视觉任务中多尺度的表示特征是非常重要的。最新的研究在不断的提升着backbone网络的多尺度表达才能在多个任务上进步了算法性能。然而大多数现有的深度学习方法是通过不同层的方式来表达多尺度特征。提出了一种新的卷积网络构造方式Res2Net通过在单个残差
3、块里面构建层次化的连接实现。Res2Net是在粒度级别上来表示多尺度特征并且增加了每层网络的感受野范围。它可以无缝插入现有的ResNet,ResNeXt等网络构造。并且在多个视觉任务的基准数据集上与baseline模型进展了比照发现它优于现有的SOTA方法。更多的消融实验结果证明了方法的优势之处。引言在多个视觉任务中如图像分类目的检测动作识别语义分割等设计一个好的多尺度特征是非常重要的。有以下三点原因第一如上图所示在一张图片里面同一目的可能有不同的大小比方图上的沙发。第二待检测目的的上下文信息可能比它本身占的区域更多例如我们需要使用大桌子作为上下文信息来判断放在上面的是杯子还是笔筒。第三从不同
4、尺度的感悟信息来理解如细粒度分类以及语义分割的任务是非常重要的。因此多尺度的特征在传统方法以及深度学习里面都得到了广泛应用。通常我们需要采用一个大感受野的特征提取器来获得不同尺度的特征描绘而卷积神经网络通过一堆卷积层可以很自然的由粗到细多尺度的提取特征。怎样设计更高效的网络构造是提升卷积神经网络性能的关键。提出了一种简单有效的多尺度提取方法。与现有的增强单层网络多尺度表达才能的CNNs方法不同它是在更细的粒度上提升了多尺度表征才能。接下来我们再来看看Res2Net的架构与体系构造等内容Res2Net已有的许多工作都是采用的上图a作为其basicblock因此祈望找到一种能保持计算量不增加却有更
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 南开大学 提出 目标 检测 Backbone 网络 模块 Res2Net
限制150内