南开大学提出目标检测新Backbone网络模块:Res2Net.docx
-
资源ID:73275850
资源大小:18.16KB
全文页数:6页
- 资源格式: DOCX
下载积分:14.8金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
南开大学提出目标检测新Backbone网络模块:Res2Net.docx
南开大学提出目标检测新Backbone网络模块:Res2Net点击上方蓝字关注我们2019Python开发者日购票请扫码咨询|高尚华、程明明等南开大学译者|刘畅编辑|Jane出品|AI科技大本营idrgznai100【导读】去年度AI科技大本营为大众报道过南开大学媒体计算实验室在边缘检测以及图像过分割的工作成果不仅刷新了精度记录算法也已经开源。今天要为大众再介绍该实验室的最新工作Res2Net一种在目的检测任务中新的Backbone网络模块。ResNet大众都很熟悉了由何恺明等人于2021年度提出其强大的表征才能让很多计算机视觉任务的性能得到了极大的提升。而南开大学的这项工作提出的新卷积网络构造方式在多个视觉任务的基准数据集上CIFAR10ImageNet与baseline模型进展了比照优于现有的SOTA方法更多的消融实验结果中也证明了方法的优势之处。此外鉴于Res2Net已经在几个具有代表性的计算机视觉任务表达出了优越性认为网络的多尺度表征才能是非常重要的。下面AI科技大本营就为大众介绍一下这项工作大众可以深化研读后进展尝试摘要在许多视觉任务中多尺度的表示特征是非常重要的。最新的研究在不断的提升着backbone网络的多尺度表达才能在多个任务上进步了算法性能。然而大多数现有的深度学习方法是通过不同层的方式来表达多尺度特征。提出了一种新的卷积网络构造方式Res2Net通过在单个残差块里面构建层次化的连接实现。Res2Net是在粒度级别上来表示多尺度特征并且增加了每层网络的感受野范围。它可以无缝插入现有的ResNet,ResNeXt等网络构造。并且在多个视觉任务的基准数据集上与baseline模型进展了比照发现它优于现有的SOTA方法。更多的消融实验结果证明了方法的优势之处。引言在多个视觉任务中如图像分类目的检测动作识别语义分割等设计一个好的多尺度特征是非常重要的。有以下三点原因第一如上图所示在一张图片里面同一目的可能有不同的大小比方图上的沙发。第二待检测目的的上下文信息可能比它本身占的区域更多例如我们需要使用大桌子作为上下文信息来判断放在上面的是杯子还是笔筒。第三从不同尺度的感悟信息来理解如细粒度分类以及语义分割的任务是非常重要的。因此多尺度的特征在传统方法以及深度学习里面都得到了广泛应用。通常我们需要采用一个大感受野的特征提取器来获得不同尺度的特征描绘而卷积神经网络通过一堆卷积层可以很自然的由粗到细多尺度的提取特征。怎样设计更高效的网络构造是提升卷积神经网络性能的关键。提出了一种简单有效的多尺度提取方法。与现有的增强单层网络多尺度表达才能的CNNs方法不同它是在更细的粒度上提升了多尺度表征才能。接下来我们再来看看Res2Net的架构与体系构造等内容Res2Net已有的许多工作都是采用的上图a作为其basicblock因此祈望找到一种能保持计算量不增加却有更强多尺度特征提取才能的构造来替代它。如上图b所示采用了更小的卷积组来替代bottleneckblock里面的3x3卷积。详细操作如下首先将1x1卷积后的特征图均分为s个特征图子集。每个特征图子集的大小一样但是通道数是输入特征图的1/s。对每一个特征图子集X_i有一个对应的3x3卷积K_i(),假设K_i()的输出是y_i。接下来每个特征图子集X_i会加上K_i-1()的输出然后一起输入进K_i()。为了在增大s的值时减少参数量省去了X_1的3x3网络。因此输出y_i可以用如下公式表示根据图b可以发现每一个X_j(ji)下的3x3卷积可以利用之前所有的特性信息它的输出会有比X_j更大的感受野。因此这样的组合可以使Res2Net的输出有更多样的感受野信息。为了更好的交融不同尺度的信息将它们的输出拼接起来然后再送入1x1卷积如上图b所示。实验提出的这个模块可以交融到现有的CNNs方法里面如ResNet,ResNeXt以及DLA为了公平的实验仅仅将里面的模块交换为Res2Net并在基准数据集CIFAR10ImageNet上对Res2Net进展了评估。以ImageNet为例进展了多个比照实验包括浅层以及深层网络的比照实验结果都显示基于Res2Net模块的网络性能更好。还探究了尺度大小对性能的影响如表格3所示其中w代表滤波器的宽度s代表尺度。在ImageNet数据集上浅层以及深层网络的实验结果尺度大小对性能的影响在更多视觉任务上的实验结果均显示Res2Net模块可以显著的提升现有算法的指标。下列图是ResNet-50以及Res2Net-50在类激活映射的结果比照下列图是ResNet-101以及Res2Net-101在语义分割任务上的可视化的结果比照下列图是ResNet-50以及Res2Net-50在目的检测任务上的结果比照下列图是ResNet-50以及Res2Net-50在实例分割任务COCO数据集上的AP以及AR两结果的比照结论Res2Net是一种简洁有效的模块探究了CNN在更细粒度级别的多尺度表达才能。它提醒了CNN网络里面除了深度宽度等现有维度之外还可以有新的维度“尺度。Res2Net模块可以很容易地交融进SOTA的方法。在CIFAR10以及ImageNet上图像分类的结果说明使用Res2Net模块的网络比ResNetResNeXtDLA等网络效果更好。鉴于Res2Net已经在几个具有代表性的计算机视觉任务表达出了优越性认为网络的多尺度表征才能是非常重要的。最后放送一下论文地址s:/arxiv.org/pdf/1904.01169.pdf本文为AI大本营编译文章转载请微信联络1092722531精彩推荐2019Python开发者日演讲议题全揭晓这一次我们仍然“只讲技术回绝空谈10余位一线Python技术专家共同打造一场硬核技术大会。更有深度培训实操环节为开发者们带来更多深度实战时机。更多详细信息请咨询13581782348微信同号。推荐浏览点击“浏览原文查看历史精彩文章。