快速多目标检测.doc
《快速多目标检测.doc》由会员分享,可在线阅读,更多相关《快速多目标检测.doc(17页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-date快速多目标检测快速多目标检测快速多目标检测 Introduction Better Faster Stronger Conclusion 本次介绍一篇有关快速目标检测的文章YOLO9000: Better, Faster, Stronger。该方法记作YOLOv2,相比v1除了在性能上有所提升之外,更是在速度上表现惊人。项目主页: Introduction 通用的目标
2、检测不但要够快够准,还要能够检测多类的目标。但实际情况是,目标检测数据集包含的类别数都太少,远远小于图像分类数据集所包含的类别数(比如ImageNet)。于是,本文提出了一种联合训练的方法,可以同时利用检测数据集和分类数据集来训练目标检测器。具体思路是,利用目标检测数据集来学习目标的准确定位,用分类数据集来增加检测的目标类别数以及检测器的鲁棒性。通过采用上述策略,本文利用COCO目标检测数据集和ImageNet图像分类数据集训练得到了YOLO9000,可以实时地检测超过9000类的目标。 Better YOLOv1同Fast RCNN相比存在定位不准以及召回率不如Region Proposal
3、方法等问题。因此,V2的主要目标就是在保持分类准确率的同时提高召回率和定位准确度。为了做到又快又好,所以文章在简化的网络上采用了很多策略来提高性能,具体用的技术如下表: (1) Batch Normalization BN可以加速收敛,同时BN也可以替代Dropout等正则化手段来防止网络过拟合。 (2) High Resolution Classifier YOLOv1是在ImageNet预训练了一个输入为224x224大小的模型,当想要检测小目标时需要把图像resize到448x448,同时网络也要相应地进行调整。为了适应较大的分辨率,YOLOv2以448x448的分辨率在ImageNet
4、上预训练了10个epoch,然后将该预训练模型在检测数据上finetune,最终得到了 4% mAP的提升。 (3) Convolutional With Anchor Boxes YOLOv1直接通过全连接层来预测bounding box的坐标,与Fast-RCNN相比有两个缺点: 一是只能预测98个框,数量太少,而Fast-RCNN在conv-map上每一个位置都可以预测9个框;二是预测坐标不如预测坐标相对偏移量有效,Fast-RCNN预测的是偏移量和置信度。因此,YOLOv2移除了全连接层,并将网络输入由448调整为416,使得最后输出的feature map大小为13x13(416/3
5、2)。之所以要调整输入为416,是为了使得最后的输出size是一个奇数,这样就可以保证feature map只有一个中心。由于目标(特别是大目标)往往位于图像中心,因此一个正中心来预测位置要比4个要好。通过在卷积层使用anchor boxes,网络可以预测超过1000个窗口,虽然这导致了准确率降低了0.3mAP,但是召回率却足足提高了7%。 (4) Dimension Clusters Fast-RCNN中使用3种scales和3中aspect ratios(1:1,1:2,2:1)在每个位置产生了9个anchor boxes。作者认为这种手动选取的anchor不够好,虽然网络最终可以学出来,
6、但如果我们可以给出更好的anchor,那么网络肯定更加容易训练而且效果更好。作者通过K-Means聚类的方式在训练集中聚出好的anchor模板。需要注意的是,在使用K-Means中如果使用传统的欧式距离度量,那么大的框肯定会产生更大的误差,因此作者更换为基于IOU的度量方式:d(box,centroid)=1?IOU(box,centroid)。下表表明,基于K-Means的anchor box选取比手动选取效果好:通过权衡速度与性能,作者最终选则聚5类时得到的anchor boxes。 (5) Direct Location Prediction 作者在训练中发现模型不稳定,特别是训练早期。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 快速 多目标 检测
限制150内