计算机视觉下的表面缺陷检测方法(共4564字).doc
《计算机视觉下的表面缺陷检测方法(共4564字).doc》由会员分享,可在线阅读,更多相关《计算机视觉下的表面缺陷检测方法(共4564字).doc(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、计算机视觉下的表面缺陷检测方法(共4564字)计算机视觉下的表面缺陷检测方法 【摘要】随着自动化技术的发展,工业中的许多环节逐渐由机器人替代。产品表面缺陷检测便是其中重要的一环,对产品质量把控有着至关重要的作用。传统人工通过肉眼对产品进行判断,速度慢,成本高,且工人主观判断素会影像检测结果的准确性。然而使用机器和算法代替人工检测却面临不小挑战,在真实的生产环境下,部分图像成像质量差,存在大量噪声、干扰。采用图像处理算法或者手工提取特征的方法在这些场景下难以取得较好的检测效果。直到近年来,人工智能进入快速发展期,深度学习在计算机视觉领域取得了重大突破。在图像分类、目标检测、图像分割等问题上都有了
2、很好的效果。在诸多领域得到了成果应用,人脸识别、行人检测、自动驾驶等。将基于深度学习的计算机视觉应用在表面缺陷检测也成为了一大发展趋势。本文介绍了多个计算机视觉任务和相关的网络结构,探究并对比在缺陷检测问题上的实际应用,分析了基于深度学习的计算机视觉在缺陷检测领域应用的问题,最后进行总结与展望。【关键词】计算机视觉;表面缺陷;检测;深度学习一、缺陷检测问题的定义工件缺陷主要是生产过程中,机器偶发故障、员工操作失误或者生产环境问题造成表面或内部的瑕疵。表面缺陷,可以直接使用普通相机拍摄的图片进行检测,而内部缺陷,则需要使用工业CT拍摄的CT图像,本文主要讨论的是,工业产品表面缺陷检测。受各种因素
3、影响,表面缺陷的类型多种多样,以铝材表面为例,有漆泡、擦花、桔皮等各种类型的缺陷。对于不同的缺陷类型需要采取不同的操作措施,部分缺陷对质量的影响较小,可以降价处理,部分缺陷可以修复,包含严重影响质量缺陷的产品则不能继续销售。因此实际应用中,首先需要对产品进行分类,区分正常无缺陷的样本和有瑕疵的样本。进一步需要对瑕疵进行定位,标记出缺陷的具体位置,本文中将其统称为缺陷检测。二、基于计算机视觉的表面缺陷检测方法2.1图像分类网络方法卷积神经网络是目前深度学习领域最具代表性的神经网络之一,是一种层次模型,包含卷积层、池化层、全连接层等多层结构。其中卷积层通过卷积核在特征图上的移动与卷积操作对图像进行
4、特征提取。池化层是对卷积层的降维处理,可以在保留特征的同时减少参数,加快计算速度,一定程度防止过拟合。全连接层每一个节点都与上层所有节点相连,主要作用是将卷积层和池化层提取的局部特征进行综合。输出的向量经过softmax逻辑回归函数得到最终的分类结果。卷积神经网络具有强大的特征提取能力,在图像分类问题上有非常好的效果。2012年imageNet图像分类任务,AlexNet1的成功登顶,分类错误率仅为15.3%,远低于其他方法,标志着深度学习的崛起,开启了计算机视觉一个新的时代。在实际应用中,一般使用经典CNN模型上改进的神经网络结构,如GoogLeNet2、ResNet3、DneseNet4等
5、。这些网络的结构更加复杂,表达能力更强,在各个数据集上的表现显著优于简单CNN网络。训练网络的时间和分类所需的时间也相应增加,需要在准确率和检测速率上进行权衡。TianWang5等使用CNN网络对DAGM20076数据集中的样本进行缺陷检测,具体做法包括两次卷积神经网络分类,首先使用一个CNN网络根据纹理特征对样本进行分类,数据集共有六种不同类别的纹理。接下来使用一个128*128的滑动窗口,步长64,在512*512的原图上进行切片,得到49张切割图像。再使用CNN网络对切割图像进行二分类,分为有缺陷和无缺陷两类,可以同时实现缺陷检测和缺陷的模糊定位。相比传统的SIFT+ANN方法,召回率,
6、准确率等指标都有了大幅提升。如果产品的缺陷特征特别明显,可以直接利用卷积神经网络对其分类,这样缺陷检测的速率和准确率都很高。但是生产中,产品表面只有小部分包含缺陷,这时就需要采取上面论文中滑动窗口的方法。需要判断每个窗口的类别。所需的存储空间和计算时间都急剧上升。而且窗口的大小限制了感知区域的大小,导致分类性能受到限制,且定位的精度不高,因此一般会选用下面的两种方法。2.2图像检测网络方法图像分类将整张图片作为输入,输出是单一标签。而目标检测需要神经网络对潜在的多个目标进行定位。RCNN就是将CNN应用到目标检测领域的里程碑模型,是一个two-stage检测算法。RCNN算法主要分为以下四步,
7、通过选择性搜索算法提出候选区域,利用CNN网络的卷积和池化操作对输入进行特征提取,根据提取的特征训练SVM分类器,最后对边界进行回归,得到精确的定位,避免多个检出。这些过程的结合使得RCNN非常慢,对每个图像的预测需要数十秒。随后提出的FastRCNN、FasterRCNN一定程度解决了这个问题。与R-CNN不同,FasterRCNN将特征提取、区域生成、边界框回归、分类等工作都整合在了一个网络之中,其核心就是区域生成网络,极大提升检测框的生成速度,检测时间显著缩短,达到了能应用的水平。Young-JinCha7通过FasterRCNN检测网络实现对桥梁表面混泥土裂缝,混泥土脱落,螺栓松动,钢
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机 视觉 表面 缺陷 检测 方法 4564
限制150内