《基于深度卷积神经网络的车型识别研究-邓柳.pdf》由会员分享,可在线阅读,更多相关《基于深度卷积神经网络的车型识别研究-邓柳.pdf(3页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 收稿日期:- - ;修回日期:- - 基金项目:国家自然科学基金资助项目();四川省科技支撑计划资助项目()作者简介:邓柳(-),女,湖北恩施人,硕士研究生,主要研究方向为计算机视觉( );汪子杰(-),男,四川资阳人,硕士研究生,主要研究方向为计算机视觉基于深度卷积神经网络的车型识别研究*邓 柳,汪子杰(西南交通大学信息科学与技术学院,成都)摘 要:近年来,深度学习中的卷积神经网络已经广泛运用于图像识别领域,它不仅显著提升了识别准确率,同时在特征提取速度方面也优于许多传统方法。针对高速公路环境下的车型识别问题,引入卷积神经网络()理论,设计相应特征提取算法,并结合分类器构建识别系统。通过对
2、高速公路上主要三种车型(小车、客车、货车)的分类实验显示,该方法在识别精度及速度上均取得了较显著的提高。关键词:深度学习;卷积神经网络;支持向量机;高速公路;车型识别中图分类号: 文献标志码: 文章编号:- ()- - : - , ( , , ,): , (), - - - , , - (,) : ; 0 引言随着现代社会生活水平的不断提高,汽车数量高速增长,交通监管面临巨大挑战。视频监控系统作为交通监管的一种重要手段,已被广泛应用于现代交通的各个领域。然而传统的依赖人工判读的方法已无法满足如今海量交通视频处理的需要,构建智能识别系统以自动处理各种交通视频信息成为必然趋势。交通视频图像中车辆类
3、型的识别,作为构建其中的一项关键技术,长期以来受到国内外研究者的广泛关注。虽然已有高校和研究机构在此投入了不少人力物力,但由于车辆外观复杂多样,受到背景、光照、视角等因素影响,在实际应用中一直难以找到稳定、有效的视觉特征以准确识别。近年来深度学习理论迅速发展,与传统依赖先验知识的特征提取算法不同,深度神经网络可在训练数据驱动下自适应地构建特征描述,具有更高的灵活性和普适性。作为实现深度学习的一项重要技术,卷积神经网络()成功训练了首个深层神经网络结构,已在图像识别、语音识别等领域取得卓越成绩。卷积神经网络可将原始数据(如图像像素值)直接作为输入,避免了传统识别算法中额外的数据预处理过程。它类似
4、于生物神经网络的权值共享网络结构可产生生物视觉中的局部感受野效应,降低网络模型复杂度、减少权值数量的同时对平移、比例缩放、倾斜等视觉形变均具有高度的抵抗能力。卷积神经网络最早的应用可以追溯到世纪年代末,美国纽约大学教授等人将用于手写数字识别作为美国银行识别票据的工具。年,加拿大多伦多大学教授深度学习领军人物利用深层的卷积神经网络在大尺度图像识别数据集上取得了最好成绩。也利用深层卷积神经网络在人脸识别上取得 的识别率。国内创业团队 利用 在人脸识别公共数据上获得第一。本文尝试利用深度卷积神经网络技术构建车辆类型特征提取算法。与传统车型识别方法相比其具有两点优势:)传统方法依赖人工设计特征,如,、
5、 ,、,等,这些特征针对通用问题,运算量大且在实际应用中往往还需对输入图像进行一系列的预处理工作。而卷积神经网络直接以原始图像为输入,在训练数据的驱动下通过自主学习获取特征描述,简化特征模型的同时提高运算效率。)车辆外观表现形式复杂。摄像机距离、高度和角度以及环境光照等因素往往会引起视频图像中车辆参数缩放、旋转、模糊等外观变化,加大识别的难度。而卷积神经网络对平移、缩放等仿射形变具有良好的抵抗能力,有效克服了车辆外观多变带来的困难。为此,本文提出基于深度卷积神经网络设计相应的车型特征提取算法,并结合,分类器构建识别系统。实验显示该系统在显著提高识别准确率的同时保持了较高的特征提取速度。第卷第期
6、年月 计算机应用研究 1 车型识别系统架构本文设计的车型识别系统整体框图如图所示。1 1 深度卷积神经网络特征学习模型特征学习模型训练过程包括逐层构建和训练两个部分。本文采用的是五层网络,网络的构建过程如图所示。第一层为网络的输入,能够对二维图像的特征进行自主学习,故在此将原始图像灰度化后直接作为网络的输入。为网络的卷积层,卷积层通过个 大小的滤波器和可加偏置进行卷积,得到个特征图。为网络的下采样层,所有的下采样层都是依次通过如下处理得到:每邻域四个像素求和,权值 (卷积核元素)加权,加上偏置 ,最后通过一个影响函数核小的激活函数。具体地,用个 大小滤波器卷积输入图像,得到个 大小的特征图,通
7、过下采样,特征图缩小为 ;然后用个同样大小滤波器卷积层,得到个 大小的特征图,同样通过下采样,特征图缩小为 ;最后将张特征图排列为一条列向量,得到最终的特征向量。训练部分包含以下两个阶段:)正向传播阶段。将训练样本输入网络,得到实际输出;)反向传播阶段。计算实际输出与理想输出间的误差,通过反向传播算法逐层传播误差,并更新各层权值。1 2 分类识别分类器作为一种具有较强泛化能力的通用学习算法,被广泛应用于图像识别领域并取得良好的效果。为了验证本文卷积神经网络提取特征的有效性,选择分类器对特征进行训练和测试。2 实验2 1 数据集本文以高速公路监控视频中的车辆图像为识别对象,所有原始数据均采集于高
8、速公路实际监控过程中的真实视频。为了确保实验的准确和可靠性,本文人工截取并标注了其中小车、客车及货车图像作为训练和测试样本。共采集不同尺度、光照和角度的车辆图片 张,根据高速公路上三种车型出现的比例分别选取小车 张,货车张,公客车张。由于每张图片的大小不一,为了满足深度卷积神经网络的输入要求,在实验中三种车型均归一化为同一尺度(高宽比 )。每种车型随机选取张图片作为训练样本,其余的作为测试样本。表给出了数据集的具体情况,部分车型图片如图所示。表 车型识别数据集车型训练测试样本尺寸(高宽)小车 货车 客车 2 2 实验结果及分析在使用提取特征前,数据集中所有彩色图像均转换为灰度图。本文以图样本车
9、型中的第一张车型图为例展示图像的各层特征,如图所示。篇幅有限,本文以小车为例展示各层特征,货车和客车只展示最后一层特征。表对比了训练不同次数的学习得到的特征和特征的实验效果,其中准确率按照式()计算。首先,分析的最优训练次数,根据网络训练次数分别定义三种网络为、。从准确率来看,得到的特征分类效果比得到的特征分类效果提高了;而在基础上只提高了 ,没有明显的提升,但训练时间前者约是后者的两倍,所以从准确率和网络训练时间综合考虑,比较合适。从时间消耗来看,特征提取时间三种网络差别较小,网络得到的特征分类器训练时间和识别时间均是最短的。综合以上各因素,针对本文的数据集,选定用于特征提取。表还给出了车型
10、识别中常用的,特征以及 ,特征的识别效果进行比较。在特征识别率方面,本文构建的比高了 ,比 高;从特征提取速度来看,比快了倍,比 快了倍;在分类器训练方面, 最快,比快了倍,比快了倍;分类识别时间 最快,比快了倍,比快了倍。综合识别率和时间消耗两个方面,的效果是最好的。表对三种车型具体的分类结果进行分析。从表中可以看出,三种方法都是小车的识别率最高。从结果来看,小车较易与其他两种车型区分,货车和客车容易导致错误分类的主要原因是对于有棚的货车外形与客车很相似,再加上光照、拍摄第期邓 柳,等:基于深度卷积神经网络的车型识别研究 角度等的影响,带来较大识别难度。图为车型特征图。从图也可以看出,客车和
11、货车提取得到的特征有一定程度的相似,所以对最后的分类正确率有一定的影响。准确率正确分类车辆数目总车辆数目 ()表 特征性能比较训练次数训练时间 特征提取时间 分类器训练时间 分类识别时间 准确率 表 车型分类结果对比算法 准确率 错误识别数准确率 错误识别数 准确率 错误识别数3 结束语本文将深度卷积神经网络引入车型识别问题,构建了相应的特征提取和识别框架。通过在高速公路监控视频数据上的对比实验显示,深度卷积神经网络学习所得特征与线性分类器结合在车型识别问题上取得了良好的效果,其识别准确率明显优于传统的和 特征。由于货车与客车外形较为相似,受光照、拍摄角度等影响,识别较为困难,笔者将对该问题开展更深入的研究工作。参考文献: , , , ,():- , , , , , : - : ,:- , , , : , , - - - : ,:- 华莉琴,许维,王拓,等采用改进的尺度不变特征转换及多视角模型对车型识别西安交通大学学报,():- , - : : ,:- - - , , , - - : ,:- , - - : ,:- , , , : ,:- , , , - : : ,:- , , , - - - :- , - - - - : ,:- , - : , , , , - , , , - ,():- ,():- 计算机应用研究第卷
限制150内