核学习的行人再识别分析.docx
《核学习的行人再识别分析.docx》由会员分享,可在线阅读,更多相关《核学习的行人再识别分析.docx(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、核学习的行人再识别分析(自动化学报)2015年第十二期行人再识别指的是在非重叠监控视频中,检索某个监控视频中出现的目的能否出如今其它的监控视频中.近期几年,行人再识别问题引起了广大科研人员的兴趣与研究.监控视频中的目的图像分辨率低、场景中存在着光照变化、视角变化、行人姿态变化以及摄像机本身属性的问题,导致同一目的在不同的监控视频中外观区别很大,使得行人再识别问题碰到了很大的挑战。为了有效的解决这些挑战,广大的研究者提出了很多解决方法.目前的行人再识别算法能够简单概括为四种:直接法、基于深度学习的方法、显著性学习的方法和间接法.直接法利用视觉特征对行人建立一个鲁棒性和区分性的表示,不需要通过学习
2、直接利用行人特征然后根据传统的类似性度量算法(欧式距离、巴氏距离等等)来度量行人之间的类似度.文献1初次提出了利用直方图特征来表征目的并通过度量直方图的类似度来识别不同的目的.文献2将行人图像粗略分为头部、上半身和下半身3部分,然后串联每一部分的颜色直方图对行人描绘.文献3采用分割的技术提取人的前景,并利用行人区域的对称性和非对称性将人的前景划分成不同的区域.对于每个区域,提取带权重的颜色直方图特征、极大稳定颜色区域(maximallystablecolorregions)特征和重复度高的构造区域(recurrenthighlystructuredpatches)特征描绘它们.文献4提出了一种
3、结合gabor特征和协方差矩阵描绘的BiCov描绘子来对行人描绘.文献5采用图案构造(pictorialstruc-ture)算法定位图像中人的各个部件所在的区域.对于每个部件的区域,提取与文献3类似的颜色直方图特征、极大稳定颜色区域特征来描绘它们.文献6利用lbp特征和21个滤波器特征(8个gabor滤波器和13个schmid滤波器)来描绘图像中的行人.文献7通过共生矩阵对行人的形状和外形特征进行描绘.固然直接法的算法模型简单,但由于在光照变化、视角变化以及姿态变化等情况下,同一个人的外观变化往往很大,很难提取出鲁棒性和区分性的特征描绘.因而在光照变化、视角变化以及姿态变化等情况下,直接法的
4、效果很差.深度学来在计算机视觉中得到了广泛的应用,因而不少学者研究并提出了基于深度学习的行人再识别算法.文献8LiWei等人提出了一种六层的FPNN神经网络,它能有效解决行人再识别中出现的光照变化、姿态变化、遮挡和背景粘连等问题,进而提高了识别率.文献9Ahmed等人提出了一种深层卷积构造能够同时自动学习特征和相应的类似性测度函数.但基于深度学习的行人再识别算法需要非常大的训练数据库,导致训练时间长,此外还需要针对特定问题搭建相应的模型,因而不利于方法的推广.同时,深度学习方法中还存在调置参数缺乏理论性指导,具有较大主观性的问题.基于显著性学习的行人再识别方法近年来也遭到研究者的广泛兴趣.人们
5、能够通过行人的一些显著信息来识别行人,但传统的方法在比拟两张图片的类似性的时候,往往忽略了行人身上的显著性特征.对此,文献10赵瑞等人提出了一种通过学习行人图像的显著性信息来度量两张行人图像的类似性的方法.但显著性学习的行人再识别算法在行人姿态变化的情况下,显著性区域会出现偏移或者消失,导致识别效果较差.间接法主要是学习得到一个分类器或一个排序模型.间接法代表性的算法有距离测度学习、支持向量机、迁移学习和流形排序算法.距离测度学习算法作为间接法中的一种,近期几年在行人再识别中得到了广泛的应用.本文提出的算法也是基于距离测度学习,所下面面着重介绍基于距离测度学习的行人再识别算法.与手动设计特征的
6、直接法不同,距离测度学习方法是一种利用机器学习的算法得出两张行人图像的类似度度量函数,使相关的行人图像对的类似度尽可能高,不相关的行人图像对的类似度尽可能低的方法.代表性的测度学习算法有文献11郑伟诗等人把行人再识别问题当成距离学习问题,提出了一种基于概率相对距离的行人匹配模型,文献12提出了一种基于统计推断的方法学习测度矩阵来度量两张行人图像的类似度,以及文献中提出的相应测度学习算法.距离测度算法是将原始特征空间投影到另一个更具区分性的特征空间.与其它的算法相比,距离测度学习算法具有更好的效果.距离测度学习算法即便只使用简单的颜色直方图作为特征,算法的性能往往优于其它算法.文献12提出了一种
7、基于统计推断的方法学习测度矩阵来度量行人对的类似度,但作者直接在原始特征空间训练得到测度矩阵,进而得到样本之间的类似性函数.原始特征空间的线性不可分性导致通过原始特征空间直接训练得到的测度矩阵不能很好的表征样本之间的类似性和差异性.本文提出基于核学习的方法,首先通过相应的核函数将原始特征空间投影到非线性空间,然后在非线性空间中学习得到相应的测度矩阵.投影后的非线性特征空间具有很好的可分性,这样学习得到的测度矩阵能准确的表征样本之间的类似性和差异性.另外,基于测度学习的行人再识别算法一般是把多特征融合并建立特征模型,然后基于相应的测度学习算法,学习得到一个测度矩阵.然而这种特征融合往往忽略了不同
8、属性特征之间的差异,这样学习得到的测度矩阵不能准确的表征样本之间的类似性与差异性.对此,本文提出在不同的特征空间中学习相应的测度矩阵,进而得到表示不同特征空间的类似性函数,最后根据不同的权重结合这些类似性函数来表征样本之间的类似性.本文算法在公共实验数据集上的实验效果优于目前主流的行人再识别算法,尤其是第一匹配率(Rank1).本文其余章节的组织安排如下.第1节介绍本文提出的行人再识别算法.第2节介绍本文算法在公共数据集上的实验.第三节总结全文以及瞻望.1基于多特征子空间与核学习的行人再识别算法1.1基于核学习的类似度量函数的学习文献12中提出了一种KISSME的算法,文中指出,从统计学角度考
9、虑,一对有序行人对(i,j)的类似度能够表示为式。文献12中提出的算法是直接在原始线性特征空间中训练得到测度矩阵,进而得到表示样本之间类似性的类似度函数.由于原始特征空间的线性不可分,上述方法得到的测度矩阵不能准确表达样本之间的类似性和差异性,导致识别效果差.本文提出基于核学习的算法首先通过相应的核函数将原始特征空间投影到更易区分的非线性空间,然后在非线性空间中训练得到测度矩阵M.这样得到的测度矩阵具M有很好的区分性,能使同类样本之间的距离尽可能小,异类样本之间的距离尽可能大.核学习的主要思想是将原始线性特征空间投影到区分性好的非线性空间.原始特征空间中的特征xxi通过函数投影到非线性空间,则
10、非线性空间的特征表示为(xxi).非线性映射函数一般是隐性函数,则很难得到显示表达式,能够利用核函数求解特征空间中样本点的内积来解决。1.2基于多特征子空间的测度学习基于测度学习的行人再识别算法一般是把多特征融合并建立特征模型,然后基于相应的测度学习算法得到测度矩阵.这种方法忽略了不同属性特征之间的差异,导致学习得到的测度矩阵不能准确的体现样本之间的类似性与差异性.对此,本文提出对于不同的特征空间单独学习相应的测度矩阵,进而得到表示不同特征空间的类似性函数,最后根据不同的权重结合这些类似性函数来表示样本之间的类似性.1.3行人图像的特征表示本文采用颜色特征和LBP特征对行人目的进行描绘,生成两
11、种特征子空间.颜色空间有很多种,用不同的色彩空间描绘一图片的效果是不同的.根据文献20和文献21,本文采用的颜色特征从RGS、HSV、YCbCr和CIELab4种颜色空间中提取.RGS空间的定义为R=R/(R+G+B)、G=G/(R+G+B)、S=(R+G+B)/3.为了获取具有鲁棒性和区分性的颜色特征表示,本文将上述四种颜色特征空间融合.融合后的颜色特征描绘对于光照变化的场景具有良好的鲁棒性.图1给出了一张被平均分成6个水平条带的行人图像,对于每个水平条带的每种颜色空间的每个通道,提取16维的颜色直方图特征,将所有的颜色直方图特征串联构成行人图像的颜色特征,进而得到行人图像颜色特征的维数为1
12、152维(4*6*3*16).原始特征空间的1152维特征经过核函数投影后的特征维度较高且大部分信息都是冗余的.因而实验中利用PCA将核空间中的特征维数降到保持大于90%的能量。为了更好的描绘图像的局部信息,本文中提取的局部特征来自于LBP等价形式中邻域点数为8半径为1和邻域点数为16半径为2两种形式的特征.上面两种LBP等价形式的维度分别为59维和243维.类似于颜色特征的提取,一张行人图像被平均分成6个水平条带,对于每个水平条带提取LBP两种形式的特征,将所有的LBP特征串联构成行人图像的局部特征,进而得到行人图像局部特征的维数为1812维(59+243)*6).同理,原始特征空间的181
13、2维特征经过核函数投影后的特征维度同样较高并且大部分信息也都是冗余的.因而实验中同样利用PCA将核空间的特征维度降到保持90%以上的能量.1.4本文算法的详细操作步骤利用步骤3得到不同核空间中的测度矩阵计算样本在不同核空间的类似度,然后将样本在不同核空间中的类似度根据一定的权值结合来表示样本之间的类似性.2实验测试与结果本节首先介绍实验中所使用的测试数据和算法性能的评测准则,其次介绍本文算法在不同公共实验集上与已有的行人再识别算法的性能比拟,然后在不同公共实验集上比照核映射前后的算法性能,最后在不同公共实验集上分析权值不同时对算法性能的影响.文中所有的实验是基于vs2010+opencv2.4
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 学习 行人 识别 分析
限制150内