基于多视图聚类的自然图像边缘检测-张衡.pdf
《基于多视图聚类的自然图像边缘检测-张衡.pdf》由会员分享,可在线阅读,更多相关《基于多视图聚类的自然图像边缘检测-张衡.pdf(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇 摇*国家自然科学基金项目(No.61373060,61073112)、江苏自然科学基金项目(No. BK2012793)资助Supported by National Natural Science Foundation of China (No. 61373060,61073112), Natural Science Foundation of JiangsuProvince (No.BK2012793)收稿日期:
2、2015-05-12;修回日期:2015-07-07;录用日期:2015-07-17Manuscript received May 12, 2015; revised July 07, 2015; accepted July 17, 2015基基于多视图聚类的自然图像边缘检测*张摇衡摇 摇谭晓阳摇 摇金摇鑫(南京航空航天大学计算机科学与技术学院摇南京210016)摘摇要摇梯度特征对线性光照变化保持不变性,而稀疏编码方法能从图像数据点中得到数据的统计特性.多视图聚类算法是把同一聚类中的不同属性集合视为不同视图,考虑不同视图的重要性进行协同聚类.文中提出基于多视图聚类的图像边缘检测算法,将两种特征
3、结合在一个统一的多视图聚类框架中,从而有效提高边缘检测的鲁棒性.该算法使用图像局部特征与稀疏编码结合的方式训练模型,并增加图像像素的空间信息和曲率信息的约束获得图像全局特征,保证检测边缘的准确性和区域一致性.在两个公开的数据库上的实验表明文中算法的可行性和有效性.关键词摇边缘检测,多视图聚类,梯度特征,稀疏编码,像素曲率中图法分类号摇 TP 391 DOI摇 10.16451/ j. cnki. issn1003鄄6059.201602008引用格式摇张衡,谭晓阳,金鑫.基于多视图聚类的自然图像边缘检测.模式识别与人工智能, 2016, 29(2):163-170.Multi鄄view Clu
4、stering Based Natural Image Contour DetectionZHANG Heng, TAN Xiaoyang, JIN Xin(College of Computer Science and Technology, Nanjing University of Aeronautics and Astronautics,Nanjing 210016)ABSTRACTThe gradient feature gives an invariant description for linear lighting changes while sparse codingmeth
5、ods can exploit the data statistics from the image data point. In multi鄄view clustering algorithm,different attributes set in the same cluster are considered as different views, and the importance ofdifferent views is taken into account for co鄄clustering. An algorithm based on multi鄄view clustering
6、forimage contour detection is proposed and it integrates both features into a unified multi鄄view clusteringframework to effectively improve the robustness of the detection system. The combination of image localfeatures and sparse code features is utilized to train model, and the spatial information
7、and curvatureinformation of the image pixels are added to obtain the global features and ensure the accuracy of thecontour detection and region consistency. Experiments on two large public available datasets show thefeasibility and effectiveness of the proposed algorithm.第29卷摇第2期模式识别与人工智能Vol.29摇 No.
8、22016年2月PR & AI Feb. 摇 2016摇 摇 摇 摇 摇摇 摇 摇 摇 摇摇 摇 摇 摇摇 摇 摇 摇 摇摇 摇 摇 摇 摇摇 摇 摇 摇 摇摇 摇 摇 摇 摇摇Key W ords 摇 Contour Detection, Multi鄄view Clustering, Gradient Feature, Sparse Coding, PixelCurvatureCitation摇 ZHANG H, TAN X Y, JIN X. Multi鄄view Clustering Based Natural Image Contour Detection.Pattern Recogn
9、ition and Artificial Intelligence, 2016, 29(2): 163-170.摇 摇图像是人类相互交流和认识客观世界的主要媒体,是人们主要的信息源.科学研究表明,人们获取的信息大约有75%来自视觉.计算机视觉处理可理解为为了实现某种任务从含有大量不相关的信息或变量中提取必要信息(不变量)的过程.图像边缘是图像的基本特征,包含图像大量有意义的信息(方向、形状等),是一种低层次(Low鄄Level)的图像特征,因此常通过图像边缘识别图像包含的内容.图像的边缘检测属于模式识别的一种,是其它图像处理的前提或基础,在过去的几十年中一直是图像处理中的研究热点.图像边缘的实
10、质是利用算法提取图像中有意义的图像分割块.图像边缘检测的好坏,直接影响后期图像处理的过程,以此准确找到图像边界与内部轮廓在许多计算机任务(如图像分割、目标识别、场景理解等)中都具有深远意义.由于视觉上较突出的边界与各种不同的视觉现象相关,因此不太可能找到一个通用的边界检测器,图像边缘检测仍是个富有挑战的难题.随着一些公开图像库(如BSDS5001、PASCAL、NYU Dataset2等)的使用愈加方便,人们可提出不同的边缘检测算法.早期的边缘算子有高斯算子、Laplace算子、Canny算子3、Ncuts算法4等.图像边界一般出现在像素灰度值剧变不连续的位置. Canny算子通过图像信噪比与
11、定位乘积度量,获取最优逼近算子.在计算机视觉中,曲率也是图像的一种重要的低层次特征. Treisman等5的研究表明直线曲率在计算机视觉处理(如边界检测、形状描述等)中也是一个重要的特征分析. Huang等6提出基于曲率的图像边缘检测算法.谱图理论尤其是Ncuts算法框架提供一种将全局图像信息融合到分组过程中,以此提取图像边界的方法.近年纹理特征的出现使得人们可通过纹理研究边界检测问题. Martin等7提出使用多通道特征(亮度、颜色、纹理等)获取最佳图像边缘. Ren8在文献7的基础上,研究多尺度特征的边界检测,证明多尺度信息有助于提高边缘检测准确率.图像的稀疏编码特征也广泛应用于计算机视觉
12、中. Mairal等9使用K奇异值分解(K Singular Value Decomposition,K鄄SVD)稀疏编码表示多尺度图像块获取图像边缘.目前的最优图像边界检测算法gPb1、 SCG10、SE11分别使用图像的梯度特征、稀疏编码、图像块的结构化信息等不同尺度特征提取图像边界.文献1使用图像的多尺度梯度特征4提取图像边缘,虽然获得不错的性能,但无法准确检测图像细节轮廓信息. Ren等10通过K鄄SVD字典学习和正交匹配追踪(Orthogonal Matching Pursuits, OMP)计算图像的稀疏编码,虽然在图像细节方面表现不错,但同时也增加检测的非边缘点的数目.因此,本文
13、结合图像梯度特征与稀疏编码,在Ncuts框架下提出基于多视图聚类的图像边缘检测算法(简记为multiPb),在构建图像的权重图方面使用多尺度多通道的梯度特征1与图像的稀疏编码特征10,梯度特征保证边界的准确性,稀疏编码特征保证边界的查全率,而像素曲率5-6和空间信息的增加克服K鄄means聚类得到的边缘不平滑和区域不一致性,同时也提高边界检测的平均准确率,使得在平均准确率方面均超过基于单一特征1,10的边缘检测算法.在公开数据库BSDS500和NYU Dataset上与其它算法进行对比,本文算法在提取图像边缘平均准确率方面表现突出.1摇基于多视图聚类的边缘检测多视图聚类算法12的思想是把同一聚
14、类中的属性集合视为不同视图,聚类时分别考虑不同视图的不同重要性进行协同聚类.本文将多视图聚类算法用于图像边缘检测中,主要流程如下:首先提取图像的梯度与稀疏编码特征构建权重图,得到图像的特征向量描述子,然后提取图像曲率与空间信息,最后通过3种不同的视图协同聚类得到图像边缘.具体流程见图1.461模式识别与人工智能摇 摇 摇 29卷v ,v , ,v1 2 kv ,v , ,v1 2 k图1摇基于多视图聚类的边缘检测算法流程图Fig.1摇 Flowchart of multi鄄view clustering based contour detection algorithm1.1摇图像局部特征提取
15、1.1.1摇梯度特征在Lab色彩空间中,文献7通过多通道、多尺度提取图像的梯度直方图特征训练模型.而本文使用图像不同通道特征(多尺度、多方向)拼接的方式并通过logistic分类器训练模型,得到每个像素点在兹方向上的边缘强度:locPb(x,y,兹) = 11 + exp( - 茁T兹G(x,y,兹), (1)其中G(x,y,兹)=bg滓(1) bg滓(3)cga滓(1) cga滓(3)cgb滓(1)cgb滓(3)tg滓(1) tg滓(3)(x,y)兹(4个通道,3个尺度的梯度特征的拼接). bg滓(i)、cga滓(i)、cgb滓(i)、tg滓(i)表示在Lab色彩空间中图像的亮度、颜色和纹理
16、通道在中心为像素点(x,y),半径为滓(i),通过方向为兹的直径划分的两半圆上像素点的直方图差分.1.1.2摇稀疏编码特征给定一幅图像Y,可表示为图像块的集合:Y = y1,y2, ,yn.使用K鄄SVD对图像编码,可得到一个过完备字典D = d1,d2, ,dm和一个相关稀疏编码矩阵X = x1,x2, ,xn.对于给定的字典D,最优化稀疏编码矩阵X可转换成求解子问题,使用OMP求解每个子问题,得到图像的稀疏编码.本文主要使用文献10中的算法提取图像的稀疏编码,并使用logistic分类器训练模型,得到像素边缘强度:摇 sPb(x,y,兹) = 11 + exp( - 茁T兹 Dp(x,y,
17、兹), (2)其中,sPb(x,y,兹)为像素点(x,y)在兹方向上的边缘强度,Dp(x,y,兹) = D琢1p ,D琢2p 兹为文献10中图像的双权重转换(Double PowerTransform)稀疏编码特征表示.对式(1)、式(2)每个方向应用非最大化抑制(No鄄max Suppression)突出边缘3,选取每个方向的最大响应值作为边缘强度:locPb(x,y) = max兹(locPb(x,y,兹),sPb(x,y) = max兹(sPb(x,y,兹).1.2摇特征向量描述子获取原始Ncuts算法利用图像灰度值特征集合,构建权重图G =(V,E).图像中每个像素点(x,y)看作是一
18、个权重图的节点(Node),像素点之间通过边(Edge)连接,边的权重衡量两个像素点属于同一个目标(Object)的可能性.通过求解(D - W)v = 姿Dv的特征向量、特征值划分图像,Dii = 移jwij.在基于多视图聚类的边缘检测中,使用图像的梯度与稀疏编码特征构建权重图,相比图像的灰度值特征,一方面增加多尺度多通道的特性,另一方面增加稀疏编码,提高边缘的查全率10.因此通过这两种特征重建权重图.边wij表示为wij =exp - maxp沂ijmutliPb(p) 滓 ,摇 椰 p椰 2 r0,其它(3)其中multiPb(x,y) = 琢 locPb(x,y) + 茁 sPb(x,
19、y),琢、茁根据数据库BSDS500中图像的真实值(Ground鄄Truth)并通过F值的梯度上升训练得到,琢= 0.45,茁 = 0.8.对于不同的数据库图像,会有不同的图像真实值,因此琢、茁也不相同.如果图像的真实值未知,则模型无法适应,因为目前方法均是基于有监督学习的图像边缘检测. wij中,ij表示像素i和像5612期摇 摇 摇 摇张衡等:基于多视图聚类的自然图像边缘检测素j之间的连线(边),滓为常量(设定滓 = 0.1).通过求解权重图矩阵的特征向量得到图像的特征向量描述子.1.3摇像素曲率与空间信息图像曲率代表图像梯度,即是图像边界的平滑性5-6.像素空间代表图像不同区域的位置信息
20、.Nixon13介绍基于边界差分的曲率计算和基于图像灰度值变化的曲率衡量.文中使用后者计算像素曲率信息,计算公式如下:籽(x,y) = 1(Mx2 + My2) 32Mx2 Myx - MxMy Myx -MxMy Myy + My2 Mxy ,其中M = Mx(x,y)2 + My(x,y)2 ,Mx、My分别为图像在x方向和y方向的梯度.通过上式得到图像的曲率信息,而本文使用的空间信息为像素坐标(x,y).1.4摇基于多视图聚类的图像边缘检测基于多视图聚类的图像边缘检测算法将图像特征向量描述子与像素曲率及空间信息视作不同的特征视图,提取图像边缘.多视图K鄄means聚类算法12目标函数表示
21、如下:摇minA 移3自 = 1(琢(自)酌 X(自)t - AU(自)T 2,1,s. t. 摇 Ai,j 沂 0,1,移Kk = 1Aik = 1,移3自 = 1琢(自) = 1,摇 (4)其中,琢(v)为第v个视图的权重因子;酌为控制权重分布的参数,通过不同类型特征的学习得到.在多视图聚类的目标函数中,X(v) 沂 Rdv伊n为第v个视图的特征,U(v) 沂 Rdv伊k为第v个视图中心矩阵,A 沂 Rn伊K为第v个视图的聚类表示矩阵,A的每行满足1鄄of鄄K的编码方式(如果数据点Xi被分配到第k个聚类,Aik = 1,否则Aik = 0).在式(4)中,使用的视图个数为3个:(v1,v2
22、, vk),(x,y),籽,其中,(v1,v2, ,vk)为式(3)中求得的特征向量描述子,(x,y)为空间信息,籽为曲率.通过式(4)最小化3个视图的聚类误差,最终获得每个像素点的分类标号,得到图像的分割边缘.算法参数为需聚类的数目K,参数酌.通过自适应调整14得到每个图像的最佳聚类数目K,一般介于3 50之间.l2,1范数为非凸的,聚类表示矩阵中的每个值均为一个二进制整数,首先将目标函数转化后再优化为J = minU(v),D(v),琢(v),A移 3v = 1(琢(v)酌H(v),其中H(v) = tr(X(v) - U(v)AT)D(v)(X(v) - U(v)AT)T) ,D(v)
23、沂 Rn伊n为第v个视图的对角矩阵,对角阵的第i个记录定义为D(v)ii = 12 e(v)i , i = 1,2, ,n, (5)e(v) = X(v)T - AU(v) T,摇 摇 摇 摇 摇其中e(v)i为式(5)中的第i行.然后通过迭代方式更新U(v)、A、D(v)、琢(v),直到目标函数收敛.由文献12中的分析可知,算法的时间复杂度和K鄄means聚类算法相似.2摇实验及结果分析2.1摇数据库与算法评估标准本文实验主要使用BSDS500数据库1评估算法性能. BSDS500包含500张自然图像(200张训练图像,200张测试图像,100张图像交叉验证),图像大小为321 伊 481,
24、且每张图像边缘的真实值(Ground鄄Truth)均已标记.实验同时也在NYU数据集2上对比部分算法性能. NYU有1 449对分辨率为480 伊 640彩色图像和深度图像,每张图像语义区域真实值已知.使用70%图像作为训练集,剩余部分作为测试集.使用目前广泛采用的文献1中的算法评估框架对比算法性能,文献1的评估标准包含边界匹配的准确率-召回率(Precision鄄Recall, P/ R)曲线,最优数据集度量(Optimal Dataset Scale, ODS)下的F值(通过P/ R计算)、单个图像的最优图像度量(Optimal Image Scale, OIS)下的F值、由P/ R曲线计
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 视图 自然 图像 边缘 检测
限制150内