图像分割阈值选取技术综述(共13页).doc
《图像分割阈值选取技术综述(共13页).doc》由会员分享,可在线阅读,更多相关《图像分割阈值选取技术综述(共13页).doc(13页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上图像分割阈值选取技术综述摘要图像分割是图像处理与计算机视觉领域低层次视觉中最为基础和重要的领域之一,它是对图像进行视觉分析和模式识别的基本前提阈值法是一种传统的图像分割方法,因其实现简单、计算量小、性能较稳定而成为图像分割中最基本和应用最广泛的分割技术已被应用于很多的领域。本文是在阅读大量国内外相关文献的基础上,对阈值分割技术稍做总结,分三个大类综述阈值选取方法,然后对阈值化算法的评估做简要介绍。关键词图像分割阈值选取全局阈值局部阈值直方图 二值化1引言所谓图像分割是指根据灰度、彩色、空间纹理、几何形状等特征把图像划分成若干个互不相交的区域,使得这些特征在同一区域内,
2、表现出一致性或相似性,而在不同区域间表现出明显的不同37简单的讲,就是在一幅图像中,把目标从背景中分离出来,以便于进一步处理。图像分割是图像处理与计算机视觉领域低层次视觉中最为基础和重要的领域之一,它是对图像进行视觉分析和模式识别的基本前提同时它也是一个经典难题,到目前为止既不存在一种通用的图像分割方法,也不存在一种判断是否分割成功的客观标准。阈值法是一种传统的图像分割方法,因其实现简单、计算量小、性能较稳定而成为图像分割中最基本和应用最广泛的分割技术已被应用于很多的领域,例如,在红外技术应用中,红外无损检测中红外热图像的分割,红外成像跟踪系统中目标的分割;在遥感应用中,合成孔径雷达图像中目标
3、的分割等;在医学应用中,血液细胞图像的分割,磁共振图像的分割;在农业工程应用中,水果品质无损检测过程中水果图像与背景的分割。在工业生产中,机器视觉运用于产品质量检测等等。在这些应用中,分割是对图像进一步分析、识别的前提,分割的准确性将直接影响后续任务的有效性,其中阈值的选取是图像阈值分割方法中的关键技术。2阈值分割的基本概念图像阈值化分割是一种最常用,同时也是最简单的图像分割方法,它特别适用于目标和背景占据不同灰度级范围的图像1。它不仅可以极大的压缩数据量,而且也大大简化了分析和处理步骤,因此在很多情况下,是进行图像分析、特征提取与模式识别之前的必要的图像预处理过程。图像阈值化的目的是要按照灰
4、度级,对像素集合进行一个划分,得到的每个子集形成一个与现实景物相对应的区域,各个区域内部具有一致的属性,而相邻区域布局有这种一致属性。这样的划分可以通过从灰度级出发选取一个或多个阈值来实现。阈值分割法是一种基于区域的图像分割技术,其基本原理是:通过设定不同的特征阈值,把图像像素点分为若干类常用的特征包括:直接来自原始图像的灰度或彩色特征;由原始灰度或彩色值变换得到的特征设原始图像为f(x,y),按照一定的准则在f(x,y)中找到特征值T,将图像分割为两个部分,分割后的图像为若取 :b0=0(黑),b1=1(白),即为我们通常所说的图像二值化。 (原始图像) (阈值分割后的二值化图像)一般意义下
5、,阈值运算可以看作是对图像中某点的灰度、该点的某种局部特性以及该点在图像中的位置的一种函数,这种阈值函数可记作 T(x,y,N(x,y),f(x,y)式中,f(x,y)是点(x,y)的灰度值;N(x,y)是点(x,y)的局部邻域特性根据对T的不同约束,可以得到3种不同类型的阈值37,即 点相关的全局阈值TT(f(x,y) (只与点的灰度值有关)区域相关的全局阈值TT(N(x,y),f(x,y) (与点的灰度值和该点的局部邻域特征有关) 局部阈值或动态阈值TT(x,y,N(x,y),f(x,y)(与点的位置、该点的灰度值和该点邻域特征有关)图像阈值化这个看似简单的问题,在过去的四十年里受到国内外
6、学者的广泛关注,产生了数以百计的阈值选取方法2-9,但是遗憾的是,如同其他图像分割算法一样,没有一个现有方法对各种各样的图像都能得到令人满意的结果,甚至也没有一个理论指导我们选择特定方法处理特定图像。所有这些阈值化方法,根据使用的是图像的局部信息还是整体信息,可以分为上下文无关(non-contextual)方法(也叫做基于点(point-dependent)的方法)和上下文相关(contextual)方法(也叫做基于区域(region-dependent)的方法);根据对全图使用统一阈值还是对不同区域使用不同阈值,可以分为全局阈值方法(global thresholding)和局部阈值方法(
7、local thresholding,也叫做自适应阈值方法adaptive thresholding);另外,还可以分为双阈值方法(bilever thresholding)和多阈值方法(multithresholding)本文分三大类对阈值选取技术进行综述:1) 基于点的全局阈值方法;2) 基于区域的全局阈值方法3) 局部阈值方法和多阈值方法3基于点的全局阈值选取方法3.1 p-分位数法1962年Doyle10提出的p-分位数法(也称p-tile法)可以说是最古老的一种阈值选取方法。该方法使目标或背景的像素比例等于其先验概率来设定阈值,简单高效,但是对于先验概率难于估计的图像却无能为力。例如
8、,根据先验知识,知道图像目标与背景象素的比例为PO/PB,则可根据此条件直接在图像直方图上找到合适的阈值T,使得f(x,y)=T的象素为目标,f(x,y)T的象素为背景。3.2 迭代方法选取阈值11初始阈值选取为图像的平均灰度T0,然后用T0将图像的象素点分作两部分,计算两部分各自的平均灰度,小于T0的部分为TA,大于T0的部分为TB计算 ,将T1 作为新的全局阈值代替T0,重复以上过程,如此迭代,直至TK 收敛,即TK1 TK 经试验比较,对于直方图双峰明显,谷底较深的图像,迭代方法可以较快地获得满意结果。但是对于直方图双峰不明显,或图像目标和背景比例差异悬殊,迭代法所选取的阈值不如最大类间
9、方差法。3.3 直方图凹面分析法从直观上说,图像直方图双峰之间的谷底,应该是比较合理的图像分割阈值,但是实际的直方图是离散的,往往十分粗糙、参差不齐,特别是当有噪声干扰时,有可能形成多个谷底。从而难以用既定的算法,实现对不同类型图像直方图谷底的搜索。Rosenfeld和Torre12提出可以构造一个包含直方图的最小凸多边形,由集差确定的凹面。若和分别表示与在灰度级之处的高度,则取局部极大值时所对应的灰度级可以作为阈值。也有人使用低通滤波的方法平滑直方图,但是滤波尺度的选择并不容易13。但此方法仍然容易受到噪声干扰,对不同类型的图像,表现出不同的分割效果。往往容易得到假的谷底。但此方法对某些只有
10、单峰直方图的图像,也可以作出分割。如:3.4 最大类间方差法由Otsu14于1978年提出的最大类间方差法以其计算简单、稳定有效,一直广为使用。从模式识别的角度看,最佳阈值应当产生最佳的目标类与北京类的分离性能,此性能我们用类别方差来表征,为此引入类内方差、类间方差和总体方差,并定义三个等效的准则测量:, , . (3)鉴于计算量的考量,人们一般通过优化第三个准则获取阈值。此方法也有其缺陷,kittler和Illingworth15的实验揭示:当图像中目标与背景的大小之比很小时方法失效。在实际运用中,往往使用以下简化计算公式:(T) WA(a-)2 + Wb(b-)2 其中,为两类间最大方差,
11、WA 为A类概率,a为A类平均灰度,Wb 为B类概率,b为B类平均灰度,为图像总体平均灰度。即阈值T将图像分成A,B两部分,使得两类总方差(T)取最大值的T,即为最佳分割阈值。3.5 熵方法八十年代以来,许多学者将Shannon信息熵的概念应用于图像阈值化,其基本思想都是利用图像的灰度分布密度函数定义图像的信息熵,根据假设的不同或视角的不同提出不同的熵准则,最后通过优化该准则得到阈值。Pun16通过使后验熵的上限最大来确定阈值。Kapur等人17的方法假定目标和背景服从两个不同的概率分布和定义 (4)使得熵 (5)达到最大求得最佳阈值。此方法又称为KSW熵方法。3.6 最小误差阈值此方法来源于
12、Bayes最小误差分类方法。Eb(T)是目标类错分到背景类的概率,Eo(T)是背景类错分到目标类的概率总的误差概率E(T) Eb(T) Eo(T)使E(T)取最小值,即为最优分类方法。在Kittler和Illingworth18于1986年提出的最小误差法中,直方图被视为目标与背景混合集概率密度函数的估计 (9)其中,为先验概率,求解下列方程可得到Bayes最小误差阈值 (10)遗憾的是上式中,和通常是未知的,Nakagawa和Rosenfeld19提倡用拟合方法从直方图中估计这些参数,但是算法相当复杂,不易实现。3.7 矩量保持法矩量保持(moment-preserving)法20 ,即矩守
13、恒阈值法,是1985年提出的,其基本思想是最佳的阈值应该使分割前后图像的矩量保持不变,由此可以得到一组矩量保持方程,求解该方程组就可以得到最佳阈值。3.8 模糊集方法模糊集理论较好的描述了人类视觉中的模糊性和随机性,因此在图像阈值化领域受到了广泛的关注。模糊集阈值化方法的基本思想是,选择一种S状的隶属度函数定义模糊集,隶属度为0.5的灰度级对应了阈值,当然在上述隶属度函数的表达式中阈值是一个未知的参数;然后在此模糊集上定义某种准则函数(例如整个图像的总体模糊度),通过优化准则函数来确定最佳阈值。Pal等21首先,他们把一幅具有个灰度级的图像看作一个模糊集,其中隶属函数定义如下: (11)参数称
14、之为交叉点(即)。由此从图像的空间平面得到模糊特性平面。然后,基于此模糊集定义了图像的线性模糊度、二次模糊度和模糊熵,使这三个量取最小值时的交叉点即为最佳阈值。文献21指出模糊隶属度函数在该算法中的作用仅在于将图像由灰度数据空间转换为模糊空间 ,其函数的形式对增强结果几乎没有影响。这就使我们有理由使用一些形式简单的函数形式。例如国内学者发表的一种模糊阈值方法22:(x) 10q-c/2qq+c/2Lx隶属度(x)表示灰度x具有明亮特性的程度,c为隶属函数窗宽,q对应隶属度为0.5的灰度级。设灰度级的模糊率为: = min(l),1-(l)则得到整幅图像的模糊率44 其中,MN为图像尺寸,L为图
15、像总灰度级,图像中灰度为的象素个数。对应于不同的q值,就可以计算出相应的图像模糊率,选取使得最小的q值,作为图像分割的最佳阈值即可。3.9 小结对于基于点的全局阈值选取方法,除上述主要几种之外还许多,但大多都是以上述基本方法为基础,做出的改进方法或者对算法的优化,如使用递推方法以降低算法复杂性。例如在文献42中,提出一种使目标和背景差距最大的阈值求取方法,类似于最大类间方差阈值法。是它的一种简化算法。又如1984年Dunn等人23提出了均匀化误差阈值选取方法,这种方法实质上是要使将背景点误分为目标点的概率等于将目标点误分为背景点的概率。类似于最小误差阈值法。近年来有一些新的研究手段被引入到阈值
16、选取中。比如人工智能,在文献24 中,描述了如何用人工智能的方法,寻找直方图的谷底点,作为全局阈值分割。其它如神经网络,数学形态学3946,小波分析与变换40等等。总的来说,基于点的全局阈值算法,与其它几大类方法相比,算法时间复杂度较低,易于实现,适合应用于在线实时图像处理系统。由于我的研究方向为机器视觉,所作的项目要求算法具有良好的实时性,因此针对基于点的全局阈值方法,阅读了较多的文献,在综述里叙述也相对比较详细。4 基于区域的全局阈值选取方法对一幅图像而言,不同的区域,比如说目标区域或背景区域,同一区域内的象素,在位置和灰度级上同时具有较强的一致性和相关性。而在上述基于点的全局阈值选取方法
17、中,有一个共同的弊病,那就是它们实际上只考虑了直方图提供的灰度级信息,而忽略了图像的空间位置细节,其结果就是它们对于最佳阈值并不是反映在直方图的谷点的情况会束手无策,不幸我们通常遇到的很多图像恰恰是这种情况。另一方面,完全不同的两幅图片却可以有相同的直方图,所以即使对于峰谷明显的情况,这些方法也不能保证你得到合理的阈值。于是,人们又提出了很多基于空间信息的阈值化方法。可以说,局域区域的全局阈值选取方法,是基于点的方法,再加上考虑点领域内象素相关性质组合而成,所以某些方法常称为“二维xxx方法”。由于考虑了象素领域的相关性质,因此对噪声有一定抑止作用41。4.1 二维熵阈值分割方法25使用灰度级
18、-局域平均灰度级形成的二维灰度直方图43进行阈值选取,这样就得到二维熵阈值化方法。(二维灰度直方图: 灰度领域平均灰度)如图,在0区和1区,象素的灰度值与领域平均灰度值接近,说明一致性和相关性较强,应该大致属于目标或背景区域;2区和3区一致性和相关性较弱,可以理解为噪声或边界部分。二维熵阈值分割,就是选择(S,T)对,使得目标类和背景类的后验熵最大。(具体方法是一维熵阈值分割的推广,可参见上一节)Abutaleb26,和Pal结合Kapur和Kirby的方法,分别提出了各自的二维熵阈值化方法,其准则函数都是使目标熵和背景熵之和最大化。Brink27的方法则是使这两者中的较小者最大化,该方法的计
19、算复杂度为,后来有人改进为递推快速算法将时间复杂度降为(其中为最大灰度级数)。4.2 简单统计法Kittler等人28,29提出一种基于简单的图像统计的阈值选取方法。使用这种方法,阈值可以直接计算得到,从而避免了分析灰度直方图,也不涉及准则函数的优化。该方法的计算公式为 (19)其中, 因为e(x,y)表征了点(x,y)领域的性质,因此本方法也属于基于区域的全局阈值法。4.3 直方图变化法从理论上说,直方图的谷底是非常理想的分割阈值,然后在实际应用中,图像常常受到噪声等的影响而使其直方图上原本分离的峰之间的谷底被填充,或者目标和背景的峰相距很近或者大小差不多,要检测他们的谷底就很难了。在上一节
20、基于点的全局阈值方法中,我们知道直方图凹面分析法的弊病是容易受到噪声干扰,对不同类型的图像,表现出不同的分割效果。往往容易得到假的谷底。这是由于原始的直方图是离散的,而且含噪声,没有考虑利用象素领域性质。而直方图变化法,就是利用一些象素领域的局部性质变换原始的直方图为一个新的直方图。这个新的直方图与原始直方图相比,或者峰之间的谷底更深,或者谷转变成峰从而更易于检测。这里的象素领域局部性质,在很多方法中经常用的是象素的梯度值。例如,由于目标区的象素具有一定的一致性和相关性,因此梯度值应该较小,背景区也类似。而边界区域或者噪声,就具有较大的梯度值。最简单的直方图变换方法,就是根据梯度值加权,梯度值
21、小的象素权加大,梯度值大的象素权减小。这样,就可以使直方图的双峰更加突起,谷底更加凹陷。4.4 其它基于区域的全局阈值法松弛法利用邻域约束条件迭代改进线性方程系统的收敛特性,当用于图像阈值化时其思想是:首先根据灰度级按概率将像素分为“亮”和“暗”两类,然后按照领域像素的概率调整每个像素的概率,调整过程迭代进行,使得属于亮(暗)区域的像素“亮(暗)”的概率变得更大。其它还有许多方法利用灰度值和梯度值散射图,或者利用灰度值和平均灰度值散射图。5 局部阈值法和多阈值法5.1 局部阈值(动态阈值)当图像中有如下一些情况:有阴影,照度不均匀,各处的对比度不同,突发噪声,背景灰度变化等,如果只用一个固定的
22、全局阈值对整幅图像进行分割,则由于不能兼顾图像各处的情况而使分割效果受到影响。有一种解决办法就是用与象素位置相关的一组阈值(即阈值是坐标的函数)来对图像各部分分别进行分割。这种与坐标相关的阈值也叫动态阈值,此方法也叫变化阈值法,或自适应阈值法。这类算法的时间复杂性可空间复杂性比较大,但是抗噪能力强,对一些用全局阈值不易分割的图像有较好的效果。例如,一幅照度不均(左边亮右边暗)的原始图像为:如果只选择一个全局阈值进行分割,那么将出现下面两种情况,都不能得到满意的效果。 (阈值低,对亮区效果好,则暗区差) (阈值高,对暗区效果好,则亮区差)若使用局部阈值,则可分别在亮区和暗区选择不同的阈值,使得整
23、体分割效果较为理性。(按两个区域取局部阈值的分割结果)进一步,若每个数字都用不同的局部阈值,则可达到更理想的分割效果。5.1.1 阈值插值法首先将图像分解成系列子图,由于子图相对原图很小,因此受阴影或对比度空间变化等带来的问题的影响会比较小。然后对每个子图计算一个局部阈值(此时的阈值可用任何一种固定阈值选取方法)。通过对这些子图所得到的阈值进行插值,就可以得到对原图中每个象素进行分割所需要的合理阈值。这里对应每个象素的阈值合起来构成的一个曲面,叫做阈值曲面。5.1.2 水线阈值算法水线(也称分水岭或流域,watershed)阈值算法可以看成是一种特殊的自适应迭代阈值方法,它的基本思想是:初始时
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 图像 分割 阈值 选取 技术 综述 13
限制150内