图像分割中灰度阈值选择方法的研究毕业论文.doc
本科毕业论文图像分割中灰度阈值选择方法的研究 姓 名 学 院 光电信息与计算机工程学院 专 业 电子信息工程 指导教师 完成日期 2013年6月 上海理工大学全日制本科生毕业设计(论文)承诺书本人郑重承诺:所呈交的毕业设计(论文) 是在导师的指导下,严格按照学校和学院的有关规定由本人独立完成。文中所引用的观点和参考资料均已标注并加以注释。论文研究过程中不存在抄袭他人研究成果和伪造相关数据等行为。如若出现任何侵犯他人知识产权等问题,本人愿意承担相关法律责任。 承诺人(签名): 日 期图像分割中灰度阈值选择方法的研究摘 要 图像分割是图像处理中最重要的内容之一。图像分割的方法有很多种,按照区域的图像分割,按照阈值的图像分割,以及按照边缘的图像分割。本论文主要研究图像分割中,基于阈值的图像分割方法。阈值分割方法是图像分割技术中最常用的方法,其实质是利用图像的灰度直方图信息获取用于分割的最佳阈值。灰度值中大于某一阈值,令处理结果为“1”,否则为“0”,从而将图像处理为黑白二值图。在这种分割技术中,确定阈值的算法不同,对相同的图像处理的结果清晰度和辨识度就不一样。本论文中主要研究了5种具体的方法:迭代法、全局阈值Otsu法阈值分割、局部阈值法、最小交叉熵阈值法分割以及最大熵分割法。对各种方法做了具体的研究和对比,当目标与背景具有明显差异时,最佳阈值法效果明显优于其他方法,总体来说,最佳阈值Otsu法具有更广的实用性,运用范围也更加普遍。最后,对于全局Otsu法进行了深入拓展,研究了更加具有优势的Otsu自适应阈值法。 关键词:图像处理,分割,灰度处理,阈值选择IMethod of gray threshold selection of image segmentationABSTRACTImage segmentation is one of the most important parts of image processing. There are many methods of image segmentation, segmentation according to the regional image segmentation threshold, according to the image, and in accordance with the edge of the image segmentation. This paper mainly studies the image segmentation, threshold segmentation method based on image. Threshold segmentation method is the most commonly used method of image segmentation technology, its essence is the use of information of gray histogram image acquisition for optimal threshold segmentation. Gray value is greater than a certain threshold, the processing result is "1", "0", otherwise the image processing for the black and white picture. In this kind of segmentation, threshold determination algorithm is different, the same results of image processing and recognition is not the same definition. This paper mainly studies 5 kinds of specific methods: iterative method, the global threshold Otsu threshold, local threshold method, minimum cross entropy threshold segmentation and maximum entropy segmentation method. The study and comparison of specific to each method, when the target and background has obvious differences, the optimal threshold method has obvious effect for other methods, in general, the best threshold Otsu method has more practical application range wide, more common. Finally, for the global Otsu method was further expanded, adaptive threshold method has more advantages. KEYWORDS: image processing, segmentation, gray processing, threshold selection目录中文摘要ABSTRACT第1 章 绪 论1第2 章 数字图像处理32.1 数字图像的基本概念32.1.1 图像的概念32.1.2 数字图像42.2 数字图像处理技术62.2.1 数字图像处理的定义62.2.2 数字图像处理技术的主要内容62.3 数字图像处理的发展8第3 章 图像分割103.1 图像分割的定义103.1.1图像分割一般定义103.1.2 图像分割更形式化的定义103.2 数字图像分割的分类113.3 图像分割方法113.3.1 基于区域的分割方法113.3.2 基于阈值的分割方法123.3.3 基于边缘的分割方法13第4 章 阈值分割的方法154.1 迭代法全域值分割154.1.1概念及其算法154.1.2 分析164.2 全局阈值OTSU法阈值分割164.2.1 概念及其算法164.2.2 分析184.3 局部阈值分割184.3.1 概念及其算法184.3.2 分析194.4 最大熵分割法194.4.1 概念及其算法194.4.3 分析194.5 最小交叉熵分割方法204.5.1 概念及算法204.5.2 分析20第5章 基于图像分割中灰度阈值选择方法的研究应用225.1 关于实验225.1.1实验相关准备225.1.2 实验过程及结论225.2 多组实验举例25第6章 基于Otsu方法的探究及深入316.1 改进的二维Otsu方法的理论研究316.2 结果展示及结论32致谢34参考文献35附录36附录1:5种分割方法代码36附录2:画出二值图的直方图38附录3:改进的Otsu自适应阈值分割39上海理工大学本科生毕业设计(论文)第1 章 绪 论图像的研究和应用中,人们往往对图像中的某些部分感兴趣,这些感兴趣的部分一般对应图像中特定的、具有特殊性质的区域(可以对应单一区域,也可以对应多个区域),称之为目标或前景;而其他部分称为图像的背景。为了辨识和分析目标,需要把目标从一幅图像中孤立出来,在此基础上才有可能对目标进一步利用,如进行特征提取和测量。(1)课题背景图像分割是图像处理中的一项关键技术,也是一经典难题,发展至今仍没有找到一个通用的方法,也没有制定出判断分割算法好坏的标准,对近几年来出现的图像分割方法作了较为全面的综述,探讨了图像分割技术的发展方向,对从事图像处理研究的科研人员具有一定的启发作用。图像分割在图像工程中起着承上启下的作用,是介于低层次处理和高层次处理的中间层次。早在1965年就有人提出了检测边缘算子边缘检测方法,边缘检测已产生了不少经典算法。目前越来越多的学者开始将数学形态学、模糊理论、遗传算法理论、分形理论和小波变换理论等研究成果运用到图像分割中,产生了结合特定数学方法和针对特殊图像分割的先进图像分割技术。图像分割是图像分析的第一步,图像分割接下来的任务,如特征提取、目标识别等的好坏,都取决于图像分割的质量如何。由于该课题的难度和深度,进展比较缓慢。图像分割算法的研究已经有几十年的历史,一直都受到人们的高度重视。关于图像分割的原理和方法国内外已有不少的研究成果。虽然研究人员针对各种问题提出了许多方法,但迄今为止仍然不存在一个普遍适用的理论和方法。基本已有的方法如:迭代法,局部阈值分割方法,最大熵法,最佳阈值法等其他方法。另外,还没有制定出选择适用分割算法的标准,不同的色彩下:如红光,紫外线,红外线等光线下;不同的光照强度下:如清晨7点,中午12点,下午6点以及晚上10点,光照强度对图像的视觉感官都不同,拍出的图像也有所差异,因此,对于不同光度下的图像,处理方式选择不同,处理后的效果就不同;另外,在室内,室外拍摄同样的物体,同样的阈值分割方法处理出来的图像,结果也会有所差异。这给图像分割技术的应用带来许多实际问题。最近几年又出现了许多新思路、新方法或改进算法,对一些经典方法和新出现的方法作了概述,并将图像分割方法分为阈值分割方法、边缘检测方法、区域提取方法和结合特定理论工具的分割方法4类。(2)课题意义在一副图像中,我们常常只对其中的某些目标感兴趣,对于这些我们感兴趣的目标,它们通常在要分割的图像中占据一定的区域,而且在某些特性上与周围的图像存在一定的差别。这些差别可能非常明显,也可能十分细微,以至于人眼无法觉察。图像分割是按一定的制约规则把图像划分为若干个互不相交、具有特定性质的区域,是把我们关注的区域从需要分割的图像中提取出来,以此进行进一步研究分析和处理的技术。图像分割的结果是图像特征提取和识别等图像理解的基础,对图像分割的研究一直是数字图像处理技术的焦点和热点。传统的图像分割方法存在着一些不足,无法满足人们的要求,给进一步的图像分析和理解过程带来了困难。随着计算机技术的发展及其相关技术的成熟,结合图像增强等图像处理技术,我们已经能够在计算机上实现图像分割处理过程。然而,到目前为止,人们还没有制定出选择合适分割算法的标准,这给图像分割技术的应用带来许多实际困难。因此,图像分割的研究还在不断深入,是目前图像处理中研究的热点之一。(3)研究内容图像分割把图像空间分成一些有意义的区域,与图像中各种物体目标相对应。它使得其后的图像分析和识别等处理过程中所要处理的数据量大大减少了,同时又保留了有关图像结构特征的信息。通过对分割结果的描述,能够理解图像中包含的有关信息。图像分割质量直接影响后续图像处理的效果,甚至决定其成败,因此,分割的方法和精确程度至关重要。由此可知,图像分割在图像工程中占据非常重要的位置。常用的图像分割方法是把图像灰度分成不同的等级,然后用设置灰度门限值(阈值)的方法确定有意义的区域或分割物体的边界。常用的阈值选择设定方法有:最小误差阈值、迭代法、最佳阈值法(大津阈值)、最大熵等。本课题全面了解阈值分割的方法,分析比较各种方法适用情况,并编程验证。第2 章 数字图像处理2.1 数字图像的基本概念图像会以各式各样的形式出现在我们面前,它分为可视,非可视;抽象,实际;合适计算机处理的,不合适计算机处理的等等。因此对不同种类的图像我们要加以区别和分析,否则容易引起一些混淆和误解。尤其是到当相互交流着不同的概念时候,也许误解会更加严重。由于图像是我们自出生以来的体验中最要的部分,也是最深刻和丰富的部分,所以更容易认为它是不言而明的,因此,在做正式的研究和实验之前,我们需要对图像的相关概念做一些简单的定义和统一,这样可以保证我们在阅读的时候前后保持一致,不至于引发不必要的误解和误读,所以,我们需要明确一些关于图像的概念。2.1.1 图像的概念图像是实物的一种表示,写真和临摹。衣服图像包含了某一物体的直观信息,可以看出某一物体信息的显示方式;是物体的一种不完全,不精确,但在某种意义上是合适的恰当的表示。(1)按照图像的存在形式物理图像:物质或能力的实际分布。抽象图像:数字图像。(2)按照图像的色彩特征区分彩色图像:又叫“多光谱图像”,表示图像上的每个点有多余一个的局部特征。如果图像的每一种成分在课件光谱之外,如红外线,微波等形成的图像则称为多光谱图像,彩色图像是多光谱图像的特例。灰阶图像:又称为“灰度图像”,“单色图像”,“亮度图像”等等,即,每个像素点上只有一个亮度值。(3)按照图像的光谱特性分将光谱波段根据光子能量进行分组,可以将图像在电磁波谱辐射的基础上进行分类,得到从加玛射线到无线电波的光谱图像,其中包括X射线图像,可见光图像,微波图像,红外光图像,紫外光图像。(4)按照图像的时间特性区分动态图像:随时间变化的图像,如电视机,电影的画面等。静止图像:不随时间变化而变化的图像,如各类图片,相机拍摄的照片等。用数学方法表示图像的信息时,通常着重考虑它的点的性质。例如,我们可以把一幅图看作是空间中各个坐标点上强度的集合,它的最通用的表达式为: ,其中x, y, z是空间坐标,是波长,t是时间,I是图像的强度,由此,这样的一个表达式可以代表一副活动的,彩色的立体的图像。当我们研究的是静止的图像时,上式与时间t无关;当我们研究单色调图像时,上式与无关。对于平面图形来说,上式与z坐标轴无关。所以,对于静止的,平面的,单色的图像来说,其数学表达式可以表示为:,其中,x, y 是空间坐标,在坐标(x, y)处的函数的幅值为改点的强度或者灰度级。上式说明,一副平面图像可以用二维亮度函数来表示,因为光的能量也是一种表现形式,。2.1.2 数字图像数字图像是物体图像的数字表示,是时间和空间的非连续函数,是为了便于计算机处理的一种图像表示形式。当上式中的x, y, f均为有限的,理算的数值时,称此图像为数字图像,数字,与采用数字方法或者离散单元进行的计算有关。如果我们定义数字图像为一个物体的数字表示,则像素就是离散单元,量化的灰度就是数字量值。(1)数字图像类型按照图像颜色和灰度的多少可以将图像分为二值图像,灰度图像,索引图像,真彩色的RGB图像四种基本类型,目前,大多数图像处理软件都支持者四种类型的图像。1)二值图像:二值图像即一副黑白图像,表示其的二维数字矩阵仅由0,1两个数字构成,“1”表示白色,“0”表示黑色,由于每一个像素(矩阵中的每一元素)取值仅有0,1两种可能,所以计算机中二值图像的数据类型通常为一个二进制位,二值图像通常用于文字,线条图的扫描识别,和掩膜图形的存储。2)灰度图像一副256级灰度图像,其矩阵元素的取值范围通常为(0,255),因此,其数据类型一般为8位无符号整数(Unit 8),这就是人们经常提到的256级灰度图像。“255”表示纯白色,“0”表示纯黑色,中间的数字从小到大表示由黑色向白色的过渡色,在某些软件中,灰度图像也可以是由双精度数据类型表示,像素的值域为(0,1),0代表白色,1代表黑色,01之间的小数则表示不同的灰度等级,二值图像可以看做是灰度图像的一个特例。3)索引图像索引图像的文件结构比较复杂,除了存放图像数据的二维矩阵外,还包括一个称之为颜色索引矩阵的二维数。它的大小由存放图像的矩阵元素的值域决定,如矩阵元素值域为(0,255),则矩阵的大小为256*3Byte,用COLORMAP=RGB表示,COLORMAP中每一行的三个元素分别指定表示该行颜色的RGB组合的红,绿,蓝单色值,COLORMAP中每一行对应图像矩阵中的一个灰度值。索引图像的索引矩阵的一部分(014)行。如某一个像素的灰度值为2,该像素就与COLORMAP中的第二行建立了映射关系,该像素在屏幕上的十几颜色由第二行的RGB组合决定。犹豫(255,0,255)组合为紫色,所以凡是灰度值是2的像素均显示为紫色。4)RGB彩色图像 RGB图像与索引图像一样的都可以用来表示彩色图像。与索引图像一样,它分别用红R,绿G,蓝B三原色的组合来表示每个像素的颜色,但是,与索引图像不同的是RGB图像每一个像素的颜色值直接存放在图像的矩阵中。由于每一像素的颜色需要由RGB三个分量来表示,因此,RGB图像的图像矩阵与其他类型不同,是一个三维矩阵,可以用M*N*3来表示。M,N分别表示图像的行列数,3个M*N的二维矩阵分别表示各个像素的R,G,B三个颜色分量,一副彩色的R,G,B图像,RGB图像的数据类型一般为8位无符号整型,通常用于表示和存放真彩色图像,也可以存放灰度图像,存放灰度图像时候,3个二维矩阵同一位置处的元素的取值是完全相同的。(2) 图像格式图像格式是指存储图像采用的文件格式。不同的操作系统,不同的处理软件所支持的图像文件格式都有可能不同,在数字图像信息处理中,了解这些数字化的图像数据是以什么格式在系统中存储,传输,以及处理都是非常重要的,实际应用中也经常会看到以下几种图像文件格式:BMP格式,GIF格式,JPEG格式,TIFF格式,PSD格式,PNG格式,SG格式,其他格式。(3) 图像显示与存储过程图像显示与存储过程包含:显示过程,存储过程,其中显示过程是图像在计算机屏幕上的显示,实际上是从存有图像数据的图像文件中取出数据,再按照计算机显示电路的要求送到显示存储器和调色板寄存器中的一个过程;存储过程则是将显示在屏幕上的图像,其调色板寄存器和显示存储器中的数据可用基本子程序读出来。(4) 图像文件的结构存储在计算机中的图像文件一般由文件头,调色板数据,像素数据三部分构成。其中文件头用于存放图像的各种特征参数,像素数据和调色板数据在文件中的存储位置和文件注解等,有固定格式和灵活格式两大类;调色板数据指的是而知,16色和256色彩色图像的色调数据,真彩图像的像素数据中已有的颜色分量,所以不需要调色板数据;像素数据以位图的形式存放,有压缩,不压缩之分,压缩数据可以节省存储容量,但是在存取时需要进行压缩和解压缩处理,处理速度稍微慢些。(5) 图像文件常用参数图像文件常用的参数为图像的宽度,高度,每个像素总位数,位平面数,图像类型,像素数据存储位置,调色板数据存储位置,图像扫描方向,和压缩类型等等。它们可以分为图幅参数,图像类型参数,位置参数等。2.2 数字图像处理技术2.2.1 数字图像处理的定义数字图像处理是对一个物体的数字表示施加一系列操作的过程,以得到所期望的结果,即将一幅图像经过修改加工成为另一幅本质不变的图像,因此,数字图像处理就是从一个图像到另一个图像的过程,采用的机器一般是数字计算机处理。与之相对应的是模拟图像处理,包括光学处理和电子处理,如照相,电视信号处理以及遥感图像处理等等。这是对模拟信号进行处理的过程,一般为实时处理速度较快。但是也存在着一些缺点,如精度差,灵活性差。数字图像处理的特点:再现性好,处理精度高,使用面宽,灵活性高,图像数据量庞大,处理费时,数字图像处理占用的平带较宽,数字图像中各个像素是不独立的,其相关性大。处理后的图像是一般给人观察和评价的,因此受人的因素影响较大。由于人的诗句系统比较复杂,受环境条件,视觉性能,人的知识状况和情绪爱好影响很大,作为图像质量的评价还有进一步深入的研究。并且图像处理技术综合性强,应用技术领域相当广泛,在通信技术,计算机技术,电子技术,电视技术都有一定的应用。而数学,物理学等领域则是数字图像处理的基础。数字图像处理技术的研究目的:对图像进行加工和分析主要有一下几个方面目的:提高图像的视感质量,以达到赏心悦目的目的。如去除图像中的噪声,改变图像的亮度,颜色,增强图像中的某些成分,一直某些成分,对图像进行几何变换等,从而改变图像的质量,以达到真实,清晰,色彩丰富,意想不到的艺术效果;对图像数据进行变换,编码,压缩,便于图像的存储和传输;提取图像中所包含的的某些特征或特殊信息,常用作模式识别,计算机视觉的预处理,这些特征包括很多方面的,如频域特性,边界区域特性,灰度颜色特性,纹理特性,形状拓扑特性和关系结构等等;生物视觉系统仿生:随着计算机技术与人工智能技术的发展没图像处理技术主要的目的演变成了处理自动装置感受的景物数据。2.2.2 数字图像处理技术的主要内容数字图像处理时利用计算机对数字图像进行系列操作,从而获得某种预期的结果技术。数字图像必须使用计算机,称为计算机图像处理。(1)图像变换直接在空间区域中进行处理,设计计算量非常大。因此,采用各种图像变换的方法,如傅里叶变换,沃尔什变换,离散余弦变换等间接处理技术,将空间域的处理转换为变换域处理,不仅可以减少计算量,而且可以获得更加有效的处理。目前新兴研究的小波变换在时间域和频率域中都具有良好的局部化特性,在图像处理应用中也非常广泛。(2)图像压缩编码数字图像的特点之一就是数据量庞大,尽管现在有大容量的存储器,可是仍然满足不了图像处理数据的需要,因此在实际应用中图像压缩是必须的,而编码是压缩技术中最重要的方法,它在图像处理技术中是发展最早而且比较成熟的技术。(3)图像增强图像增强是对图像质量在一般意义上的改善,当无法知道图像退化有关的定量信息时候,可以使用图像增强技术较为主观的改善图像的质量,所以图像增强技术是一种用于改善图像视觉质量所采用的方法。(4)图像复原 当图像品质下降的原因已经知道的时候,复原技术可以对图像进行修正,图像复原最为关键的是对每种退化都需要由一个合理的模型。此技术需要对图像降质的原因有一定清楚的了解,一般来说应该根据降质过程建立的“降质模型”再采用某种过滤方法,恢复或者重建原来的图像。(5)图像重建图像重建是指从数据到图像的处理,即输入的是某种数据,而经过处理后得到的结果是图像,CT就是图像重建处理的实例。现在,图像重建与计算机图形学结合,加以光照模型和各种渲染技术,把多个二维图像结合成为三维图像,生成各种有强烈真实感的高质量图像。(6)图像分割图像分割是数字图像处理技术中的关键技术之一,把图像分成区域的的过程就是图像分割。图像中包含多个对象,例如一幅医学图像中显示出正常的活着有病变的各种器官组织。图像处理为达到识别和理解的目的,几乎都按照一定的规则将图像分割成几个区域,每个区域代表被成像的一个部分,其意义的特征有图像中的边缘,区域,等,这是进一步进行图像识别,分析,理解的基础。图像自动分割是图像处理中的最困难问题之一,人类视觉系统的优越性使得人类能将所观察的复杂场景中的对象分开,并识别出每个出现的物体。但对计算机来说,这却是一个难以解决的问题。现在,大部分图像的自动分割还需要人工提供必需的信息来帮助,只有一部分领域开始使用;由于解决和分割有关的基本问题是特定领域中图像分析使用化的关键一步,因此将各种方法融合在一起并使用知识来提高处理的可靠性,有效性是图像分割的研究重点。(7)图像描述作为最简单的二值图像可采用几何特性描述物体的特性,一般图像的描述方法采用二维形状描述,它有边界描述和区域描述两大类方法。对于特殊的纹理图像可以采用二维纹理特征描述。随着图像处理研究的深入发展,已经开始进行三维物体描述研究,提出了体积描述,广义圆柱体,表面描述等方法。图像分析图像处理应用的目的几乎均涉及图像分析,有利于计算机多图像的分类,识别和理解。对图像中我们感兴趣的目标进行检测和测量,获得它们的客观信息,从而建立对图像的描述。图像分析就是一个从图像到图像的过程。这里的数据可以是目标特征的测量结果,或者是基于测量的符号表示,它们都描述了目标的特点和性质。(8)图像分类图像分类是图像经过某些预处理,如图像增强,图像复原,图像压缩之后,对图像分割和特征提取,从而进行判别,分类。近几年研究中逐渐发现人工神经网络模式分类和模糊模式识别分类在图形识别中也越来越受到相当程度的重视。(9)图像理解图像理解的重点是在图像分析的基础之上进一步研究图像中各目标的性质和它们之间的相互联系,得出对图像内容含义的理解以及对原来客观场景的解释,从而指导我们的决策;如果说图像分析主要是以观察者为中心研究客观世界,那么图像理解在一定程度上就是以客观世界为中心借助知识,经验,等来把握整个客观世界,包括没有直接观察到的事物。2.3 数字图像处理的发展图像处理的发展,最早的应用之一是在报纸业,后来转而采用基于光学还原的技术,在电报接收端用穿孔纸带打出图片,到1929年灰度等级已经由5个增加为15个;在20世纪50年代中使用计算机对美国“旅行者7号”传送的月球图像进行处理,以矫正在航天器上电视摄像机中各种类型的图像畸变。数字图像作为一门学科大约形成于20世纪60年代初期,60年代至70年代开始用于医学图像,地球遥感监测,天文学等领域。70年代之后就更加迅猛的发展起来,并且广泛应用于太空探索,生物医学工程工业应用,遥感应用,军事应用等。图像处理首次获得实际成果应用的应该是美国喷气推进实验室。数字图像处理去的的另一个巨大成就是在医学上获得的成果,1972年英国EMI公司工程师发明了CT。随着图像处理技术的深入发展,从20世纪70年代中期开始,随着计算机技术和人工智能,思维科学的深入研究,迅速发展,数字图像处理向更高,更深层次发展。人们开始研究如何用计算机系统解释图像,实现类似人类视觉系统理解外部世界,这就是图像理解,也叫计算机视觉。人类本身对于自己的视觉过程了解还不是很多,因此计算机视觉是一个有待人们更进一步探索的新领域。第3 章 图像分割图像分割是一种重要的图像技术,它不仅得到了人们广泛的重视和研究,也在实际中得到了大量的应用;图像分割在不同领域中有时也有其他名称,如目标轮廓技术,阈值化技术,图像区分或求差技术,目标检测技术,目标识别技术和目标跟踪技术等,这些技术本身或核心实际上也是图像分割技术。3.1 图像分割的定义3.1.1图像分割一般定义所谓图像分割是指将图像中具有特殊涵义的不同区域区分开来,这些区域是互相不交叉的,每一个区域都满足特定区域的一致性。好的图像分割应该具备以下特征:分割出来的各区域对某种特性,如灰度和纹理,而言具有相似性,区域内部是连通的且没有过多小孔。相邻区域对分割所依据的性质是有明显的差异的。区域边界明确。大多数图像分割方法只是部分满足上述特征,如果强调分割区域的同性质约束,则分割区域很容易产生大量小孔和不规整边缘;若强调不同区域间性质差异的显著性,容易造成不同区域的合并,具体处理时,不同的图像分割方法总是在各种约束条件之间寻找一种合理的平衡。3.1.2 图像分割更形式化的定义人们对图像分割研究已久,对其定义也有多种多样: 图像分割,是将图像中的具有特殊意义的不同区域进行划分,使得这些区域之间互不相交,并且每个区域需要满足特定区域的一致性条件;图像分割是指将图像划分为与其中含有的真实世界的物体或区域有强相关性的组成部分的过程。上述关于图像分割的定义比较笼统,我们可借助集合概念出如下比较正式的定义:用代表整个图像区域,可将分割看作将分成个子区的处理,满足: (3-1)是一个连接区域, ; (3-2) 对所有的和, ; (3-3)=,对. (3-4) = 对任何邻接区域和. (3-5)其中是定义在集合中的点上的逻辑谓词,是空集。上述条件指出分割必须是完全的,即每个点都必须在一个区域中。条件要求区域是按照预先定义好的方式连接的。条件说明区域之间不相交。条件说明分割区域中的像素点必须满足的性质所有的像素有相同的灰度级,则条件指出领域区域和在谓词上的意义不同。3.2 数字图像分割的分类在国内外学者对图像分割进行的近几十年的研究中,产生了大量有价值的研究成果,从不同的角度分析,关于图像分割的分类繁多。根据图像的属性分类,可分为灰度图像分割和彩色图像分割;根据图像的状态分类,可分为静态图像分割和动态图像分割;根据图像的应用领域分类,可分为医学图像分割、安全图像分割、交通图像分割、军事图像分割、工业图像分割等;根据应用目的分类,可分为粗分割和细分割两大类;根据分割方法的不同分类,图像分割可大致分为3类:基于直方图的分割技术(如阈值分割、聚类分割等)、基于物理性质的分割技术(如利用光照特性和物体表面特征等)、基于邻域的分割技术(如边缘检测、区域增长)3.3 图像分割方法3.3.1 基于区域的分割方法正如它的名字所暗示的,区域生长是一种根据事前定义的准则将像素或子区域聚合成更大的区域的过程。基本的方法是以一组“种子”点开始将与种子性质相似(诸如灰度级或颜色的特定范围)的相邻像素附加到生长区域的每个种子上。通常根据所解决的问题的性质而选择一个或多个起点。当一个先验信息无效时,这一过程将对每个像素计算相同的特性集,最终这个特性集在生长过程中用于将像素归属某个区域。如果这些计算的结果呈现了不同簇的值,则那些由于自身的性质处在这些簇中心附近的像素可以作为种子。基于区域的分割方法主要有两种常用方法:区域生长法和分离合并方法。区域生长法是从一个或若干个像素点(种子)开始,按照生长准则不断进行合并完成分割;分离合并方法则是从整幅图像开始,不断的分离或合并完成分割。区域生长法,其基本思想是首先选择一批种子像素作为生长点,然后按某种生长准则或策略,把种子像素周围与它们特性相同或相近的像素点划入种子像素所在的区域,这个过程反复进行,直到没有更多的合并过程发生。这种方法需解决问题有三个:一是如何选择或确定一组能正确代表所需区域的种子像素,二是如何确定在生长过程中将相邻像素包括进来的准则,三是制定停止生长过程的条件或者规则。由于生长准则的选取既与具体问题本身有关,又与所用的图像信息有关,因此其选择要考虑像素间的连通性和邻近性,否则会出现无意义的分类结果。该方法的优点是运算量不大,对于较均匀的连通目标有较好的分割效果;缺点是需要预先人为确定种子像素,对噪声敏感,可能导致区域内有空洞区域分离与合并令R表示正幅图像区域并选择一个谓词P。对R进行分割的一种是反复将分割的得到图像再次分为四个区域,知道对任何区域,有。这里是从正幅图像开始。如果,就将图像分割为4个区域。对任何区域如果P的值是FALSE,就将这4个区域的每个区域再次分别分割为4个区域,如此不断继续下去。这种特殊的分割技术用所谓的四叉树形式表示最为方便(就是说,每个非叶子节点正好有4个子树),这正如图3-7所说明的那样。注意,树的根对应于整幅图像,每个节点对应于划分的字部分。此时,只有进行了进一步的再细分。 图3-6 分裂图像R44RR1R2R3R4R41R42R43图3-7 相应的四叉树结构图3.3.2 基于阈值的分割方法(1)二值法阈值分割方法是图像分割技术中最常用的方法,其实质是利用图像的灰度直方图信息获取用于分割的最佳阈值。根据已有的研究,阈值法可分为两类:全局阈值法和局部阈值法。全局阈值法,是指借助于图像的全部信息,然后根据这些信息获取图像的最佳分割阈值。全局阈值可以是单阈值,也可以是多阈值;而局部阈值法是把原始的整幅图像分为几个部分的子图像,之后在每个子图像区域应用全局阈值法获取最佳分割阈值。其中全局阈值法又可分为基于点的阈值法和基于区域的阈值法。另外,根据阈值的个数,阈值法还可以分成单阈值方法和多阈值方法。基于阈值的分割方法利用图像的目标和背景在灰度特性上的差异,把图像看做具有不同灰度级的两类区域的组合。它的基本原理是选取一个最适当的阈值,将这个阈值作为区分目标和背景的判断标准,即判断图像中的每个像素点属于目标区域还是属于背景区域,从而得到相应的二值化图像。假设一幅原始灰度图像,其选取的阈值为,分割后的图像定义如下 (3-8)(3-8)式中,表示分割后的二值图像。阈值分割方法实际就是按某个准则函数求最优阈值的过程,假设原始图像的灰度级为L,图像总的像素点个数为,灰度级为的像素点数为,即= (3-9)灰度级为的像素点数出现的概率为=即=, (3-10)之后再按照某一准则选取最佳阈值,根据选取准则的不同,常用的阈值分割方法有以下几种:迭代法、Otsu法(最大类间差法)、最大熵法、最小交叉熵法等。3.3.3 基于边缘的分割方法数字图像的边缘检测是图像分割、目标区域识别、区域形状提取等图像分析领域非常重要的基础,也是图像识别研究中用来提取图像特征的一个重要属性。图像中目标物体的边缘是以图像局部特征不连续的形式出现的,也就是指图像中局部灰度值变化最明显的区域,同时目标物体的边缘也是图像不同区域的分界处。基于边缘检测的分割方法,其基本思想就是先检测图像的边缘点信息,之后将这些检测到的边缘点按照一定的规则策略连接起来形成区域,而达到分割的目的。图像中边缘上的像素点的邻域是一个灰度级的变化区域,衡量这种灰度级变化有两个特征值,即灰度的变化方向和变化率,分别用梯度向量的方向和幅值表示。设对于连续图像F(x, y)其方向导数在边缘方向上有局部最大值。所以边缘检测就是求F(x, y)梯度的局部最大值和方向。在方向沿的梯度: (3-11)时,取最大值,则=0 (3-12)得到梯度最大值 ,称为梯度模,梯度