8. 图像特征提取与分析.ppt
《8. 图像特征提取与分析.ppt》由会员分享,可在线阅读,更多相关《8. 图像特征提取与分析.ppt(73页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、东北大学信息学院东北大学信息学院 陈东岳陈东岳 魏颖魏颖图像处理分析与识别8.1 基本概念基本概念8.2 边界特征的表征边界特征的表征8.3 边界特征的描述边界特征的描述8.4 区域特征的表征与描述区域特征的表征与描述8.5 子空间方法子空间方法第八章 图像特征提取与分析8.1 基本概念图像处理图像处理图像分析图像分析图像理解图像理解图像信号图像信号图像特征图像特征图像模式图像模式视网膜视网膜视皮层视皮层高级皮层高级皮层算法算法信息信息器官器官特征提取在视觉系统中的地位特征提取在视觉系统中的地位 特征提取是图像分析的根本目的,是将信息形式从原始图特征提取是图像分析的根本目的,是将信息形式从原始
2、图像信号转变为图像模式的像信号转变为图像模式的中转站中转站,是连接感知功能与认知功,是连接感知功能与认知功能的能的枢纽枢纽。8.1 基本概念为什么要做特征提取为什么要做特征提取图像分析图像分析(通常为图像分割通常为图像分割)能够获取表征目标的原始数据,能够获取表征目标的原始数据,但通常这些原始数据存在数据量过大、冗余信息过多、可分但通常这些原始数据存在数据量过大、冗余信息过多、可分性差、不变性差等缺点,因此我们需要找到更能有效反映信性差、不变性差等缺点,因此我们需要找到更能有效反映信号分类特性及本质的精炼号分类特性及本质的精炼表达形式表达形式特征提取的定义特征提取的定义从信号中提取出最能代表其
3、分类本质的特征的方法。从信号中提取出最能代表其分类本质的特征的方法。特征提取的内容特征提取的内容特征的表征特征的表征特征的描述特征的描述特征的选择特征的选择8.1 基本概念提取的特征应具有的特点提取的特征应具有的特点可区分性可区分性独立性独立性鲁棒性鲁棒性(不变性,适应性)(不变性,适应性)数量少数量少基于图像信号的特征提取策略基于图像信号的特征提取策略1)从目标的外部信息入手(边界)从目标的外部信息入手(边界)2)从目标的内部信息入手(区域包含的像素)从目标的内部信息入手(区域包含的像素)8.1 基本概念特征不变性(线性形变)特征不变性(线性形变)平移不变性平移不变性尺度不变性尺度不变性旋转
4、不变性旋转不变性仿射不变性仿射不变性8.2 边界特征的表征链码链码链码是对图像边界点坐标的一种精炼表征,该方法采用边界点的排列顺是对图像边界点坐标的一种精炼表征,该方法采用边界点的排列顺序和方向编码来表示曲线。对于离散的数字图像而言,区域的边界轮廓序和方向编码来表示曲线。对于离散的数字图像而言,区域的边界轮廓可理解为边界上相邻的像素单元之间线段逐段相连而成。并对每一种类可理解为边界上相邻的像素单元之间线段逐段相连而成。并对每一种类型(方向)的线段定义对应的码字,将码字连接从而实现对整个边界曲型(方向)的线段定义对应的码字,将码字连接从而实现对整个边界曲线的编码。线的编码。常见的链码形式有常见的
5、链码形式有4链码和链码和8链码链码方向方向角度角度编码编码东东00东北东北451北北902西北西北1353西西1804西南西南2255南南2706东南东南31578.2 边界特征的表征链码 a)原链码方向 图a曲线的链码为:01122233100000765556706其差分链码为:21010010670000777001116图b曲线的链码为:23344455322222107770120其差分链码为:21010010670000777001116目标旋转后,目标旋转后,其链码发生改变其链码发生改变解决方案:解决方案:差分链码:用当前线差分链码:用当前线段与其前一个线段之段与其前一个线段之间
6、的逆时针夹角对应间的逆时针夹角对应的码字表征该线段的码字表征该线段b)逆时针旋转908.2 边界特征的表征链码决定链码的几个因素决定链码的几个因素1)起点:)起点:为保持其旋转不变性,通常要选择一个与图像位置和旋转角为保持其旋转不变性,通常要选择一个与图像位置和旋转角度无关的确定方法,例如到目标质心距离最远的点。度无关的确定方法,例如到目标质心距离最远的点。2)行进方向)行进方向顺时针,或者逆时针。顺时针,或者逆时针。3)尺度)尺度目标的尺度决定了链码的长度,可以通过降采样的方法来实目标的尺度决定了链码的长度,可以通过降采样的方法来实现链码的尺度不变性。现链码的尺度不变性。8.2 边界特征的表
7、征链码(a)原分辨率下的边界采样点原分辨率下的边界采样点(b)降采样后的边界点降采样后的边界点8.2 边界特征的表征链码(1)(1)区域边界的周长区域边界的周长 假设假设区域的边界链码为区域的边界链码为 ,每个码段,每个码段ai所表示的线段长度为所表示的线段长度为 那么那么该区域边界的周长为该区域边界的周长为 式式中中n ne e为链码序列中偶数码个数;为链码序列中偶数码个数;n n为链码序列中码的总个数。为链码序列中码的总个数。(2 2)计算区域计算区域的面积的面积 对对x x轴的积分轴的积分S S就是就是面积。面积。式中式中 ,是初始点的纵坐标,是初始点的纵坐标,a ai0i0和和a ai
8、2i2分别是链码的环长度分别是链码的环长度在在k=0k=0(水平),水平),k=2k=2(垂直)方向的分量。对于封闭链码(初始点坐垂直)方向的分量。对于封闭链码(初始点坐标与终点坐标相同),标与终点坐标相同),y y0 0能任意选择。按顺时针方向编码,根据面积能任意选择。按顺时针方向编码,根据面积计算公式得到链码所代表的包围区域的面积。计算公式得到链码所代表的包围区域的面积。(3)(3)对对x x轴的一阶矩轴的一阶矩(k=0)k=0)8.2 边界特征的表征链码(4(4)对对x x轴的二阶矩(轴的二阶矩(k=0k=0)(5 5)形心形心位置位置(x xc c,y,yc c)S S是面积是面积,M
9、1是链码的是链码的一阶矩一阶矩。(6)(6)两点之间的距离两点之间的距离如果链中任意两个离散点之间的码为如果链中任意两个离散点之间的码为 ,那么这两点间的距离是,那么这两点间的距离是根据链码还可以计算其他形状特征。根据链码还可以计算其他形状特征。8.2 边界特征的表征多边形近似最小周长多边形最小周长多边形以栅格为单位为目标边界建立一个内接多边形与一个外以栅格为单位为目标边界建立一个内接多边形与一个外接多边形,并在这两个多边形只见的区域寻找一条周长接多边形,并在这两个多边形只见的区域寻找一条周长最小的多边形闭合曲线所谓对原目标边界的近似。最小的多边形闭合曲线所谓对原目标边界的近似。8.2 边界特
10、征的表征多边形近似基于点的融合技术基于点的融合技术1)在边界上选择一个起点,作为)在边界上选择一个起点,作为“拟合点集拟合点集”2)按顺时针将下一个边界点加入拟合点集,利用最小二乘)按顺时针将下一个边界点加入拟合点集,利用最小二乘法对拟合点集内的所有点进行直线拟合。法对拟合点集内的所有点进行直线拟合。3)如果:)如果:a)拟合误差小于阈值)拟合误差小于阈值T,则重复步骤,则重复步骤 2)b)拟合误差大于阈值)拟合误差大于阈值T,保留上一次的直线拟合的结,保留上一次的直线拟合的结 果,将拟合点集清空,将当前的这个边界点作为作果,将拟合点集清空,将当前的这个边界点作为作 为一个新的起点加入拟合点集
11、。为一个新的起点加入拟合点集。4)将每次保留的拟合直线中被相邻的两条拟合直线截出的)将每次保留的拟合直线中被相邻的两条拟合直线截出的线段作为多边形的一条边,最终形成近似多边形线段作为多边形的一条边,最终形成近似多边形 8.2 边界特征的表征多边形近似拆分技术拆分技术根据点到直线的距离,对目标边界进行分割,直到满足根据点到直线的距离,对目标边界进行分割,直到满足某种近似条件为止。某种近似条件为止。终止条件(例子)终止条件(例子)边界点到近似多边边界点到近似多边形的距离的方差小形的距离的方差小于某一阈值时终止于某一阈值时终止初始分割:初始分割:1)边界上相互距离)边界上相互距离最远的两个点;最远的
12、两个点;2)整个目标的主分)整个目标的主分量方向;量方向;8.2 边界特征的表征标记图标记图标记图是一种将边界二维坐标转换为一维函数的方法,最常是一种将边界二维坐标转换为一维函数的方法,最常用的算法是将边界点到目标质心的距离作为对应角度的函数。用的算法是将边界点到目标质心的距离作为对应角度的函数。8.2 边界特征的表征标记图标记图的不变性:标记图的不变性:平移不变性:平移不变性:标记图函数生成总是以目标的质心为原点;标记图函数生成总是以目标的质心为原点;尺度不变性:尺度不变性:标记图函数归一化(方差归一化或线性压缩置标记图函数归一化(方差归一化或线性压缩置区间区间0 1)将产生尺度不变性;)将
13、产生尺度不变性;旋转不变性:旋转不变性:选择从质心到具有某种特性的起点的射线方向选择从质心到具有某种特性的起点的射线方向作为作为0度角方向,可以产生旋转不变性。度角方向,可以产生旋转不变性。8.2 边界特征的表征边界线段边界线段边界线段法的基本思路是将目标边界曲线分割成不同的线段,法的基本思路是将目标边界曲线分割成不同的线段,并对这些线段分别进行表征。常用于目标区域为并对这些线段分别进行表征。常用于目标区域为凹集凹集的情况的情况凹集与凸集凹集与凸集包包含含凹凹集集P的的最最小小的的凸凸集集被被定定义义为为是是凹凹集集P的的凸凸壳壳,记为,记为H(P)8.2 边界特征的表征与描述边界线段边界线段
14、算法边界线段算法为凹集为凹集P建立凸壳建立凸壳H(p),以以P与与H(p)的边界上的某个汇入点的边界上的某个汇入点(即在该点的前即在该点的前一个一个P的边界点不再的边界点不再H(p)的边界上,而该点在的边界上,而该点在H(p)的边界上的边界上)为起点,顺为起点,顺时针沿着时针沿着P的边界移动,得到所有的的边界移动,得到所有的n个汇入点和分离点,相邻的汇入点个汇入点和分离点,相邻的汇入点和分离点即将平的边界分为和分离点即将平的边界分为n段。段。8.2 边界特征的表征与描述骨骼化骨骼化骨骼化是一种表现目标集合形状骨架的形态学操作。是一种表现目标集合形状骨架的形态学操作。表示对集合S用结构元素B进行
15、k次连续的腐蚀8.2 边界特征的表征骨骼化骨骼化的结果是可以被理解为原目标区域内某些点的集合,骨骼化的结果是可以被理解为原目标区域内某些点的集合,这些点的共同特征是有两个或以上的边界点与该点之间的距这些点的共同特征是有两个或以上的边界点与该点之间的距离最短。离最短。在具体应用中,由于噪声的影响,分割结果的骨架可能存在在具体应用中,由于噪声的影响,分割结果的骨架可能存在大量的毛刺,可以利用毛刺去除算法得到更具有鲁棒性的骨大量的毛刺,可以利用毛刺去除算法得到更具有鲁棒性的骨架结果架结果8.2 边界特征的表征总结篇“表征表征”是特征分布、组织、表达的模式,主要反是特征分布、组织、表达的模式,主要反映
16、特征在物理意义上的特点,通常以几何形式为基映特征在物理意义上的特点,通常以几何形式为基础。础。表征的具体形式很大程度上决定了特征的数据形式,表征的具体形式很大程度上决定了特征的数据形式,可以看做是可以看做是对原始信息的一种有序化整理对原始信息的一种有序化整理,使其更,使其更能符合识别算法处理的要求。能符合识别算法处理的要求。在选择具体的表征形式时,要注意考虑后期的识别在选择具体的表征形式时,要注意考虑后期的识别算法的要求与限制,一般要使表征形式具有几个特算法的要求与限制,一般要使表征形式具有几个特性:性:不变性不变性(平移,尺度,旋转平移,尺度,旋转),降维,可区分度,降维,可区分度。8.3
17、边界特征的描述常用简单描述子区域边界周长区域边界周长在图像中,边界像素数可以大致的描述边界长度,更加在图像中,边界像素数可以大致的描述边界长度,更加精确的定义是边界中水平线段和垂直线段的总长度,加精确的定义是边界中水平线段和垂直线段的总长度,加上对角线方向线段总长度的上对角线方向线段总长度的 倍。倍。利用链码可以简单的得到区域边界周长,利用链码可以简单的得到区域边界周长,假设区域的边假设区域的边界链码为界链码为 a1,a2,a3,an,每个码段,每个码段ai所表示的线段长度所表示的线段长度为为 li,那么该区域边界的周长为:,那么该区域边界的周长为:式中式中n ne e为链码序列中偶数码个数;
18、为链码序列中偶数码个数;n n为链码序列中码的总为链码序列中码的总个数。个数。8.3 边界特征的描述常用简单描述子直径与径方向直径与径方向边界边界B的直径定义为:的直径定义为:径方向即为边界直径对应的方向径方向即为边界直径对应的方向边界边界B的直径,可以理解为的直径,可以理解为B的最小外接圆的直径的最小外接圆的直径相关概念:相关概念:长轴长轴L短轴短轴M基本矩形基本矩形S离心率离心率(L/M)8.3 边界特征的描述常用简单描述子曲率曲率曲率的数学定义是斜率的变化率,但在离散的数曲率的数学定义是斜率的变化率,但在离散的数字图像中,局部曲率受离散量影响无法准确估计。字图像中,局部曲率受离散量影响无
19、法准确估计。常用的方法是用改点左右的相邻线段的斜率差作常用的方法是用改点左右的相邻线段的斜率差作为对曲率的估计为对曲率的估计8.3 边界特征的描述形状数形状数形状数是一种由链码衍生得到的具有旋转,平移和尺度不变是一种由链码衍生得到的具有旋转,平移和尺度不变性的边界描述方法。性的边界描述方法。如果把具有固定长度边界的差分链码看做是链码起点位置的如果把具有固定长度边界的差分链码看做是链码起点位置的函数,则形状数就是这个函数的最小值。函数,则形状数就是这个函数的最小值。8.3 边界特征的描述形状数形状数的最小差分链码特性使其具有了很好的形状数的最小差分链码特性使其具有了很好的旋转不变性旋转不变性和和
20、平移不变性平移不变性。而。而其尺度不变性其尺度不变性是通过一种基于离心率的是通过一种基于离心率的降采样方式来实现的。形状数的尺度主要由其阶数确定降采样方式来实现的。形状数的尺度主要由其阶数确定形状数的形状数的阶数阶数是指形状数的长度。是指形状数的长度。尺度不变性尺度不变性 阶数不变阶数不变产生具有尺度不变性形状数的步骤产生具有尺度不变性形状数的步骤1)确定阶数)确定阶数n2)构造边界)构造边界B的基本矩形的基本矩形S(B)3)构造一个阶数为)构造一个阶数为n且其离心率与且其离心率与S(B)最为相似的矩形栅格阵列,使其包最为相似的矩形栅格阵列,使其包含边界含边界B4)在此矩形栅格阵列中对)在此矩
21、形栅格阵列中对B进行降采样,计算其阶数进行降采样,计算其阶数nd。若。若nd4的情况。的情况。统计矩的特点在于其明确的物理意义,如一阶矩反映了目标统计矩的特点在于其明确的物理意义,如一阶矩反映了目标的质心,二阶矩反映了边界分布的分散度,三阶矩反映了边的质心,二阶矩反映了边界分布的分散度,三阶矩反映了边界曲线的对称性,四阶矩反应边界与高斯分布的相似性等等。界曲线的对称性,四阶矩反应边界与高斯分布的相似性等等。8.3 边界特征的描述总结篇所有基于边界特征的描述子的基本信息都是边界点所有基于边界特征的描述子的基本信息都是边界点的坐标序列,产生描述子的基本策略都是使用一种的坐标序列,产生描述子的基本策
22、略都是使用一种更加精简的表达方式来重新描述这个坐标序列。在更加精简的表达方式来重新描述这个坐标序列。在描述过程中允许去除冗余信息,甚至是损失一些非描述过程中允许去除冗余信息,甚至是损失一些非冗余信息。冗余信息。在具体的描述子选择方案上,一般要注意描述子的在具体的描述子选择方案上,一般要注意描述子的三个不变性三个不变性:平移,尺度和旋转。此外,还需注意:平移,尺度和旋转。此外,还需注意起点不同带来的描述子的变化。起点不同带来的描述子的变化。8.4 区域特征的表征与描述基本区域特征幅度特征幅度特征例如平均幅度例如平均幅度直方图特征直方图特征:图像对比度、动态范围、明暗程度等:图像对比度、动态范围、
23、明暗程度等均值均值方差方差歪斜度歪斜度8.4 区域特征的表征与描述基本区域特征直方图特征直方图特征峭度峭度能量能量熵熵8.4 区域特征的表征与描述空域描述子空域描述子是不对图像进行变换而直接在图像的空间域,提取形状特征空域描述子是不对图像进行变换而直接在图像的空间域,提取形状特征的方法。这里主要包括的方法。这里主要包括图像的面积,致密性,圆形度,拓扑描述子,图图像的面积,致密性,圆形度,拓扑描述子,图像的凹凸性,像素的距离等像的凹凸性,像素的距离等 面积面积目标面积可用连通区域内像素个数和来统计得到,尽管面积不具有目标面积可用连通区域内像素个数和来统计得到,尽管面积不具有尺度不变性,但它经常用
24、于在遥感图像或工业图像中获取相关重要尺度不变性,但它经常用于在遥感图像或工业图像中获取相关重要信息信息致密度致密度设区域周长为设区域周长为L,面积为,面积为S,则致密度,则致密度e的定义为:的定义为:圆形度圆形度圆形度圆形度R0:圆形度圆形度R0用来描述景物形状接近圆形的程度,它是测量用来描述景物形状接近圆形的程度,它是测量区域形状常用的量。其计算公式为:区域形状常用的量。其计算公式为:8.4 区域特征的表征与描述空域描述子拓扑描述子拓扑描述子是一种鲁棒性非常强的描述子,它研究的是图像是一种鲁棒性非常强的描述子,它研究的是图像在没有撕裂与连接的情况下,不被任何其他图像形变影响的在没有撕裂与连接
25、的情况下,不被任何其他图像形变影响的描述子。通常包括,顶点数,边数,面数,孔洞数,连通区描述子。通常包括,顶点数,边数,面数,孔洞数,连通区域数,欧拉数等。域数,欧拉数等。顶点数顶点数W,边数,边数Q,面数,面数F,孔洞数,孔洞数H,连通区域数,连通区域数C,欧拉,欧拉数数E。在图像区域的描述中,比较常用的是孔洞数在图像区域的描述中,比较常用的是孔洞数H,连通区域数,连通区域数C和欧拉数和欧拉数E,三者只见的关系是:,三者只见的关系是:E=C-H“A”的欧拉数E(A)=0“B”的欧拉数E(B)=-18.4 区域特征的表征与描述空域描述子用线段表示的区域,可根据欧拉数来描述。如下图中的多边形网,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 8. 图像特征提取与分析 图像 特征 提取 分析
限制150内