图像描述与分析幻灯片.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《图像描述与分析幻灯片.ppt》由会员分享,可在线阅读,更多相关《图像描述与分析幻灯片.ppt(135页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、图像描述与分析第1页,共135页,编辑于2022年,星期五第7章 图像描述T图像描述(图像理解)是图像处理的一个重要分支。T图像描述是用一组数量或符号(也称描述子)来表达图像物体的某些特征。T图像描述既可以是图像中各个组成部分的性质的描述,也可以是其各个部分彼此间关系的描述。第2页,共135页,编辑于2022年,星期五特征形成 根据待识别的图像,通过计算产生一组原始特征,称之为特征形成。特征提取原始特征的数量很大,或者说原始样本处于一个高维空间中,通过映射或变换的方法可以将高维空间中的特征描述用低维空间的特征来描述,这个过程就叫特征提取。图像特征第3页,共135页,编辑于2022年,星期五图像
2、特征:指图像的原始特性或属性。其中有些是视觉直接感受到的自然特征,如区域的亮度、边缘的轮廓、纹理或色彩等;有些是需要通过变换或测量才能得到的人为特征,如变换频谱、直方图、矩等。常用的图像特征有颜色特征、形状特征、幅度特征、纹理特征、变换系数特征、空间特征。图像特征第4页,共135页,编辑于2022年,星期五颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征。颜色特征 第5页,共135页,编辑于2022年
3、,星期五人们的视觉系统对于景物认识的初级阶段是形状。图像经过边缘提取与分割等操作,就会得到景物的边缘和区域,也就获取了景物的的形状。任何一个景物形状特征均可由其几何属性(如长短、面积、距离、凹凸等),统计属性(如投影)和拓扑属性(如连通、欧拉数)来进行描述。形状特征 第6页,共135页,编辑于2022年,星期五第7章 图像描述与分析7.1 灰度描述7.2 边界描述7.3 区域描述7.4 纹理描述第7页,共135页,编辑于2022年,星期五7.1 灰度描述7.1.1 幅度特征7.1.2 直方图特征7.1.3 变换系数特征第8页,共135页,编辑于2022年,星期五7.1.1 幅度特征在所有的图像
4、特征中,最基本的是图像的幅度特征。可以在某一像素点或其邻域内做出幅度的测量,例如在区域NN内的平均幅度,即:可以直接从图像像素的灰度值,或从某些线性、非线性变换后构成新的图像幅度的空间来求得各式各样图像的幅度特征图。第9页,共135页,编辑于2022年,星期五7.1.1 幅度特征 a)原图 b)利用幅度特征将目标分割出来第10页,共135页,编辑于2022年,星期五一幅数字图像可以看作是一个二维随机过程的一个样本,可以用联合概率分布来描述。通过对图像的各像素幅度值可以设法估计出图像的概率分布,从而形成图的直方图特征。图像灰度的一阶概率分布定义为:M为围绕(x,y)点被测窗口内的像素总数;N(b
5、)为该窗口内灰度值为b的像素总数。7.1.2 直方图特征第11页,共135页,编辑于2022年,星期五图像的直方图特征可以提供图像信息的许多特征。图像对比度、动态范围、明暗程度等。例如直方图密集地分布在很窄的区域之内,说明图像的对比度很低;若直方图有两个峰值,说明存在着两种不同亮度的区域。一阶直方图的特征参数:rk量化层 均值:方差:斜度:7.1.2 直方图特征第12页,共135页,编辑于2022年,星期五 峭度:熵:能量:7.1.2 直方图特征第13页,共135页,编辑于2022年,星期五二阶直方图的特征是以像素对的联合概率分布为基础得出的。若两个像素f(i,j)及f(m,n)分别位于(i,
6、j)点和(m,n)点,两者的间距为|i-m|、|j-n|,并可用极坐标、表达,幅度值的联合分布为:a、b为量化的幅度值。直方图的二阶分布为:7.1.2 直方图特征表示在图像中,在方向上、径向间距为的像素对f(i,j)=a,f(m,n)=b出现的频数;M窗口中像素的总数。第14页,共135页,编辑于2022年,星期五假设图像的各像素对都是相互关联的,则P(a,b)将在阵列的对角线上密集起来。以下一些度量,用来描述围绕P(a,b)对角线能量扩散的情况:自相关:协方差:7.1.2 直方图特征惯性矩:第15页,共135页,编辑于2022年,星期五绝对值:能量:7.1.2 直方图特征熵:第16页,共13
7、5页,编辑于2022年,星期五由于图像的二维变换得出的系数反映了二维变换后图像在频率域的分布情况,因此常常用二维的傅里叶变换作为一种图像特征的提取方法。7.1.3 变换系数特征设M(u,v)是F(u,v)的平方值,即当f(x,y)的原点有了位移时,M(u,v)的值保持不变,因此M(u,v)与F(u,v)不是唯一对应的,这种性质称为位移不变性。第17页,共135页,编辑于2022年,星期五v v(m+1)u v(m)水平切口垂直切口环状切口扇状切口7.1.3 变换系数特征T如果把M(u,v)在某些规定区域内的累计值求出,也可以把图像的某些特征突出起来。u(m)u(m+1)(m+1)(m)第18页
8、,共135页,编辑于2022年,星期五T特征:图像中含有这些切口的频谱成分的含量。把这些特征提取出来,可以作为模式识别或分类系统的输入信息。这种方法已成功用于土地情况分类,放射照片病情诊断等。7.1.3 变换系数特征第19页,共135页,编辑于2022年,星期五为了描述目标物的二维形状,通常采用的方法是利用目标为了描述目标物的二维形状,通常采用的方法是利用目标物的边界来表示物体,即所谓的边界描述。当一个目标区物的边界来表示物体,即所谓的边界描述。当一个目标区域边界上的点已被确定时,就可以利用这些边界点来区别域边界上的点已被确定时,就可以利用这些边界点来区别不同区域的形状。这样做既可以节省存储信
9、息,又可以准不同区域的形状。这样做既可以节省存储信息,又可以准确的确定物体。确的确定物体。7.2 边界描述7.2.1 链码描述7.2.2 傅里叶描述子第20页,共135页,编辑于2022年,星期五7.2.1 链码描述T在数字图像中,边界或曲线是由一系列离散的像素点在数字图像中,边界或曲线是由一系列离散的像素点组成的,其最简单的表示方法是由美国学者组成的,其最简单的表示方法是由美国学者FreemanFreeman提提出的链码方法。出的链码方法。T链码实质上是一串指向符的序列,有链码实质上是一串指向符的序列,有4向链码、向链码、8向链向链码等。码等。第21页,共135页,编辑于2022年,星期五
10、4向链码 8向链码7.2.1 链码描述对任一像素点P,考虑它的8个邻近像素,指向符共有8个方向,分别用0、1.7表示。链码表示就是从某一起点开始沿曲线观察每一段的走向并用相应的指向符来表示,结果形成一个数列。可以用链码来描述任意曲线或者闭合的边界。第22页,共135页,编辑于2022年,星期五 a)原链码方向 b)逆时针旋转90 图a曲线的链码为:01122233100000765556706 图b曲线的链码为:23344455322222107770120 7.2.1 链码描述第23页,共135页,编辑于2022年,星期五用链码表示给定目标的边界时,如果目标平移,链码不会发生变化,而如果目标
11、旋转则链码会发生变化。为解决这个问题,可利用链码的一阶差分来重新构造一个表示原链码各段之间方向变化的新序列,相当于把链码进行旋转归一化。差分链码可用相邻两个方向数按反方向相减(后一个减去前一个),并对结果作模8运算得到。7.2.1 链码描述第24页,共135页,编辑于2022年,星期五 a)原链码方向 b)逆时针旋转90 图a曲线的链码为:01122233100000765556706其差分链码为:1010010670000777001116 图b曲线的链码为:23344455322222107770120 其差分链码为:10100106700007770011167.2.1 链码描述曲线旋转
12、到不同位置对应不同的链码,但其差分链码不变。第25页,共135页,编辑于2022年,星期五曲线的链码是:6022222021013444444454577012其差分链码是:2200006277121000000171201117.2.1 链码描述第26页,共135页,编辑于2022年,星期五曲线的链码是:024444424323566666676711234其差分链码是:220000627712100000171201117.2.1 链码描述第27页,共135页,编辑于2022年,星期五T链码的特殊性质 一个物体很容易实现旋转45。如果一个物体旋转n45,可由原链码加上 n 倍的模8得到链码
13、的微分,也称差分码,由原码的一阶差分求得链码差分是关于旋转不变的边界描述方法区域的一些其它性质,如面积和角点,可以由链码直接得7.2.1 链码描述第28页,共135页,编辑于2022年,星期五7.2.2 傅里叶描述子T对边界的离散傅里叶变换表达,可以作为定量描述边界形状的基础。采用傅里叶描述的一个优点是将二维的问题简化为一维问题。即将x-y平面中的曲线段转化为一维函数f(r)(在r-f(r)平面上),也可将x-y平面中的曲线段转化为复平面上的一个序列。T转换方法:将x-y平面与复平面u-v重合,其中,实部u轴与x轴重合,虚部v轴与y轴重合。这样可用复数u+jv的形式来表示给定边界上的每个点(x
14、,y)。第29页,共135页,编辑于2022年,星期五7.2.2 傅里叶描述子T两种表示方法本质上是一致的,是点点对应的。两种表示方法本质上是一致的,是点点对应的。边界点的两种表示方法第30页,共135页,编辑于2022年,星期五现在考虑一个由N点组成的封闭边界,从任一点开始绕边界一周就得到一个复数序列,即:7.1.3 变换系数特征s(k)的离散傅里叶变换是:S(w)可称为边界的傅里叶描述,它的傅里叶反变换是:第31页,共135页,编辑于2022年,星期五在变换过程中信息没有任何增减,为我们有选择地描述边界提供了方便。取S(w)的前M个系数即可得到s(k)的一个近似:7.1.3 变换系数特征k
15、的范围不变,即在近似边界上的点数不变,但w的范围缩小了,即重建边界点所需的频率阶数减少了。傅里叶变换的高频分量对应一些细节而低频分量对应总体形状,因此用一些低频分量的傅里叶系数足以近似描述边界形状。第32页,共135页,编辑于2022年,星期五7.3 区域描述对一幅灰度图像或者彩色图像运用图像分割的方法进行处理,把其中感兴趣的像素分离出来作为目标像素,不感兴趣的部分作为背景像素,就可以得到一幅二值图像。理想情况下,希望该二值图像中的两个值准确地代表“目标”及“背景”。但实际中往往所检测道的目标中还有若干个假目标出现,还有可能提取的是多个目标,因此就需要对二值图像进行处理,实现对目标的分析。二值
16、图像包含目标的位置、形状、结构等很多重要信息,是图像分析和目标识别的依据。第33页,共135页,编辑于2022年,星期五7.3 区域描述7.3.1 几何特征7.3.2 不变矩第34页,共135页,编辑于2022年,星期五 1、像素与、像素与邻域邻域对于任意像素(i,j),(s,t)是一对适当的整数,则把像素的集合(i+s,j+t)叫做像素(i,j)的邻域.直观上看,这是像素(i,j)附近的像素形成的区域.最经常采用的是4-邻域和8-邻域 a)4-邻域 b)8-邻域 7.3.1 几何特征第35页,共135页,编辑于2022年,星期五区域面积是区域的一个基本特性,描述区域的大小。图像中的区域面积用
17、同一标记的区域内像素的个数总和来表示。区域的面积和周长 按上述表示法区域按上述表示法区域R R的面积的面积S=41。T2、区域面积、区域面积第36页,共135页,编辑于2022年,星期五 3.位置位置质心形心由于目标在图像中总有一定的面积大小,因此有必要定义目标在图像中的精确位置。目标的位置有形心、质心之分,形心为目标形状的中心,质心为目标质量的中心。第37页,共135页,编辑于2022年,星期五4.区域周长区域周长周长是区域形状的一个重要的整体参数。数字图像子集S的周长定义有不同概念,常用的有以下三种定义:(1)用边界所占面积表示,即边界点数之和;(3)区域边界8链码的长度(2)用区域中相邻
18、边缘点间距离之和来表示。在区域的边界像素中,设某像素与其水平或垂直方向上相邻边缘像素间的距离为1,与倾斜方向上相邻边缘像素间的距离为 。周长就是这些像素间距离的总和。第38页,共135页,编辑于2022年,星期五5.方向方向二阶矩轴:物体上的全部点到该线的距离平方和最小其中 是物体点到直线 的距离第39页,共135页,编辑于2022年,星期五6.距离距离 1)欧几里德距离(Euclidean)2)4-邻域距离(City-block城区距离)3)8-邻域距离(Chessboard棋盘距离)图像中两点P(x,y)和Q(u,v)之间的距离是重要的几何特性。常用以下三种方法测量:第40页,共135页,
19、编辑于2022年,星期五如图所示。街区距离和棋盘距离都是欧式距离的一种近似。第41页,共135页,编辑于2022年,星期五 下图中表示了以中心像素为原点的各像素的距离。从离开一个像素的等距离线可以看出,在欧氏距离中大致呈圆形,在棋盘距离中呈方形,在街区距离中呈倾斜45度的正方形。6.距离距离第42页,共135页,编辑于2022年,星期五 描述连通域与圆形相似程度的量。根据圆周长与圆面积的计算公式,定义圆形度的计算公式如下:其中,为连通域S的面积;为连通域S的周长。圆形度 值越大,表明目标与圆形的相似度越高。7.圆形度圆形度第43页,共135页,编辑于2022年,星期五8.矩形度矩形度 描述连通
20、域与矩形相似程度的量 其中,为连通域S的面积;是包含该连通域的最小矩形的面积。对于矩形目标,矩形度 取最大值1,对细长而弯曲的目标,则矩形度的值变得很小。第44页,共135页,编辑于2022年,星期五9.长宽比长宽比 其中,是包围连通域的最小矩形的宽度;是包围连通域的最小矩形的长度。是将细长目标与近似矩形或圆形目标进行区分时采用的形状度量。第45页,共135页,编辑于2022年,星期五10、欧拉数、欧拉数 图像的欧拉数是图像的拓扑特性之,它表明了图像的连通性。欧拉数定义为一个图中或一个区域中的连接部分数C和孔数H的差 E=C-H。下图(a)的图形有一个连接成分和一个孔,所以它的欧拉数为0,而下
21、图(b)有一个连接成分和两个孔,所以它的欧拉数为-1。具有欧拉数为具有欧拉数为0和和-1的图形的图形 可见通过欧拉数可见通过欧拉数 可用于目标识别。可用于目标识别。第46页,共135页,编辑于2022年,星期五该式描述了区域单位面积的周长大小,e值越大,表明单位面积的周长大,即区域离散,则为复杂形状;反之,则为简单形状。e值最小的区域为圆形。典型连续区域的计算结果为:圆形e=12.6;正方形e=16.0;正三角形e=20.8。11、形状复杂性、形状复杂性e:第47页,共135页,编辑于2022年,星期五(12)凹凸性凹凸性 凹凸性是区域的基本特征之一,区域凹凸性可通过以下方法进行判别:区域内任
22、意两像素间的连线穿过区域外的像素,则此区域为凹形。换句话说,区域中任意两个1像素之间,只要出现0像素,就称为凹形。相反,区域内任意两个像素的间的连线不穿过区域外的像素,则称为凸形。第48页,共135页,编辑于2022年,星期五 如图(a)第三行的区域内像素(3,3)与像素(3,8)间的像素值顺次为110001,出现了3个0像素,因此该区域为凹形。图(b)为凸形。(12)凹凸性凹凸性 第49页,共135页,编辑于2022年,星期五包含任一凹形的最小凸形称为该凹形的凸封闭包。将凸封闭包减去凹形得到凹形面积。为表示区域的凹特性,可采用凹性率E参数;E=Se/S Se为凹行面积,S为区域面积,图(c)
23、为图(a)的凸封闭包,(c)中图像减去(a)中的图像得到图(d)的结果。(12)凹凸性凹凸性 第50页,共135页,编辑于2022年,星期五7.3.2 不变矩由于图像区域的某些矩对于平移、旋转、尺度等几何变换具有一些不变的特性,因此,矩的表示方法在物体的分类与识别方面具有重要的意义。第51页,共135页,编辑于2022年,星期五对于二维连续函数 ,阶矩定义为:由于j和k可取所有的非负整数值,因此形成了一个矩的无限集。而且,这个集合完全可以确定函数f(x,y)本身。也就是说集合mjk对于函数f(x,y)是唯一的,也只有f(x,y)才具有这种特定的矩集,参数j+k称为矩的阶。为了描述物体的形状,假
24、设f(x,y)的目标物体取值为1,背景为0,即函数只反映了物体的形状而忽略其内部的灰度级细节。1.矩的定义第52页,共135页,编辑于2022年,星期五零阶矩是物体的面积:j=1,m=0,m10对二值图像来讲就是物体上所有的点x坐标的总和。m01是物体上所有的点y坐标的总和。令:1.矩的定义则:是二值图像中一个物体的质心的坐标。第53页,共135页,编辑于2022年,星期五中心矩定义为:如果f(x,y)是数字图像,则上式变为:1.矩的定义第54页,共135页,编辑于2022年,星期五 定义归一化的中心矩为:利用归一化的中心矩,可以获得对平移、缩放、镜像和旋转都不敏感的7个不变矩,定义如下:2.
25、不变矩第55页,共135页,编辑于2022年,星期五2、不变矩第56页,共135页,编辑于2022年,星期五2、不变矩 原图 原图缩小一半 逆时针旋转450逆时针旋转900 逆时针旋转1350 逆时针旋转1800 第57页,共135页,编辑于2022年,星期五2、不变矩以上图像的7个不变矩见表7-7 P139第58页,共135页,编辑于2022年,星期五7.4 纹理描述7.4.1 矩分析法 7.4.2 灰度差分统计法7.4.3 灰度共生矩阵法 7.4.4 纹理的结构分析第59页,共135页,编辑于2022年,星期五T纹理:是指人们所观察到的图像像素(或子区域)的灰度变化规律。灰度与颜色的二维变
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 图像 描述 分析 幻灯片
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内