图像的基本知识及运算优秀PPT.ppt
第第2章图像的基本学问及章图像的基本学问及运算运算专业术语及表示方法专业术语及表示方法图像与视觉之间的关系图像与视觉之间的关系图像象素间的关系图像象素间的关系图像间的运算图像间的运算专业术语专业术语p数字图像与物理图像数字图像是离散的,物理图像是连续的函数p数字化为了适应数字计算机的处理,必需对连续图像函数进行空间和幅值数字化。空间坐标(x,y)的数字化称为图像采样,而幅值数字化被称为灰度级量化。经过数字化后的图像称为数字图像(或离散图像)。p采样就是图像在空间上的离散化处理,即使空间上连续变更的图像离散化 p量化经过取样的图像,只是在空间上被离散为像素(样本)的阵列,而每一个样本灰度值还是一个有无穷多个取值的连续变更量,必需将其转化为有限个离散值,赋于不同码字才能真正成为数字图像,再由数字计算机或其它数字设备进行处理运算,这样的转化过程称其为量化 p辨别率 空间辨别率和灰度辨别率p 灰度辨别率是指值的单位幅度上包含的灰度级数,即在灰度级数中可辨别的最小变更。若用8比特来存储一幅数字图像,其灰度级为256。p 空间辨别率是指图像中可辨别的最小细微环节,采样间隔确定空间辨别率的主要参数。一般状况下,假如没有必要实际度量所涉及象素的物理辨别率和在原始场景中分析细微环节等级时,通常将图像大小MN,灰度为L级的数字图像称为空间辨别率为MN,灰度级辨别率为L级的图像。对比度指一幅图像中灰度反差的大小,对比度最大亮度对比度指一幅图像中灰度反差的大小,对比度最大亮度/最小亮度最小亮度p图像噪声阻碍人们感觉器官对所接收的信息理解的因素,种类很多,如加性噪声、乘性噪声、白噪声和高斯噪声采样点和量化级的选取p假定一幅图像取MN个样点,对样点值进行Q 级分档取整。那么对 M、N和Q如何取值呢?p为了存取的便利,Q一般总是取成2的整数次幂,如Q2b,b为正整数,通常称为对图像进行b比特量化。p对b来讲,取值越大,重建图像失真越小 p对MN的取值,主要的依据是取样的约束条件,也就是在MN达到满足取样定理的状况下,重建图像就不会产生失真,否则就会因取样点数不够而产生所谓混淆失真 数字图像的表示数字图像的表示p灰度图像表示象素象素(pixel)灰度图象灰度图象(128x128)及其对应的数值矩阵(仅列出一部分及其对应的数值矩阵(仅列出一部分(26x31))p彩色图像表示彩色图象可以用红、绿、蓝三元组的二维矩阵来表示。p通常,三元组的每个数值也是在0到255之间,0表示相应的基色在该象素中没有,而255则代表相应的基色在该象素中取得最大值,这种状况下每个象素可用三个字节来表示彩色图象彩色图象(128x128)及其对应的数值矩阵(仅列出一部分及其对应的数值矩阵(仅列出一部分(25x31))p二值图像表示为了削减计算量,常将灰度图像转为二值图像处理。为了削减计算量,常将灰度图像转为二值图像处理。定义:只有黑白两个灰度级,即象素灰度级非定义:只有黑白两个灰度级,即象素灰度级非1即即0,如,如文字图片,其数字图像可用每个象素文字图片,其数字图像可用每个象素1bit的矩阵表示的矩阵表示二值图像的特殊表示法:如链码二值图像的特殊表示法:如链码(Freeman码码)适合表示直线和曲线组成的二值图像,以及描述适合表示直线和曲线组成的二值图像,以及描述图像的边界轮廓图像的边界轮廓接受链码节约很多的比特数规定了链的起接受链码节约很多的比特数规定了链的起点坐标和链的斜率序列,这样就可以完全描点坐标和链的斜率序列,这样就可以完全描述曲线和直线述曲线和直线八向链码八向链码图像信息的基本学问图像信息的基本学问p图像与视觉之间的关系图像与视觉之间的关系p图像象素之间联系图像象素之间联系p图像之间的运算图像之间的运算p人眼与亮度视觉人眼与亮度视觉镜头镜头成像成像面面人眼的亮度适应范围人眼的亮度适应范围 量级量级同时亮度适应区间不大,同时亮度适应区间不大,一般一般 64级级 晶状体晶状体视网膜视网膜人眼截面示意图人眼截面示意图15m100m17mmx/17=15/100 x=2.55mm假设一个平面如磨砂玻璃一样散光,被假设一个平面如磨砂玻璃一样散光,被1个强度为个强度为I且可且可以变更的光源从背后照亮,以变更的光源从背后照亮,1个照度增量为个照度增量为I,像短促,像短促闪光一样加在匀整照明的平面上,可使人感到平面中间闪光一样加在匀整照明的平面上,可使人感到平面中间像像1个圆形亮点,如图所示个圆形亮点,如图所示假如假如I不够亮,试验者没有感知上的变更,当不够亮,试验者没有感知上的变更,当I逐步逐步增加,感知上发生变更。假如增加,感知上发生变更。假如50的机会感知亮度变更,的机会感知亮度变更,则量则量I50/I为韦伯率,小的韦伯率表示可区分强度的小为韦伯率,小的韦伯率表示可区分强度的小变更,有较好的亮度区分实力;大的韦伯率表示只有大变更,有较好的亮度区分实力;大的韦伯率表示只有大的强度变更才能区分,有较差的亮度区分实力的强度变更才能区分,有较差的亮度区分实力p亮度适应亮度适应p马赫带效应马赫带效应亮背景下显得暗、暗亮背景下显得暗、暗背景下显得亮背景下显得亮它是基于人眼对某个它是基于人眼对某个区域感觉到的亮度并区域感觉到的亮度并不仅仅依靠于它的强不仅仅依靠于它的强度度 n同时对比度同时对比度视觉系统有趋视觉系统有趋向于过高或过向于过高或过低估计不同亮低估计不同亮度区域边界值度区域边界值的现象的现象每个条带内部的亮度每个条带内部的亮度是常数,但仍旧有猛是常数,但仍旧有猛烈的边缘效应烈的边缘效应颜色视觉颜色视觉R 波长波长700 nmG 波长波长546.1 nmB 波长波长435.8 nm三基色三基色颜色分解颜色分解亮度(亮度(Intensity)色调色调(Hue)饱和度饱和度(Saturation)区分颜色的区分颜色的3种基本特性种基本特性色度色度对彩色图像来说,颜色中对彩色图像来说,颜色中掺入白色越多,就越亮,掺入白色越多,就越亮,掺入黑色越多灰度就越小掺入黑色越多灰度就越小与混合光谱中主要光波长与混合光谱中主要光波长相联系相联系与确定色调的纯度有关,纯光与确定色调的纯度有关,纯光谱是完全饱和的,随着白光的谱是完全饱和的,随着白光的加入,饱和度渐渐削减加入,饱和度渐渐削减颜色模型颜色模型pRGBpCMYpYUVpYCrCbpHSVRGB彩色空间彩色空间pRGB颜色模型主要应用于颜色模型主要应用于CRT监视器和图形刷新设备中。尽管该监视器和图形刷新设备中。尽管该彩色空间是最普遍的,但是由于彩色空间是最普遍的,但是由于R、G、B三色之间存在猛烈的相三色之间存在猛烈的相关性关性 pCMY-在印刷行业,CMY分别是青色(Cyan)、品红(Magenta)、黄色(Yellow)三种油墨色 pCMY常用于从白光中滤去某种颜色,又被称为减性原色系统。pCMY颜色模型与RGB颜色模型几乎完全相同。差别仅仅在于前者的原点为白,而后者的原点为黑。前者是定义在白色中减去某种颜色来定义一种颜色,而后者是通过从黑色中加入颜色来定义一种颜色。CMY彩色空间HSV彩色空间彩色空间该模型常常为艺术家所运用。这种格式反映了人该模型常常为艺术家所运用。这种格式反映了人类视察色调的方式,同时也有利于图像处理类视察色调的方式,同时也有利于图像处理 优点优点亮度(亮度(V V)与反映色调本质特性的两个参)与反映色调本质特性的两个参数色度(数色度(H H)和饱和度()和饱和度(S S)分开分开 光照明暗给物体颜色带来的干脆影响就是亮度重光照明暗给物体颜色带来的干脆影响就是亮度重量(量(V V),所以若能将亮度重量从色调中提取出),所以若能将亮度重量从色调中提取出去,而只用反映色调本质特性的色度、饱和度来去,而只用反映色调本质特性的色度、饱和度来进行聚类分析,会获得比较好的效果。这也正是进行聚类分析,会获得比较好的效果。这也正是HSVHSV模型在彩色图像处理和计算机视觉的探讨中模型在彩色图像处理和计算机视觉的探讨中常常被运用的缘由常常被运用的缘由p与与RGB之间关系之间关系YUV彩色空间彩色空间p一种彩色传输模型,主要用于彩色电视信号传输一种彩色传输模型,主要用于彩色电视信号传输标准标准pY黑白亮度重量,黑白亮度重量,U,V彩色信息用以显示彩色彩色信息用以显示彩色图像图像与与RGB之间的转换关系:之间的转换关系:YCrCb彩色空间彩色空间p一种彩色传输模型一种彩色传输模型 ,主要用于彩色电视信号传输标准方面,主要用于彩色电视信号传输标准方面,被广泛的应用在电视的色调显示等领域中被广泛的应用在电视的色调显示等领域中 优点优点人类视觉人类视觉感知过程感知过程相类似相类似应用于电视显应用于电视显示,视频压缩,示,视频压缩,MPGE/JPEG将色调中的将色调中的亮度重量分亮度重量分别别计算过程和计算过程和空间坐标形空间坐标形式简洁式简洁p与与RGB之间关系之间关系图像象素间的联系图像象素间的联系p主要介绍数字图像中基本而又重要的象素间的关主要介绍数字图像中基本而又重要的象素间的关系系表示一幅图像表示一幅图像p和和q 表示图像中某个特定的象素表示图像中某个特定的象素象素的邻域象素的邻域4邻域和邻域和8邻域邻域4邻域邻域4对角邻域对角邻域8邻域邻域连通性连通性p为了确定目标的边界和区域的元素为了确定目标的边界和区域的元素p分为连接和连通,连接是连通的一个特例分为连接和连通,连接是连通的一个特例V定义为连接的灰度值集合定义为连接的灰度值集合如在一幅二值图中,为考虑灰度值为如在一幅二值图中,为考虑灰度值为1的象素之间的连通性,的象素之间的连通性,V=1。又知在。又知在l幅灰度图中,考虑具有灰度值在幅灰度图中,考虑具有灰度值在8到到16之之间象素的连通性,则间象素的连通性,则V=8,9,15,16。0 1 1 0 1 0 0 0 1V=1定义定义3种状况的连接种状况的连接 (3)m-连连接接(混混合合连连接接):2个个象象素素p 和和r在在V中中取取值且满足下列条件之一,则它们为值且满足下列条件之一,则它们为m-连接:连接:r在在 中;中;是空集,这个集合是由是空集,这个集合是由p和和r的在的在V中取中取值的值的4-近邻象素组成的。近邻象素组成的。为了消除为了消除8-连接连接时的多路连接时的多路连接 0 1 1 0 1 0 0 0 18-连接连接2条条连线连线 0 1 1 0 1 0 0 0 1m-连接连接(1 1)4-4-连接连接:2:2个象素个象素p和和r在在V V中取值且中取值且r在在 中中,则它们为则它们为4-4-连接;连接;(2 2)8-8-连接连接:2:2个象素个象素p和和r在在V V中取值且中取值且r在在 中,中,则它们为则它们为8-8-连接;连接;m-不连接不连接路径p接近假如1个象素p和1个象素q是连通的,则称象素p接近于q p路径假如一条从具有坐标(x,y)的象素p,到具有坐标(s,t)的象素q的路径,是指具有坐标(x0,y0),(x1,y1),(xn,yn)的不同象素的序列。其中(x0,y0)=(x,y),(xn,yn)(s,t),(xi,yi)接近于(xi-1,yi-1),1in,n是路径的长度 连通体算法p在二值图像中标注值为1的4-连通元素为例来说明自动标注连通元素的算法 p1、申请一片标注空间p2、对图像中的随意象素p,其上面的象素为t,左边的象素为r,从左向右扫描图像,有4中状况,如图所示:p A:如r和t的值为0,给p一个新标记;p B:如r或t有一个为1,将为1的标记给p;p C:如r和t都是1,并且有相同标记,赋该标记到p;p D:如r和t都是1,并且有不同的标记,赋这两个标记中的一个给p,并且建立一个说明,指出那两个标记是等价的。3、在扫描结束时,全部具有1值的点都被打上标记,但这些标记中的一些或许是等价的,现在须要做的是整理全部的等价对成为等价类,然后给每一个类一个标记,其次次扫描图像,用所赐予的等价类的标记替换不同的标记。象素间的距离测量象素间的距离测量给给定定3 3个个象象素素p,p,q,q,r,r,坐坐标标分分别别为为 ,假假如如下下列列条件满足的话,条件满足的话,D D是距离量度函数:是距离量度函数:(1 1)(当且仅当当且仅当 );(2 2);(3 3)。点点p p和和q q之间的之间的EuclideanEuclidean距离定义为距离定义为 小于等于某个值小于等于某个值d的的距离,以距离,以(x,y)为中心,为中心,以以d为半径的圆中为半径的圆中点点p和和q之间的之间的 距离,即城市距离,即城市(city-block)距离距离,定义定义为为:小于等于某个值小于等于某个值d的距离,以的距离,以(x,y)为中心的菱形为中心的菱形点点p和和q之间的之间的 距离,即棋盘距离,即棋盘(chessboard)距离距离,定义为定义为:两点两点p和和q之间的之间的 距离等于它们之间最短的距离等于它们之间最短的4-通路的长度,通路的长度,距离也有类似性质。实际上我们考虑距离也有类似性质。实际上我们考虑2点点p和和q之间的之间的 距离距离和和 距离时并不需要看它们之间是否真有距离时并不需要看它们之间是否真有1条通路,因为这些条通路,因为这些距离的定义只涉及这些点的坐标。但对距离的定义只涉及这些点的坐标。但对m-连通,连通,2点之间的距点之间的距离值(通路的长度)依赖于沿通路的象素和它们近邻象素的值。离值(通路的长度)依赖于沿通路的象素和它们近邻象素的值。小于等于某个值小于等于某个值d的距离,以的距离,以(x,y)为中心的正方形为中心的正方形图像之间的运算p代数运算p几何运算代数运算p代数运算是指对图像象素几何不变更,图像灰度级的加、减、乘和除运算。也就是对两幅输入图像进行点对点的加、减、乘和除计算而得到输出图像的运算 可以将两幅待处理的图像可以将两幅待处理的图像f(x,y)和和g(x,y)以矩阵的形式表达以矩阵的形式表达M、N分别代表图像的行列数。这样,对于尺寸相同的两幅图像,其分别代表图像的行列数。这样,对于尺寸相同的两幅图像,其间的加、减、乘和除运算可分别表达为间的加、减、乘和除运算可分别表达为 既可为常数,也可为变量。既可为常数,也可为变量。应用p加运算应用求平均降噪声假设我们有M帧待分析的图像序列,则第k帧图像表示为志向图像噪声假设噪声图像为零均值以及各帧独立 定义功率信噪比为 对M帧图像进行平均,则有则输出图像的信噪比为 p减运算应用序列图像求运动目标几何运算p通过图像象素位置的变换,运算后,干脆确定该象素灰度的运算。与代数运算不同,几何运算可变更图像中各物体之间的空间关系 p可看成是将各物体在图像内移动。一个几何运算须要两个独立的算法。p空间变换,用它来描述每个象素如何从其初始位置“移动”到终止位置;p灰度级插值的算法,这是因为,在一般状况下,输入图像的位置坐标(x,y)为整数,而输出图像的位置坐标为非整数。空间变换p要求保持图像中曲线型特征的连续性和各物体的连通性,一个约束较少的空间变换算法很可能会弄断直线和打碎图像,从而使图像的内容“支离裂开”。p一般用数学方法来描述输入、输出图像点之间的空间关系。几何运算的一般定义为:灰度级插值p在输入图像f(x,y)中,灰度值仅仅在整数位置(x,y)处被定义,然而在上式中,g(x,y)的灰度值一般由处在非整数坐标上的f(x,y)的值来确定。所以,假如把几何运算看成是一个从f到g的映射,则f中的一个象素会映射到g中的几个象素之间的位置 p最简洁的方法最近邻法p一般采样双线性插值双线性插值p令f(x,y)为两个变量的函数,其在单位正方形顶点的值已知,假设我们希望通过插值得到正方形内随意点的f(x,y)的灰度值,则可由双曲线方程从a到d这四个系数需由已知的四个顶点的f(x,y)灰度值拟合 xy123p步骤1对上端的两个顶点进行线性插值,可得:p步骤2对底端的两个顶点进行线性插值,可得 p步骤3进行垂直方向的线性插值 p合并xy123基本的几何运算p平移p放大、缩小p旋转平移p变换公式yx放大、缩小使图像在x轴方向放大(缩小)c倍,在y轴方向上放大(缩小)d倍 yx由于放大(缩小)算子运算不是一一映射,只是简洁的重复放大,因此将产生所谓的“方块”效应,为改善这种可视效果,须要进行插值运算 旋转p变换公式对图像绕原点顺时针角旋转变换 x x yyXY应用p消退由摄像机缘由导致的数字图像几何畸变;消退由摄像机缘由导致的数字图像几何畸变;p对相像图像进行配准,以便进行图像比较对相像图像进行配准,以便进行图像比较p医学图像融合