第八讲图像信息检索.ppt
《第八讲图像信息检索.ppt》由会员分享,可在线阅读,更多相关《第八讲图像信息检索.ppt(23页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第八讲第八讲 图像信息检索图像信息检索 多媒体数据包括图形、图像、音频及视频。相应地就有图形检索、图像检多媒体数据包括图形、图像、音频及视频。相应地就有图形检索、图像检索、音频检索和视频检索问题。正如文本一样,真正的检索是基于语义的,因索、音频检索和视频检索问题。正如文本一样,真正的检索是基于语义的,因此真正的多媒体检索也应该是基于内容(语义)的。此真正的多媒体检索也应该是基于内容(语义)的。关于图形非常利于检索。其关于图形非常利于检索。其基本图元是点、线、面。它们均基本图元是点、线、面。它们均由坐标来定义和描述。线是点坐由坐标来定义和描述。线是点坐标的序列,面是封闭的点坐标序标的序列,面是封
2、闭的点坐标序列。这些坐标数据完全可以存储列。这些坐标数据完全可以存储到数据库中,因此,图形的检索到数据库中,因此,图形的检索本质上是数据库技术与图形处理本质上是数据库技术与图形处理技术的结合。例如各种技术的结合。例如各种GIS应用应用均可视为图形检索系统。均可视为图形检索系统。左图为左图为Google地图。地图。GISGIS数据组织示例数据组织示例id x y 图标类型图标类型 点图元数据点图元数据id 起点起点 长度长度 线型线型 线图元数据线图元数据x yid 起点起点 长度长度 填充色填充色 面图元数据面图元数据x yid 名称名称 地址地址 邮编邮编 点属性数据点属性数据 相对地,每一
3、个线图元和面图元都有自己的相对地,每一个线图元和面图元都有自己的属性数据。可见,可采用数据库的关系模型表达属性数据。可见,可采用数据库的关系模型表达GIS数据。结合图形处理技术来实现图形界面显数据。结合图形处理技术来实现图形界面显示、坐标变换、图形移动和缩放等操作。示、坐标变换、图形移动和缩放等操作。图像数据图像数据 该图为谷该图为谷歌卫星照片与歌卫星照片与部分图形数据部分图形数据的叠加结果。的叠加结果。卫星照片卫星照片是一种图像数是一种图像数据。本质上是据。本质上是像素点矩阵,像素点矩阵,每个像素点一每个像素点一般是一个颜色般是一个颜色值。值。图像数据示例图像数据示例 图像的存储可视为二维矩
4、阵(也可视为按列或图像的存储可视为二维矩阵(也可视为按列或按列存储的一维数组)。按列存储的一维数组)。每一个像素点为一种颜色值。如用一个字节存每一个像素点为一种颜色值。如用一个字节存储一个像素值,则称储一个像素值,则称256色图像,用两个字节存储色图像,用两个字节存储一个像素值,则称一个像素值,则称16位彩色图像,用三个字节存储位彩色图像,用三个字节存储一个像素值,则一个像素值,则24位真彩色图像(人眼是区分不出位真彩色图像(人眼是区分不出这么多种颜色的)。这么多种颜色的)。mn像素像素RGBRGB颜色系统:颜色系统:即利用三原色值来表示一个像素值。即利用三原色值来表示一个像素值。灰度图像:灰
5、度图像:一般解释为像素值是最暗的黑色到最亮的白色之间的某个等级值。一般解释为像素值是最暗的黑色到最亮的白色之间的某个等级值。该等级一般称为亮度等级,即用像素点明亮程度的不同来体现一幅该等级一般称为亮度等级,即用像素点明亮程度的不同来体现一幅 图像内容,如黑白电视。图像内容,如黑白电视。彩色图像向灰度图像的转换:彩色图像向灰度图像的转换:Y=0.299R+0.687G+0.114B 转换算法很多,这只是其中的一种。转换算法很多,这只是其中的一种。图像的其它色彩空间图像的其它色彩空间 除了除了RGB颜色系统外,还有颜色系统外,还有HSL色彩空间(即色相、饱和度和亮度)、色彩空间(即色相、饱和度和亮
6、度)、HSV色彩空间(即色相、饱和度和色调)等其它的色彩空间。色彩空间(即色相、饱和度和色调)等其它的色彩空间。HSL色彩空间色彩空间 HSV把颜色描述在圆柱体内的点,圆柱的中心轴取值为自底部的黑色到顶把颜色描述在圆柱体内的点,圆柱的中心轴取值为自底部的黑色到顶部的白色,而中间为灰色;绕这个轴的角度对应于是色相;到中心轴的距离对部的白色,而中间为灰色;绕这个轴的角度对应于是色相;到中心轴的距离对应于饱和度;而沿着中心轴的距离对应于色调。在应于饱和度;而沿着中心轴的距离对应于色调。在HSL把颜色描述为双圆锥体把颜色描述为双圆锥体和圆球体,沿着中心轴的距离对应于亮度。和圆球体,沿着中心轴的距离对应
7、于亮度。HSV色彩空间色彩空间RGBRGB值向值向HSLHSL值或值或HSVHSV值的转换值的转换 RGB、HSL、HSV虽然是不同色彩空间的表达方式,但可相互转换。其转虽然是不同色彩空间的表达方式,但可相互转换。其转换算法也较多,下面是其中的一种。换算法也较多,下面是其中的一种。RGB向向HSL的转换的转换RGB向向HSV的转换的转换其中其中 h 值的计算与左侧相同。值的计算与左侧相同。式中的式中的 r、g、b 值要求在值要求在 01 之间,之间,max 表示三者中的最大者,表示三者中的最大者,min 表示表示三者中的最小者。三者中的最小者。h 在在 03600;s、l 与与 v 均在均在
8、01 之间。之间。图像检索图像检索 图像检索:图像检索:一般是指给定一个等查询的图像示例,从众多的图像集合中检一般是指给定一个等查询的图像示例,从众多的图像集合中检索与待查询相似的图像作为检索结果。索与待查询相似的图像作为检索结果。查询要求的表达查询要求的表达也可考虑采用自然语也可考虑采用自然语言,这不但机器理解言,这不但机器理解难度大,而且人的精难度大,而且人的精确描述也较困难,同确描述也较困难,同时图像内容的提取也时图像内容的提取也是问题的瓶颈。是问题的瓶颈。问题:问题:从检索的从检索的角度看,图像的特征角度看,图像的特征是什么?如何表达?是什么?如何表达?如何计算图像之间的如何计算图像之
9、间的相似度?相似度?图像的灰度直方图特征图像的灰度直方图特征 图像的灰度直方图:图像的灰度直方图:即按灰度图像(彩色图像可转换为灰度图像)的灰度即按灰度图像(彩色图像可转换为灰度图像)的灰度级统计出每个灰度级下的像素点个数,形成一张直方图。级统计出每个灰度级下的像素点个数,形成一张直方图。以以256级灰度为例,某图像级灰度为例,某图像 P 的灰度直方图如下所示。的灰度直方图如下所示。0 1 2 3 4 255灰度级灰度级78156113429589P:(:(78,156,113,42,95,89)即图像表示成以灰度等级为分量的向量。图像的集合则表示成相同灰度等即图像表示成以灰度等级为分量的向量
10、。图像的集合则表示成相同灰度等级下的矩阵。级下的矩阵。P1:(:(78,156,113,89 )P2:(:(12,34,147,137)P3:(:(98,578,985,56 )可见,图像的相似性度量可通过向量之间可见,图像的相似性度量可通过向量之间的相似性度量来实现。如向量的内积、夹角余的相似性度量来实现。如向量的内积、夹角余弦等。另外,该矩阵也可进行归一化处理。弦等。另外,该矩阵也可进行归一化处理。图像的其它直方图特征图像的其它直方图特征 除灰度直方图外,图像的许多特征均可以直方图的方式体现。除灰度直方图外,图像的许多特征均可以直方图的方式体现。1、颜色直方图颜色直方图 即直方图的横坐标为
11、颜色值。显然,对于即直方图的横坐标为颜色值。显然,对于16位彩色图像,则对应的向量将位彩色图像,则对应的向量将达到达到65536维。维。24位彩色图像将达到位彩色图像将达到16777216维。当然可考虑一些降维方法,维。当然可考虑一些降维方法,比如对颜色值进行抽样统计等。比如对颜色值进行抽样统计等。2、HSL空间或空间或HSV空间的直方图空间的直方图 灰度或颜色直方图是在灰度或颜色直方图是在RGB空间下的统计。可将图像转换为空间下的统计。可将图像转换为 HSL 空间或空间或HSV 空间,从而可以统计出相应的空间,从而可以统计出相应的色相直方图、饱和度直方图、亮度直方图色相直方图、饱和度直方图、
12、亮度直方图或色调直方图或色调直方图。3、变换域空间的直方图变换域空间的直方图 可利用可利用信号与系统信号与系统、数字图像处理数字图像处理中的知识,将图像视为信号,中的知识,将图像视为信号,可求出多种变换域特征。如离散傅里叶变换、离散沃尔什变换、离散余弦变换、可求出多种变换域特征。如离散傅里叶变换、离散沃尔什变换、离散余弦变换、小波变换等各种信号处理技术。小波变换等各种信号处理技术。若采用离散傅氏变换,可统计出图像在频域下的频率直方图,从而得到频若采用离散傅氏变换,可统计出图像在频域下的频率直方图,从而得到频域意义下的向量表示。域意义下的向量表示。图像的颜色相干矢量特征图像的颜色相干矢量特征 以
13、灰度直方图为例。在上述的灰度直方图统计中没有考虑某灰度级像素点以灰度直方图为例。在上述的灰度直方图统计中没有考虑某灰度级像素点周围相邻像素点灰度分布的情况。周围相邻像素点灰度分布的情况。相干像素数:相干像素数:即针对每一个灰度等级,若该灰度等级的某像素点周围的相邻像即针对每一个灰度等级,若该灰度等级的某像素点周围的相邻像 素为同一灰度等级,且该区域的像素点个数大于事先指定的阈值素为同一灰度等级,且该区域的像素点个数大于事先指定的阈值 (如该阈值规定为整幅图像像素点个数的(如该阈值规定为整幅图像像素点个数的1%),则该区域内的像),则该区域内的像 素点个数称为相干像素数;否则称为不相干像素数。素
14、点个数称为相干像素数;否则称为不相干像素数。这样,在统计某灰度等级的像素点个数时,会得到两个数,一个是相干像这样,在统计某灰度等级的像素点个数时,会得到两个数,一个是相干像素数,另一个是不相干像素数。图示如下:素数,另一个是不相干像素数。图示如下:233457129320 1 2 255787813447(23,78,34,135,57,129,32,47)不相干像素数不相干像素数相干像素数相干像素数 显然,该方法增加了向量的维数。但包含了图像中灰度等级相同的区域性显然,该方法增加了向量的维数。但包含了图像中灰度等级相同的区域性质的特征。另外,该方法不仅针对灰度直方图,也可考虑应用于其他直方图
15、。质的特征。另外,该方法不仅针对灰度直方图,也可考虑应用于其他直方图。图像的颜色矩特征图像的颜色矩特征 图像的颜色矩:图像的颜色矩:是指图像中每个像素点同一颜色分量的是指图像中每个像素点同一颜色分量的 1 阶矩、阶矩、2 阶矩、阶矩、3阶矩、阶矩、n 阶矩、阶矩、。RGBRGBRGBRGBp1p2p3p4 以以RGB图像为例,图像为例,p1、p2、p3、是像素点编号。是像素点编号。一阶矩一阶矩二阶矩二阶矩三阶矩三阶矩 式中式中 N 为像素点个数。若只用以上为像素点个数。若只用以上 13 阶矩,则一幅图像可用一个阶矩,则一幅图像可用一个 9 维向维向量表达,即量表达,即 图像的颜色矩反映了颜色的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 图像 信息 检索
限制150内