基于形状特征的图像检索(共42页).doc
《基于形状特征的图像检索(共42页).doc》由会员分享,可在线阅读,更多相关《基于形状特征的图像检索(共42页).doc(42页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上专心-专注-专业 题目: 基于形状特征的图像检索系统的设计与实现 基于形状特征的图像检索系统的设计与实现摘要近年来,随着多媒体和计算机互联网技术的快速发展,数字图像的数量正以惊人的速度增长。面对日益丰富的图像信息海洋,人们需要有效地从中获取所期望得到多媒体信息。因此,在大规模的图像数据库中进行快速、准确的检索成为人们研究的热点。为了实现快速而准确地检索图像,利用图像的视觉特征,如颜色、纹理、形状等来进行图像检索的技术,也就是基于内容的图像检索技术(CBIR)应运而生6。本文主要研究基于形状特征的图像检索,边缘检测是基于形状特征的一种检索方法,边缘是图像最基本的特性。在
2、图像边缘检测中,微分算子可以提取出图像的细节信息,景物边缘是细节信息中最具有描述景物特征的部分,也是图像分析中的一个不可或缺的部分。本文详细地分析了一种边缘检测方法Canny算子,用C+编程实现各算子的边缘检测,并根据边缘检测的有效性和定位的可靠性,得出Canny算子具备有最优边缘检测所需的特性。并通过基于轮廓的描述方法,傅里叶描述符对图像的形状特征进行描述并存入数据库中。对行相应的检索功能。关键词:图像检索;形状特征;Canny算子;边缘检测;傅里叶描述符Design and Implementation of Image Retrieval System Based on Shape Fe
3、aturesABSTRACTWith the rapid development of multimedia and computer network technique, the quantity of digital image and video is going up fabulously. Facing the vast ocean of information of image, it has a good sense to obtain the desired multimedia information. Currently, rapid and effective searc
4、hing for desired image from large-scale image databases becomes an hot research topic. In order to retrieve image quickly and accurately using image visual features such as color, texture, shape, which named content-based image retrieval (CBIR) came into being. This paper introduces the principle of
5、 wavelet transform applying to image edge detection. Edge detection is based on the shape of the characteristics of a retrieval method, and the edge is the most basic characteristics of the image. In the image edge detection ,differential operator can be used to extract the details of the images, fe
6、atures edge is the most detailed information describing the characteristics of the features of the image analysis, and is also an integral part of the image. This paper analyzes a Canny operator edge detection method, and we complete with the C+ language procedure to come ture edge detection. Accord
7、ing to the effectiveness of the image detection and the reliability of the orientation, we can deduced that the Canny operator have the characteristics which the image edge has. And contour-based method for describing the image Fourier descriptors to describe the shape feature and stored in the data
8、base. Align the corresponding search function.Key words:image retrieval;sharp feature;Canny operator;edge detection;Fourier shape descriptors目录0012334456781 前言1.1 课题背景及研究意义随着多媒体技术、计算机技术、通信技术及Intemet网络的迅速发展,人们正在快速地进入一个信息化社会。现代技术已能运用各种手段大量的采集和产生各种类型的多媒体数据,人们对多媒体信息的需求也越来越大量和频繁。虽然信息的快速增长促进了社会的发展,但是信息膨胀也
9、给人类带来了过多信息量以至于超过了人的接受能力。因此,除了获取、处理和存储多媒体信息十分重要,怎样在海量的多媒体信息中快速有效地访问人们感兴趣的多媒体信息也显示出了同样的重要性。图像信息是多媒体信息中最常见的一种,也具有多媒体信息数据量大、抽象程度低的特点。如何从海量的图像信息中有效地获取有用信息,即图像信息资源的管理和检索显得日益重要。随着人们对图像信息的巨大需求的增长,产生了基于文本的图像检索技术,比如著名的搜索引擎百度中对图像的检索。这种基于文本的检索技术所利用的人工标注方法存在局限性,经常检索出来大量的用户不感兴趣的图像,5但在没有更好解决办法的情况下,用户只能继续使用。因此如何对图像
10、的内容自动、客观、全面地进行特征提取。真实有效的表示图像内容,帮助用户快速有效地访问感兴趣的图像有着极大的研究需求和迫切的需要,而基于内容的图像检索(Content Based mage Retrieval,CBIR)技术恰好能有效的解决这个问题。另外在实际的应用中,图像数据库及其检索的研究对多媒体数字图书馆、医学图像管理、卫星遥感图像和计算机辅助设计和制造、地理信息系统、犯罪识别系统、商标版权的管理,生物的辨识分类等方面提供有力的支持。1.2 国内外发展状况近年来,CBIR已经成为一个非常活跃的研究领域,各国科研机构与公司已陆续推出了一些CBIR系统的产品,有的已经成功应用到医学、商标、专利
11、检索等领域。IBM 的QBIC(Query By Image Content) 是第一个商业性的CBIR 系统。它提供了基于颜色、纹理、形状和手绘草图的图像索引方法。 Columbia 大学的Visual SEEK 提供了基于色彩和纹理的索引方法。PhotoBook 是麻省理工学院(MIT) 媒体实验室开发的一套检索、浏览图像的交互式工具,它包含三个子系统分别提取形状、纹理和人脸特征,【】用户可以分别做基于上述一种特征的检索。 MARS (multimedia analysis and retrieval system)系统由美国UIUC 大学开发,其不同之处在于用到了很多领域的知识:计算机视
12、觉、数据库管理系统和信息检索。新加坡国立大学开发的一个基于内容的图像检索系统,其显著技术特色包括:多种特征提取方法、多种基于内容检索方法、使用自组织神经网络对复杂特征度量、建立基于内容索引的新方法以及对多媒体信息进行模糊检索的新技术。清华大学的ImgRetr结合了多种组织方法,就能提供基于主色、纹理、直方图、颜色分布、框架等多种方式的检索。1.3 课题研究的主要内容本文依托基于内容的图像检索技术,重点研究基于形状特征的图像检索。形状特征不同于颜色、纹理特征,形状特征的表达必须以对图像中物体或区域的划分为基础。在二维图像空间中,形状通常被认为是一条封闭的轮廓曲线所包围的区域,通常情况下形状特征有
13、两类表示方法,一类是区域特征,利用的是整个形状区域;另一类是轮廓特征,利用的则是图像的外边界。本文主要研究的就是外边界的索引方法边缘检测,边缘检测的方法有很多,如:Roberts交叉微分算子、Sobel微分算子、Priwitt微分算子和Laplacian微分算子以及Canny算子。而其中属Canny算子最好。对图像特征进行描述有很多种方法,链码、曲率尺度空间、TAR描述符、傅立叶描述符、小波描述符、边界矩等。本文主要研究的是傅里叶描述符。其主要思想是用物体边界的傅立叶变换作为其形状描述。2 基于形状特征的图像检索2.1 图像检索技术的发展过程图像检索技术始于上个世纪70年代,当时主要是基于文本
14、的检索,即使用关键词和描述性文本进行检索,要求用户对文本特征的描述具有一定的准确性和规范性。但是随着大规模数字图像库的出现,基于文本的检索技术暴露出自身的缺点。进入90 年代, 基于内容的图像检索技术应运而生,其思路是利用图像自身的视觉特征,如:颜色、纹理结构、形状、空间关系作为图像的内容进行匹配、查找。它通过利用已有的算法,使得特征提取和匹配完全可以由机器自动完成,检索过程不需要太多的人为干预和解释,这就克服了手工注释的低效和二义性。2.1.1 基于内容的图像检索技术目前,对图像的检索在图像索引与研究中应用最为广泛,基于图像颜色特征、纹理特征、形状特征和物体空间方位的检索方法是比较成熟的几种
15、。近年来,基于内容的图像检索引起了多交叉学科研究人员的注意。在国外,特别是在美国等发达国家,这项技术已成为一个研究热点。一些科研部门、高等院校、商业公司以至于政府机构都纷纷投入大量人力和物力进行系统的研究和开发,以期取得领先地位。目前已经推出了一些CBIR系统的产品,如美国的IBM公司、Virage和Excalibur开发出的基于图像内容的相似性特征的图像库检索引擎,并在网上提供了演示站点。国内的研究主要集中在基于图像颜色的查询,也有一部分基于纹理和形状的查询。目前,该技术已成功应用于人脸识别技术;针对商标与设计专利类的图像进行检索,防止专利纠纷的产生。除此之外,它还可以解译影像数据中的建筑、
16、村庄、耕地等不同种类的地形信息,实现对遥感图像的检索。总之,该项技术在实际中的应用会越来越广泛,而且必将在各个领域当中占据主导地位,并带动相关产业的发展,促进多媒体信息化的交流。2.1.2 基于形状特征的图像检索由于许多图像检索系统都把重点放在基于颜色或者纹理的方法上。但是对于某些图像来说, 纹理和颜色信息不够丰富, 如一些商标图像等, 这时基于颜色和纹理的方法就无法满足检索需要, 而必须从图像的形状着手。形状特征是图像的核心特征之一, 图像的形状信息不随图像颜色的变化而变化, 是物体的稳定特征。用形状特征区别物体非常直观, 是人们分类不同图像的主要特征之一。因此, 利用形状特征检索图像可以提
17、高检索的准确性和效率。基于形状特征的图像检索主要是检测出目标的轮廓线或分割出目标的轮廓, 并针对其进行形状特征的提取或直接针对图像寻找适当的矢量特征。形状描述应该在尽可能区别不同目标的基础上对目标的平移、旋转和尺度变化不敏感。目前, 虽然已经提出了许多形状分析方法, 但要将其有效地运用于图像检索上还有一些问题亟待解决, 如算法的效率和复杂性, 形状特征的提取与描述等。2.2 边缘检测边缘是图像的最重要的特征。边缘是指周围像素灰度有阶跃变化或屋顶变化的那些像素的集合。Poggio在文中说:“或许对应着图像中物体的边界或许并没有对应着图像中物体的边界,但是边缘具有十分令人满意的性质它能大大地减少所
18、要处理的信息但是又保留了图像中物体的形状信息”。边缘检测是图像识别的基础和前提,直接决定了图像识别结果的正确性。由于边缘检测还不成熟,直接影响了图像识别的应用,一直是图像识别领域的一个研究热点。经过多年的研究,边缘检测已经渗透到各个应用领域。在医学上,边缘检测用于肾小球的提取,在工业和工程方面的应用在工业和工程领域中,用于纤维制品的检测,在。喷漆、焊接、装配中也得到了有效的利用。在文化艺术上,用于纺织工艺品设计,服装设计与制作,发型设计,文物资料照片的复制和修复,运动员动作分析和评分等等。总之,边缘检测已经应用于各个领域。是 我们不可忽视的一项研究热点。2.3 Canny边缘检测2.3.1 C
19、anny指标基于微分算子的边缘提取存在的一个比较麻烦的的问题就是如何选择合适的阈值,可以使边缘从细节当中提取出来。阈值的选择不同,所提取出的边界信息就不同。在两个不同的阈值下,采用同样的微分算子均可以提取出图像的边缘,但是两者有比较大的区别。这样,在边缘提取中就存在着对提取好坏的评价。针对这一问题,根据边缘检测的有效性和定位的可靠性,Canny研究 了最优边缘检测器所需的特性,给出了评价边缘检测性能优劣的三个指标:(1)好的信噪比,即将非边缘点判为边缘点的概率要低,将边缘点判为非边缘点的概率要低;(2)好的定位性能,即检测出的边缘点要尽可能在实际边缘的中心;(3)对单一边缘仅有惟一响应,即单个
20、边缘产生多个响应的概率要低,并且虚假响应边界应得到最大的抑制。用一句话说,就是希望在提高对景物边缘的敏感性的同时,可以抑制噪声的方法才是好的边缘提取方法。值得庆幸的是,且个线性算子可以在抵抗噪声与边缘检测之间获得一个最佳的折中,这个算子就是高斯函数的一阶导数。高斯函数与原图的卷积达到了抵抗噪声的作用,而求导数,则是检测景物边缘的手段。对于阶跃形的边缘,Canny推导出的最优边缘检测器的形状与高斯函数和一阶导数类似,因此Canny边缘检测器就是由高斯函数的一阶导数构成的。我们知道,高斯函数是圆对称的,因此Canny算子在边缘方向上是对称的,在垂直于边缘的方向上是反对称的。这就意味着该算子对最急剧
21、的变化方向上的边缘特别敏感,但在沿边缘方向上是不敏感的。设二维高斯函数为 (2-1)其中,是高斯函数的分布参数,可用以控制对图像的平滑程度。最优阶跃边缘检测算子是以卷积G*为基础的,边缘强度为,而边缘方向为。从高斯函数的定义可知,该函数是无限拖尾的,在实际中,一般情况下是将原始模板截断到有限尺寸N。实验表明,当时,能够获得较好的边缘检测结果。2.3.2 Canny算子的实现下面是Canny算子的具体实现。利用高斯函数的可分性,将G的两个滤波卷积模板分解为两个一维的行列滤波器: (2-2) 其中 (2-3) (2-4) (2-5) (2-6) (2-7) (2-8) K为常数将式(2-2)(2-
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 形状 特征 图像 检索 42
限制150内