多媒体内容检索与管理.ppt
《多媒体内容检索与管理.ppt》由会员分享,可在线阅读,更多相关《多媒体内容检索与管理.ppt(117页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多媒体内容检索与管理李颖吴昊赵艳2多媒体内容检索与管理多媒体内容检索与管理1多媒体数据库多媒体数据库2多媒体内容管理3多媒体内容检索6基于内容视频检索5基于内容音频检索4基于内容图像检索 31.11.1多媒体概念多媒体概念即媒介,承载、传输和表现信息的手段指集数据、文字、图形、图像、声音和视频等为一体的综合媒体信息指利用计算机将文本、图形、图像、声音、动画、视频等多种媒体信息进行处理和综合集成,以供人机交互使用的一个计算机应用分支Page 41.21.2多媒体数据库系统多媒体数据库系统数据量数据量数据量数据量大大大大 结构构复复杂数据数据传输的的连续性性时序性序性-同步同步机制机制Page 5
2、1.21.2多媒体数据库系统多媒体数据库系统存存储和和处理复理复杂对象象面向面向应用用强调媒体独立性媒体独立性处理的理的应用用对象不同,象不同,处理的方式也不同理的方式也不同具有更具有更强的的对象象访问手段手段强调终端用端用户界面的灵活界面的灵活性和多性和多样性性存存储和和处理格式化数据理格式化数据单一的数据模型一的数据模型简单的的查询方式方式提供准确的提供准确的查询1.21.2多媒体数据库系统多媒体数据库系统MDBS的的层次次结构构多媒体数据多媒体数据库系系统的的核心任核心任务是是实时地地综合合处理理图、文、声信、文、声信息息集中型集中型A指由指由单独一个独一个MDBMS来建立和管来建立和管
3、理不同媒体的数据理不同媒体的数据库,并由并由这个个MDBMS来来管理管理对象空象空间及目的及目的数据的集成数据的集成。协作型作型C协作型作型MDBS是由多是由多个数据个数据库管理系管理系统组成的,成的,这些数据些数据库管管理系理系统之之间没有主从没有主从之分,但能相互通信,之分,但能相互通信,协调工作。工作。主从型主从型B每一个数据每一个数据库都有自都有自己的管理系己的管理系统,称,称为从从MDBMS,各自管,各自管理自己的数据理自己的数据库。这些从些从MDBMS又受一又受一个被称个被称为主主MDBMS的的统一控制和管理。一控制和管理。1.21.2多媒体数据库系统多媒体数据库系统集中型集中型组
4、织结构构Page 71.21.2多媒体数据库系统多媒体数据库系统主从型主从型组织结构构Page 81.21.2多媒体数据库系统多媒体数据库系统协作型作型组织结构构Page 91.31.3多媒体数据库(多媒体数据库(MDBMDB)传统数据数据库系系统的主要的主要处理理对象是整数、象是整数、实数、字符数、字符串等串等简单类型数据,但型数据,但这种格式数据很种格式数据很难实现对人人脸、指、指纹、人的声音等事物的有效描述。、人的声音等事物的有效描述。传统数据数据库的的层次次结构构如下:如下:Page 101.31.3多媒体数据库(多媒体数据库(MDBMDB)传统数据数据库的的层次次结构可以在用构可以在
5、用户给出出查询条件后迅条件后迅速地速地检索到正确的信息,但面索到正确的信息,但面对图像、声音、像、声音、视频等无格等无格式数据,如何式数据,如何设定定检索条件,如何索条件,如何查询所需所需结果等,都是果等,都是无法直接无法直接实现的。的。因此就必因此就必须寻找恰当的找恰当的结构分构分层形式,已有多种形式,已有多种层次划次划分,包括分,包括对传统数据数据库的的扩展、展、对面向面向对象数据象数据库的的扩展、展、超媒体超媒体层次次扩展等。展等。虽然各有所不同,但大都是从最低然各有所不同,但大都是从最低层增加增加对多媒体数据的控制与支持,在最高多媒体数据的控制与支持,在最高层支持多媒体的支持多媒体的综
6、合表合表现和用和用户的的查询描述,在中描述,在中间增加增加对多媒体数据的多媒体数据的关关联和超和超链的的处理。理。Page 111.31.3多媒体数据库(多媒体数据库(MDBMDB)综合各多媒体数据的合各多媒体数据的层次次结构如下构如下:最高层支持多媒体的综合表现和用户的查询描述,完成用户对多媒体信息的查询描述和得到多媒体信息的查询结果中间层增加对多媒体数据的关联和超链的处理,对现实世界用多媒体数据信息进行的描述,也是多媒体数据库中在全局概念下的一个整体视图,该层为上层的用户接口、下层的多媒体数据存储和存取建立起一个在逻辑上统一的通道通过存取与存储数据模型描述媒体数据的逻辑位置安排、相互的内容
7、关联、特征与数据的关系等,并完成多媒体数据的逻辑存储与存取。底层增加对多媒体数据的控制与支持。建立在多媒体操作系统之上,对不同性质媒体分别进行相应的分割、识别、变换等操作,并确定物理存储的位置和方法,以实现对各种媒体的最基本数据的管理和操纵Page 121.41.4多媒体数据库管理系统(多媒体数据库管理系统(MDBMSMDBMS)在多媒体系在多媒体系统中存在着声音、文字、中存在着声音、文字、图形、形、视频等媒等媒体信息,与体信息,与传统的的计算机算机应用系用系统中只存在字符、数中只存在字符、数值相相比比扩充很大,充很大,这就需要一种新的管理系就需要一种新的管理系统对多媒体数据多媒体数据库进行管
8、理。行管理。这种种MDBMS能像能像传统的数据的数据库那那样对多媒体多媒体数据数据进行有效地行有效地组织、管理和存取,并可以、管理和存取,并可以实现以下功能:以下功能:多媒体数据多媒体数据库对象的定象的定义、多媒体数据存取、多媒体数据、多媒体数据存取、多媒体数据库运行控制、多媒体数据运行控制、多媒体数据库建立与建立与维护、多媒体数据、多媒体数据库在在网网络上的通信功能等。上的通信功能等。Page 13Page 141.41.4多媒体数据库管理系统(多媒体数据库管理系统(MDBMSMDBMS)MDBMS的基本功能A、表示和、表示和处理各种媒体理各种媒体数据,如文本、数据,如文本、图像、像、音音频
9、、视频等。等。B、反映和管理各种媒体、反映和管理各种媒体数据的特性,或各种媒数据的特性,或各种媒体数据之体数据之间的空的空间或或时间的关的关联。A、提供、提供对无格式数据无格式数据的的查询搜索功能搜索功能B、对不同媒体提供不不同媒体提供不同的操作方法,如同的操作方法,如图形、形、图像的像的编辑处理,理,声音数据的剪声音数据的剪辑等。等。A、解决分布在网、解决分布在网络上的多上的多媒体媒体库中数据的定中数据的定义、存、存储、操作操作问题。B、对数据的一致性、安全数据的一致性、安全性、并性、并发性性进行管理。行管理。1.41.4多媒体数据库管理系统(多媒体数据库管理系统(MDBMSMDBMS)多媒
10、体数据多媒体数据库管理系管理系统MDBMS(Multimedia Database Management System)一般由用一般由用户界面、存界面、存储子系子系统、特征数据、特征数据库、索引子系、索引子系统、检索子系索子系统和数据分和数据分析子系析子系统等部分等部分组成。其中用成。其中用户界面采用界面采用B/S方式方式实现,该用用户界面需要支持用界面需要支持用户以以图形方式形方式进行基于内容的行基于内容的查询,同同时也需要支持也需要支持传统文本方式的文本方式的查询。其体系。其体系结构如下构如下图:Page 151.41.4多媒体数据库管理系统(多媒体数据库管理系统(MDBMSMDBMS)P
11、age 1617多媒体内容检索与管理多媒体内容检索与管理1多媒体数据库2多媒体内容管理多媒体内容管理3多媒体内容检索6基于内容视频检索5基于内容音频检索4基于内容图像检索Page 182.12.1多媒体内容处理多媒体内容处理概念概念级内容内容感知特性感知特性逻辑关系关系特指特征特指特征多媒体数据的内容概念多媒体数据的内容概念的的层次次视觉特性,如特性,如颜色、色、视觉对象、象、纹理、理、草草图、形状、体、形状、体积、空、空间关系、关系、轮廓、廓、等,听等,听觉特性如音特性如音调、音色、音、音色、音质等。等。音音视频对象的象的时间和空和空间关系,关系,语义和上下文关和上下文关联等。等。与与应用相
12、关的媒体特征,如人的体用相关的媒体特征,如人的体形特征、面部特征、指形特征、面部特征、指纹特征等。特征等。对象的象的语义表达,例如利用文本的描表达,例如利用文本的描述,通述,通过分分类和目和目录来来组织层次次浏览,用用链来来组织上下文关上下文关联。2.12.1多媒体内容处理多媒体内容处理多媒体内容的多媒体内容的处理如下理如下图所示可分所示可分为三大部分:三大部分:a、内容内容获取、取、b、内内容描述和容描述和c、内容操内容操纵。首先要。首先要对原始媒体原始媒体进行行处理并提取内容,然后用理并提取内容,然后用标准形式描述所提取的内容,以支持各种内容的准形式描述所提取的内容,以支持各种内容的查询、
13、检索、索引等内容索、索引等内容的操的操纵。Page 192.12.1多媒体内容处理多媒体内容处理内容内容获取取是通是通过对各种内容的分析和各种内容的分析和处理而理而获得媒得媒体内容的体内容的过程。多媒体数据的重要成分是空程。多媒体数据的重要成分是空间和和时间结构,首先必构,首先必须分割出分割出图像像对象、象、视频的的时间结构、运构、运动对象,以及象,以及这些些对象之象之间的关系,然后提取的关系,然后提取显著的区著的区别特征和人的特征和人的视觉、听、听觉感知特征来表示媒体和媒体感知特征来表示媒体和媒体对象象的性的性质。Page 202.12.1多媒体内容处理多媒体内容处理内容描述内容描述就是就是
14、针对获取的内容取的内容进行描述。行描述。为了支持数了支持数据管理的灵活性、数据据管理的灵活性、数据资源的全球化和互操作性,描述必源的全球化和互操作性,描述必须基于一定的基于一定的标准。准。MPEG-7标准被称准被称为“多媒体内容描述多媒体内容描述接口接口”,主要采用描述子,主要采用描述子(Descriptor)和描述模式来分和描述模式来分别描述媒体的特性及其关系。描述子是特征的表示法,一个描述媒体的特性及其关系。描述子是特征的表示法,一个描述子就是定描述子就是定义特征的特征的语法和法和语义学。学。MPEG-7标准定准定义了了一系列的描述一系列的描述结构、一种构、一种详细说明描述明描述结构的构的
15、语言、描述言、描述定定义语言言(DDL)和多种和多种编码描述方法。描述方法。Page 212.12.1多媒体内容处理多媒体内容处理内容操内容操纵主要主要针对内容的用内容的用户操作和操作和应用。有用。有许多多这方面的名方面的名词和和术语。查询(Query)是面向用是面向用户的的术语,多用于数据多用于数据库操作、操作、检索索(Retrieval)是在索引支持下的是在索引支持下的快速信息快速信息获取方式、搜索取方式、搜索(Search)常用于常用于Internet的搜索的搜索引擎、摘要引擎、摘要(Summarization,Excerpt)是适合于是适合于视频和音和音频等等时基媒体的特殊操作、基媒体
16、的特殊操作、浏览(Browsing)可以可以线性或非性或非线性地存取性地存取结构化的内容、构化的内容、过滤(Filtering)是与是与检索相反的一种信息存取方式。索相反的一种信息存取方式。Page 222.22.2基于内容的多媒体信息检索基于内容的多媒体信息检索基于内容基于内容检索索(Content based),就是从媒体数据中提,就是从媒体数据中提取出特定的信息取出特定的信息线索,根据索,根据这些些线索从大量存索从大量存储在数据在数据库中的媒体中中的媒体中进行行查找,找,检索出具有相似特征的媒体数据出索出具有相似特征的媒体数据出来。来。多媒体数据的多媒体数据的“内容内容”表示多媒体信息的
17、含表示多媒体信息的含义、要旨、要旨、主主题和和显著的性著的性质、实质性的性的东西、物理西、物理细节等,而多媒等,而多媒体内容体内容处理技理技术要基于要基于对内容的基本定内容的基本定义。Page 23Page 242.22.2基于内容的多媒体信息检索基于内容的多媒体信息检索多媒体信息多媒体信息检索的特点索的特点相似性相似性检索:索:CBR采用一种采用一种近似匹配近似匹配的的方法和技方法和技术,逐步求精来,逐步求精来获得得查询和和检索索结果,每一果,每一层的中的中间结果是一个集合,果是一个集合,不断减少集合的范不断减少集合的范围,直到定位到,直到定位到查找找的目的目标直接从内容中提取信息直接从内容
18、中提取信息线索:索:CBR直接直接对文本、文本、图像、像、视频、音、音频进行分析,从中行分析,从中抽取内容特征抽取内容特征,然后利用,然后利用这些内容特征建些内容特征建立索引并立索引并进行行检索索。满足用足用户多多层次的次的检索要求:索要求:CBR检索索系系统通常由通常由媒体媒体库、特征特征库和和知知识库组成。成。大型数据大型数据库(集集)的的快速快速检索索:CBR往往往往拥有数量巨大、种有数量巨大、种类繁多的多媒体数据繁多的多媒体数据库,能能够实现对多媒体信息的快速多媒体信息的快速检索。索。2.32.3内容检索的关键技术内容检索的关键技术基于内容的多媒体数据基于内容的多媒体数据库管理系管理系
19、统除了解决媒体信息的存除了解决媒体信息的存储,还要要求能求能够从媒体数据中分析、从媒体数据中分析、抽取可供抽取可供检索的内容特征索的内容特征,用于信息的用于信息的检索。其关索。其关键技技术主要有特征抽取、特征分析和特征匹配。主要有特征抽取、特征分析和特征匹配。特征提取:提取各种特征,如特征提取:提取各种特征,如颜色,色,纹理,形状等。根据提取的特理,形状等。根据提取的特征不同,采取不同的征不同,采取不同的处理,例如提取形状特征,就需要先理,例如提取形状特征,就需要先进行行图像像分割和分割和边缘提取等步提取等步骤。选择合适的算法,并在效率和精确性方面合适的算法,并在效率和精确性方面加以改加以改进
20、,以适,以适应检索的需要,并索的需要,并实现特征的提取。特征的提取。特征分析:特征分析:对图像的各种特征像的各种特征进行分析,行分析,选择提取效率高、信息提取效率高、信息浓缩性好的特征,或者将几种特征性好的特征,或者将几种特征进行行组合,用到合,用到检索索领域。域。特征匹配:特征匹配:选择何种模型来衡量何种模型来衡量图像特征像特征间的相似度。的相似度。Page 252.32.3内容检索的关键技术内容检索的关键技术基于内容多媒体数据基于内容多媒体数据库管理系管理系统的的功能框架如下的的功能框架如下图所示。所示。Page 262.42.4基于内容的多媒体信息检索体系结构基于内容的多媒体信息检索体系
21、结构基于内容基于内容检索系索系统结构由特征分析子系构由特征分析子系统、特征提取子系、特征提取子系统、数、数据据库、查询接口、接口、检索引擎和索引索引擎和索引过滤等子系等子系统组成,同成,同时需要相需要相应的知的知识辅助支持特定助支持特定领域的内容域的内容处理。理。Page 272.42.4基于内容的多媒体信息检索体系结构基于内容的多媒体信息检索体系结构特征分析:特征分析:该子系子系统负责将需要入将需要入库的媒体的媒体进行分割或行分割或节段化,段化,标识出需要的出需要的对象或内容关象或内容关键点,以便有点,以便有针对性的性的对目目标进行特征提行特征提取。特征取。特征标识可通可通过用用户输入或系入
22、或系统定定义。特征提取特征提取对用用户提供或系提供或系统标明的媒体明的媒体对象象进行特征提取行特征提取处理。提理。提取特征取特征时需要知需要知识处理模理模块的的辅助,与助,与标准化的知准化的知识定定义直接有关。直接有关。数据数据库包含多媒体数据包含多媒体数据库和特征数据和特征数据库,分,分别存放多媒体数据同存放多媒体数据同对应的特征数据,它的特征数据,它们彼此之彼此之间存在着一定的存在着一定的对应关系。特征关系。特征库中包中包含了由用含了由用户输入的和入的和预处理自理自动提取的特征数据,通提取的特征数据,通过检索引擎索引擎组织与媒体与媒体类型相匹配的索引来达到快速搜索的目的。型相匹配的索引来达
23、到快速搜索的目的。Page 282.42.4基于内容的多媒体信息检索体系结构基于内容的多媒体信息检索体系结构查询接口,即人机交互界面,友好的人机交互界面是接口,即人机交互界面,友好的人机交互界面是检索系索系统不可不可缺少的。在基于内容的缺少的。在基于内容的检索中,由于特征不直索中,由于特征不直观,因此必,因此必须为用用户提供一个可提供一个可视化的化的输入手段,入手段,还应在用在用户界面提供界面提供查询结果的果的创览功能,即功能,即为用用户提供初步提供初步查询结果的返回,系果的返回,系统会根据用会根据用户选择的的排序排序标准准(如如颜色、旋律、色、旋律、节拍等拍等),按照相似度的大小将,按照相似
24、度的大小将结果排列果排列后,返回后,返回给用用户。检索引擎,索引擎,检索要将特征提取索要将特征提取值和特征和特征库中的中的值进行比行比较,得到一,得到一个相似度。不同的媒体各自具有不同的相似度算法,个相似度。不同的媒体各自具有不同的相似度算法,这些算法也称些算法也称为相似性相似性测度函数。度函数。检索引擎使用相似性索引擎使用相似性测度函数集去度函数集去进行比行比较,从而确定与特征从而确定与特征库的的值最接近的多媒体数据。最接近的多媒体数据。索引索引过滤在大在大规模多媒体数据模多媒体数据检索索过程中,程中,为了提高了提高检索效率,常索效率,常在在检索引擎索引擎进行匹配之前采用索引行匹配之前采用索
25、引过滤方法,取出高方法,取出高维特征用于匹特征用于匹配。配。Page 292.42.4基于内容的多媒体信息检索体系结构基于内容的多媒体信息检索体系结构如果用如果用户对系系统返回的返回的查询结果不果不满意怎么意怎么办?相关返相关返馈技技术Page 302.52.5基于内容的多媒体信息检索中的相关反馈技术基于内容的多媒体信息检索中的相关反馈技术在基于内容的在基于内容的检索索过程中相关反程中相关反馈是一个相当重要的是一个相当重要的过程。因程。因为仅仅基于基于图像低像低层特征很特征很难给出令人出令人满意的意的结果,主要原因是果,主要原因是图像低像低层特征和高特征和高层语义间存在着很大的差距。相关反存在
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体 内容 检索 管理
限制150内