信息管理和信息系统第4章.ppt
《信息管理和信息系统第4章.ppt》由会员分享,可在线阅读,更多相关《信息管理和信息系统第4章.ppt(73页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章第四章 多媒体信息存储与检索多媒体信息存储与检索 信息存储与检索本章目录本章目录第一节第一节 引言引言第二节第二节 多媒体技术概述多媒体技术概述第三节第三节 多媒体数据模型多媒体数据模型第四节第四节 多媒体数据压缩技术多媒体数据压缩技术第五节第五节 基于内容的多媒体检索技术基于内容的多媒体检索技术2信息存储与检索第一节第一节 引言引言v随着信息时代的到来,信息多元化程度加深,人们不再满足于单一的文本交流。多媒体技术的出现,使得信息的表达方式更生动、更容易被人们所理解,因此迅速成为信息存在的主要方式。3信息存储与检索第一节第一节 引言引言v传统的信息检索系统只处理文本和非结构化的数据,信息
2、是以离散的形式(如字符、数字等)存储在关系数据库中,并以结构化查询语言(SQL)或超链接来进行查询检索;而多媒体数据则是连续的、形式多样的、海量的信息,并且多媒体数据(如图像、视频)在不同的人眼中可能有不同的理解,要把所有不同的解释都用关键字(文本或数字)来表示显然是不可能的。另外,关键字不能有效地表示视频数据的时序特征,也不支持语义关系,因此需要开发出一种新的检索技术来检索多媒体数据。为了适应这一需求,人们提出了基于内容的多媒体信息检索思想。4信息存储与检索第一节第一节 引言引言v为了适应这一需求,人们提出了基于内容的多媒体信息检索思想。基于内容的检索是指根据媒体和媒体对象的内容及上下文联系
3、在大规模多媒体数据库中进行检索。他的研究目标是提供在没有人类参与的情况下能自动识别或理解图像重要特征的算法。目前,基于内容的多媒体信息检索的主要工作集中在识别和描述图像的颜色、纹理、形状和空间关系上,对于视频数据,还有视频分割、关键帧提取、场景变换探测以及故事情节重构等问题。由此可见,这是一门涉及面很广的交叉学科,需要以图像处理、模式识别、计算机视觉、图像理解等领域的知识为基础,还需从认知科学、人工智能、数据库管理系统、人机交互、信息检索等领域引入新的媒体数据表示和数据模型,从而设计出可靠、有效的检索算法、系统结构以及友好的人机界面。5信息存储与检索4.2.1 多媒体的概念多媒体的概念(一)媒
4、体的含义v“媒体”一词的含义很多,但在计算机领域中主要有两层含义:一是指信息的物理载体,如磁盘、磁带、光盘等;另一是指信息的表现或传播形式,如声音、文字、图像、动画等。根据国际电信联盟(ITU:International Telecommunication Union)电信标准部推出的ITU-TI.374建议的定义,可以将媒体划分为如下五类:(1)感觉媒体(2)表示媒体(3)表现媒体(4)存储媒体(5)传输媒体 7信息存储与检索4.2.1 多媒体的概念多媒体的概念(一)媒体的含义v(1)感觉媒体:指直接作用于人的感觉器官,使人产生直接感觉的媒体。如引起听觉反应的声音,引起视觉反应的图像等。v(
5、2)表示媒体:指传输感觉媒体的中介媒体,即用于数据交换的编码。如图像编码(JPEG、MPEG等)、文本编码(ASCII码、GB2312等)和声音编码等。v(3)表现媒体):指进行信息输入和输出的媒体。如键盘、鼠标、扫描仪、话筒、摄像机等为输入媒体;显示器、打印机、喇叭等为输出媒体。v(4)存储媒体:指用于存储表示媒体的物理介质。如硬盘、软盘、磁盘、光盘、ROM及RAM等。v(5)传输媒体:指传输表示媒体的物理介质。如电缆、光缆等。8信息存储与检索4.2.1 多媒体的概念多媒体的概念(二)多媒体的含义v在人们的日常谈论中,多媒体的“媒体”常常泛指“感觉媒体”,但多媒体技术所处理的“媒体”主要是指
6、“表示媒体”,而“多”则表示信息表示媒体的多样化。v现在的多媒体技术往往与计算机联系在一起,是指利用计算机技术把各种信息媒体综合一体化,使它们建立起逻辑联系,并进行加工处理的技术。所谓加工处理主要是指对这些媒体的录入、对信息进行压缩和解压缩、存储、显示、传输等。因此,多媒体不是“混媒体”。尽管包含的媒体元素很多,但并非机械地将他们拼凑在一起。9信息存储与检索4.2.2 多媒体技术的关键特征多媒体技术的关键特征 v多媒体技术主要体现出综合处理多种媒体信息的特点,包括信息载体的:(1)多样性(2)集成性(3)交互性(4)实时性(5)互补性 这5个特性缺一不可。其中,多样性、实时性和互补性是基础,集
7、成性是手段、方式或形式,交互性是核心或灵魂。10信息存储与检索4.2.2 多媒体技术的关键特征多媒体技术的关键特征 v1.信息载体多样性指文字、文本、图形、图像、视频、语音等多种媒体信息于一体。2.交互性多媒体的第二个关键特性是交互性。所谓交互就是通过各种媒体信息,使参与的各方(不论是发送方还是接收方)都可以进行编辑、控制和传递。交互性将向用户提供更加有效的控制和使用信息的手段和方法,同时也为应用开辟了更加广阔的领域。交互可做到自由地控制和干预信息的处理,增加对信息的注意力和理解,延长信息的保留时间。11信息存储与检索4.2.2 多媒体技术的关键特征多媒体技术的关键特征 v3.互补性每一种媒体
8、都有其自身规律,各种媒体之间必须有机地配合才能协调一致。多种媒体之间的协调以及时间、空间的协调是多媒体的关键技术之一。4.实时性所谓实时就是在人的感官系统允许的情况下,进行多媒体交互,就好像面对面(Face To Face)一样,图像和声音都是连续的。实时多媒体分布系统是把计算机的交互性、通信的分布性和电视的真实性有机地结合在一起。5.集成性多媒体技术是多种媒体的有机集成。它集文字、文本、图形、图像、视频、语音等多种媒体信息于一体。12信息存储与检索4.2.3 多媒体技术的主要研究内容多媒体技术的主要研究内容 v多媒体技术的研究内容包括:多媒体数据处理技术,如多媒体数据模型、多媒体数据压缩、多
9、媒体数据存储与检索技术等;多媒体数据传输技术,如多媒体网络技术、多媒体视频点播技术等;多媒体专用设备技术,如多媒体专用芯片技术、多媒体专用输入/输出技术等。本章内容将只对多媒体数据处理技术作出阐述。13信息存储与检索 4.3.1 多媒体数据模型概述多媒体数据模型概述(一)多媒体数据模型的概念v数据模型是数据库系统中的术语,用来表示实体以及实体间的联系。数据库的数据模型由三部分组成:数据库的数据结构、数据库操作集合和完整性规则集合。其中,最重要的部分是反映能够数据库逻辑结构的数据结构,因为数据模型的作用就是能清晰地表示数据库的逻辑结构,以便使用户更有效地存取数据。最著名的数据模型有层次模型、网状
10、模型和关系模型。15信息存储与检索 4.3.1 多媒体数据模型概述多媒体数据模型概述(一)多媒体数据模型的概念v多媒体数据模型的基本任务是:能够表示各种不同媒体数据的构造及其属性特征;同时能够指出不同媒体数据之间的相互关系,包括相互之间的信息语义关系,以及媒体特性之间的关系,主要是时空特性关系。v在多媒体信息检索系统的框架下,如何进行多媒体数据模型的构建工作呢?注意两方面的问题:第一,数据模型应该根据用户能够指定的、存储于系统的数据来定义。数据模型应该能够把常规数据类型和多媒体类型进行整合,而且应该提供对这种数据进行分析、检索和查询的方法。第二,系统应该为多媒体数据的内部表示提供一个模型,这个
11、模型的定义对于有效的查询处理来说是至关重要的。16信息存储与检索 4.3.1 多媒体数据模型概述多媒体数据模型概述(二)多媒体数据模型的体系结构 一个完整的多媒体数据模型应该是对多媒体信息系统的信息和数据的内容、不同媒体对象或由它们合成的复合对象的表现、内容与表现之间的映射/对应关系进行组织结构上的抽象概括和规范描述的一个整体。内容多媒体应用多媒体信息元多媒体数据元表现上层脚本同步中层合成同步底层系统同步联系握手图图4-1 多媒体数据模型的体系结构多媒体数据模型的体系结构资料来源:张维明,2002.多媒体信息系统.北京:电子工业出版社17信息存储与检索 4.3.1 多媒体数据模型概述多媒体数据
12、模型概述(三)多媒体数据模型的种类 多媒体数据模型的分类没有定则。基于不同结构不同层次,可以将其分为超媒体模型、时基媒体模型、基于媒体内容模型、文献模型和信息元模型等。基于模型的性质,又可以将其分为表现模型和同步模型。基于不同的建模方法,则可将其分为NF2数据模型、面向对象数据模型和对象-关系模型等。18信息存储与检索 4.3.2 图像的数据模型图像的数据模型 图像可模型化为图像和图像对象,图像可以包含许多图像对象,并对图像对象的解释是领域相关的。图像数据模型可以分为三个层次:语义表现层、逻辑表现层和物理表现层。1、物理表现层 物理表现层提供原始图像数据,即图像的物理表示及物理特性。物理特性和
13、领域无关,可直接从物理表现中抽取或预先抽取存于计算机中。图像的物理层特征主要包括颜色、纹理、轮廓等视觉信息。19信息存储与检索 4.3.2 图像的数据模型图像的数据模型2、逻辑表现层 逻辑表现层包括图像逻辑属性和图像对象的逻辑属性。用于描述一个集成实体图像性质的属性称为图像逻辑属性,如一副图像中包含的对象数,对象间的空间关系等。用于描述图像中的对象集合性质的属性称为图像对象逻辑属性,如每个对象的最小边界矩形,对象的空间位置等。3、语义表现层 图像的语义表现层是用于描述图像所表明的高层领域的概念,通常图像的主题、作者的创作意图,个人的印象等,具有很大的不确定性。语义特征主要通过用户从图像本身进行
14、认知,需要人工捕捉,主观感受因素较强,常常会因人而异。对于图像语义特征的提取和描述,可以加工成知识库,提供智能检索服务。20信息存储与检索 4.3.2 图像的数据模型图像的数据模型语义1语义2语义3语义n语义表现层图像逻辑表示图像对象逻辑表示逻辑表现层物理表现层图图4-2 图像数据模型的层次化表现图像数据模型的层次化表现资料来源:张维明,2002.多媒体信息系统.北京:电子工业出版社21信息存储与检索 4.3.3 音频的数据模型音频的数据模型v音频信息也可以采用文本处理的方法,选择主题词、关键词对音频内容加以人工标引,揭示音频的主题内容及特征,例如对于一首歌曲,歌词就是它的内容描述。但这些仍属
15、于传统文本处理的范畴,它与基于音频内容的特征处理完全不同。所谓基于音频内容的特征处理方法,就是针对音频信息的物理样本、基本属性等进行分析处理,通过数学与统计学方法来获得音频信息物理、听觉、语义等不同层次(或级别)上的特征,并揭示特征之间的相互关系。v下面就介绍几个通过短时处理技术得到的比较常用而且重要的特征:(一)音调(二)响度(三)过零率(四)亮度(五)带宽22信息存储与检索 4.3.4 视频的数据模型视频的数据模型v视频就是一组连续的静态图像按照时间的顺序连续更换形成的动画、影像等。简单地说,视频数据是连续的图像序列。在对视频进行分类和检索之前,必须了解视频的数据结构。视频数据可用故事单元
16、、场景、镜头、帧来描述。对于视频文件来说,我们也可以利用与处理图像和音频相同的方法,进行视频外部特征信息的文本著录,以实现简单的初级检索。然而,与图像、音频一样,只有对基于视频内容本身进行处理才能获得更有效的检索。23信息存储与检索 4.3.4 视频的数据模型视频的数据模型视频故事单元1故事单元2故事单元n场景1场景2场景m镜头1帧镜头2帧镜头3帧图图4-3 4-3 视频的分层结构描述视频的分层结构描述资料来源:张维明,2002.多媒体信息系统.北京:电子工业出版社24信息存储与检索4.4.1 数据压缩技术概述数据压缩技术概述(一)多媒体数据压缩的必要性和可能性 数据压缩就是以一定的质量损失为
17、容限,按照某种方法从给定的信息源中推出简化的数据表述,它通过减少信号空间的量,使信号能安排到给定的信息集或样本集中。一般说来,多媒体数据中存在的数据冗余类型主要有以下几种:(1)空间冗余(2)时间冗余(3)结构冗余(4)视觉冗余(5)听觉冗余(6)知识冗余26信息存储与检索4.4.1 数据压缩技术概述数据压缩技术概述(一)多媒体数据压缩的必要性和可能性 一、空间冗余是静态图像中存在的最主要的一种数据冗余。同一景物表面上采样点的颜色之间往往存在着空间连贯性,但是基于离散像素采样来表示物体颜色的方式通常没有利用这种连贯性。例如:图像中有一片连续的区域,其像素为相同的颜色,空间冗余产生。二、时间冗余
18、是序列图像中经常包含的冗余。一组连续的画面之间往往存在着时间和空间的相关性,但是基于离散时间采样来表示运动图像的方式通常没有利用这种连贯性。例如:房间里的两个人在聊天,在这个聊天的过程中,背景(房间和家具)一直是相同的,同时也没有移动,而且是同样的两个人在聊天,只有动作和位置的变化。27信息存储与检索4.4.1 数据压缩技术概述数据压缩技术概述(一)多媒体数据压缩的必要性和可能性三、结构冗余是在某些场景中,存在着明显的图像分布模式,这种种分布模式称作结构。图像中重复出现或相近的纹理结构,结构可以通过特定的过程来生成。例如:方格状的地板,蜂窝,砖墙,草席等图结构上存在冗余。已知分布模式,可以通过
19、某一过程生成图像。四、视觉冗余是人类的视觉系统对图像场的敏感性是非均匀和非线性的。对亮度变化敏感,而对色度的变化相对不敏感;在高亮度区,人眼对亮度变化敏感度下降;对物体边缘敏感,内部区域相对不敏感;对整体结构敏感,而对内部细节相对不敏感。可以根据这些视觉特性对图像信息进行取舍。28信息存储与检索4.4.1 数据压缩技术概述数据压缩技术概述(二)多媒体数据压缩的基本要求 对多媒体数据进行压缩处理需要两个过程。一是编码过程,即将原始数据经过编码进行压缩,以便于存储和传输;另一是解码过程,对编码后的数据进行解码,还原为可以使用的数据。对数据进行压缩处理一般具有以下基本要求:(1)可还原(2)压缩比高
20、(3)重现质量好(4)计算成本低(5)实时性好29第四章30信息信息编码vHuffman编码Huffman编码时采取从后向前推,即以概率最小的向概率大的方向进行编码处理,最后建立一颗Huffman编码树。各个符号作为二叉树的叶结点,每个节点有一个权,它是符号出现的概率。第四章31信息信息编码建立Huffman编码树的步骤描述如下:将信息集合中的各信息元素按概率依次从大到小排列。使概率最小的二组信息元素分别对应于码和码。将这两个信息元素的概率相加,作为另一组信息元素出现的概率。再一次重新依次按概率大小排序。重复以上步骤,直到剩下最后一个元素,并将其作为树根。第四章324.1、信息、信息编码vHu
21、ffman编码举例下面几个图可以看到Huffman编码的构造过程是一个反复比较的过程,它总是选择两个使用频率较小的结点进行合并,生成出一个树,这个树经过编码后就会得到Huffman编码。第四章33信息信息编码v在上图中各点中的数字代表各点的使用次数,您可以把这几个方块想成A,B,C,D,它们在某一文章中的使用频率为7次,5次,1次等等。第四章34信息信息编码v选择使用率小的两个点1,3构成新点4。第四章35信息信息编码v在状态1图中选择5,4(也是两个最小的,注意不是1,3,因为1,3现在已经归在4里面了)进行合并。第四章36信息信息编码v在状态2表中的最小两个点已经变为7,6了,这时合并它们
22、两个生成新点13。第四章37信息信息编码v只剩两个点了,不管多少它们也是最小的了,合并了算了。第四章38信息信息编码v请注意这个编码,每个点下面有两个分枝,分别编码为0,1。至此编码结束,所得到编码即从最上面的点延线下行,至所要编码的点,将沿路经过的0和1记录下来就是了。71161050030111010第四章39信息信息编码vHuffman编码所以能获得高效编码,原因就在于高概率的信息元素总是取短码。由此也可以得出结论,即信源中各信息元素的概率分布越是不均匀,Huffman编码的有效性越能发挥出来。而一旦信息元素发生的概率趋于平衡,Huffman编码有效性也将随之势去。第四章40信息信息压缩
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息管理 信息系统
限制150内