《多媒体通信技术》PPT课件.ppt
《《多媒体通信技术》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《多媒体通信技术》PPT课件.ppt(393页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多媒体通信技术多媒体通信技术 第一章多媒体通信技术概述第二章音频技术基础第三章图像技术基础第四章视频信息压缩与处理第五章多媒体通信系统中的关键技术第六章多媒体通信网络技术第七章多媒体数据的分布式处理第八章多媒体通信应用系统本书章节本书章节第一章多媒体通信技术概述o多媒体技术的概念o多媒体通信系统的概念及主要特征o多媒体通信中的关键技术o多媒体通信的应用o多媒体通信技术的发展趋势1.1多媒体通信的基本概念o1媒体媒体“媒体媒体”是指信息传递和存储的最基本的技术和手段,即信息的是指信息传递和存储的最基本的技术和手段,即信息的载体。载体。媒体可划分为5大类:(1)感觉媒体感觉媒体(perceptio
2、nmedium)感觉媒体是指人类通过其感觉器官,如听觉、视觉、嗅觉、味觉和触觉器官等直接产生感觉(感知信息内容)的一类媒体,包括:声音、文字、图像、气味、冷热等。(2)表示媒体表示媒体(representationmedium)表示媒体是指用于数据交换的编码表示,包括:图像编码、文本编码、声音编码等。其目的是为了能有效地加工、处理、存储和传输感觉媒体。(3)显示媒体显示媒体(presentationmedium)显示媒体是指进行信息输入和输出的媒体。输入媒体包括:链盘、鼠标、摄像头、话筒、扫描仪、触摸屏等,输出媒体包括:显示屏、打印机、扬声器等。(4)存储媒体存储媒体(storagemediu
3、m)存储媒体是指进行信息存储的媒体。包括:硬盘、光盘、软盘、磁带、ROM、RAM等。(5)传输媒体传输媒体(transmissionmedium)传输媒体是指承载信息,将信息进行传输的媒体。包括:双绞线、同轴电缆、光缆、无线电链路等。在多媒体技术中的“多媒体”通常是指感觉媒体的组合,即声音、文字、图像、数据等各种媒体的组合。2多媒体多媒体(Multimedia)“多媒体技术多媒体技术”的定义:的定义:所谓多媒体技术就是计算机交互式所谓多媒体技术就是计算机交互式综合处理多媒体媒体信息综合处理多媒体媒体信息文本、图形、图像和声音,使多种信文本、图形、图像和声音,使多种信息建立逻辑连接,集成为一个系
4、统并具有交互性。简而言之,多媒息建立逻辑连接,集成为一个系统并具有交互性。简而言之,多媒体技术就是计算机综合处理声、文、图体技术就是计算机综合处理声、文、图 信息的技术,具有集成性、信息的技术,具有集成性、实时性和交互性的特点。实时性和交互性的特点。多媒体技术最简单的表现形式就是多媒体计算机。多媒体计算机相对于普通计算机的一个根本不同点在于在多媒体计算机中增加了对活动图像(包括伴音在内)的处理、存储和显示的能力,其硬件配以声卡、视频采集卡等。其主要特征体现在它能够有效地对电视图像数据进行实时的压缩和解压缩,并能够使在时间上有相关性的多种媒体保持同步。3多媒体通信多媒体通信多媒体通信技术是多媒体
5、技术、计算机技术、通信技术和网络技术等相互结合和发展的产物。多媒体通信系统同时具有以下三个特征:n集成性集成性n交互性交互性n同步性同步性o集成性集成性:主要是对各类信息进行存储、传输、处理、显现的能力。o1)内容数据信息:文本、图形、静止图像与二值图像、声音、运动图像。o2)多媒体和超媒体信息:是结构化信息,由结构框架+内容数据组成。o3)脚本信息o4)特定的应用信息o交互性交互性:指的是在通信中使用者与系统之间的相互沟通的特性,它使用户可以更有效地控制和使用信息,增加对信息的注释和理解。oo交互性有两个方面的内容:o人机接口:也就是人在使用系统的终端时,系统向用户提供的操作界面。o通信协议
6、:用户终端与系统之间的应用层通信协议。o同步性:同步性:多媒体通信终端上显现的图象、声音和文字等信息是以同步方式工作。o检索“刘谦春晚”,显示多媒体信息,各信息同步显示。1多媒体数据压缩技术多媒体数据压缩技术数据压缩的必要性和可能性。1.2多媒体通信中的关键技术多媒体信息的特点1.1.多媒体信息的类型多媒体信息的类型 文本、图形、图像、动画、声音、视频文本、图形、图像、动画、声音、视频2.2.常用多媒体处理软件常用多媒体处理软件 CorelDraw Illustrator o图形类o图像类photoshop ACDSee 多媒体信息的特点 o动画类二维动画Flash ANIMO 三维动画3ds
7、 max mayaCooledit pro VEGAS o声音类o影视编辑类o交互演示类Authorware director flashPremiere after effect o编程类Vb VC Delphi Java3.3.多媒体信息的特点多媒体信息的特点n多媒体数据类型复杂(多样性)多媒体数据类型复杂(多样性)多媒体数据种类繁多也决定了多媒体数据表示的复杂性n多媒体数据的实时性多媒体数据的实时性 由于在多媒体技术中新引入的复杂媒体类型大部份都含有与时间有关的信息,因此在许多场合都要求实时处理3.3.多媒体信息的特点多媒体信息的特点n多媒体数据的同步性多媒体数据的同步性 另一由于引入与
8、时间有关的媒体而形成的重要特点n数据量大数据量大 多媒体系统需要大量的存储空间来存放复杂类型的数据n多媒体数据的交互性多媒体数据的交互性n码率可变、突发性强码率可变、突发性强 人们讲话时的停顿、所传场景图像中物体的运动等都会形成码流速率的波动,而且这种波动往往呈现出极强的突发性。信息压缩的必要性n由于多媒体数据量非常大,造成计算机的存储和网络由于多媒体数据量非常大,造成计算机的存储和网络传输负担传输负担若帧速率为25帧秒,则1s的数据量大约为25MB,一个640MB的光盘只能存放大约25s的动态图像一幅640480分辨率的24位真彩色图像的数据量约为900KB;一个100MB的硬盘只能存储约1
9、00幅静止图像画面n解决办法之一就是进行解决办法之一就是进行数据压缩数据压缩,压缩后再进行存储,压缩后再进行存储和传输,到需要时再解压、还原。和传输,到需要时再解压、还原。表1各种信号的特性和未压缩速率信息压缩的必要性 从从上上图图可可以以看看出出:未未进进行行任任何何形形式式编编码码和和压压缩缩的的窄窄带带语语音音信信号号需需要要128 kb/s的的速速率率,即即两两倍倍于于普普通通电电话话的的速速率率。信信号号未未被被压压缩缩的的宽宽带带话话音音需需要要256 kb/s的的速速率率,未未压压缩缩的的双双声声道道立立体体声声CD音音频频需需要要1.41 Mb/s的的速速率率。在在保保持持原原
10、始始信信号号质质量量的的前前提提下下,窄窄带带语语音音可可以以压压缩缩到到4 kb/s(30 1的的压压缩缩比比),宽宽带带话话音音可可以以压压缩缩到到约约16 kb/s(15 1的的压缩比),压缩比),CD音频可以压缩到音频可以压缩到64 kb/s(22 1的压缩比)。的压缩比)。显显然然,多多媒媒体体信信号号在在进进行行有有效效的的存存储储和和传传输输之之前前,必必须进行处理,须进行处理,而最关键的处理方法是进行数据压缩。而最关键的处理方法是进行数据压缩。信息压缩的可行性 研研究究表表明明,一一个个文文件件所所包包含含的的数数据据量量并并不不等等于于它它所所包包含含的的信信息息量量,数数据
11、据中中通通常常包包含含很很大大的的冗冗余余,其关系如:其关系如:D=I+r 其中其中D为数据量,为数据量,I I为信息量,为信息量,r r为冗余量。为冗余量。压压缩缩:在在多多媒媒体体信信息息中中包包含含大大量量冗冗余余的的信信息息,把把这这些冗余的信息去掉的过程。些冗余的信息去掉的过程。信息压缩的可行性音频、图像和视频数据中存在的冗余主要有以下几种:(1)空间冗余图象本身的数据冗余在任何一幅图像中,均有许多灰度或颜色都相同的邻近像素组成的局部区域,它们形成了一个性质相同的集合块,即它们之间具有空间(或空域)上的强相关性,在图像中就表现为空间冗余。空间冗余的压缩方法:空间冗余的压缩方法:把这种
12、局部区域集合块当作一个整体,用极少的数据量来表示,从而节省存储空间。这种压缩方法叫空间压缩或帧内压缩,它的基本点就在于减少邻近像素之间的空间(或空域)相关性。信息压缩的可行性该图为一张俯视图,该图为一张俯视图,图中央的黑色是一块表面均匀的积木块,图中央的黑色是一块表面均匀的积木块,在图中,在图中,黑色区域所有点的表示数据差不多都是相同的,黑色区域所有点的表示数据差不多都是相同的,因而黑色区域的数据因而黑色区域的数据表达有很大的冗余。表达有很大的冗余。信息压缩的可行性(2)时间冗余)时间冗余序列图像和语音数据中包含的冗余。活动图像(视频)中的两幅相邻图像之间存在的相关性或一段时间内连续音频存在的
13、相关性。信息压缩的可行性(3)信息熵冗余)信息熵冗余信息熵冗余也称为编码冗余,它是指一块数据所携带的信息量少于数据本身所产生的冗余。例如,利用等长码表示信息就比不等长码如Huffman编码表示信息量存在冗余。(4)结构冗余)结构冗余指图象各部分结构上的类似性所产生的冗余,例如物体表面图象上的纹理结构。信息压缩的可行性(5)知识冗余)知识冗余指某些图象的结构可由这些图象的先验知识和背景知识获得。例:汽车图象的结构可由汽车的先验知识和背景知识得到。这种冗余称为知识冗余。例:人脸的图像有固定的结构,嘴的上方有鼻子,鼻子的上方有眼睛,鼻子位于正脸图像的中线上等等。这类规律的结构可由先验知识和背景知识得
14、到,因此这类信息对一般人来说是冗余信息。信息压缩的可行性(6)视觉听觉冗余)视觉听觉冗余视觉听觉冗余是指人的视觉、听觉分辨率低于实际图象、音频的分辨率所产生的冗余。例如,人的视觉对灰度等级的分辨率是2个等级,而一般图象量化所采用灰度等级是2等级。例如,人的视觉对于图像边缘的急剧变化不敏感,对图像的亮度信息敏感,对颜色的分辨率较弱等。因此,如果图像经压缩或量化发生的变化(或称引入了噪声)不能被视觉所感觉,则认为图像质量是完好的或是够好的,即图像压缩并恢复后仍有满意的主观图像质量。(7)其他冗余其他冗余4.压缩的种类压缩的种类l无损压缩无损压缩 也称为冗余压缩或无失真压缩。冗余压缩法去掉或者减少了
15、数据中的冗余,但这些冗余数据是用特定的方法重新插入到数据中。冗余压缩是可逆的,它能保证百分之百地恢复原始数据。在多媒体技术中,一般用于文本的压缩。但这种方法压缩比较低。常用的压缩编码方法有LZW编码、行程编码、霍夫曼(Huffman)编码等,压缩比一般在2:15:1之间。l有损压缩有损压缩 也称为有失真压缩或熵压缩法。压缩了熵,会减少信息量,而损失的信息量是不能恢复的,因此这种压缩方法是不可逆的。这种方法适合对图像、声音、动态视频等数据进行压缩,对动态视频的压缩比可达到50:1200:1。当然,对多媒体数据进行有损压缩后,就涉及到压缩质量的问题,一般的要求是压缩后的内容不应该影响人们对信息的理
16、解。数据压缩的主要指标 有有较较高高的的压压缩缩比比、压压缩缩和和解解压压缩缩时时间间短短、解解压压缩缩后后信信息恢复质量高是评价压缩好坏的主要方面。息恢复质量高是评价压缩好坏的主要方面。1.有较高的压缩比有较高的压缩比 即即压压缩缩前前后后的的数数据据量量之之比比,如如果果文文件件的的大大小小为为1MB,经经过过压压缩缩处处理理后后变变成成0.5MB,那那么么压压缩缩比比为为2:1。高高的的压压缩缩比比是是数数据据压压缩缩的的根根本本目目的的,无无论论从从哪哪个个角角度度看看,在在同同样样压压缩缩效效果果的的前前提提下下,数数据据压压缩缩得得越越小小越越好好。当当然然还还要要考考虑虑多多媒媒
17、体体数数据据压缩后的输入和输出表示方式。压缩后的输入和输出表示方式。数据压缩的主要指标2.解压缩后信息恢复质量高解压缩后信息恢复质量高 对对于于文文本本等等文文件件,特特别别是是是是程程序序文文件件,是是不不允允许许在在压压缩缩和和解解压压缩缩过过程程中中丢丢失失信信息息的的。因因此此需需要要采采用用无无损损压压缩缩,不不存存在在压压缩缩后后恢恢复复质质量量的的问问题题。对对于于图图像像、声声音音和和视视频频影影像像,数数据据经经过过压压缩缩后后允允许许信信息息的的部部分分丢丢失失。在在这这种种情情况况下下,信信息息经经解解压压缩缩后后不不可可能能完完全全恢恢复复,压压缩缩和和解解压压缩缩质质
18、量量就就不不能能不不考考虑虑。因因此,是否具有好的恢复质量是数据压缩的另一个重要指标。此,是否具有好的恢复质量是数据压缩的另一个重要指标。表2 图像主观评价性能表 主观评价分 质量尺度 妨碍观看尺度 5 非常好 丝毫看不出图像质量变坏 4 好 能看出图像质量变化,但不妨碍观看 3 一般 清楚地看出图像质量变坏,对观看稍有妨碍 2 差 对观看有妨碍 1 非常差 非常严重地妨碍观看数据压缩的主要指标3.压缩和解压缩时间短压缩和解压缩时间短 数数据据的的压压缩缩和和解解压压缩缩是是在在一一定定数数学学模模型型的的基基础础上上,通通过过一一系系列列数数学学运运算算实实现现的的。计计算算方方法法的的好好
19、坏坏直直接接关关系系到到压压缩缩和和解解压压缩过程所需要的时间。缩过程所需要的时间。数据压缩的主要指标 有有较较高高的的压压缩缩比比、压压缩缩和和解解压压缩缩时时间间短短、解解压压缩缩后后信信息恢复质量高是评价压缩好坏的主要方面。息恢复质量高是评价压缩好坏的主要方面。1.有较高的压缩比有较高的压缩比 即即压压缩缩前前后后的的数数据据量量之之比比,如如果果文文件件的的大大小小为为1MB,经经过过压压缩缩处处理理后后变变成成0.5MB,那那么么压压缩缩比比为为2:1。高高的的压压缩缩比比是是数数据据压压缩缩的的根根本本目目的的,无无论论从从哪哪个个角角度度看看,在在同同样样压压缩缩效效果果的的前前
20、提提下下,数数据据压压缩缩得得越越小小越越好好。当当然然还还要要考考虑虑多多媒媒体体数数据据压缩后的输入和输出表示方式。压缩后的输入和输出表示方式。1.2多媒体通信中的关键技术n视频压缩视频压缩从图像压缩编码的发展过程看,可以分为三个阶段,即第一代、第二代、第三代图像压缩编码方法。第一代图像压缩编码方法以仙农信息论为基础,考虑图像信源的统以仙农信息论为基础,考虑图像信源的统计特性,采用预测编码、变换编码、矢量量化编码、子带编码、小波计特性,采用预测编码、变换编码、矢量量化编码、子带编码、小波变换编码、神经网络编码等方法。变换编码、神经网络编码等方法。第一代图像压缩编码方法于80年代初已趋于成熟
21、,目前利用第一代技术对视频图像的压缩可以得到848Kb/s的最低码率。第二代图像压缩编码方法充分考虑了人眼的视觉特性,从人类的考虑了人眼的视觉特性,从人类的主观特性出发,采用基于方向滤波的图像编码方法和基于图像轮廓主观特性出发,采用基于方向滤波的图像编码方法和基于图像轮廓纹理的编码方法纹理的编码方法,利用第二代图像压缩编码方法可以获得极低码率的图像数据,目前第二代技术尚未发展到成熟的阶段。第三代图像压缩编码方法考虑到了图像传递的景物特征,采用分考虑到了图像传递的景物特征,采用分形编码方法和基于模型的编码方法形编码方法和基于模型的编码方法,其中基于模型的压缩编码方法是目前最活跃的研究领域,代表着
22、新一代的压缩编码方向。有关图像压缩编码的国际标准主要有:JPEG、H.261、H.263、MPEG-1、MPEG-2/H.262、MPEG-4等。MPEG-7和MPEG-21是MPEG系列标准中的新成员,MPEG-7的正式名称为“多媒体内容描述接口”,用于描述多媒体内容数据。MPEG-21即“多媒体框架”,这一概念是在1999年10月的MPEG会议上提出的,它是一种用于协调处于不同地点、与不同类型的网络相联接的各种设备间进行多媒体信息交互的综合性标准。n音频压缩音频压缩基本上与图像压缩编码技术相同,不同之处在于图像信号是二维信号,而音频信号是一维信号。相比较而言,其数据压缩难度较低。涉及的声音
23、压缩编码的国际标准主要有:G.711、G.721、G.722、G.728、G.729、G.723.1等。o2多媒体数据的获取与显示技术多媒体数据的获取与显示技术多媒体数据的获取与显示主要指人机交互的界面,它介于用户和计算机系统之间。用户通过人机界面向系统提供命令、数据等输入信息,系统则将输出信息通过人机界面呈现给用户。字符界面字符界面,输入工具是键盘图形化界面图形化界面,输入工具是鼠标、跟踪球、电子笔、触摸屏、摄像头和视音频采集卡等;输出手段可采用声音、图形图像以及活动视频作为信息的显示形式。文字识别技术文字识别技术 语音识别技术语音识别技术o3多媒体数据库及其检索技术多媒体数据库及其检索技术
24、传统的数据库管理系统管理多媒体数据的方法的局限性,集中表现在以下三个方面。第一,多媒体数据所包含的信息量非常大,用人工注释难以准确描述;第二,多媒体数据随时变化,因而难以统计及预测;第三,多媒体数据内部有各种复杂的时域、空域以及基于内容的约束关系,传统的数据库系统未曾涉及到这些方面。由此开发出新的多媒体数据库系统,同时基于内容的多媒体信息检索研究方案也应运而生。多媒体数据的内容包括概念级内容、感知特性(例如图像的颜色、纹理,声音的音色、音质等)、逻辑关系(例如音视频对象的时空关系等)、信号特征(通过信号处理方法例如小波变换获得的媒体特征)、特定领域的特征(与应用相关,例如人的面部特征、指纹特征
25、)等。o4多媒体通信网络技术多媒体通信网络技术随着视频会议、视频点播、远程教育等多媒体网络应用的开展,能够满足多媒体应用需要的通信网络必须具有高带宽、可提供服务质量的保证、实现媒体同步等特点。目前的多媒体网络应用主要涉及到网络传输、服务质量、服务模式等方面的技术。因为传统的基于分组交换的IP网络只提供尽力而为型的服务,要在IP网上得到QoS的保证需要额外的协议或标准,目前有综合服务模型(IntServ)/RSVP、区分服务模型(DiffServ)、多协议标签交换MPLS等,而IETF新公布的IPv6协议则在一定程度上满足了QoS的服务质量要求。对于电路交换网,则通过已有的ITU-TH.32X和
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体通信技术 多媒体 通信 技术 PPT 课件
限制150内