多媒体图像压缩的技术.ppt
《多媒体图像压缩的技术.ppt》由会员分享,可在线阅读,更多相关《多媒体图像压缩的技术.ppt(21页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多媒体图像压缩技术 摘要:多媒体数据压缩技术是现代网络发展的摘要:多媒体数据压缩技术是现代网络发展的关键性技术之一。由于图像和声音信号中存在关键性技术之一。由于图像和声音信号中存在各种各样的冗余,为数据压缩提供了可能。数各种各样的冗余,为数据压缩提供了可能。数据压缩技术有无损压和有损压缩两大类,这些据压缩技术有无损压和有损压缩两大类,这些压缩技术又各有不同的标准。压缩技术又各有不同的标准。一、多媒体数据压缩技术 仙农仙农(C(CE EShannon)Shannon)在创立信息论时,提出把数据看作是信息和冗余度的在创立信息论时,提出把数据看作是信息和冗余度的组合。早期的数据压缩之所以成为信息论的
2、一部分是因为它涉及冗余度问题。组合。早期的数据压缩之所以成为信息论的一部分是因为它涉及冗余度问题。而数据之所以能够被压缩是因为其中存在各种各样的冗余;其中有时间冗余而数据之所以能够被压缩是因为其中存在各种各样的冗余;其中有时间冗余性、空间冗余性、信息熵冗余、先验知识冗余、其它冗余等。时间冗余是语性、空间冗余性、信息熵冗余、先验知识冗余、其它冗余等。时间冗余是语音和序列图像中常见的冗余,运动图像中前后两帧间就存在很强的相关性,音和序列图像中常见的冗余,运动图像中前后两帧间就存在很强的相关性,利用帧间运动补兴就可以将图像数据的速率大大压缩。语音也是这样。尤其利用帧间运动补兴就可以将图像数据的速率大
3、大压缩。语音也是这样。尤其是浊音段,在相当长的时间内是浊音段,在相当长的时间内(几到几十毫秒几到几十毫秒)语音信号都表现出很强的周期语音信号都表现出很强的周期性,可以利用线性预测的方法得到较高的压缩比。空间冗余是用来表示图像性,可以利用线性预测的方法得到较高的压缩比。空间冗余是用来表示图像数据中存在的某种空间上的规则性,如大面积的均匀背景中就有很大的空间数据中存在的某种空间上的规则性,如大面积的均匀背景中就有很大的空间冗余性。信息熵冗余是指在信源的符号表示过程中由于未遵循信息论意义下冗余性。信息熵冗余是指在信源的符号表示过程中由于未遵循信息论意义下最优编码而造成的冗余性,这种冗余性可以通过熵编
4、码来进行压缩,经常使最优编码而造成的冗余性,这种冗余性可以通过熵编码来进行压缩,经常使用的如用的如Huff-manHuff-man编码。先验知识冗余是指数据的理解与先验知识有相当大的编码。先验知识冗余是指数据的理解与先验知识有相当大的关系,如当收信方知道一个单词的前几个字母为关系,如当收信方知道一个单词的前几个字母为administratoadministrato时,立刻就可以时,立刻就可以猜到最后一个字母为猜到最后一个字母为r r,那么在这种情况下,最后一个字母就不带任何信息量,那么在这种情况下,最后一个字母就不带任何信息量了,这就是一种先验知识冗余。其它冗余是指那些主观无法感受到的信息等了
5、,这就是一种先验知识冗余。其它冗余是指那些主观无法感受到的信息等带来的冗余。带来的冗余。通常数据压缩技术可分为无损压缩通常数据压缩技术可分为无损压缩(又叫冗余压缩又叫冗余压缩)和有损和有损压缩压缩(又叫熵压缩又叫熵压缩)两大类。无损压缩就是把数据中的冗余两大类。无损压缩就是把数据中的冗余去掉或减少,但这些冗余量是可以重新插入到数据中的,去掉或减少,但这些冗余量是可以重新插入到数据中的,因而不会产生失真。该方法一般用于文本数据的压缩,它因而不会产生失真。该方法一般用于文本数据的压缩,它可以保证完全地恢复原始数据;其缺点是压缩比小可以保证完全地恢复原始数据;其缺点是压缩比小(其压其压缩比一般为缩比
6、一般为2 2:1 1至至5 5:1)1)。有损压缩是对熵进行压缩,因。有损压缩是对熵进行压缩,因而存在一定程度的失真;它主要用于对声音、图像、动态而存在一定程度的失真;它主要用于对声音、图像、动态视频等数据进行压缩,压缩比较高视频等数据进行压缩,压缩比较高(其压缩比一般高达其压缩比一般高达2020:1 1以上。最新被称为以上。最新被称为“EigenID”“EigenID”的压缩技术可将基因的压缩技术可将基因数据压缩数据压缩1 15 5亿倍亿倍)。对于多媒体图像采用的有损压缩的。对于多媒体图像采用的有损压缩的标准有静态图像压缩标准标准有静态图像压缩标准(JPEG(JPEG标准,即标准,即Join
7、tPhotographicExpertGroupJointPhotographicExpertGroup标准标准)和动态图像压缩标准和动态图像压缩标准(MPEG(MPEG标准,即标准,即MovingPictureExpertGroupMovingPictureExpertGroup标准标准)。PEGPEG利用了人眼的心理和生理特征及其局限性来利用了人眼的心理和生理特征及其局限性来对彩色的、单色的和多灰度连续色调的、静态图对彩色的、单色的和多灰度连续色调的、静态图像的、数字图像的压缩,因此它非常适合不太复像的、数字图像的压缩,因此它非常适合不太复杂的以及一般来源于真实景物的图像。它定义了杂的以及
8、一般来源于真实景物的图像。它定义了两种基本的压缩算法:一种是基于有失真的压缩两种基本的压缩算法:一种是基于有失真的压缩算法,另一种是基于空间线性预测技术算法,另一种是基于空间线性预测技术(DPCM)(DPCM)无无失真的压缩算法。为了满足各种需要,它制定了失真的压缩算法。为了满足各种需要,它制定了四种工作模式:无失真压缩、基于四种工作模式:无失真压缩、基于DCTDCT的顺序工的顺序工作方式、累进工作方式和分层工作方式。作方式、累进工作方式和分层工作方式。MPEGMPEG用于活动影像的压缩。用于活动影像的压缩。MPEGMPEG标准具体包三部分内容:标准具体包三部分内容:(1)MPEG(1)MPE
9、G视频、视频、(2)MPEG(2)MPEG音频、音频、(3)MP(3)MP系统系统(视频和音频的同步视频和音频的同步)。MPEGMPEG视频是视频是标准的核心分,它采用了帧内和帧间相结合的压缩方法,以离散余变标准的核心分,它采用了帧内和帧间相结合的压缩方法,以离散余变换换(DCT)(DCT)和运动补偿两项技术为基础,在图像质量基不变的情况下,和运动补偿两项技术为基础,在图像质量基不变的情况下,MPEGMPEG可把图像压缩至可把图像压缩至1 1100100或更或更MPEGMPEG音频压缩算法则是根据人耳屏音频压缩算法则是根据人耳屏蔽滤波功能。利用音响心理学的基本原理,即蔽滤波功能。利用音响心理学
10、的基本原理,即“某些频率的音响在重某些频率的音响在重放其频率的音频时听不到放其频率的音频时听不到”这样一个特性,将那些人耳完全不到或基这样一个特性,将那些人耳完全不到或基本上听到的多余音频信号压缩掉,最后使音频号的压缩比达到本上听到的多余音频信号压缩掉,最后使音频号的压缩比达到8 8:1 1或或更高,音质逼真,与更高,音质逼真,与CDCD唱片可媲美。按照唱片可媲美。按照MPEGMPEG标准,标准,MPEGMPEG数据流数据流包含系统层和压层数据。系统层含有定时信号,图像和声音的同步、包含系统层和压层数据。系统层含有定时信号,图像和声音的同步、多分配等信息。压缩层包含经压缩后的实际的图像和声数据
11、,该数据多分配等信息。压缩层包含经压缩后的实际的图像和声数据,该数据流将视频、音频信号复合及同步后,其数据输率为流将视频、音频信号复合及同步后,其数据输率为1 15MB5MBs s。其中。其中压缩图像数据传输率为压缩图像数据传输率为1 12M2M压缩声音传输率为压缩声音传输率为0 02MB2MBs s。MPEGMPEG标准的发展经历了标准的发展经历了MPEGI,MPEGMPEGI,MPEG一一2 2、MPEGMPEG一一4 4、MPEG-7MPEG-7、MPEGMPEG一一2121等不同层次。在等不同层次。在MPEGMPEG的不同标准中,的不同标准中,每每个标准都是建立在前面的标准之上的,并与
12、前面的标个标准都是建立在前面的标准之上的,并与前面的标准向后的兼容。目前在图像压缩中,应用得较多的是准向后的兼容。目前在图像压缩中,应用得较多的是MPEGMPEG一一4 4标准,标准,MPEG-MPEG-是在是在MPEG-2MPEG-2基础上作了很大的扩基础上作了很大的扩充,主要目标是多媒体应用。在充,主要目标是多媒体应用。在MPEGMPEG一一2 2标准中,我们的标准中,我们的观念是单幅图像,而且包含了一幅图像的全部元素。在观念是单幅图像,而且包含了一幅图像的全部元素。在MPEGMPEG一一4 4标准下,我们的观念变为多图像元素,其中的每标准下,我们的观念变为多图像元素,其中的每个多图像元素
13、都是独立编码处理的。该标准包含了为接个多图像元素都是独立编码处理的。该标准包含了为接收器所用的指令,告诉接收器如何构成最终的图像。收器所用的指令,告诉接收器如何构成最终的图像。每个解码缓冲器只接收属于它自己的灵敏据流,并转送给解码器。复合存储每个解码缓冲器只接收属于它自己的灵敏据流,并转送给解码器。复合存储器完成图像元素的存储,并将它们送到显示器的恰当位置。音频的情况也是器完成图像元素的存储,并将它们送到显示器的恰当位置。音频的情况也是这样,但显然不同点是要求同时提供所有的元素。数据上的时间标记保证这这样,但显然不同点是要求同时提供所有的元素。数据上的时间标记保证这些元素在时间上能正确同步。些
14、元素在时间上能正确同步。MPEGMPEG一一4 4标准对自然元素标准对自然元素(实物图像实物图像)和合成元和合成元素进行区分和规定,计算机生成的动画是合成元素的一个例子。比如,一幅素进行区分和规定,计算机生成的动画是合成元素的一个例子。比如,一幅完整的图像可以包含一幅实际的背景图,并在前面有一幅动画或者有另外一完整的图像可以包含一幅实际的背景图,并在前面有一幅动画或者有另外一幅自然图像。这样的每一幅图像都可以作最佳压缩,并互相独立地传送到接幅自然图像。这样的每一幅图像都可以作最佳压缩,并互相独立地传送到接收器,接收器知道如何把这些元素组合在一起。在收器,接收器知道如何把这些元素组合在一起。在M
15、PEGMPEG一一2 2标准中,图像被标准中,图像被看作一个整体来压缩;而在看作一个整体来压缩;而在MPEGMPEG一一4 4标准下,对图像中的每一个元素进行优标准下,对图像中的每一个元素进行优化压缩。静止的背景不必压缩到以后的化压缩。静止的背景不必压缩到以后的I I帧之中去,否则会使带宽的使用变得帧之中去,否则会使带宽的使用变得很紧张。而如果这个背景图像静止很紧张。而如果这个背景图像静止1010秒钟,就只要传送一次秒钟,就只要传送一次(假设我们不必担假设我们不必担心有人在该时间内切人此频道心有人在该时间内切人此频道),需要不断传送的仅是前台的比较小的图像元,需要不断传送的仅是前台的比较小的图
16、像元素。对有些节目类型,这样做会节省大量的带宽。素。对有些节目类型,这样做会节省大量的带宽。MPEGMPEG一一4 4标准对音频的处标准对音频的处理也是相同的。例如,有一位独唱演员,伴随有电子合成器,在理也是相同的。例如,有一位独唱演员,伴随有电子合成器,在MPEGMPEG一一2 2标标准下,我们必须先把独唱和合成器作混合,然后再对合成的音频信号进行压准下,我们必须先把独唱和合成器作混合,然后再对合成的音频信号进行压缩与传送。在缩与传送。在MPEGMPEG一一4 4标准下,我们可以对独唱作单独压缩,然后再传送乐标准下,我们可以对独唱作单独压缩,然后再传送乐器数字接口的声轨信号,就可以使接收器重
17、建伴音。器数字接口的声轨信号,就可以使接收器重建伴音。当然,接收器必须能支持MIDI放音。与传送合成的信号相比,分别传送独唱信号和MIDI数据要节省大量的带宽。其它的节目类型同样可以作类似的规定。MPEG一7标准又叫多媒体内容描述接口标准。图像可以用色彩、纹理、形状、运动等参数来描述,MPEG一7标准是依靠众多的参数对图像与声音实现分类,并对它们的数据库实现查询。二、多媒体数据压缩技术的实现方法 目前多媒体压缩技术的实现方法已有近百种,其中基于信源理论编码目前多媒体压缩技术的实现方法已有近百种,其中基于信源理论编码的压缩方法、离散余弦变换的压缩方法、离散余弦变换(DCT)(DCT)和小波分解技
18、术压缩算法的研究更和小波分解技术压缩算法的研究更具有代表性。小波技术突破了传统压缩方法的局限性,引入了局部和具有代表性。小波技术突破了传统压缩方法的局限性,引入了局部和全局相关去冗余的新思想,具有较大的潜力,因此近几年来吸引了众全局相关去冗余的新思想,具有较大的潜力,因此近几年来吸引了众多的研究者。在小波压缩技术中,一幅图像可以被分解为若干个叫做多的研究者。在小波压缩技术中,一幅图像可以被分解为若干个叫做“小片小片”的区域;在每个小片中,图像经滤波后被分解成若干个低频与的区域;在每个小片中,图像经滤波后被分解成若干个低频与高频分量。低频分量可以用不同的分辨率进行量化,即图像的低频部高频分量。低
19、频分量可以用不同的分辨率进行量化,即图像的低频部分需要许多的二进制位,以改善图像重构时的信噪比。低频元素采用分需要许多的二进制位,以改善图像重构时的信噪比。低频元素采用精细量化,高频分量可以量化得比较粗糙,因为你不太容易看到变化精细量化,高频分量可以量化得比较粗糙,因为你不太容易看到变化区域的噪声与误差。此外,碎片技术已经作为一种压缩方法被提出,区域的噪声与误差。此外,碎片技术已经作为一种压缩方法被提出,这种技术依靠实际图形的重复特性。用碎片技术压缩图像时需要占用这种技术依靠实际图形的重复特性。用碎片技术压缩图像时需要占用大量的计算机资源,但可以获得很好的结果。借助于从大量的计算机资源,但可以
20、获得很好的结果。借助于从DNADNA序列研究序列研究中发展出来的模式识别技术,能减少通过中发展出来的模式识别技术,能减少通过WANWAN链路的流量,最多时的链路的流量,最多时的压缩比率能达到压缩比率能达到9090,从而为网络传送图像和声音提供更大的压缩比,从而为网络传送图像和声音提供更大的压缩比,减轻风络负荷,更好地实现网络信息传播。减轻风络负荷,更好地实现网络信息传播。三、压缩原理 由于图像数据之间存在着一定的冗余,所以使得数据的压由于图像数据之间存在着一定的冗余,所以使得数据的压缩成为可能。信息论的创始人缩成为可能。信息论的创始人ShannonShannon提出把数据看作是提出把数据看作是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体 图像 压缩 技术
限制150内