多媒体图像压缩技术优秀课件.ppt
《多媒体图像压缩技术优秀课件.ppt》由会员分享,可在线阅读,更多相关《多媒体图像压缩技术优秀课件.ppt(21页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多媒体图像压缩技术第1页,本讲稿共21页一、多媒体数据压缩技术 仙农仙农(C(CE EShannon)Shannon)在创立信息论时,提出把数据看作是信息和冗余度的组合。在创立信息论时,提出把数据看作是信息和冗余度的组合。早期的数据压缩之所以成为信息论的一部分是因为它涉及冗余度问题。而数据之早期的数据压缩之所以成为信息论的一部分是因为它涉及冗余度问题。而数据之所以能够被压缩是因为其中存在各种各样的冗余;其中有时间冗余性、空间冗余所以能够被压缩是因为其中存在各种各样的冗余;其中有时间冗余性、空间冗余性、信息熵冗余、先验知识冗余、其它冗余等。时间冗余是语音和序列图像中常性、信息熵冗余、先验知识冗余
2、、其它冗余等。时间冗余是语音和序列图像中常见的冗余,运动图像中前后两帧间就存在很强的相关性,利用帧间运动补兴就可见的冗余,运动图像中前后两帧间就存在很强的相关性,利用帧间运动补兴就可以将图像数据的速率大大压缩。语音也是这样。尤其是浊音段,在相当长的时间以将图像数据的速率大大压缩。语音也是这样。尤其是浊音段,在相当长的时间内内(几到几十毫秒几到几十毫秒)语音信号都表现出很强的周期性,可以利用线性预测的方法得语音信号都表现出很强的周期性,可以利用线性预测的方法得到较高的压缩比。空间冗余是用来表示图像数据中存在的某种空间上的规则性,到较高的压缩比。空间冗余是用来表示图像数据中存在的某种空间上的规则性
3、,如大面积的均匀背景中就有很大的空间冗余性。信息熵冗余是指在信源的符号表如大面积的均匀背景中就有很大的空间冗余性。信息熵冗余是指在信源的符号表示过程中由于未遵循信息论意义下最优编码而造成的冗余性,这种冗余性可以通示过程中由于未遵循信息论意义下最优编码而造成的冗余性,这种冗余性可以通过熵编码来进行压缩,经常使用的如过熵编码来进行压缩,经常使用的如Huff-manHuff-man编码。先验知识冗余是指数据的理编码。先验知识冗余是指数据的理解与先验知识有相当大的关系,如当收信方知道一个单词的前几个字母为解与先验知识有相当大的关系,如当收信方知道一个单词的前几个字母为administratoadmin
4、istrato时,立刻就可以猜到最后一个字母为时,立刻就可以猜到最后一个字母为r r,那么在这种情况下,最后一,那么在这种情况下,最后一个字母就不带任何信息量了,这就是一种先验知识冗余。其它冗余是指那些主观个字母就不带任何信息量了,这就是一种先验知识冗余。其它冗余是指那些主观无法感受到的信息等带来的冗余。无法感受到的信息等带来的冗余。第2页,本讲稿共21页 通常数据压缩技术可分为无损压缩通常数据压缩技术可分为无损压缩(又叫冗余压缩又叫冗余压缩)和有损压缩和有损压缩(又叫又叫熵压缩熵压缩)两大类。无损压缩就是把数据中的冗余去掉或减少,但这些两大类。无损压缩就是把数据中的冗余去掉或减少,但这些冗余
5、量是可以重新插入到数据中的,因而不会产生失真。该方法一般冗余量是可以重新插入到数据中的,因而不会产生失真。该方法一般用于文本数据的压缩,它可以保证完全地恢复原始数据;其缺点是压用于文本数据的压缩,它可以保证完全地恢复原始数据;其缺点是压缩比小缩比小(其压缩比一般为其压缩比一般为2 2:1 1至至5 5:1)1)。有损压缩是对熵进行压缩,因。有损压缩是对熵进行压缩,因而存在一定程度的失真;它主要用于对声音、图像、动态视频等数据而存在一定程度的失真;它主要用于对声音、图像、动态视频等数据进行压缩,压缩比较高进行压缩,压缩比较高(其压缩比一般高达其压缩比一般高达2020:1 1以上。最新被称为以上。
6、最新被称为“E EigenigenIDID”的压缩技术可将基因数据压缩的压缩技术可将基因数据压缩1 15 5亿倍亿倍)。对于。对于多媒体图像采用的有损压缩的标准有静态图像压缩标准多媒体图像采用的有损压缩的标准有静态图像压缩标准(JPEG(JPEG标标准,即准,即 JointPhotographicExpertGroupJointPhotographicExpertGroup 标准标准)和动态图像压和动态图像压缩标准缩标准(MPEG(MPEG标准,即标准,即 MovingPictureExpertGroupMovingPictureExpertGroup 标准标准)。第3页,本讲稿共21页PEG
7、PEG利用了人眼的心理和生理特征及其局限性来对利用了人眼的心理和生理特征及其局限性来对彩色的、单色的和多灰度连续色调的、静态图像的、彩色的、单色的和多灰度连续色调的、静态图像的、数字图像的压缩,因此它非常适合不太复杂的以及数字图像的压缩,因此它非常适合不太复杂的以及一般来源于真实景物的图像。它定义了两种基本的一般来源于真实景物的图像。它定义了两种基本的压缩算法:一种是基于有失真的压缩算法,另一种压缩算法:一种是基于有失真的压缩算法,另一种是基于空间线性预测技术是基于空间线性预测技术(DPCM)(DPCM)无失真的压缩算法。无失真的压缩算法。为了满足各种需要,它制定了四种工作模式:无失为了满足各
8、种需要,它制定了四种工作模式:无失真压缩、基于真压缩、基于DCTDCT的顺序工作方式、累进工作方式的顺序工作方式、累进工作方式和分层工作方式。和分层工作方式。第4页,本讲稿共21页 MPEGMPEG用于活动影像的压缩。用于活动影像的压缩。MPEGMPEG标准具体包三部分内容:标准具体包三部分内容:(1)MPEG(1)MPEG视频、视频、(2)MPEG(2)MPEG音频、音频、(3)MP(3)MP系统系统(视频和音频的同步视频和音频的同步)。MPEGMPEG视频是标准的核心视频是标准的核心分,它采用了帧内和帧间相结合的压缩方法,以离散余变换分,它采用了帧内和帧间相结合的压缩方法,以离散余变换(D
9、CT)(DCT)和运动和运动补偿两项技术为基础,在图像质量基不变的情况下,补偿两项技术为基础,在图像质量基不变的情况下,MPEGMPEG可把图像压缩可把图像压缩至至1 1100100或更或更MPEGMPEG音频压缩算法则是根据人耳屏蔽滤波功能。利用音响音频压缩算法则是根据人耳屏蔽滤波功能。利用音响心理学的基本原理,即心理学的基本原理,即“某些频率的音响在重放其频率的音频时听不到某些频率的音响在重放其频率的音频时听不到”这样这样一个特性,将那些人耳完全不到或基本上听到的多余音频信号压缩掉,最后使音一个特性,将那些人耳完全不到或基本上听到的多余音频信号压缩掉,最后使音频号的压缩比达到频号的压缩比达
10、到8 8:1 1或更高,音质逼真,与或更高,音质逼真,与CDCD唱片可媲美。按照唱片可媲美。按照MPEGMPEG标准,标准,MPEGMPEG数据流包含系统层和压层数据。系统层含有定时信号,图像和声音的同步、数据流包含系统层和压层数据。系统层含有定时信号,图像和声音的同步、多分配等信息。压缩层包含经压缩后的实际的图像和声数据,该数据流将视频、多分配等信息。压缩层包含经压缩后的实际的图像和声数据,该数据流将视频、音频信号复合及同步后,其数据输率为音频信号复合及同步后,其数据输率为1 15MB5MBs s。其中压缩图像数据传输率为。其中压缩图像数据传输率为1 12M2M压缩声音传输率为压缩声音传输率
11、为0 02MB2MBs s。第5页,本讲稿共21页 MPEGMPEG标准的发展经历了标准的发展经历了MPEGMPEGI,MPEGI,MPEG一一2 2、MPEGMPEG一一4 4、MPEG-7MPEG-7、MPEGMPEG一一2121等不同层次。在等不同层次。在MPEGMPEG的不同标准中,每的不同标准中,每个标准都个标准都是建立在前面的标准之上的,并与前面的标准向后的兼容。目是建立在前面的标准之上的,并与前面的标准向后的兼容。目前在图像压缩中,应用得较多的是前在图像压缩中,应用得较多的是MPEGMPEG一一4 4标准,标准,MPEG-MPEG-是在是在MPEG-2MPEG-2基础上作了很大的
12、扩充,主要目标是多媒体应用。在基础上作了很大的扩充,主要目标是多媒体应用。在MPEGMPEG一一2 2标准中,我们的观念是单幅图像,而且包含了一幅图标准中,我们的观念是单幅图像,而且包含了一幅图像的全部元素。在像的全部元素。在MPEGMPEG一一4 4标准下,我们的观念变为多图像元标准下,我们的观念变为多图像元素,其中的每素,其中的每个多图像元素都是独立编码处理的。该标准包含了个多图像元素都是独立编码处理的。该标准包含了为接收器所用的指令,告诉接收器如何构成最终的图像。为接收器所用的指令,告诉接收器如何构成最终的图像。第6页,本讲稿共21页 每个解码缓冲器只接收属于它自己的灵敏据流,并转送给解
13、码器。复合存储器完每个解码缓冲器只接收属于它自己的灵敏据流,并转送给解码器。复合存储器完成图像元素的存储,并将它们送到显示器的恰当位置。音频的情况也是这样,但成图像元素的存储,并将它们送到显示器的恰当位置。音频的情况也是这样,但显然不同点是要求同时提供所有的元素。数据上的时间标记保证这些元素在时间显然不同点是要求同时提供所有的元素。数据上的时间标记保证这些元素在时间上能正确同步。上能正确同步。MPEGMPEG一一4 4标准对自然元素标准对自然元素(实物图像实物图像)和合成元素进行区分和规定,和合成元素进行区分和规定,计算机生成的动画是合成元素的一个例子。比如,一幅完整的图像可以包含一幅计算机生
14、成的动画是合成元素的一个例子。比如,一幅完整的图像可以包含一幅实际的背景图,并在前面有一幅动画或者有另外一幅自然图像。这样的每一幅图实际的背景图,并在前面有一幅动画或者有另外一幅自然图像。这样的每一幅图像都可以作最佳压缩,并互相独立地传送到接收器,接收器知道如何把这些元素像都可以作最佳压缩,并互相独立地传送到接收器,接收器知道如何把这些元素组合在一起。在组合在一起。在MPEGMPEG一一2 2标准中,图像被看作一个整体来压缩;而在标准中,图像被看作一个整体来压缩;而在MPEGMPEG一一4 4标标准下,对图像中的每一个元素进行优化压缩。静止的背景不必压缩到以后的准下,对图像中的每一个元素进行优
15、化压缩。静止的背景不必压缩到以后的I I帧之帧之中去,否则会使带宽的使用变得很紧张。而如果这个背景图像静止中去,否则会使带宽的使用变得很紧张。而如果这个背景图像静止1010秒钟,就只秒钟,就只要传送一次要传送一次(假设我们不必担心有人在该时间内切人此频道假设我们不必担心有人在该时间内切人此频道),需要不断传送的仅,需要不断传送的仅是前台的比较小的图像元素。对有些节目类型,这样做会节省大量的带宽。是前台的比较小的图像元素。对有些节目类型,这样做会节省大量的带宽。MPEGMPEG一一4 4标准对音频的处理也是相同的。例如,有一位独唱演员,伴随有电子合成器,标准对音频的处理也是相同的。例如,有一位独
16、唱演员,伴随有电子合成器,在在MPEGMPEG一一2 2标准下,我们必须先把独唱和合成器作混合,然后再对合成的音频信标准下,我们必须先把独唱和合成器作混合,然后再对合成的音频信号进行压缩与传送。在号进行压缩与传送。在MPEGMPEG一一4 4标准下,我们可以对独唱作单独压缩,然后再传标准下,我们可以对独唱作单独压缩,然后再传送乐器数字接口的声轨信号,就可以使接收器重建伴音。送乐器数字接口的声轨信号,就可以使接收器重建伴音。第7页,本讲稿共21页当然,接收器必须能支持MIDI放音。与传送合成的信号相比,分别传送独唱信号和MIDI数据要节省大量的带宽。其它的节目类型同样可以作类似的规定。MPEG一
17、7标准又叫多媒体内容描述接口标准。图像可以用色彩、纹理、形状、运动等参数来描述,MPEG一7标准是依靠众多的参数对图像与声音实现分类,并对它们的数据库实现查询。第8页,本讲稿共21页二、多媒体数据压缩技术的实现方法 目前多媒体压缩技术的实现方法已有近百种,其中基于信源理论编码的压缩目前多媒体压缩技术的实现方法已有近百种,其中基于信源理论编码的压缩方法、离散余弦变换方法、离散余弦变换(DCT)(DCT)和小波分解技术压缩算法的研究更具有代表性。小和小波分解技术压缩算法的研究更具有代表性。小波技术突破了传统压缩方法的局限性,引入了局部和全局相关去冗余的新思波技术突破了传统压缩方法的局限性,引入了局
18、部和全局相关去冗余的新思想,具有较大的潜力,因此近几年来吸引了众多的研究者。在小波压缩技术想,具有较大的潜力,因此近几年来吸引了众多的研究者。在小波压缩技术中,一幅图像可以被分解为若干个叫做中,一幅图像可以被分解为若干个叫做“小片小片”的区域;在每个小片中,图的区域;在每个小片中,图像经滤波后被分解成若干个低频与高频分量。低频分量可以用不同的分辨率像经滤波后被分解成若干个低频与高频分量。低频分量可以用不同的分辨率进行量化,即图像的低频部分需要许多的二进制位,以改善图像重构时的信进行量化,即图像的低频部分需要许多的二进制位,以改善图像重构时的信噪比。低频元素采用精细量化,高频分量可以量化得比较粗
19、糙,因为你不太噪比。低频元素采用精细量化,高频分量可以量化得比较粗糙,因为你不太容易看到变化区域的噪声与误差。此外,碎片技术已经作为一种压缩方法被容易看到变化区域的噪声与误差。此外,碎片技术已经作为一种压缩方法被提出,这种技术依靠实际图形的重复特性。用碎片技术压缩图像时需要占用提出,这种技术依靠实际图形的重复特性。用碎片技术压缩图像时需要占用大量的计算机资源,但可以获得很好的结果。借助于从大量的计算机资源,但可以获得很好的结果。借助于从DNADNA序列研究中发展序列研究中发展出来的模式识别技术,能减少通过出来的模式识别技术,能减少通过WANWAN链路的流量,最多时的压缩比率能达链路的流量,最多
20、时的压缩比率能达到到9090,从而为网络传送图像和声音提供更大的压缩比,减轻风络负荷,更,从而为网络传送图像和声音提供更大的压缩比,减轻风络负荷,更好地实现网络信息传播。好地实现网络信息传播。第9页,本讲稿共21页三、压缩原理 由于图像数据之间存在着一定的冗余,所以使得数据的压缩成为可能。由于图像数据之间存在着一定的冗余,所以使得数据的压缩成为可能。信息论的创始人信息论的创始人ShannonShannon提出把数据看作是信息和冗余度提出把数据看作是信息和冗余度(redundancyredundancy)的组合。所谓冗余度,是由于一副图像的各像素之间)的组合。所谓冗余度,是由于一副图像的各像素之
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体 图像 压缩 技术 优秀 课件
限制150内