多媒体图像压缩技术PPT讲稿.ppt
《多媒体图像压缩技术PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《多媒体图像压缩技术PPT讲稿.ppt(21页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多媒体图像压缩技术第1页,共21页,编辑于2022年,星期六一、多媒体数据压缩技术 仙农仙农(C(CE EShannon)Shannon)在创立信息论时,提出把数据看作是信息和冗余度的组合。早在创立信息论时,提出把数据看作是信息和冗余度的组合。早期的数据压缩之所以成为信息论的一部分是因为它涉及冗余度问题。而数据之所以能期的数据压缩之所以成为信息论的一部分是因为它涉及冗余度问题。而数据之所以能够被压缩是因为其中存在各种各样的冗余;其中有时间冗余性、空间冗余性、信息熵够被压缩是因为其中存在各种各样的冗余;其中有时间冗余性、空间冗余性、信息熵冗余、先验知识冗余、其它冗余等。时间冗余是语音和序列图像中
2、常见的冗余,运动冗余、先验知识冗余、其它冗余等。时间冗余是语音和序列图像中常见的冗余,运动图像中前后两帧间就存在很强的相关性,利用帧间运动补兴就可以将图像数据的速率图像中前后两帧间就存在很强的相关性,利用帧间运动补兴就可以将图像数据的速率大大压缩。语音也是这样。尤其是浊音段,在相当长的时间内大大压缩。语音也是这样。尤其是浊音段,在相当长的时间内(几到几十毫秒几到几十毫秒)语音信语音信号都表现出很强的周期性,可以利用线性预测的方法得到较高的压缩比。空间冗余是号都表现出很强的周期性,可以利用线性预测的方法得到较高的压缩比。空间冗余是用来表示图像数据中存在的某种空间上的规则性,如大面积的均匀背景中就
3、有很大的用来表示图像数据中存在的某种空间上的规则性,如大面积的均匀背景中就有很大的空间冗余性。信息熵冗余是指在信源的符号表示过程中由于未遵循信息论意义下最优空间冗余性。信息熵冗余是指在信源的符号表示过程中由于未遵循信息论意义下最优编码而造成的冗余性,这种冗余性可以通过熵编码来进行压缩,经常使用的如编码而造成的冗余性,这种冗余性可以通过熵编码来进行压缩,经常使用的如Huff-Huff-manman编码。先验知识冗余是指数据的理解与先验知识有相当大的关系,如当收信方知编码。先验知识冗余是指数据的理解与先验知识有相当大的关系,如当收信方知道一个单词的前几个字母为道一个单词的前几个字母为adminis
4、tratoadministrato时,立刻就可以猜到最后一个字母为时,立刻就可以猜到最后一个字母为r r,那么,那么在这种情况下,最后一个字母就不带任何信息量了,这就是一种先验知识冗余。其它在这种情况下,最后一个字母就不带任何信息量了,这就是一种先验知识冗余。其它冗余是指那些主观无法感受到的信息等带来的冗余。冗余是指那些主观无法感受到的信息等带来的冗余。第2页,共21页,编辑于2022年,星期六通常数据压缩技术可分为无损压缩通常数据压缩技术可分为无损压缩(又叫冗余压缩又叫冗余压缩)和有损压缩和有损压缩(又叫熵压缩又叫熵压缩)两大类。无损压缩就是把数据中的冗余去掉或减两大类。无损压缩就是把数据中
5、的冗余去掉或减少,但这些冗余量是可以重新插入到数据中的,因而不会产生少,但这些冗余量是可以重新插入到数据中的,因而不会产生失真。该方法一般用于文本数据的压缩,它可以保证完全地恢失真。该方法一般用于文本数据的压缩,它可以保证完全地恢复原始数据;其缺点是压缩比小复原始数据;其缺点是压缩比小(其压缩比一般为其压缩比一般为2 2:1 1至至5 5:1)1)。有损压缩是对熵进行压缩,因而存在一定程度的失真;它主要有损压缩是对熵进行压缩,因而存在一定程度的失真;它主要用于对声音、图像、动态视频等数据进行压缩,压缩比较高用于对声音、图像、动态视频等数据进行压缩,压缩比较高(其压缩比一般高达其压缩比一般高达2
6、020:1 1以上。最新被称为以上。最新被称为“E EigenigenIDID”的的压缩技术可将基因数据压缩压缩技术可将基因数据压缩1 15 5亿倍亿倍)。对于多媒体图像采用的有损。对于多媒体图像采用的有损压缩的标准有静态图像压缩标准压缩的标准有静态图像压缩标准(JPEG(JPEG标准,即标准,即 JointPhotographicExpertGroupJointPhotographicExpertGroup 标准标准)和动态图像压缩标准和动态图像压缩标准(MPEG(MPEG标准,即标准,即 MovingPictureExpertGroupMovingPictureExpertGroup 标准
7、标准)。第3页,共21页,编辑于2022年,星期六PEGPEG利用了人眼的心理和生理特征及其局限性来对彩色利用了人眼的心理和生理特征及其局限性来对彩色的、单色的和多灰度连续色调的、静态图像的、数字图的、单色的和多灰度连续色调的、静态图像的、数字图像的压缩,因此它非常适合不太复杂的以及一般来源于像的压缩,因此它非常适合不太复杂的以及一般来源于真实景物的图像。它定义了两种基本的压缩算法:一种真实景物的图像。它定义了两种基本的压缩算法:一种是基于有失真的压缩算法,另一种是基于空间线性预测是基于有失真的压缩算法,另一种是基于空间线性预测技术技术(DPCM)(DPCM)无失真的压缩算法。为了满足各种需要
8、,它无失真的压缩算法。为了满足各种需要,它制定了四种工作模式:无失真压缩、基于制定了四种工作模式:无失真压缩、基于DCTDCT的顺序工的顺序工作方式、累进工作方式和分层工作方式。作方式、累进工作方式和分层工作方式。第4页,共21页,编辑于2022年,星期六 MPEGMPEG用于活动影像的压缩。用于活动影像的压缩。MPEGMPEG标准具体包三部分内容:标准具体包三部分内容:(1)MPEG(1)MPEG视频、视频、(2)MPEG(2)MPEG音频、音频、(3)MP(3)MP系统系统(视频和音频的同步视频和音频的同步)。MPEGMPEG视频是标准的核心分,视频是标准的核心分,它采用了帧内和帧间相结合
9、的压缩方法,以离散余变换它采用了帧内和帧间相结合的压缩方法,以离散余变换(DCT)(DCT)和运动补偿两项和运动补偿两项技术为基础,在图像质量基不变的情况下,技术为基础,在图像质量基不变的情况下,MPEGMPEG可把图像压缩至可把图像压缩至1 1100100或或更更MPEGMPEG音频压缩算法则是根据人耳屏蔽滤波功能。利用音响心理学的基本音频压缩算法则是根据人耳屏蔽滤波功能。利用音响心理学的基本原理,即原理,即“某些频率的音响在重放其频率的音频时听不到某些频率的音响在重放其频率的音频时听不到”这样一个特性,这样一个特性,将那些人耳完全不到或基本上听到的多余音频信号压缩掉,最后使音频将那些人耳完
10、全不到或基本上听到的多余音频信号压缩掉,最后使音频号的压缩比达到号的压缩比达到8 8:1 1或更高,音质逼真,与或更高,音质逼真,与CDCD唱片可媲美。按照唱片可媲美。按照MPEGMPEG标准,标准,MPEGMPEG数据流包含系统层和压层数据。系统层含有定时信号,图像数据流包含系统层和压层数据。系统层含有定时信号,图像和声音的同步、多分配等信息。压缩层包含经压缩后的实际的图像和声和声音的同步、多分配等信息。压缩层包含经压缩后的实际的图像和声数据,该数据流将视频、音频信号复合及同步后,其数据输率为数据,该数据流将视频、音频信号复合及同步后,其数据输率为1 15MB5MBs s。其中压缩图像数据传
11、输率为。其中压缩图像数据传输率为1 12M2M压缩声音传输率为压缩声音传输率为0 02MB2MBs s。第5页,共21页,编辑于2022年,星期六MPEGMPEG标准的发展经历了标准的发展经历了MPEGMPEGI,MPEGI,MPEG一一2 2、MPEGMPEG一一4 4、MPEG-7MPEG-7、MPEGMPEG一一2121等不同层次。在等不同层次。在MPEGMPEG的不同标准中,每的不同标准中,每个标准都是建个标准都是建立在前面的标准之上的,并与前面的标准向后的兼容。目前在图像压立在前面的标准之上的,并与前面的标准向后的兼容。目前在图像压缩中,应用得较多的是缩中,应用得较多的是MPEGMP
12、EG一一4 4标准,标准,MPEG-MPEG-是在是在MPEG-2MPEG-2基础上作基础上作了很大的扩充,主要目标是多媒体应用。在了很大的扩充,主要目标是多媒体应用。在MPEGMPEG一一2 2标准中,我们标准中,我们的观念是单幅图像,而且包含了一幅图像的全部元素。在的观念是单幅图像,而且包含了一幅图像的全部元素。在MPEGMPEG一一4 4标准下,我们的观念变为多图像元素,其中的每标准下,我们的观念变为多图像元素,其中的每个多图像元素都是个多图像元素都是独立编码处理的。该标准包含了为接收器所用的指令,告诉接收器如独立编码处理的。该标准包含了为接收器所用的指令,告诉接收器如何构成最终的图像。
13、何构成最终的图像。第6页,共21页,编辑于2022年,星期六 每个解码缓冲器只接收属于它自己的灵敏据流,并转送给解码器。复合存储器完成图像元素的存每个解码缓冲器只接收属于它自己的灵敏据流,并转送给解码器。复合存储器完成图像元素的存储,并将它们送到显示器的恰当位置。音频的情况也是这样,但显然不同点是要求同时提供所有储,并将它们送到显示器的恰当位置。音频的情况也是这样,但显然不同点是要求同时提供所有的元素。数据上的时间标记保证这些元素在时间上能正确同步。的元素。数据上的时间标记保证这些元素在时间上能正确同步。MPEGMPEG一一4 4标准对自然元素标准对自然元素(实物图实物图像像)和合成元素进行区
14、分和规定,计算机生成的动画是合成元素的一个例子。比如,一幅完整的图和合成元素进行区分和规定,计算机生成的动画是合成元素的一个例子。比如,一幅完整的图像可以包含一幅实际的背景图,并在前面有一幅动画或者有另外一幅自然图像。这样的每一幅图像可以包含一幅实际的背景图,并在前面有一幅动画或者有另外一幅自然图像。这样的每一幅图像都可以作最佳压缩,并互相独立地传送到接收器,接收器知道如何把这些元素组合在一起。在像都可以作最佳压缩,并互相独立地传送到接收器,接收器知道如何把这些元素组合在一起。在MPEGMPEG一一2 2标准中,图像被看作一个整体来压缩;而在标准中,图像被看作一个整体来压缩;而在MPEGMPE
15、G一一4 4标准下,对图像中的每一个元素进标准下,对图像中的每一个元素进行优化压缩。静止的背景不必压缩到以后的行优化压缩。静止的背景不必压缩到以后的I I帧之中去,否则会使带宽的使用变得很紧张。而如果帧之中去,否则会使带宽的使用变得很紧张。而如果这个背景图像静止这个背景图像静止1010秒钟,就只要传送一次秒钟,就只要传送一次(假设我们不必担心有人在该时间内切人此频道假设我们不必担心有人在该时间内切人此频道),需,需要不断传送的仅是前台的比较小的图像元素。对有些节目类型,这样做会节省大量的带宽。要不断传送的仅是前台的比较小的图像元素。对有些节目类型,这样做会节省大量的带宽。MPEGMPEG一一4
16、 4标准对音频的处理也是相同的。例如,有一位独唱演员,伴随有电子合成器,在标准对音频的处理也是相同的。例如,有一位独唱演员,伴随有电子合成器,在MPEGMPEG一一2 2标准标准下,我们必须先把独唱和合成器作混合,然后再对合成的音频信号进行压缩与传送。在下,我们必须先把独唱和合成器作混合,然后再对合成的音频信号进行压缩与传送。在MPEGMPEG一一4 4标准下,我们可以对独唱作单独压缩,然后再传送乐器数字接口的声轨信号,就可以使接收器重标准下,我们可以对独唱作单独压缩,然后再传送乐器数字接口的声轨信号,就可以使接收器重建伴音。建伴音。第7页,共21页,编辑于2022年,星期六当然,接收器必须能
17、支持MIDI放音。与传送合成的信号相比,分别传送独唱信号和MIDI数据要节省大量的带宽。其它的节目类型同样可以作类似的规定。MPEG一7标准又叫多媒体内容描述接口标准。图像可以用色彩、纹理、形状、运动等参数来描述,MPEG一7标准是依靠众多的参数对图像与声音实现分类,并对它们的数据库实现查询。第8页,共21页,编辑于2022年,星期六二、多媒体数据压缩技术的实现方法 目前多媒体压缩技术的实现方法已有近百种,其中基于信源理论编码的压缩方法、目前多媒体压缩技术的实现方法已有近百种,其中基于信源理论编码的压缩方法、离散余弦变换离散余弦变换(DCT)(DCT)和小波分解技术压缩算法的研究更具有代表性。
18、小波技术突和小波分解技术压缩算法的研究更具有代表性。小波技术突破了传统压缩方法的局限性,引入了局部和全局相关去冗余的新思想,具有较大破了传统压缩方法的局限性,引入了局部和全局相关去冗余的新思想,具有较大的潜力,因此近几年来吸引了众多的研究者。在小波压缩技术中,一幅图像可以的潜力,因此近几年来吸引了众多的研究者。在小波压缩技术中,一幅图像可以被分解为若干个叫做被分解为若干个叫做“小片小片”的区域;在每个小片中,图像经滤波后被分解的区域;在每个小片中,图像经滤波后被分解成若干个低频与高频分量。低频分量可以用不同的分辨率进行量化,即成若干个低频与高频分量。低频分量可以用不同的分辨率进行量化,即图像的
19、低频部分需要许多的二进制位,以改善图像重构时的信噪比。低图像的低频部分需要许多的二进制位,以改善图像重构时的信噪比。低频元素采用精细量化,高频分量可以量化得比较粗糙,因为你不太容易频元素采用精细量化,高频分量可以量化得比较粗糙,因为你不太容易看到变化区域的噪声与误差。此外,碎片技术已经作为一种压缩方法被看到变化区域的噪声与误差。此外,碎片技术已经作为一种压缩方法被提出,这种技术依靠实际图形的重复特性。用碎片技术压缩图像时需要提出,这种技术依靠实际图形的重复特性。用碎片技术压缩图像时需要占用大量的计算机资源,但可以获得很好的结果。借助于从占用大量的计算机资源,但可以获得很好的结果。借助于从DNA
20、DNA序列研序列研究中发展出来的模式识别技术,能减少通过究中发展出来的模式识别技术,能减少通过WANWAN链路的流量,最多时的链路的流量,最多时的压缩比率能达到压缩比率能达到9090,从而为网络传送图像和声音提供更大的压缩比,从而为网络传送图像和声音提供更大的压缩比,减轻风络负荷,更好地实现网络信息传播。减轻风络负荷,更好地实现网络信息传播。第9页,共21页,编辑于2022年,星期六三、压缩原理 由于图像数据之间存在着一定的冗余,所以使得数据的压缩成为可能。由于图像数据之间存在着一定的冗余,所以使得数据的压缩成为可能。信息论的创始人信息论的创始人ShannonShannon提出把数据看作是信息
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体 图像 压缩 技术 PPT 讲稿
限制150内