书签分享收藏举报版权申诉 / 20

立即下载

当前位置：首页 > 教育专区 > 高考资料 > 多媒体数据压缩算法研究报告与实现.pdf

多媒体数据压缩算法研究报告与实现.pdf

上传人：Q****o

文档编号：56614007

上传时间：2022-11-02

格式：PDF

页数：20

大小：251.91KB

( 4.5 )

《多媒体数据压缩算法研究报告与实现.pdf》由会员分享，可在线阅读，更多相关《多媒体数据压缩算法研究报告与实现.pdf（20页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、个人资料整理仅限学习使用多媒体数据压缩算法研究与实现摘要：多媒体数据压缩技术是实现实时有效地处理、传输和存储庞大的多媒体数据的关键技术。许多应用领域对多媒体信息的实时压缩提出了更高的要求，快速、高效的压缩算法是解决这一问题的关键。针对多媒体数据在空间、时间、结构、视觉、知识等方面所产生的冗余,利用有损压缩和无损压缩等方法,对图像、音频、视频等多媒体数据进行压缩,以保留尽可能少的有用信息。本文主要是把所学的数据结构和算法设计的知识应用于实践，对目前普遍采用的多媒体数据及其压缩算法加以研究，同时介绍了数据压缩所采用的分类、方法及其标准，并分析每种算法的优缺点，并据此选择设计一种多媒体数据的无损压缩

2、算法。并以实例加以说明。关键词：多媒体。压缩。哈夫曼编码.1.多媒体数据类型1.1 文字在现实世界中，文字是人与计算机之间进行信息交换的主要媒体。文字主要包括西文与中文。在计算机中，文字用二进制编码表示，即使用不同的二进制编码来代表不同的文字。1.2 音频音频 Audio）指的是20HZ20kHz 的频率范围，但实际上“音频”常常被作为“音频信号”或“声音”的同义语，是属于听觉类媒体，主要分为波形声音、语音和音乐。1.3 视频媒体能够利用视觉传递信息的媒体都是视频媒体。位图图像、矢量图像等都是视频媒体。1.4 动画动画是指运动的画面，动画在多媒体中是一种非常有用的信息交换工具。动画之所以成为可

3、能，是因为人类的“视觉暂留”的生理现象。用计算机实现的动画有两种，一种是帧动画，另一种是造型动画。2.数据压缩基本原理2.1 信息、数据和编码数据是用来记录和传送信息，或者说数据是信息的载体。真正有用的不是数据本身，而是数据所携带的信息。数据压缩的理论基础是信息论。数据压缩技术是建立在信息论的基础之上的。数据压缩的理论极限是信息熵。而信息熵有两个基本概念作铺垫，这两个基本概念就是信息、信息量。首先第一个概念“信息”。1信息信息是用不确定的量度定义的，也就是说信息被假设为由一系列的随机变量所代表，它们往往用随机出现的符号来表示。我们称输出这些符号的源为“信源”。也就是要进行研究与压缩的对象。应该

4、理解这个概念中的“不确定性”、“随机”性、“度量”性，也就是说当你收到一条消息之前，某一事件处于不确定的状态中，当你收到消息后，去除不确定性，从而获得信息，因此去除不确定性的多少就成为信息的度量。比如：你在考试过后，没收到考试成绩考试成绩通知为消息）之前，你不知道你的考试成绩是否及格，那么你就处于一个不确定的状态；当你收到成绩通知消息）是“及格”，此时，你就去除了“不及格”不确定状态，占50%），你得到了消息“及格”。一个消息的可能性愈小，其信息含量愈大；反之，消息的可能性愈大，其信息含量愈小。个人资料整理仅限学习使用2信息量指从 N个相等的可能事件中选出一个事件所需要的信息度量和含量。也可

5、以说是辨别N个事件中特定事件所需提问“是”或“否”的最小次数。例如：从 64 个数 164 的整数）中选定某一个数采用折半查找算法），提问：“是否大于 32？”，则不论回答是与否，都消去半数的可能事件，如此下去，只要问6 次这类问题，就可以从64 个数中选定一个数，则所需的信息量是6，假定任选一个数的概率都相等，即P(x=1/N，则信息量I(x 可定义为：上式可随对数所用“底”的不同而取不同的值，因而其单位也就不同。设底取大于1 的整数，考虑一般物理器件的二态性，通常取 2，相应的信息量单位为比特 bit）；当=e，相应的信息量单位为奈特Nat）；当=10，相应的信息量单位为哈特大时，算出

6、的I(x 小，那么这个事件发生的可能性大，不确定性小，事件一旦发生后提供的信息量也少。必然事件的P(x等于 1，I(x 等于 0，所以必然事件的消息报导，不含任何信息量；但是一件人们都没有估计到的事件极小），一旦发生后，I(x 大，包含的信息量很大。所以随机事件的先验概率，与事件发生后所产生的信息量，有密切关系。I(x 称 x 发生后的自信息量，它也是一个随机变量。现在可以给“熵”下个定义了。信息量计算的是一个信源的某一个事件。3信息熵信源 X发出的 xj(j=1,2,n,共n 个随机事件的自信息统计平均，即求数学期望H(X在信息论中称为信源X 的“熵”(Entropy，它的含义是信源X 发

7、出任意一个随机变量的平均信息量。更详细的说，一般在解释和理解信息熵时，有4 种样式：是不确定性的度量；2）当处于事件发生之时，是一种惊奇性的度量；3）当处于事件发生之后，是获得信息的度量；=P(x2=P(x3P(x8=1/8，计算信源X的熵。应用“熵”的定义可得其平均信息量为3 比特：香农信息论认为：信源所含有的平均信息量空间冗余。这是图像数据经常存在的一种冗余。在同一幅图像中，规则物体和规则背景的表面特性具有相关性，这些相关性的光成像结构在数字化图像中就表现为数据冗余。(2时间冗余。时间冗余在图像序列中就是相邻帧图像之间有较大相关性，一帧图像中的某物体或场景可以由其他帧图像中的物体或场景重构

8、出来，音频的一个连续的渐变过程中，也存在同样的时间冗余。(3信息熵冗余。信源编码时，当分配给某个码元素的比特数使编码后单位数据量等于其信源熵，即达到其压缩极限。但实际中各码元素的先验概率很难预知，比特分配不能达到最佳，实际的单位数据量大于信源熵时，便存在信息熵冗余。(4 视觉冗余。人眼对于图像场的注意是非均匀的，人眼并不能觉察图像场的所有变化。事实上人类视觉的一般分辨率为26灰度等级，而一般图像的量化采用的是28灰度等级，即存在着视觉冗余。(5 听觉冗余。人耳对不同频率的声音的敏感性是不同的，并不能察觉所有频率的变化，对某些频率不必特别关注，因此存在听觉冗余。(6结构冗余。图像一般都有非常强的

9、纹理结构。如草席图像，纹理一般都是比较有规律的结构，因此在结构上存在冗余。(7知识冗余。图像的理解与某些基础知识有很大的相关性。例如，人脸的图像有同样的结构：嘴的上方有鼻子，鼻子上方有眼睛，鼻子在正脸图像的中线上等。这些规律性可由某些基础知识得到，此类冗余为知识冗余。(8其他冗余。多媒体数据除了上述冗余类型外，还存在其他一些冗余类型，如由图像非定常特性所产生的冗余等。3.数据压缩标准数据压缩是多媒体通信中的核心技术之一,数据压缩研究中应注意的问题是，首先，编码方法必须能用计算机或硬件电路高速实现；其次，要符合当前的国际标准。为此,国际上制定了很多与之相关的数据压缩标准,主要可分为三类:音频压缩

10、标准,二值和静止图像压缩标准,以及视频压缩标准。文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4

11、X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2

12、 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4

13、X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2

14、 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4

15、X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2

16、 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2个人资料整理仅限学习使用3.1 音频数据的压缩标准音频信号是多媒体信息的重要组成部分。音频信号可以分为电话音频信号、调幅广播音频信号和高保真的立体声音信号。前两种单频信号的压缩技术比较成熟,例如,ADPCM、CELP 和子带编码等。国际电报电话咨询委员会CCITT）和国际标准化组织已为这两种音频信号的压缩编码制

17、定了一些国际标准。1.G.711标准1972年CCITT(现更名为 ITU2T为电话质量和语音压缩制定了PCM 标准 G.711。其速率为64kbit/s,使用非线性量化技术,其质量相当于12比特线性量化。2.G.721标准1984年CCITT制定了 G.721标准,使用自适应差分PCM 编码(ADPCM,其速率 32kbit/s。ADPCM是一种对中等质量音频信号进行高效编码的有效算法之一,它不仅适用于语音压缩,而且也适用于调幅广播质量的音频压缩和CD2I音频压缩等应用。3.G.722标准1988年CCITT为调幅广播质量的音频信号压缩制定了G.722标准,它使用子带编码方案,用滤波器将输入

18、信号分成高低两个子带信号,然后分别使用 ADPCM进行编码,经复用后形成输出码流。G.722标准也提供数据插入功能,这样音频码流与所插入的数据一起形成比特流。G.722能将 224kbit/s的调幅广播质量的音频信号压缩为64kbit/s,主要用于视听多媒体和会议电视等。4.G.728标准为了进一步降低语音压缩的速率,1991 年CCITT制定了 G.728标准,使用基于短延时码本激励线性预测编码(LD2CELP 算法,其速率为 16kbit/s,其质量与 32kbit/s的 G.721标准相当。5.MPEG 21音频编码MPEG21 音频编码是国际上制定的第一个高保真立体声音频编码标准(IS

19、O1117223。通过对 14 种音频编码方案的比较测试,最后选定了以MUSICAM(MaskingPatternUniversalSubbandIntegratedCodingAndMultiplexing为基础的三层编码结构。根据不同的应用要求,使用不同的层来构成其音频编码器。在MPEG21 中音频编码的 1、2层称之为 MUSICAM。MUSICAM 使用了以下技术:子带滤波器先将输入的数字音频信号分成 32个子带。在每个子带中,确定一段信号中的最大电平,由此得到比例因子这一编码参数。由于比例因子的相对变化很小,因此采用差分熵编码方法。根据人耳的掩蔽效应确定掩蔽门限,据此自适应地分配比特

20、,以达到高效压缩音频数据。最后,将音频压缩数据、比例因子和比特分配信息按帧结构组合在一起,形成音频比特流。6.MPEG 22音频编码在MPEG21 音频编码中,MUSICAM 只能传送左右两个声道。为此,MPEG 扩展了低码率多声道编码,将多声道扩展信息加到MPEG21 音频数据帧结构的辅助数据段(其长度没有限制中。这样可将声道数扩展至5.1,即3个前声道(左L、中 C和右 R、2个环绕声(左LS、右 RS 和1个超低音声道 LFE(常称之为 0.1。由此,形成了 MPEG22 音频编码标准SO1381823。MPEG22 音频编码能传送多路声音,并能确保比特流与MPEG21 前向和后向兼容。

21、7.AC23系统AC23 系统是 Dolby 公司开发的新一代高保真立体声音频编码系统,它继承了 AC22系统的许多优点(例如,变换编码、自适应量化和比特分配、人耳的听觉特性等,并采用了一些新的技术(例如,指数编码、混合前/后向自适应比特分配和耦合技术等。AC23 系统的总体性能要优于目前的MPEG22 音频算法(称之为 MUSICAM 环绕声。文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:C

22、P2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7

23、J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:C

24、P2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7

25、J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:C

26、P2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7

27、J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2个人资料整理

28、仅限学习使用3.2 二值图象压缩标准二值图像是指只有黑、白两个亮度值的图像,例如由文字组成的图像、地图、线路图等。灰度图像经过比特平面分解或抖动处理后也能变为二值图像。二值图像编码最常用、最典型的例子是传真。为此,CCITT先后制定了 G3 和G4 标准,其中,G3使用 MR 编码算法。而 G4是G3的改进型,使用 MMR 算法。目前,这两种二值图像压缩标准广泛地应用于传真通信和文档存储领域。另一个正在发展的二值图像压缩标准是JBIG,JBIG 是二值图像专家组的缩写。JBIG可望成为新一代二值图像和低像素精度图像的无失真压缩标准。虽然已有了优秀的MMRG4标准,但还是要制定JBIG,其主要原

29、因是改进二值中间色调图像的压缩性能。因为二值中间色调图像与二值文字图像具有非常不同的统计特性。而G3/G4不适应于中间色调图像,当G3/G4压缩这类图像时,不仅得不到压缩,反而有可能扩展数据量,而使用 JBIG标准可获得约8:1 的压缩。它使用了与JPEG 标准相同的算术编码方法,其压缩效率要比目前的传真标准G3/G4高得多。值得指出的是,JBIG 标准虽然是针对二值图像的,但它也可以对包括灰度值的黑白图像或彩色图像进行编码。3.3 静止图象压缩标准ISO和CCITT于 1986年底成立了“联合图片专家组”,简称为 JPEG,研究连续色调静止图像压缩的国际标准。从1988年至 1990年,JP

30、EG 进行了大量的改进工作后,于 1991年4月形成了ISOCD10918 号标准草案。JPEG 标准草案(DIS 包括两部分,一部分为要求和指标,描述连续色调静止图像编码和解码过程的要求和要实现的指标,以及用于应用间交换压缩图像数据的编码表示(即交换格式。这些过程和表示是通用的,可适用于很广的应用范围,例如通信和计算机系统中的彩色和灰度图像编码。另一部分描述如何确定部分1所定义的各种编码和解码过程的一致性。3.4 视频压缩标准视频是多媒体通信中最重要的媒体之一。一方面视频媒体能给人以“百闻不如一见”的感受,与话音相比,视频可以说是一种高级媒体,能给人带来高级的视觉享受。另一方面由于视频的信息

31、量非常大(尤其是数字化后,按质量划分,视频可大致分为以下三类:低质量视频,画面较小,通常为 QCIF 或CIF格式,帧速率低,通常为 5 10帧/秒,既可为黑白视频也可为彩色视频。其典型的应用包括电视电话和会议电视。中等质量的视频,中等大小的画面,通常为 CIF或CCIR 601视频格式。帧速率为2530 帧/秒,多为彩色视频。其典型应用有CD 和数字音频磁带等数字存储媒体。高质量视频,其画面较大,通常为 CCIR 601视频格式至高清晰度电视视频格式。帧速率 25 帧/秒,高质量的彩色图像。其典型应用包括广播质量的普通数字电视和高清晰度电视等。针对上述三种视频,国际上制定了相应的视频压缩标准

32、:H.261、MPEG21 和MPEG22。值得一提的是 1992年成立了一个专家组来制定非常低码率(kbit/s级的视频标准 MPEG24。打算用于未来的电视电话和移动多媒体通信系统,例如视频蜂窝电话等。1.H.261 H.261是 CCITT制定的视频压缩标准,它是国际上第一个视频压缩标准,主要用于电视电话和会议电视,以满足 ISDN日益发展的需要。H.261视频压缩算法的核心是运动估值预测和DCT 编码。由于它是第一个国际视频压缩标准,其许多技术(包括视频数据结构,运动估算与补偿,DCT变换、量化和熵编码等都被后来的 MPEG21 和MPEG22 所借鉴和采用。2.MPEG21 MPE

33、G 是活动图像专家组的缩写,MPEG21 采用 CIF视频格式,帧速率为 25帧/秒或 30帧/秒,码率为 1.5Mbit/s(其中,视频约 1.2 Mbit/s,音频约 0.3Mbit/s,图像质量略高于家用VHS 录像机,音频质量(双声道接近 CD 质量。由于 MPEG21 采用类似于 H.261的通用编码方法,因文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM

34、1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B

35、2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM

36、1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B

37、2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM

38、1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B

39、2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2个人资料整理仅限学习使用此,MPEG2

40、1 不仅可用于数字存储媒体,而且可用于通信和广播,其压缩数据能以文件的形式传送、管理和接收。3.MPEG22 MPEG22 是继 MPEG21 后,MPEG 制定的又一视频压缩标准(ISO/IEC13818。由于是 MPEG21 的继承和发展,因此,MPEG22 能适用于更广的应用领域,主要包括数字存储媒体,广播电视和通信,制定 MPEG22 标准的出发点是保持通用性,适用于广泛的应用领域、比特率、分辨率、质量和服务。为了适应各种不同的应用要求,MPEG22 使用了可分级性(scalability,即能提供不同的服务等级(level。为此,该标准定义了几种不同的可分级性形式。基本的可分级性形式

41、有:数据划分、信噪比(SNR、空间和时间的可分级性。进一步也支持这几种基本可分级性形式的组合,称之为混合可分级性。MPEG22 标准是目前为止最重要的视频压缩标准。它对多媒体通信和广播电视等领域将会产生深远的影响。随着宽带ISDN、超大规模集成电路和计算机技术的发展,其应用前景十分广阔。4.数据压缩算法各种媒体信息(特别是图像和动态视频数据量非常大。这么大的数据量不仅超出了计算机的存储和处理能力，更是当前通信信道的传输速率所不及的。因此，为了存储、处理和传输这些数据，必须进行压缩。相比之下，语音的数据量较小，且基本压缩方法己经成熟，目前的数据压缩研究主要集中于图像和视频信号的压缩方面。数据压缩

42、的核心是计算方法，不同的计算方法，产生不同形式的压缩编码，以解决不同数据的存储与传送问题。数据冗余类型和数据压缩的算法是对应的，一般根据不同的冗余类型采用不同的编码形式，随后是采用特定的技术手段和软硬件，以实现数据压缩。4.1 算法的分类数据压缩方法种类繁多，可以分为无损无失真）压缩和有损无损压缩编码基于信息熵原理，属于可逆编码。其压缩比一般不高。(2所谓“可逆”，是指压缩的数据可以不折不扣地还原成原始数据。(3典型的可逆编码有：霍夫曼编码、算术编码、行程编码、LZW编码等。2有损压缩算法有损压缩是指解码后的数据与原始数据不一致。有损压缩方法利用了人类视觉对图像中的某些频率成分不敏感的特性，

43、允许压缩过程中损失一定的信息；虽然不能完全恢复原始数据，但是所损失的部分对理解原始图像的影响较小，却换来了大得多的压缩比。有损压缩广泛应用于语音、图像和视频数据的压缩。(1该编码在压缩时舍弃部分数据，还原后的数据与原始数据存在差异。有损压缩具有不可恢复性和不可逆性。(2有损压缩编码类型有：预测编码、变换编码等4.2 预测编码预测编码 Predictive Coding）是一种有失真的编码，是一种专门用作压缩冗余数据的编码技术。预测编码主要是减少了数据在时间和空间上的相关性，因而对于时间序列数据有着广泛的应用价值。预测编码是根据某一模型利用以往的样本值对于新样本值进行预测，然后将样本的实际值与其

44、预测值相减得到一个误差值，对于这一误差值进行编码。如果模型足够好且样本序列在时间上相关性较强，那么误差信号的幅度将远远小于原始信号，从而可以用较少的电平类对其差值量化得到较大的数据压缩结果。如果能精确预测数据源输出端作为时间函数使用的样本值的话，那就不存在关于数据源的不确定性，因而也就不存在要传输的信息。换句话说，如果我们能得到一个数学模型完全代表数据源，那么在接收端就能依据这一数学模型精确地产生出这些数据。然而没有一个实际的系统能找到其完整的数据模型，我们能找到的最好的预测器是以某种最小化的误差对下一个采样进行预测的预测器。预测编码方法分线性预测和非线性预测编码方法。线性预测编码方法，也称差

45、值脉冲编码调制法，简称DPCM。1）DPCM 的基本原理一幅二维静止图像，设空间坐标像素点的实际灰度为，是根据以前已出现的像素点的灰度对该点的预测灰度，也称预测值或估计值。空间坐标像素点的实际灰度值。空间坐标像素点的预测灰度值实际值和预测值之间的差值，以下式表示，=-实际值和预测值之差将差值定义为预测误差，由于之间有极强的相关性，所以这个预测误差是很小的。编码时，不是对像素点的实际灰度进行编码，而是对预测误差信号进行量化、编码、发送，由此而得名为差值脉冲编码调制法，简写DPCM。编码和解码过程见图4-2 所示：文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档

46、编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8

47、K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档

48、编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8

49、K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档

50、编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

4.3 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 多媒体数据压缩算法研究报告实现

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：多媒体数据压缩算法研究报告与实现.pdf
链接地址：https://www.taowenge.com/p-56614007.html