多媒体数据压缩算法研究报告与实现.pdf
《多媒体数据压缩算法研究报告与实现.pdf》由会员分享,可在线阅读,更多相关《多媒体数据压缩算法研究报告与实现.pdf(20页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、个人资料整理仅限学习使用多媒体数据压缩算法研究与实现摘要:多媒体数据压缩技术是实现实时有效地处理、传输和存储庞大的多媒体数据的关键技术。许多应用领域对多媒体信息的实时压缩提出了更高的要求,快速、高效的压缩算法是解决这一问题的关键。针对多媒体数据在空间、时间、结构、视觉、知识等方面所产生的冗余,利用有损压缩和无损压缩等方法,对图像、音频、视频等多媒体数据进行压缩,以保留尽可能少的有用信息。本文主要是把所学的数据结构和算法设计的知识应用于实践,对目前普遍采用的多媒体数据及其压缩算法加以研究,同时介绍了数据压缩所采用的分类、方法及其标准,并分析每种算法的优缺点,并据此选择设计一种多媒体数据的无损压缩
2、算法。并以实例加以说明。关键词:多媒体。压缩。哈夫曼编码.1.多媒体数据类型1.1 文字在现实世界中,文字是人与计算机之间进行信息交换的主要媒体。文字主要包括西文与中文。在计算机中,文字用二进制编码表示,即使用不同的二进制编码来代表不同的文字。1.2 音频音频 Audio)指的是20HZ20kHz 的频率范围,但实际上“音频”常常被作为“音频信号”或“声音”的同义语,是属于听觉类媒体,主要分为波形声音、语音和音乐。1.3 视频媒体能够利用视觉传递信息的媒体都是视频媒体。位图图像、矢量图像等都是视频媒体。1.4 动画动画是指运动的画面,动画在多媒体中是一种非常有用的信息交换工具。动画之所以成为可
3、能,是因为人类的“视觉暂留”的生理现象。用计算机实现的动画有两种,一种是帧动画,另一种是造型动画。2.数据压缩基本原理2.1 信息、数据和编码数据是用来记录和传送信息,或者说数据是信息的载体。真正有用的不是数据本身,而是数据所携带的信息。数据压缩的理论基础是信息论。数据压缩技术是建立在信息论的基础之上的。数据压缩的理论极限是信息熵。而信息熵有两个基本概念作铺垫,这两个基本概念就是信息、信息量。首先第一个概念“信息”。1信息信息是用不确定的量度定义的,也就是说信息被假设为由一系列的随机变量所代表,它们往往用随机出现的符号来表示。我们称输出这些符号的源为“信源”。也就是要进行研究与压缩的对象。应该
4、理解这个概念中的“不确定性”、“随机”性、“度量”性,也就是说当你收到一条消息之前,某一事件处于不确定的状态中,当你收到消息后,去除不确定性,从而获得信息,因此去除不确定性的多少就成为信息的度量。比如:你在考试过后,没收到考试成绩 考试成绩通知为消息)之前,你不知道你的考试成绩是否及格,那么你就处于一个不确定的状态;当你收到成绩通知消息)是“及格”,此时,你就去除了“不及格”不确定状态,占50%),你得到了消息“及格”。一个消息的可能性愈小,其信息含量愈大;反之,消息的可能性愈大,其信息含量愈小。个人资料整理仅限学习使用2信息量指从 N个相等的可能事件中选出一个事件所需要的信息度量和含量。也可
5、以说是辨别N个事件中特定事件所需提问“是”或“否”的最小次数。例如:从 64 个数 164 的整数)中选定某一个数采用折半查找算法),提问:“是否大于 32?”,则不论回答是与否,都消去半数的可能事件,如此下去,只要问6 次这类问题,就可以从64 个数中选定一个数,则所需的信息量是6,假定任选一个数的概率都相等,即P(x=1/N,则信息量I(x 可定义为:上式可随对数所用“底”的不同而取不同的值,因而其单位也就不同。设底取大于1 的整数,考虑一般物理器件的二态性,通常 取 2,相应的信息量单位为比特 bit);当=e,相应的信息量单位为奈特Nat);当=10,相应的信息量单位为哈特 大时,算出
6、的I(x 小,那么这个事件发生的可能性大,不确定性小,事件一旦发生后提供的信息量也少。必然事件的P(x等于 1,I(x 等于 0,所以必然事件的消息报导,不含任何信息量;但是一件人们都没有估计到的事件 极小),一旦发生后,I(x 大,包含的信息量很大。所以随机事件的先验概率,与事件发生后所产生的信息量,有密切关系。I(x 称 x 发生后的自信息量,它也是一个随机变量。现在可以给“熵”下个定义了。信息量计算的是一个信源的某一个事件。3信息熵信源 X发出的 xj(j=1,2,n,共n 个随机事件的自信息统计平均,即求数学期望H(X在信息论中称为信源X 的“熵”(Entropy,它的含义是信源X 发
7、出任意一个随机变量的平均信息量。更详细的说,一般在解释和理解信息熵时,有4 种样式:是不确定性的度量;2)当处于事件发生之时,是一种惊奇性的度量;3)当处于事件发生之后,是获得信息的度量;=P(x2=P(x3P(x8=1/8,计算信源X的熵。应用“熵”的定义可得其平均信息量为3 比特:香农信息论认为:信源所含有的平均信息量空间冗余。这是图像数据经常存在的一种冗余。在同一幅图像中,规则物体和规则背景的表面特性具有相关性,这些相关性的光成像结构在数字化图像中就表现为数据冗余。(2时间冗余。时间冗余在图像序列中就是相邻帧图像之间有较大相关性,一帧图像中的某物体或场景可以由其他帧图像中的物体或场景重构
8、出来,音频的一个连续的渐变过程中,也存在同样的时间冗余。(3信息熵冗余。信源编码时,当分配给某个码元素的比特数使编码后单位数据量等于其信源熵,即达到其压缩极限。但实际中各码元素的先验概率很难预知,比特分配不能达到最佳,实际的单位数据量大于信源熵时,便存在信息熵冗余。(4 视觉冗余。人眼对于图像场的注意是非均匀的,人眼并不能觉察图像场的所有变化。事实上人类视觉的一般分辨率为26灰度等级,而一般图像的量化采用的是28灰度等级,即存在着视觉冗余。(5 听觉冗余。人耳对不同频率的声音的敏感性是不同的,并不能察觉所有频率的变化,对某些频率不必特别关注,因此存在听觉冗余。(6结构冗余。图像一般都有非常强的
9、纹理结构。如草席图像,纹理一般都是比较有规律的结构,因此在结构上存在冗余。(7知识冗余。图像的理解与某些基础知识有很大的相关性。例如,人脸的图像有同样的结构:嘴的上方有鼻子,鼻子上方有眼睛,鼻子在正脸图像的中线上等。这些规律性可由某些基础知识得到,此类冗余为知识冗余。(8其他冗余。多媒体数据除了上述冗余类型外,还存在其他一些冗余类型,如由图像非定常特性所产生的冗余等。3.数据压缩标准数据压缩是多媒体通信中的核心技术之一,数据压缩研究中应注意的问题是,首先,编码方法必须能用计算机或硬件电路高速实现;其次,要符合当前的国际标准。为此,国际上制定了很多与之相关的数据压缩标准,主要可分为三类:音频压缩
10、标准,二值和静止图像压缩标准,以及视频压缩标准。文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4
11、X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2
12、 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4
13、X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2
14、 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4
15、X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2
16、 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2个人资料整理仅限学习使用3.1 音频数据的压缩标准音频信号是多媒体信息的重要组成部分。音频信号可以分为电话音频信号、调幅广播音频信号和高保真的立体声音信号。前两种单频信号的压缩技术比较成熟,例如,ADPCM、CELP 和子带编码等。国际电报电话咨询委员会CCITT)和国际标准化组织已为这两种音频信号的压缩编码制
17、定了一些国际标准。1.G.711标准1972年CCITT(现更名为 ITU2T为电话质量和语音压缩制定了PCM 标准 G.711。其速率为64kbit/s,使用非线性量化技术,其质量相当于12比特线性量化。2.G.721标准1984年CCITT制定了 G.721标准,使用自适应差分PCM 编码(ADPCM,其速率 32kbit/s。ADPCM是一种对中等质量音频信号进行高效编码的有效算法之一,它不仅适用于语音压缩,而且也适用于调幅广播质量的音频压缩和CD2I音频压缩等应用。3.G.722标准1988年CCITT为调幅广播质量的音频信号压缩制定了G.722标准,它使用子带编码方案,用滤波器将输入
18、信号分成高低两个子带信号,然后分别使用 ADPCM进行编码,经复用后形成输出码流。G.722标准也提供数据插入功能,这样音频码流与所插入的数据一起形成比特流。G.722能将 224kbit/s的调幅广播质量的音频信号压缩为64kbit/s,主要用于视听多媒体和会议电视等。4.G.728标准为了进一步降低语音压缩的速率,1991 年CCITT制定了 G.728标准,使用基于短延时码本激励线性预测编码(LD2CELP 算法,其速率为 16kbit/s,其质量与 32kbit/s的 G.721标准相当。5.MPEG 21音频编码MPEG21 音频编码是国际上制定的第一个高保真立体声音频编码标准(IS
19、O1117223。通过对 14 种音频编码方案的比较测试,最后选定了以MUSICAM(MaskingPatternUniversalSubbandIntegratedCodingAndMultiplexing为基础的三层编码结构。根据不同的应用要求,使用不同的层来构成其音频编码器。在MPEG21 中音频编码的 1、2层称之为 MUSICAM。MUSICAM 使用了以下技术:子带滤波器先将输入的数字音频信号分成 32个子带。在每个子带中,确定一段信号中的最大电平,由此得到比例因子这一编码参数。由于比例因子的相对变化很小,因此采用差分熵编码方法。根据人耳的掩蔽效应确定掩蔽门限,据此自适应地分配比特
20、,以达到高效压缩音频数据。最后,将音频压缩数据、比例因子和比特分配信息按帧结构组合在一起,形成音频比特流。6.MPEG 22音频编码在MPEG21 音频编码中,MUSICAM 只能传送左右两个声道。为此,MPEG 扩展了低码率多声道编码,将多声道扩展信息加到MPEG21 音频数据帧结构的辅助数据段(其长度没有限制中。这样可将声道数扩展至5.1,即3个前声道(左L、中 C和右 R、2个环绕声(左LS、右 RS 和1个超低音声道 LFE(常称之为 0.1。由此,形成了 MPEG22 音频编码标准SO1381823。MPEG22 音频编码能传送多路声音,并能确保比特流与MPEG21 前向和后向兼容。
21、7.AC23系统AC23 系统是 Dolby 公司开发的新一代高保真立体声音频编码系统,它继承了 AC22系统的许多优点(例如,变换编码、自适应量化和比特分配、人耳的听觉特性等,并采用了一些新的技术(例如,指数编码、混合前/后向自适应比特分配和耦合技术等。AC23 系统的总体性能要优于目前的MPEG22 音频算法(称之为 MUSICAM 环绕声。文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:C
22、P2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7
23、J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:C
24、P2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7
25、J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:CP2X4K7K4U2 HM1B8K2I7J2 ZV4Q6Z4X1B2文档编码:C
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体 数据压缩 算法 研究 报告 实现
限制150内