数字媒体压缩技术.ppt
数字媒体基础数字媒体基础数字媒体基础数字媒体基础数字媒体压缩技术数字媒体压缩技术教学目标:教学目标:(1 1)了解数字媒体数据压缩的原因。)了解数字媒体数据压缩的原因。(2 2)理解数字媒体数据压缩技术的不同分类。)理解数字媒体数据压缩技术的不同分类。(3 3)掌握通用的数据压缩编码算法。)掌握通用的数据压缩编码算法。(4 4)了解各种数字媒体数据压缩的标准。)了解各种数字媒体数据压缩的标准。数字媒体基础数字媒体基础学习内容:学习内容:1 1 数据压缩及分类数据压缩及分类2 2 通用的数据压缩技术通用的数据压缩技术3 3 数字媒体压缩标准数字媒体压缩标准数字媒体基础数字媒体基础1.1 1.1 压缩的可能性与信息冗余压缩的可能性与信息冗余 经过数字化处理后的图形、图像、视频和音经过数字化处理后的图形、图像、视频和音频等媒体信息的数据量非常大,如果不进行数据压频等媒体信息的数据量非常大,如果不进行数据压缩,计算机系统就无法对它进行存储、交换和传输。缩,计算机系统就无法对它进行存储、交换和传输。1 1)数字图像)数字图像2 2)数字视频)数字视频3 3)数字音频)数字音频(数据量的计算)(数据量的计算)1 1 数据压缩及分类数据压缩及分类数字媒体基础数字媒体基础1.1 1.1 压缩的可能性与信息冗余压缩的可能性与信息冗余 数据能够被压缩的主要原因在于媒体数据中存数据能够被压缩的主要原因在于媒体数据中存在数据的信息冗余。信息量包含在数据之中,一在数据的信息冗余。信息量包含在数据之中,一般的数据冗余主要体现在:般的数据冗余主要体现在:1 1)空间冗余)空间冗余 2 2)结构冗余)结构冗余 3 3)时间冗余)时间冗余 4 4)视觉冗余)视觉冗余 5 5)知识冗余)知识冗余 6 6)信息熵冗余)信息熵冗余 1 1 数据压缩及分类数据压缩及分类数字媒体基础数字媒体基础1.2 1.2 数据压缩分类数据压缩分类数字媒体基础数字媒体基础按信息压缩前后比较是否有损失进行划分:按信息压缩前后比较是否有损失进行划分:无损压缩无损压缩指使用压缩后的数据进行重构(还原指使用压缩后的数据进行重构(还原或解压缩),重构后的数据与原来的数据完全或解压缩),重构后的数据与原来的数据完全相同。常用的无损压缩算法有霍夫曼相同。常用的无损压缩算法有霍夫曼(Huffman)(Huffman)算法和算法和LZWLZW算法算法 。也称为可逆编码。也称为可逆编码。有损压缩有损压缩指使用压缩后的数据进行重构,重构指使用压缩后的数据进行重构,重构后的数据与原来的数据有所不同,但不影响人后的数据与原来的数据有所不同,但不影响人对原始资料表达的信息造成误解。也称为不可对原始资料表达的信息造成误解。也称为不可逆编码。逆编码。数字媒体基础数字媒体基础按数据压缩编码的原理和方法进行划分:按数据压缩编码的原理和方法进行划分:统计编码统计编码:主要针对:主要针对无记忆信源无记忆信源,根据信息码,根据信息码字出现概率的分布特征而进行压缩编码,寻找字出现概率的分布特征而进行压缩编码,寻找概率与码字长度间的最优匹配。概率与码字长度间的最优匹配。预测编码预测编码:是利用空间中相邻数据的相关性来:是利用空间中相邻数据的相关性来进行压缩数据的。进行压缩数据的。变换编码变换编码:是将图像时域信号转换为频域信号:是将图像时域信号转换为频域信号进行处理。进行处理。分析分析 合成编码合成编码:是指通过对源数据的分析,:是指通过对源数据的分析,将其分解成一系列更适合于表示的将其分解成一系列更适合于表示的“基元基元”或或从中提取若干更为本质意义的参数,编码仅对从中提取若干更为本质意义的参数,编码仅对这些基本单元或特征参数进行。这些基本单元或特征参数进行。数字媒体基础数字媒体基础无记忆信源无记忆信源【无记忆信源无记忆信源】(1 1)存在一个或多个基本符号集;()存在一个或多个基本符号集;(2 2)将多)将多个基本符号集做笛卡儿积,形成一定长度的联合概率空间;个基本符号集做笛卡儿积,形成一定长度的联合概率空间;(3 3)运用外力的功(电动势)将单个符号或一定长度的符号)运用外力的功(电动势)将单个符号或一定长度的符号序列从随机事件转化成必然事件,或者说,将一个随机系统序列从随机事件转化成必然事件,或者说,将一个随机系统转化成一个必然系统;并且转化成一个必然系统;并且回退到原始空间中来,该原始空回退到原始空间中来,该原始空间的概率分布不因为事件的发生而改变间的概率分布不因为事件的发生而改变。【有记忆信源有记忆信源】(1 1)存在一个或多个基本符号集;()存在一个或多个基本符号集;(2 2)将多)将多个基本符号集做笛卡儿积,形成一定长度的联合概率空间;个基本符号集做笛卡儿积,形成一定长度的联合概率空间;(3 3)运用外力的功(电动势)将单个符号或一定长度的符号)运用外力的功(电动势)将单个符号或一定长度的符号序列从随机事件转化成必然事件,或者说,将一个随机系统序列从随机事件转化成必然事件,或者说,将一个随机系统转化成一个必然系统;转化成一个必然系统;不能回退到原始空间中来,即原始空不能回退到原始空间中来,即原始空间的概率分布因为事件的发生而改变间的概率分布因为事件的发生而改变。数字媒体基础数字媒体基础按照媒体的类型进行压缩划分:按照媒体的类型进行压缩划分:图像压缩标准:图像压缩标准:JPEGJPEG等等声音压缩标准:声音压缩标准:MP3MP3运动图像压缩标准:运动图像压缩标准:MPEGMPEG、H.26xH.26x系列、系列、AVSAVS目录目录数字媒体基础数字媒体基础2 2 通用的数据压缩技术通用的数据压缩技术行程编码行程编码字典编码字典编码熵编码等熵编码等PCMPCMDMDMDPCMDPCM 通用的压缩方法具有压缩比低、通用的压缩方法具有压缩比低、通用性强等特点通用性强等特点 无损压缩技术无损压缩技术有损压缩技术有损压缩技术目录目录数字媒体基础数字媒体基础2.1 2.1 编码的理论基础编码的理论基础数据压缩技术的理论基础是信息论。数据压缩技术的理论基础是信息论。根据信息论的原理,可以找到最佳数据压缩编根据信息论的原理,可以找到最佳数据压缩编码方法,数据压缩的理论极限是信息熵。码方法,数据压缩的理论极限是信息熵。熵是信息量的度量方法,它表示某一事件出现熵是信息量的度量方法,它表示某一事件出现的消息越多,事件发生的可能性就越小,数学的消息越多,事件发生的可能性就越小,数学上就是概率越小。上就是概率越小。数字媒体基础数字媒体基础信息与信息量信息与信息量 信息量是指信源中某种事件的信息度量或含量。一个事件出现的可能性愈小,其信息量愈多,反之亦然。若pi为第i个事件的概率为0 pi 1,则该事件的信息量为 一个信源包括的所有数据叫数据量,而数据量中包含有冗余信息。信息量=数据量-冗余量数字媒体基础数字媒体基础信息熵信息熵信息熵就是将信源所有可能事件的信息量的平均。设从N个数中选定任一个数xj的概率为p(xj),假定选定任意一个数的概率都相等,即p(xj)1/N,则 I(xj)log2N-log2 1/N-log2p(xj)=Ip(xj)上式中,p(xj)是信源X发出xj的概率。I(xj)的含义是信源X发出xj这个消息(随机事件)后,接收端收到信息量的量度。数字媒体基础数字媒体基础信息熵信息熵(续续)信源X 发出的xj(j=1,2,n)共n 个随机事件的信息量的统计平均,即H(X)=EI(xj)=H(X)称为信源X 的“熵”,即信源X发出任意一个随机变量的平均信息量。其中,等概率事件的熵最大,假设有N个事件,此时熵为:H(X)数字媒体基础数字媒体基础信息熵信息熵(续续)当当P(x1)1时,时,P(x2)P(x3)P(xj)0 0,此,此时熵为时熵为 H(X)P(x1)0 0由上可得熵的范围为:由上可得熵的范围为:0 0 H(X)数字媒体基础数字媒体基础信息熵信息熵(续续)在编码中用熵值来衡量是否为最佳编码。若以在编码中用熵值来衡量是否为最佳编码。若以L Lc c表示编码器输出码字的平均码长,其计算公表示编码器输出码字的平均码长,其计算公式为:式为:L Lc c (j j=1,2,=1,2,n n)其中:其中:P P(x xj j)是信源是信源X X发出发出x xj j 的概率,的概率,L L(x xj j)为为x xj j的编码长。的编码长。数字媒体基础数字媒体基础信息熵信息熵(续续)平均码长与信息熵之间的关系为:平均码长与信息熵之间的关系为:L Lc cH(H(X X)有冗余,不是最佳。有冗余,不是最佳。L Lc c H(H(X X)不可能。不可能。L Lc c H(H(X X)最佳编码(最佳编码(L Lc c稍大于稍大于H(H(X X))熵值为平均码长熵值为平均码长L Lc c的下限。的下限。数字媒体基础数字媒体基础2.2 2.2 霍夫曼编码霍夫曼编码 霍夫曼编码(Huffman)是运用信息熵原理的一种无损编码方法,这种编码方法根据源数据各信号发生的概率进行编码。在源数据中出现概率大的信号,分配的码字越短;出现概率越小的信号,其码字越长,从而达到用尽可能少的码表示源数据。数字媒体基础数字媒体基础霍夫曼编码的算法:霍夫曼编码的算法:1.初始化,根据符号概率的大小顺序对符号进行排序。2.把概率最小的两个符号组成一个新符号(节点),即新符号的概率等于这两个符号概率之和。3.重复第2步,直到形成一个符号为止(树),其概率和等于1。4.分配码字。码字分配从最后一步开始反向进行,即从最后两个概率开始逐渐向前进行编码,对于每次相加的两个概率,给概率大的赋“0”,概率小的赋“1”(也可以全部相反,如果两个概率相等,则从中任选一个赋“0”,另一个赋“1”)。数字媒体基础数字媒体基础霍夫曼编码构造出来的编码值不是唯一的。霍夫曼编码构造出来的编码值不是唯一的。对不同信号源的编码效率不同。对不同信号源的编码效率不同。由于编码长度可变,因此译码时间较长;编由于编码长度可变,因此译码时间较长;编码长度的不统一,也使得硬件实现有难度。码长度的不统一,也使得硬件实现有难度。霍夫曼编码的特点:霍夫曼编码的特点:数字媒体基础数字媒体基础2.3 2.3 行程编码行程编码 行程编码又称行程长度编码(行程编码又称行程长度编码(Run Length EncodingRun Length Encoding,RLERLE),是一种熵编码。这种编码方法广泛地应用于各),是一种熵编码。这种编码方法广泛地应用于各种图像格式的数据压缩处理中。种图像格式的数据压缩处理中。行程编码的原理是在给定的图像数据中寻找连续重复的行程编码的原理是在给定的图像数据中寻找连续重复的数值,然后用两个字符取代这些连续值。即将具有相同数值,然后用两个字符取代这些连续值。即将具有相同值的连续串用其串长和一个代表值来代替,该连续串就值的连续串用其串长和一个代表值来代替,该连续串就称为行程,串长称为行程长度。称为行程,串长称为行程长度。数字媒体基础数字媒体基础2.3 2.3 行程编码行程编码假定一幅灰度图像,第假定一幅灰度图像,第n n行的像素值为:行的像素值为:用用RLERLE编码方法得到的代码为:编码方法得到的代码为:4 41606084 4114140。代码斜黑体表示的数字是行程长度,黑体字后代码斜黑体表示的数字是行程长度,黑体字后面的数字代表像素的颜色值。面的数字代表像素的颜色值。数字媒体基础数字媒体基础行程编码分类:行程编码分类:定长编码定长编码定长编码是指编码的行程长度所用的二进制定长编码是指编码的行程长度所用的二进制位数固定位数固定 不定长编码不定长编码变长行程编码是指对不同范围的行程长度使变长行程编码是指对不同范围的行程长度使用不同位数的二进制位数进行编码。使用变用不同位数的二进制位数进行编码。使用变长行程编码需要增加标志位来表明所使用的长行程编码需要增加标志位来表明所使用的二进制位数。二进制位数。数字媒体基础数字媒体基础2.4 2.4 词典编码词典编码 词典编码(词典编码(dictionary encodingdictionary encoding)技术)技术属于无损压缩技术,主要是利用数据本身包含属于无损压缩技术,主要是利用数据本身包含许多重复的字符串的特性。可以用一些简单的许多重复的字符串的特性。可以用一些简单的代号代替这些字符串,就可以实现压缩,实际代号代替这些字符串,就可以实现压缩,实际上就是利用了信源符号之间的相关性。字符串上就是利用了信源符号之间的相关性。字符串与代号的对应表就是词典。与代号的对应表就是词典。数字媒体基础数字媒体基础词典编码的种类:词典编码的种类:第一种方法的思想是查第一种方法的思想是查找目前正在压缩的字符找目前正在压缩的字符序列在以前输入的数据序列在以前输入的数据中是否出现过,然后用中是否出现过,然后用出现过的字符串代替重出现过的字符串代替重复的部分,它的输出仅复的部分,它的输出仅仅是指向早期出现过的仅是指向早期出现过的字符串字符串“指针指针”。这里所指的词典是指用这里所指的词典是指用以前处理过的数据表示以前处理过的数据表示编码过程中遇到的重复编码过程中遇到的重复部分。这类编码的所有部分。这类编码的所有算法都是以算法都是以LZ77LZ77算法为算法为基础的。基础的。数字媒体基础数字媒体基础词典编码的种类:词典编码的种类:第二种算法的思想是第二种算法的思想是从输入的数据中创建从输入的数据中创建一个一个“短语词典短语词典”,这类短语不一定有具这类短语不一定有具体的含义,可以是任体的含义,可以是任意字符的组合。在编意字符的组合。在编码过程中遇到在码过程中遇到在“短短语词典语词典”中出现的短中出现的短语是,编码器就输出语是,编码器就输出这个词典中的短语这个词典中的短语“索引号索引号”,而不是短,而不是短语本身。语本身。数字媒体基础数字媒体基础2.4.1 LZ772.4.1 LZ77算法算法LZ77LZ77是以以色列计算机专家是以以色列计算机专家Abraham LempelAbraham Lempel和和Jakob ZivJakob Ziv在在19771977年开发和发表的。年开发和发表的。此算法的一个改进算法是由此算法的一个改进算法是由StorerStorer和和SzymanskiSzymanski在在19821982年开发的,称为年开发的,称为LZSSLZSS算法。算法。LZ77 LZ77 算法在某种意义上又可以称为算法在某种意义上又可以称为“滑动窗口压滑动窗口压缩缩”,该算法将一个虚拟的、可以跟随压缩进程,该算法将一个虚拟的、可以跟随压缩进程滑动的窗口作为词典,要压缩的字符串如果在该滑动的窗口作为词典,要压缩的字符串如果在该窗口中出现,则输出其出现位置和长度。窗口中出现,则输出其出现位置和长度。数字媒体基础数字媒体基础LZ77LZ77算法中涉及的概念算法中涉及的概念 1.1.输入字符流输入字符流(input stream)(input stream):要被压缩的字符序:要被压缩的字符序列。列。2.2.字符字符(character)(character):输入数据流中的基本单元。:输入数据流中的基本单元。3.3.编码位置编码位置(coding position)(coding position):输入数据流中当前:输入数据流中当前要编码的字符位置,指前向缓冲存储器中的开始要编码的字符位置,指前向缓冲存储器中的开始字符。字符。4.4.前向缓冲存储器前向缓冲存储器(Lookahead buffer)(Lookahead buffer):存放从编:存放从编码位置到输入数据流结束的字符序列的存储器。码位置到输入数据流结束的字符序列的存储器。5.5.窗口窗口(window)(window):指包含:指包含W W个字符的窗口,字符是从个字符的窗口,字符是从编码位置开始向后数也就是最后处理的字符数。编码位置开始向后数也就是最后处理的字符数。6.6.指针指针(pointer)(pointer):指向窗口中的匹配串且含长度的:指向窗口中的匹配串且含长度的指针。指针。数字媒体基础数字媒体基础LZ77LZ77算法具体步骤算法具体步骤(1 1)把编码位置设置到输入数据流的开始位置。)把编码位置设置到输入数据流的开始位置。(2 2)找窗口中最长的匹配串)找窗口中最长的匹配串(3 3)以)以“(Pointer,Length)Characters(Pointer,Length)Characters”的格式的格式输出,其中输出,其中PointerPointer是指向窗口中匹配串的指针,是指向窗口中匹配串的指针,LengthLength表示匹配字符的长度,表示匹配字符的长度,CharactersCharacters是前向是前向缓冲存储器中的不匹配的第缓冲存储器中的不匹配的第1 1个符。个符。(4 4)如果前向缓冲存储器不是空的,则把编码位置)如果前向缓冲存储器不是空的,则把编码位置和窗口向前移和窗口向前移(Length+1)(Length+1)个字符,然后返回到步个字符,然后返回到步骤(骤(2 2)。)。数字媒体基础数字媒体基础2.4.2 LZW2.4.2 LZW算法算法LZWLZW压缩算法是一种新颖的压缩方法,它采用了一压缩算法是一种新颖的压缩方法,它采用了一种先进的串表压缩,将每个第一次出现的串放在种先进的串表压缩,将每个第一次出现的串放在一个串表中,用一个数字来表示串,压缩文件只一个串表中,用一个数字来表示串,压缩文件只存贮数字,则不存贮串,从而使图像文件的压缩存贮数字,则不存贮串,从而使图像文件的压缩效率得到较大的提高。效率得到较大的提高。LZWLZW编码是围绕称为词典的转换表来完成的。编码是围绕称为词典的转换表来完成的。数字媒体基础数字媒体基础LZWLZW算法中的术语和符号算法中的术语和符号 1.1.前缀前缀(Prefix)(Prefix):在一个字符之前的字符序列。在一个字符之前的字符序列。2.2.缀缀-符串符串(String)(String):前缀字符。:前缀字符。3.3.码字码字(Code word)(Code word):4.4.码字流码字流(Codestream)(Codestream):5.5.词典词典(Dictionary)(Dictionary):缀缀-符串表。符串表。6.6.当前前缀当前前缀(Current prefix)(Current prefix):7.7.当前字符当前字符(Current character)(Current character):8.8.当前码字当前码字(Current code word)(Current code word):数字媒体基础数字媒体基础LZWLZW编码算法执行步骤编码算法执行步骤 1.1.开始时的词典包含所有可能的根开始时的词典包含所有可能的根(Root)(Root),而当前,而当前前缀前缀P P是空的;是空的;2.2.当前字符当前字符(C)(C):=字符流中的下一个字符;字符流中的下一个字符;3.3.判断缀判断缀-符串符串P+CP+C是否在词典中是否在词典中1 1)如果)如果“是是”:P P:=P+C/(=P+C/(用用C C扩展扩展P)P);2 2)如果)如果“否否”:把代表当前前缀把代表当前前缀P P的码字输出的码字输出到码字流;到码字流;把缀把缀-符串符串P+CP+C添加到词典;添加到词典;令令P P:=C/(=C/(现在的现在的P P仅包含一个字符仅包含一个字符C)C);判断字符流中是否还有字符要编码判断字符流中是否还有字符要编码1 1)如果)如果“是是”,就返回到步骤,就返回到步骤2 2;2 2)如果)如果“否否”:把代表当前前缀把代表当前前缀P P的码字输出的码字输出到码字流;到码字流;结束。结束。数字媒体基础数字媒体基础2.5 2.5 脉冲编码调制脉冲编码调制脉冲编码调制脉冲编码调制 (PCM)(PCM)就是将模拟调制信号的采样值变换为就是将模拟调制信号的采样值变换为脉冲码组。脉冲码组。PCMPCM编码包括如下三个过程:编码包括如下三个过程:采样,将模拟信号转换为时间离散的样本脉冲序列。采样,将模拟信号转换为时间离散的样本脉冲序列。量化,将离散时间连续幅度的抽样信号转换成为离散量化,将离散时间连续幅度的抽样信号转换成为离散时间离散幅度的数字信号。时间离散幅度的数字信号。编码,用一定位数的脉冲码组表示量化采样值。编码,用一定位数的脉冲码组表示量化采样值。数字媒体基础数字媒体基础PCMPCM系统原理图系统原理图 数字媒体基础数字媒体基础PCMPCM编码的优点编码的优点有很强的抗干扰性有很强的抗干扰性能方便的利用计算机编程,实现各种能方便的利用计算机编程,实现各种智能化设计。智能化设计。数字媒体基础数字媒体基础2.6 2.6 增量调制(增量调制(DMDM)增量调制也称增量调制也称调制调制(DM)(DM),它是一种预测编码技,它是一种预测编码技术,是术,是PCMPCM编码的一种变形。编码的一种变形。DMDM是对实际的采样信号与预测的采样信号之差的是对实际的采样信号与预测的采样信号之差的极性进行编码,将极性变成极性进行编码,将极性变成“0 0”和和“1 1”这两种这两种可能的取值之一。如果实际的采样信号与预测的可能的取值之一。如果实际的采样信号与预测的采样信号之差的极性为采样信号之差的极性为“正正”,则用,则用“1 1”表示;表示;相反则用相反则用“0 0”表示,或者相反。表示,或者相反。数字媒体基础数字媒体基础DMDM波形编码的原理波形编码的原理 在开始阶段增量调制器的输出不能保持跟踪输入信号的快速变化,在开始阶段增量调制器的输出不能保持跟踪输入信号的快速变化,这种现象就称为增量调制器的这种现象就称为增量调制器的“斜率过载斜率过载”。在输入信号缓慢变化部分,即输入信号与预测信号的差值接近零在输入信号缓慢变化部分,即输入信号与预测信号的差值接近零的区域,增量调制器的输出出现随机交变的的区域,增量调制器的输出出现随机交变的“0 0”和和“1 1”。这种。这种现象称为增量调制器的粒状噪声。现象称为增量调制器的粒状噪声。数字媒体基础数字媒体基础2.7 2.7 差分脉冲编码调制差分脉冲编码调制差分脉冲编码调制(差分脉冲编码调制(DPCMDPCM)是利用样本与样)是利用样本与样本之间存在的信息冗余度来进行编码的一种数本之间存在的信息冗余度来进行编码的一种数据压缩技术。据压缩技术。差值脉冲编码调制是利用信号的相关性找出可差值脉冲编码调制是利用信号的相关性找出可以反映信号变化特征的一个差值量进行编码。以反映信号变化特征的一个差值量进行编码。数字媒体基础数字媒体基础DPCMDPCM的基本工作原理的基本工作原理根据过去的样本去估算(根据过去的样本去估算(estimateestimate)下一个样本)下一个样本信号的幅度大小,这个值称为预测值,然后对实信号的幅度大小,这个值称为预测值,然后对实际信号值与预测值之差进行量化编码,从而就减际信号值与预测值之差进行量化编码,从而就减少了表示每个样本信号的位数。少了表示每个样本信号的位数。它与脉冲编码调制(它与脉冲编码调制(PCMPCM)不同处在于,)不同处在于,PCMPCM是直是直接对采样信号进行量化编码,而接对采样信号进行量化编码,而DPCMDPCM是对实际信是对实际信号值与预测值之差进行量化编码。号值与预测值之差进行量化编码。数字媒体基础数字媒体基础DPCMDPCM的原理图的原理图 量化器量化器S(k)+逆量化器逆量化器预测器预测器d(k)I(k)Se(k-1)8比特比特PCM样本样本kPCM样本样本k-1Se(k-1)dq(k)Sr(k)+-目录目录数字媒体基础数字媒体基础3 3 数字媒体压缩标准数字媒体压缩标准3.1 3.1 声音压缩标准声音压缩标准 MP3MP3是是MPEG-1MPEG-1的标准草案中音频编码的的标准草案中音频编码的Layer 3Layer 3。MP3 MP3 最大特点是能以较小的比特率、较大压缩比最大特点是能以较小的比特率、较大压缩比达到近乎完美的达到近乎完美的CDCD音质,制作简单,交流方便。音质,制作简单,交流方便。MP3MP3压缩编码是一个国际性全开放的编码方案压缩编码是一个国际性全开放的编码方案,其其编码算法流程大致分为时频映射、心理声学模型、编码算法流程大致分为时频映射、心理声学模型、量化编码三大功能模块,这三个功能模块是实现量化编码三大功能模块,这三个功能模块是实现MP3 MP3 编码的关键。编码的关键。数字媒体基础数字媒体基础MP4MP4MP4MP4是是MPEG-2 AAC(ISO/IEC 13818-7)MPEG-2 AAC(ISO/IEC 13818-7)技术技术(Advanced Audio Coding)(Advanced Audio Coding)。MP4MP4的特点是音质更加完美而压缩比更大。它增加的特点是音质更加完美而压缩比更大。它增加了诸如对立体声的完美再现、比特流效果音扫描、了诸如对立体声的完美再现、比特流效果音扫描、多媒体控制、降噪等多媒体控制、降噪等MP3MP3没有的特性,使得在音频没有的特性,使得在音频压缩后仍能完美的再现压缩后仍能完美的再现CDCD的音质。的音质。数字媒体基础数字媒体基础3.2 3.2 图像压缩标准图像压缩标准JPEGJPEG是国际标准组织是国际标准组织(ISO)(ISO)和国际电工委员会和国际电工委员会(IECIEC)制定出的第一套国际静态图像压缩标准:)制定出的第一套国际静态图像压缩标准:ISO/IEC 10918ISO/IEC 109181 1号标准号标准 “多灰度连续色调静态多灰度连续色调静态图像压缩编码图像压缩编码”俗称为俗称为JPEGJPEG,以其优异的性能,以其优异的性能,该标准一直到当前仍被因特网、数码相机等很多该标准一直到当前仍被因特网、数码相机等很多领域广泛应用。领域广泛应用。JPEGJPEG包含两种基本的压缩算法:无损压缩算法包含两种基本的压缩算法:无损压缩算法(基于差分脉冲调制(基于差分脉冲调制 )和有损压缩算法(基于离)和有损压缩算法(基于离散余弦变换散余弦变换 )。)。可达到可达到15201520的压缩比。的压缩比。数字媒体基础数字媒体基础JPEG 2000 JPEG 2000 JPEG 2000 JPEG 2000 弥补了传统弥补了传统JPEGJPEG压缩技术缺陷,压缩技术缺陷,有以下优点:有以下优点:高压缩率高压缩率 支持无损压缩和有损压缩支持无损压缩和有损压缩 渐进传输渐进传输 对感兴趣区域压缩对感兴趣区域压缩 数字媒体基础数字媒体基础3.3 3.3 运动图像压缩标准运动图像压缩标准1 1、MPEGMPEG标准标准 运动图像专家组运动图像专家组MPEGMPEG是由国际标准化组织是由国际标准化组织ISOISO和国际电工委员会和国际电工委员会IECIEC联合成立的,负责开发电视联合成立的,负责开发电视图像数据和声音数据的编码、解码和它们的同步图像数据和声音数据的编码、解码和它们的同步标准。这个专家组开发的标准称为标准。这个专家组开发的标准称为MPEGMPEG标准。标准。数字媒体基础数字媒体基础MPEG-1 MPEG-1 标准标准 MPEG-1 MPEG-1 标准于标准于19931993年公布,用于传输年公布,用于传输1.5Mbps1.5Mbps数据传数据传输率的数字存储媒体运动图像及其伴音的编码。输率的数字存储媒体运动图像及其伴音的编码。该标准包括五个部分,分别为:系统、电视图像、音该标准包括五个部分,分别为:系统、电视图像、音频、一致性测试和软件模拟。频、一致性测试和软件模拟。MPEG-1MPEG-1的数据流包含:图像流、伴音流和系统流三种的数据流包含:图像流、伴音流和系统流三种成分。成分。数字媒体基础数字媒体基础MPEG-1 MPEG-1 译码器方框图译码器方框图图像流包含画面信息,伴音流包含声音信息,系统图像流包含画面信息,伴音流包含声音信息,系统流实现图像和伴音的同步,所有播放流实现图像和伴音的同步,所有播放MPEGMPEG图像和伴图像和伴音数据所需的时钟信息都包含在系统流中。音数据所需的时钟信息都包含在系统流中。数字媒体基础数字媒体基础 MPEG-2 MPEG-2 标准标准 MPEG-2MPEG-2标准包括了系统、电视图像、音频、一致性测标准包括了系统、电视图像、音频、一致性测试、软件模拟、数字存储媒体命令和控制扩展协议、试、软件模拟、数字存储媒体命令和控制扩展协议、先进声音编码、编码器实时接口扩展标准、先进声音编码、编码器实时接口扩展标准、DSM-CCDSM-CC一一致性扩展测试等。致性扩展测试等。MPEG-2MPEG-2的主要特点是:的主要特点是:1 1)MPEG-2MPEG-2解码器兼容解码器兼容MPEG-1MPEG-1和和MPEG-2MPEG-2标准。标准。2 2)其视频数据速率为)其视频数据速率为3 Mb/s3 Mb/s15Mb/s15Mb/s,基本分辨率,基本分辨率为为720576720576像素,每秒可播放像素,每秒可播放3030帧画面。帧画面。3 3)可以)可以301301或更低的压缩比提供具有广播级质量或更低的压缩比提供具有广播级质量的视频图像。的视频图像。4 4)允许在画面质量、存储容量和带宽之间选择,在)允许在画面质量、存储容量和带宽之间选择,在一定范围内改变压缩比。一定范围内改变压缩比。数字媒体基础数字媒体基础MPEG-4 MPEG-4 标准标准 MPEG-4MPEG-4标准于标准于19981998年年1111月公布,是各种音频月公布,是各种音频/视频视频对象的编码,包括了系统、电视图像、音频、一对象的编码,包括了系统、电视图像、音频、一致性测试和参考软件、传输多媒体集成框架等。致性测试和参考软件、传输多媒体集成框架等。MPEG-4MPEG-4为多媒体数据压缩编码提供的是一种格式、为多媒体数据压缩编码提供的是一种格式、一种框架,而不是具体算法,以建立一种更自由一种框架,而不是具体算法,以建立一种更自由的通信与开发环境。的通信与开发环境。MPEG-4MPEG-4的目标是支持多种多媒体的应用,特别是的目标是支持多种多媒体的应用,特别是多媒体信息基于内容的检索和访问,可以根据不多媒体信息基于内容的检索和访问,可以根据不同的应用需求现场配置解码器。其编码系统也是同的应用需求现场配置解码器。其编码系统也是开放的,可以随时加入新的有效的算法模块。开放的,可以随时加入新的有效的算法模块。数字媒体基础数字媒体基础MPEG-7 MPEG-7 标准标准MPEG-7MPEG-7标准于标准于20012001年公布,称为多媒体内容描述接口,年公布,称为多媒体内容描述接口,包括系统、描述定义语言、电视图像、音频、多媒体包括系统、描述定义语言、电视图像、音频、多媒体描述框架、参考软件以及一致性测试七个部分。描述框架、参考软件以及一致性测试七个部分。MPEG-7MPEG-7标准的目的是产生一个描述多媒体内容的标准,标准的目的是产生一个描述多媒体内容的标准,支持对多媒体信息在不同程度层面上的解释和理解,支持对多媒体信息在不同程度层面上的解释和理解,从而使其可以根据用户的需要进行传递和存取。从而使其可以根据用户的需要进行传递和存取。MPEG-7MPEG-7注重的是提供视听信息内容的描述方案,并不注重的是提供视听信息内容的描述方案,并不包括针对不同应用的特征提取方法和搜索引擎。包括针对不同应用的特征提取方法和搜索引擎。数字媒体基础数字媒体基础MPEG-21 MPEG-21 标准标准 MPEG-21MPEG-21基于两个基本概念:分布和处理基本单元基于两个基本概念:分布和处理基本单元(Digital ItemDigital Item,DIDI)以及)以及DIDI与用户间的互操作。与用户间的互操作。MPEG-21MPEG-21可表述为以一种高效、透明和可以互操作的方可表述为以一种高效、透明和可以互操作的方式支持用户交换、接入、使用甚至操作式支持用户交换、接入、使用甚至操作DIDI的技术。的技术。DIDI是是MPEG-21MPEG-21框架中一个具有标准表示、身份认证和框架中一个具有标准表示、身份认证和相关元数据的数字对象。这个实体是框架中分布和相关元数据的数字对象。这个实体是框架中分布和处理的基本单元。处理的基本单元。用户是指与用户是指与MPEG-21MPEG-21进行环境交互或者使用进行环境交互或者使用DIDI的任何的任何实体。实体。MPEG-21MPEG-21可以被看成是提供用户间交互的一个框架。可以被看成是提供用户间交互的一个框架。数字媒体基础数字媒体基础2 2、H.26XH.26X系列视频标准系列视频标准H.26XH.26X系列视频标准是国际电信联盟系列视频标准是国际电信联盟ITUITU的视频编码专的视频编码专家组(家组(ITU-TITU-T)制定的系列图像压缩标准,主要有)制定的系列图像压缩标准,主要有H.261H.261、H.263H.263、H264H264等。这些视频标准主要应用于实等。这些视频标准主要应用于实时视频通信领域,如会议电视、可视电话等。时视频通信领域,如会议电视、可视电话等。H.261H.261又称又称P x 64P x 64,传输码率为,传输码率为P x 64kbpsP x 64kbps,其中,其中P P可可变。根据图像传输清晰度的不同,传输码率变化范围变。根据图像传输清晰度的不同,传输码率变化范围在在64kbps64kbps至至1.92Mbps1.92Mbps之间,编码方法包括之间,编码方法包括DCTDCT变换,变换,可控步长线性量化,变长编码及预测编码等。可控步长线性量化,变长编码及预测编码等。数字媒体基础数字媒体基础2 2、H.26XH.26X系列视频标准(续)系列视频标准(续)H.263H.263是是ITU-TITU-T为低于为低于64kb/s64kb/s的窄带通信信道制定的窄带通信信道制定的视频编码标准,其标准输入图像格式可以是的视频编码标准,其标准输入图像格式可以是S-S-QCIFQCIF、QCIFQCIF、CIFCIF、4CIF4CIF或者或者16CIF16CIF的彩色的彩色420420子取样图像。子取样图像。H.264H.264引入了很多先进的技术,可得到较高的压缩引入了很多先进的技术,可得到较高的压缩比,但提高了算法的复杂度比,但提高了算法的复杂度 。因此。因此H.264H.264标准中加标准中加入了去块效应滤波器,对块的边界进行滤波。入了去块效应滤波器,对块的边界进行滤波。数字媒体基础数字媒体基础3 3、AVSAVS标准标准AVSAVS(Audio Video StandardsAudio Video Standards)是中国自主制定的音视)是中国自主制定的音视频编码技术标准,其核心是把数字视频和音频数据压缩频编码技术标准,其核心是把数字视频和音频数据压缩为原来的几十分之一甚至百分之一以下。为原来的几十分之一甚至百分之一以下。AVSAVS标准包括系统、视频、音频、数字版权保护等四个标准包括系统、视频、音频、数字版权保护等四个主要技术标准和一致性测试等支撑标准。主要技术标准和一致性测试等支撑标准。AVS-AVS-视频当中具有特征性的核心技术包括:视频当中具有特征性的核心技术包括:8x88x8整数变整数变换、量化、帧内预测、换、量化、帧内预测、1/41/4精度像素插值、特殊的帧间精度像素插值、特殊的帧间预测运动补偿、二维熵编码、去块效应环内滤波等。预测运动补偿、二维熵编码、去块效应环内滤波等。目录目录