数字媒体压缩技术.ppt
《数字媒体压缩技术.ppt》由会员分享,可在线阅读,更多相关《数字媒体压缩技术.ppt(61页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数字媒体基础数字媒体基础数字媒体基础数字媒体基础数字媒体压缩技术数字媒体压缩技术教学目标:教学目标:(1 1)了解数字媒体数据压缩的原因。)了解数字媒体数据压缩的原因。(2 2)理解数字媒体数据压缩技术的不同分类。)理解数字媒体数据压缩技术的不同分类。(3 3)掌握通用的数据压缩编码算法。)掌握通用的数据压缩编码算法。(4 4)了解各种数字媒体数据压缩的标准。)了解各种数字媒体数据压缩的标准。数字媒体基础数字媒体基础学习内容:学习内容:1 1 数据压缩及分类数据压缩及分类2 2 通用的数据压缩技术通用的数据压缩技术3 3 数字媒体压缩标准数字媒体压缩标准数字媒体基础数字媒体基础1.1 1.1
2、压缩的可能性与信息冗余压缩的可能性与信息冗余 经过数字化处理后的图形、图像、视频和音经过数字化处理后的图形、图像、视频和音频等媒体信息的数据量非常大,如果不进行数据压频等媒体信息的数据量非常大,如果不进行数据压缩,计算机系统就无法对它进行存储、交换和传输。缩,计算机系统就无法对它进行存储、交换和传输。1 1)数字图像)数字图像2 2)数字视频)数字视频3 3)数字音频)数字音频(数据量的计算)(数据量的计算)1 1 数据压缩及分类数据压缩及分类数字媒体基础数字媒体基础1.1 1.1 压缩的可能性与信息冗余压缩的可能性与信息冗余 数据能够被压缩的主要原因在于媒体数据中存数据能够被压缩的主要原因在
3、于媒体数据中存在数据的信息冗余。信息量包含在数据之中,一在数据的信息冗余。信息量包含在数据之中,一般的数据冗余主要体现在:般的数据冗余主要体现在:1 1)空间冗余)空间冗余 2 2)结构冗余)结构冗余 3 3)时间冗余)时间冗余 4 4)视觉冗余)视觉冗余 5 5)知识冗余)知识冗余 6 6)信息熵冗余)信息熵冗余 1 1 数据压缩及分类数据压缩及分类数字媒体基础数字媒体基础1.2 1.2 数据压缩分类数据压缩分类数字媒体基础数字媒体基础按信息压缩前后比较是否有损失进行划分:按信息压缩前后比较是否有损失进行划分:无损压缩无损压缩指使用压缩后的数据进行重构(还原指使用压缩后的数据进行重构(还原或
4、解压缩),重构后的数据与原来的数据完全或解压缩),重构后的数据与原来的数据完全相同。常用的无损压缩算法有霍夫曼相同。常用的无损压缩算法有霍夫曼(Huffman)(Huffman)算法和算法和LZWLZW算法算法 。也称为可逆编码。也称为可逆编码。有损压缩有损压缩指使用压缩后的数据进行重构,重构指使用压缩后的数据进行重构,重构后的数据与原来的数据有所不同,但不影响人后的数据与原来的数据有所不同,但不影响人对原始资料表达的信息造成误解。也称为不可对原始资料表达的信息造成误解。也称为不可逆编码。逆编码。数字媒体基础数字媒体基础按数据压缩编码的原理和方法进行划分:按数据压缩编码的原理和方法进行划分:统
5、计编码统计编码:主要针对:主要针对无记忆信源无记忆信源,根据信息码,根据信息码字出现概率的分布特征而进行压缩编码,寻找字出现概率的分布特征而进行压缩编码,寻找概率与码字长度间的最优匹配。概率与码字长度间的最优匹配。预测编码预测编码:是利用空间中相邻数据的相关性来:是利用空间中相邻数据的相关性来进行压缩数据的。进行压缩数据的。变换编码变换编码:是将图像时域信号转换为频域信号:是将图像时域信号转换为频域信号进行处理。进行处理。分析分析 合成编码合成编码:是指通过对源数据的分析,:是指通过对源数据的分析,将其分解成一系列更适合于表示的将其分解成一系列更适合于表示的“基元基元”或或从中提取若干更为本质
6、意义的参数,编码仅对从中提取若干更为本质意义的参数,编码仅对这些基本单元或特征参数进行。这些基本单元或特征参数进行。数字媒体基础数字媒体基础无记忆信源无记忆信源【无记忆信源无记忆信源】(1 1)存在一个或多个基本符号集;()存在一个或多个基本符号集;(2 2)将多)将多个基本符号集做笛卡儿积,形成一定长度的联合概率空间;个基本符号集做笛卡儿积,形成一定长度的联合概率空间;(3 3)运用外力的功(电动势)将单个符号或一定长度的符号)运用外力的功(电动势)将单个符号或一定长度的符号序列从随机事件转化成必然事件,或者说,将一个随机系统序列从随机事件转化成必然事件,或者说,将一个随机系统转化成一个必然
7、系统;并且转化成一个必然系统;并且回退到原始空间中来,该原始空回退到原始空间中来,该原始空间的概率分布不因为事件的发生而改变间的概率分布不因为事件的发生而改变。【有记忆信源有记忆信源】(1 1)存在一个或多个基本符号集;()存在一个或多个基本符号集;(2 2)将多)将多个基本符号集做笛卡儿积,形成一定长度的联合概率空间;个基本符号集做笛卡儿积,形成一定长度的联合概率空间;(3 3)运用外力的功(电动势)将单个符号或一定长度的符号)运用外力的功(电动势)将单个符号或一定长度的符号序列从随机事件转化成必然事件,或者说,将一个随机系统序列从随机事件转化成必然事件,或者说,将一个随机系统转化成一个必然
8、系统;转化成一个必然系统;不能回退到原始空间中来,即原始空不能回退到原始空间中来,即原始空间的概率分布因为事件的发生而改变间的概率分布因为事件的发生而改变。数字媒体基础数字媒体基础按照媒体的类型进行压缩划分:按照媒体的类型进行压缩划分:图像压缩标准:图像压缩标准:JPEGJPEG等等声音压缩标准:声音压缩标准:MP3MP3运动图像压缩标准:运动图像压缩标准:MPEGMPEG、H.26xH.26x系列、系列、AVSAVS目录目录数字媒体基础数字媒体基础2 2 通用的数据压缩技术通用的数据压缩技术行程编码行程编码字典编码字典编码熵编码等熵编码等PCMPCMDMDMDPCMDPCM 通用的压缩方法具
9、有压缩比低、通用的压缩方法具有压缩比低、通用性强等特点通用性强等特点 无损压缩技术无损压缩技术有损压缩技术有损压缩技术目录目录数字媒体基础数字媒体基础2.1 2.1 编码的理论基础编码的理论基础数据压缩技术的理论基础是信息论。数据压缩技术的理论基础是信息论。根据信息论的原理,可以找到最佳数据压缩编根据信息论的原理,可以找到最佳数据压缩编码方法,数据压缩的理论极限是信息熵。码方法,数据压缩的理论极限是信息熵。熵是信息量的度量方法,它表示某一事件出现熵是信息量的度量方法,它表示某一事件出现的消息越多,事件发生的可能性就越小,数学的消息越多,事件发生的可能性就越小,数学上就是概率越小。上就是概率越小
10、。数字媒体基础数字媒体基础信息与信息量信息与信息量 信息量是指信源中某种事件的信息度量或含量。一个事件出现的可能性愈小,其信息量愈多,反之亦然。若pi为第i个事件的概率为0 pi 1,则该事件的信息量为 一个信源包括的所有数据叫数据量,而数据量中包含有冗余信息。信息量=数据量-冗余量数字媒体基础数字媒体基础信息熵信息熵信息熵就是将信源所有可能事件的信息量的平均。设从N个数中选定任一个数xj的概率为p(xj),假定选定任意一个数的概率都相等,即p(xj)1/N,则 I(xj)log2N-log2 1/N-log2p(xj)=Ip(xj)上式中,p(xj)是信源X发出xj的概率。I(xj)的含义是
11、信源X发出xj这个消息(随机事件)后,接收端收到信息量的量度。数字媒体基础数字媒体基础信息熵信息熵(续续)信源X 发出的xj(j=1,2,n)共n 个随机事件的信息量的统计平均,即H(X)=EI(xj)=H(X)称为信源X 的“熵”,即信源X发出任意一个随机变量的平均信息量。其中,等概率事件的熵最大,假设有N个事件,此时熵为:H(X)数字媒体基础数字媒体基础信息熵信息熵(续续)当当P(x1)1时,时,P(x2)P(x3)P(xj)0 0,此,此时熵为时熵为 H(X)P(x1)0 0由上可得熵的范围为:由上可得熵的范围为:0 0 H(X)数字媒体基础数字媒体基础信息熵信息熵(续续)在编码中用熵值
12、来衡量是否为最佳编码。若以在编码中用熵值来衡量是否为最佳编码。若以L Lc c表示编码器输出码字的平均码长,其计算公表示编码器输出码字的平均码长,其计算公式为:式为:L Lc c (j j=1,2,=1,2,n n)其中:其中:P P(x xj j)是信源是信源X X发出发出x xj j 的概率,的概率,L L(x xj j)为为x xj j的编码长。的编码长。数字媒体基础数字媒体基础信息熵信息熵(续续)平均码长与信息熵之间的关系为:平均码长与信息熵之间的关系为:L Lc cH(H(X X)有冗余,不是最佳。有冗余,不是最佳。L Lc c H(H(X X)不可能。不可能。L Lc c H(H(
13、X X)最佳编码(最佳编码(L Lc c稍大于稍大于H(H(X X))熵值为平均码长熵值为平均码长L Lc c的下限。的下限。数字媒体基础数字媒体基础2.2 2.2 霍夫曼编码霍夫曼编码 霍夫曼编码(Huffman)是运用信息熵原理的一种无损编码方法,这种编码方法根据源数据各信号发生的概率进行编码。在源数据中出现概率大的信号,分配的码字越短;出现概率越小的信号,其码字越长,从而达到用尽可能少的码表示源数据。数字媒体基础数字媒体基础霍夫曼编码的算法:霍夫曼编码的算法:1.初始化,根据符号概率的大小顺序对符号进行排序。2.把概率最小的两个符号组成一个新符号(节点),即新符号的概率等于这两个符号概率
14、之和。3.重复第2步,直到形成一个符号为止(树),其概率和等于1。4.分配码字。码字分配从最后一步开始反向进行,即从最后两个概率开始逐渐向前进行编码,对于每次相加的两个概率,给概率大的赋“0”,概率小的赋“1”(也可以全部相反,如果两个概率相等,则从中任选一个赋“0”,另一个赋“1”)。数字媒体基础数字媒体基础霍夫曼编码构造出来的编码值不是唯一的。霍夫曼编码构造出来的编码值不是唯一的。对不同信号源的编码效率不同。对不同信号源的编码效率不同。由于编码长度可变,因此译码时间较长;编由于编码长度可变,因此译码时间较长;编码长度的不统一,也使得硬件实现有难度。码长度的不统一,也使得硬件实现有难度。霍夫
15、曼编码的特点:霍夫曼编码的特点:数字媒体基础数字媒体基础2.3 2.3 行程编码行程编码 行程编码又称行程长度编码(行程编码又称行程长度编码(Run Length EncodingRun Length Encoding,RLERLE),是一种熵编码。这种编码方法广泛地应用于各),是一种熵编码。这种编码方法广泛地应用于各种图像格式的数据压缩处理中。种图像格式的数据压缩处理中。行程编码的原理是在给定的图像数据中寻找连续重复的行程编码的原理是在给定的图像数据中寻找连续重复的数值,然后用两个字符取代这些连续值。即将具有相同数值,然后用两个字符取代这些连续值。即将具有相同值的连续串用其串长和一个代表值来
16、代替,该连续串就值的连续串用其串长和一个代表值来代替,该连续串就称为行程,串长称为行程长度。称为行程,串长称为行程长度。数字媒体基础数字媒体基础2.3 2.3 行程编码行程编码假定一幅灰度图像,第假定一幅灰度图像,第n n行的像素值为:行的像素值为:用用RLERLE编码方法得到的代码为:编码方法得到的代码为:4 41606084 4114140。代码斜黑体表示的数字是行程长度,黑体字后代码斜黑体表示的数字是行程长度,黑体字后面的数字代表像素的颜色值。面的数字代表像素的颜色值。数字媒体基础数字媒体基础行程编码分类:行程编码分类:定长编码定长编码定长编码是指编码的行程长度所用的二进制定长编码是指编
17、码的行程长度所用的二进制位数固定位数固定 不定长编码不定长编码变长行程编码是指对不同范围的行程长度使变长行程编码是指对不同范围的行程长度使用不同位数的二进制位数进行编码。使用变用不同位数的二进制位数进行编码。使用变长行程编码需要增加标志位来表明所使用的长行程编码需要增加标志位来表明所使用的二进制位数。二进制位数。数字媒体基础数字媒体基础2.4 2.4 词典编码词典编码 词典编码(词典编码(dictionary encodingdictionary encoding)技术)技术属于无损压缩技术,主要是利用数据本身包含属于无损压缩技术,主要是利用数据本身包含许多重复的字符串的特性。可以用一些简单的
18、许多重复的字符串的特性。可以用一些简单的代号代替这些字符串,就可以实现压缩,实际代号代替这些字符串,就可以实现压缩,实际上就是利用了信源符号之间的相关性。字符串上就是利用了信源符号之间的相关性。字符串与代号的对应表就是词典。与代号的对应表就是词典。数字媒体基础数字媒体基础词典编码的种类:词典编码的种类:第一种方法的思想是查第一种方法的思想是查找目前正在压缩的字符找目前正在压缩的字符序列在以前输入的数据序列在以前输入的数据中是否出现过,然后用中是否出现过,然后用出现过的字符串代替重出现过的字符串代替重复的部分,它的输出仅复的部分,它的输出仅仅是指向早期出现过的仅是指向早期出现过的字符串字符串“指
19、针指针”。这里所指的词典是指用这里所指的词典是指用以前处理过的数据表示以前处理过的数据表示编码过程中遇到的重复编码过程中遇到的重复部分。这类编码的所有部分。这类编码的所有算法都是以算法都是以LZ77LZ77算法为算法为基础的。基础的。数字媒体基础数字媒体基础词典编码的种类:词典编码的种类:第二种算法的思想是第二种算法的思想是从输入的数据中创建从输入的数据中创建一个一个“短语词典短语词典”,这类短语不一定有具这类短语不一定有具体的含义,可以是任体的含义,可以是任意字符的组合。在编意字符的组合。在编码过程中遇到在码过程中遇到在“短短语词典语词典”中出现的短中出现的短语是,编码器就输出语是,编码器就
20、输出这个词典中的短语这个词典中的短语“索引号索引号”,而不是短,而不是短语本身。语本身。数字媒体基础数字媒体基础2.4.1 LZ772.4.1 LZ77算法算法LZ77LZ77是以以色列计算机专家是以以色列计算机专家Abraham LempelAbraham Lempel和和Jakob ZivJakob Ziv在在19771977年开发和发表的。年开发和发表的。此算法的一个改进算法是由此算法的一个改进算法是由StorerStorer和和SzymanskiSzymanski在在19821982年开发的,称为年开发的,称为LZSSLZSS算法。算法。LZ77 LZ77 算法在某种意义上又可以称为算
21、法在某种意义上又可以称为“滑动窗口压滑动窗口压缩缩”,该算法将一个虚拟的、可以跟随压缩进程,该算法将一个虚拟的、可以跟随压缩进程滑动的窗口作为词典,要压缩的字符串如果在该滑动的窗口作为词典,要压缩的字符串如果在该窗口中出现,则输出其出现位置和长度。窗口中出现,则输出其出现位置和长度。数字媒体基础数字媒体基础LZ77LZ77算法中涉及的概念算法中涉及的概念 1.1.输入字符流输入字符流(input stream)(input stream):要被压缩的字符序:要被压缩的字符序列。列。2.2.字符字符(character)(character):输入数据流中的基本单元。:输入数据流中的基本单元。3
22、.3.编码位置编码位置(coding position)(coding position):输入数据流中当前:输入数据流中当前要编码的字符位置,指前向缓冲存储器中的开始要编码的字符位置,指前向缓冲存储器中的开始字符。字符。4.4.前向缓冲存储器前向缓冲存储器(Lookahead buffer)(Lookahead buffer):存放从编:存放从编码位置到输入数据流结束的字符序列的存储器。码位置到输入数据流结束的字符序列的存储器。5.5.窗口窗口(window)(window):指包含:指包含W W个字符的窗口,字符是从个字符的窗口,字符是从编码位置开始向后数也就是最后处理的字符数。编码位置开
23、始向后数也就是最后处理的字符数。6.6.指针指针(pointer)(pointer):指向窗口中的匹配串且含长度的:指向窗口中的匹配串且含长度的指针。指针。数字媒体基础数字媒体基础LZ77LZ77算法具体步骤算法具体步骤(1 1)把编码位置设置到输入数据流的开始位置。)把编码位置设置到输入数据流的开始位置。(2 2)找窗口中最长的匹配串)找窗口中最长的匹配串(3 3)以)以“(Pointer,Length)Characters(Pointer,Length)Characters”的格式的格式输出,其中输出,其中PointerPointer是指向窗口中匹配串的指针,是指向窗口中匹配串的指针,Le
24、ngthLength表示匹配字符的长度,表示匹配字符的长度,CharactersCharacters是前向是前向缓冲存储器中的不匹配的第缓冲存储器中的不匹配的第1 1个符。个符。(4 4)如果前向缓冲存储器不是空的,则把编码位置)如果前向缓冲存储器不是空的,则把编码位置和窗口向前移和窗口向前移(Length+1)(Length+1)个字符,然后返回到步个字符,然后返回到步骤(骤(2 2)。)。数字媒体基础数字媒体基础2.4.2 LZW2.4.2 LZW算法算法LZWLZW压缩算法是一种新颖的压缩方法,它采用了一压缩算法是一种新颖的压缩方法,它采用了一种先进的串表压缩,将每个第一次出现的串放在种
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字 媒体 压缩 技术
限制150内