第4章 多媒体数据压缩与编码技术.ppt
《第4章 多媒体数据压缩与编码技术.ppt》由会员分享,可在线阅读,更多相关《第4章 多媒体数据压缩与编码技术.ppt(75页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第4章章 多媒体数据压缩与编码技术多媒体数据压缩与编码技术本章重点:本章重点:编码模型编码模型 编码压缩方法分类编码压缩方法分类 统计编码的基本原理统计编码的基本原理 预测编码的基本原理预测编码的基本原理 变换编码的基本原理变换编码的基本原理 视频编码的基本原理视频编码的基本原理第第4 4章章 多媒体数据压缩与编码技术多媒体数据压缩与编码技术4.1 4.1 编码压缩的必要性与可能性编码压缩的必要性与可能性 4.2 4.2 编码模型编码模型 4.3 4.3 编码压缩方法分类编码压缩方法分类 4.4 4.4 统计编码统计编码 4.5 4.5 预测编码预测编码 4.6 4.6 变换编码变换编码 4
2、.7 4.7 其他编码其他编码 4.8 4.8 视频编码视频编码 4.9 4.9 本章小结本章小结4.1 4.1 编码压缩的必要性与可能性编码压缩的必要性与可能性4.1.1 4.1.1 编码压缩的必要性编码压缩的必要性4.1.2 4.1.2 编码压缩的可能性编码压缩的可能性 4.1.1 4.1.1 编码压缩的必要性编码压缩的必要性n众所周知,图像量化所需数据量大。图像和视众所周知,图像量化所需数据量大。图像和视频的庞大数据对计算机的处理速度、存储容量频的庞大数据对计算机的处理速度、存储容量都提出过高的要求。因此必须进行数据量压缩。都提出过高的要求。因此必须进行数据量压缩。n从传送的角度来看,在
3、信道带宽、通信链路容从传送的角度来看,在信道带宽、通信链路容 量一定的前提下,采用编码压缩技术,减少量一定的前提下,采用编码压缩技术,减少传输数据量,是提高通信速度的重要手段。因传输数据量,是提高通信速度的重要手段。因此,更要求数据量压缩。此,更要求数据量压缩。4.1.2 4.1.2 编码压缩的可能性编码压缩的可能性 众所周知,视频由一帧一帧的图像组成,众所周知,视频由一帧一帧的图像组成,而图像的各像素之间,无论是在行方向还是在而图像的各像素之间,无论是在行方向还是在列方向,都存在着一定的相关性,即冗余度。列方向,都存在着一定的相关性,即冗余度。应用某种编码方法提取或减少这些冗余度,便应用某种
4、编码方法提取或减少这些冗余度,便可以达到压缩数据的目的。可以达到压缩数据的目的。常见的静态图像数据冗余包括:常见的静态图像数据冗余包括:n1.1.空间冗余空间冗余 这是静态图像存在的最主要的一种数据冗这是静态图像存在的最主要的一种数据冗余。一幅图像记录了画面上可见景物的颜色。余。一幅图像记录了画面上可见景物的颜色。同一景物表面上各采样点的颜色之间往往存在同一景物表面上各采样点的颜色之间往往存在着空间连贯性,从而产生了空间冗余。着空间连贯性,从而产生了空间冗余。4.1.2 4.1.2 编码压缩的可能性编码压缩的可能性n2.2.时间冗余时间冗余 在视频的相邻帧间,往往包含相同的背景在视频的相邻帧间
5、,往往包含相同的背景和移动物体,因此,后一帧数据与前一帧数据和移动物体,因此,后一帧数据与前一帧数据有许多共同的地方,即在时间上存在大量的冗有许多共同的地方,即在时间上存在大量的冗余。余。n3.3.结构冗余结构冗余 在有些图像的纹理区,图像的像素值存在在有些图像的纹理区,图像的像素值存在着明显的分布模式。例如,方格状的地板图案着明显的分布模式。例如,方格状的地板图案等。我们称这种冗余为结构冗余。等。我们称这种冗余为结构冗余。n4.4.知识冗余知识冗余 有些图像的理解与某些知识有相当大的相有些图像的理解与某些知识有相当大的相关性。例如,人脸的图像有固定的结构。这类关性。例如,人脸的图像有固定的结
6、构。这类4.1.2 4.1.2 编码压缩的可能性编码压缩的可能性 规律性的结构可由先验知识和背景知识得到,规律性的结构可由先验知识和背景知识得到,我们称此类冗余为知识冗余。我们称此类冗余为知识冗余。n5.5.视觉冗余视觉冗余 事实表明,人类的视觉系统对图像场的敏事实表明,人类的视觉系统对图像场的敏感性是非均匀的和非线性的。然而,在记录原感性是非均匀的和非线性的。然而,在记录原始图像数据时,通常假定视觉系统是线性的和始图像数据时,通常假定视觉系统是线性的和均匀的,对视觉敏感和不敏感的部分同等对待,均匀的,对视觉敏感和不敏感的部分同等对待,从而产生了比理想编码更多的数据,这就是视从而产生了比理想编
7、码更多的数据,这就是视觉冗余。觉冗余。n6.6.图像区域的相同性冗余图像区域的相同性冗余 是指在图像中的两个或多个区域所对应的所有是指在图像中的两个或多个区域所对应的所有4.1.2 4.1.2 编码压缩的可能性编码压缩的可能性 像素值相同或相近,从而产生的数据重复性存像素值相同或相近,从而产生的数据重复性存储,这就是图像区域的相似性冗余。储,这就是图像区域的相似性冗余。n7.7.纹理的统计冗余纹理的统计冗余 有些图像纹理尽管不严格服从某有些图像纹理尽管不严格服从某分布规分布规律,但是它在统计的意义上服从该规律。利用律,但是它在统计的意义上服从该规律。利用这种性质也可以减少表示图像的数据量,所以
8、这种性质也可以减少表示图像的数据量,所以我们称之为纹理的统计冗余。我们称之为纹理的统计冗余。4.2 4.2 编码模型编码模型 n4.2.1 4.2.1 信源编码器和信源解码器信源编码器和信源解码器n4.2.2 4.2.2 信道编码器和解码器信道编码器和解码器4.2 4.2 编码模型编码模型 如图如图4.14.1所示,一个压缩系统包括两个不所示,一个压缩系统包括两个不同的结构块:一个编码器和一个解码器。图像同的结构块:一个编码器和一个解码器。图像f f(x x,y y)输入到编码器中,这个编码器可以根)输入到编码器中,这个编码器可以根据输入数据生成一组符号。在通过信道进行传据输入数据生成一组符号
9、。在通过信道进行传输之后,将经过编码的表达符号送入解码器,输之后,将经过编码的表达符号送入解码器,经过重构后,就生成了输出图像。经过重构后,就生成了输出图像。4.2.1 4.2.1 信源编码器和信源解码器信源编码器和信源解码器 信源编码器的任务是减少或消除输入图像信源编码器的任务是减少或消除输入图像中的冗余。编码的框图如图下图中的冗余。编码的框图如图下图(a)(a)所示。所示。从原理来看主要分为三个阶段,第一阶段从原理来看主要分为三个阶段,第一阶段将输入数据转换为可以减少输入图像中像素间将输入数据转换为可以减少输入图像中像素间冗余的数据的集合。第二阶段设法去除原图象冗余的数据的集合。第二阶段设
10、法去除原图象信号的相关性,例如对电视信号就可以去掉帧信号的相关性,例如对电视信号就可以去掉帧内各种相关,还可以去除帧间相关。这样有利内各种相关,还可以去除帧间相关。这样有利 4.2.1 4.2.1 信源编码器和信源解码器信源编码器和信源解码器 于编码压缩。第三阶段就是找一种更近于熵,于编码压缩。第三阶段就是找一种更近于熵,又利于计算机处理的编码方式。又利于计算机处理的编码方式。下图下图(b)中显示的信源解码器仅包含两部中显示的信源解码器仅包含两部分:一个符号解码器和一个反向转换器。这些分:一个符号解码器和一个反向转换器。这些模块的运行次序与编码器的符号编码器和转换模块的运行次序与编码器的符号编
11、码器和转换模块的操作次序相反。模块的操作次序相反。4.2.2 信道编码器和解码器信道编码器和解码器 当信道带有噪声或易于出现错误时,信道编当信道带有噪声或易于出现错误时,信道编码器和解码器就在整个译码解码处理中扮演了码器和解码器就在整个译码解码处理中扮演了重要的角色。重要的角色。最有用的最有用的种信道编码技术是由种信道编码技术是由R Rw wHammingHamming提出的。该技术基于这样的思想,即提出的。该技术基于这样的思想,即向被编码数据中加入足够的位数以确保可用的向被编码数据中加入足够的位数以确保可用的码字间变化的位数最小。例如,利用码字间变化的位数最小。例如,利用HammingHam
12、ming码将码将3 3位冗余码加到位冗余码加到4 4位字上,使得任意两个有位字上,使得任意两个有效码字间的距离为效码字间的距离为3 3,则所有的一位错误都可,则所有的一位错误都可以检测出来并得到纠止。与以检测出来并得到纠止。与4 4位二进制数位二进制数b3b2b1b0b3b2b1b0相联系的相联系的7 7位位Hamming(7Hamming(7,4)4)码字码字 4.2.2 信道编码器和解码器信道编码器和解码器h1h2h1h2h5h6h7h5h6h7是:是:这里表示异或运算。这里表示异或运算。h1h1,h2h2和和h4h4位分别是位分别是位字段位字段b3b2b0b3b2b0,b3b1b0b3b
13、1b0和和b2b1b0b2b1b0的偶校验位。的偶校验位。4.2.2 信道编码器和解码器信道编码器和解码器 为了将汉明(为了将汉明(HammingHamming)编码结果进行解)编码结果进行解码,信道解码器必须为先前设立的偶校验的各码,信道解码器必须为先前设立的偶校验的各个位字段进行奇校验并检查译码值。一位错误个位字段进行奇校验并检查译码值。一位错误由一个非零奇偶校验字由一个非零奇偶校验字c4c2c1c4c2c1给出,这里,给出,这里,4.3 编码压缩方法分类编码压缩方法分类 数据压缩的目标是去除各种冗余。根据压数据压缩的目标是去除各种冗余。根据压缩后是否有信息丢失,多媒体数据压缩技术可缩后是
14、否有信息丢失,多媒体数据压缩技术可分为无损压缩技术和有损压缩技术两类。数据分为无损压缩技术和有损压缩技术两类。数据压缩编码分类如图压缩编码分类如图4.34.3所示。所示。常见的无损压缩技术有:常见的无损压缩技术有:n霍夫曼编码霍夫曼编码n算术编码算术编码n行程编码行程编码n词典编码词典编码 4.3 编码压缩方法分类编码压缩方法分类 常用的一些有损压缩技术包括:常用的一些有损压缩技术包括:n预测编码预测编码n变换编码变换编码n基于模型编码基于模型编码n分形编码分形编码n其他编码其他编码4.3 编码压缩方法分类编码压缩方法分类4.4 统计编码统计编码 统计编码属无损编码,它是根据消息出现统计编码属
15、无损编码,它是根据消息出现概率的分布特性而进行的压缩编码。统计编码概率的分布特性而进行的压缩编码。统计编码又可分为定长码和变长码。又可分为定长码和变长码。常用的统计编码有常用的统计编码有Huffman编码、行程编码和算术编码三种。编码、行程编码和算术编码三种。4.4.1 4.4.1 哈夫曼(哈夫曼(HuffmanHuffman)编码)编码 4.4.2 4.4.2 香农香农-费诺编码费诺编码4.4.3 4.4.3 算术编码算术编码4.4.4 4.4.4 游程编码(游程编码(RLCRLC)4.4.5 LZW4.4.5 LZW编码编码4.4.1 4.4.1 哈夫曼(哈夫曼(HuffmanHuffma
16、n)编码)编码 在一幅图像中,有些图像数据出现的频率在一幅图像中,有些图像数据出现的频率高,有些图像数据出现的频率低。如果对那些高,有些图像数据出现的频率低。如果对那些出现频率高的数据用较少的位数来表示,而出出现频率高的数据用较少的位数来表示,而出现频率低的数据用较多的位数来表示,这样从现频率低的数据用较多的位数来表示,这样从总的效果来看还是节省了存储空间。这种编码总的效果来看还是节省了存储空间。这种编码思想首先由香农(思想首先由香农(ShannonShannon)提出,哈夫曼后)提出,哈夫曼后来对它提出了一种改进的编码方法,用这种方来对它提出了一种改进的编码方法,用这种方法得到的编码称为法得
17、到的编码称为HuffmanHuffman编码,编码,HuffmanHuffman编码编码是一种变长编码。是一种变长编码。4.4.1 4.4.1 哈夫曼(哈夫曼(HuffmanHuffman)编码)编码n1.理论基础理论基础 一个事件集合一个事件集合x1,x2,,xn处于一个基处于一个基本概率空间,其相应概率为本概率空间,其相应概率为p1,p2,,pn,且且p1+p2+pn=1。每一个信息的信息量。每一个信息的信息量为为 (4-3)定义在概率空间中每定义在概率空间中每事件的概率不相等事件的概率不相等时的平均信息量为信息熵,则信息熵时的平均信息量为信息熵,则信息熵H可采用可采用如下公式计算:如下公
18、式计算:(4-4)4.4.1 4.4.1 哈夫曼(哈夫曼(HuffmanHuffman)编码)编码【例例4.14.1】信息熵的计算。信息熵的计算。设设8 8个随机变量具有同等概率为个随机变量具有同等概率为1/81/8,则熵:,则熵:即计算出即计算出H=3H=3比特。比特。n2.Huffman编码编码 Huffman编码是编码是1952年由年由Huffman提出提出的一种编码方法。它在变长编码方法中是最佳的一种编码方法。它在变长编码方法中是最佳的。的。4.4.1 4.4.1 哈夫曼(哈夫曼(HuffmanHuffman)编码)编码设信源设信源A A的信源空间为:的信源空间为:其中其中 ,现用现用
19、r个码符号的码符号集个码符号的码符号集 对信源对信源A中的每个符号中的每个符号 (i1,2,N)进行编码。具体编码的方法是:)进行编码。具体编码的方法是:(1)(1)把信源符号按其出现概率的大小顺序排列起把信源符号按其出现概率的大小顺序排列起来;来;(2)(2)把最末两个具有最小概率的元素之概率加起把最末两个具有最小概率的元素之概率加起来;来;4.4.1 4.4.1 哈夫曼(哈夫曼(HuffmanHuffman)编码)编码 (3)(3)把该概率之和同其余概率由大到小排把该概率之和同其余概率由大到小排队,然队,然 后再把两个最小概率加起来,再重后再把两个最小概率加起来,再重新排队;新排队;重复步
20、骤重复步骤,直到最后只剩下两个概率为止。直到最后只剩下两个概率为止。在上述工作完毕之后,从最后两个概率开在上述工作完毕之后,从最后两个概率开始逐步向前进行编码。对于概率大的赋予始逐步向前进行编码。对于概率大的赋予0 0,小的赋予小的赋予1 1。4.4.1 4.4.1 哈夫曼(哈夫曼(HuffmanHuffman)编码)编码4.4.1 4.4.1 哈夫曼(哈夫曼(HuffmanHuffman)编码)编码 经霍夫曼编码后,平均码长为:经霍夫曼编码后,平均码长为:=0.410.3020.14+0.065+0.045=2.20(bit)4.4.1 4.4.1 哈夫曼(哈夫曼(HuffmanHuffma
21、n)编码)编码n3.Huffman3.Huffman编码的几点说明编码的几点说明 (1 1)HuffmanHuffman编码是最佳的,虽然构造出编码是最佳的,虽然构造出来的码不唯一,但其平均码长却相同,所以不来的码不唯一,但其平均码长却相同,所以不影响编码效率和数据压缩性能。影响编码效率和数据压缩性能。(2 2)由于)由于HuffmanHuffman码的码长参差不齐,因码的码长参差不齐,因此,存在一个输入、输出速率匹配问题。解决此,存在一个输入、输出速率匹配问题。解决的办法是设置一定容量的缓冲存储器。的办法是设置一定容量的缓冲存储器。(3 3)HuffmanHuffman码在存储或传输过程中,
22、如码在存储或传输过程中,如果出现误码,可能会引起误码的连续传播,果出现误码,可能会引起误码的连续传播,1bit1bit的误码可能把一大串码字全部破坏,因此,的误码可能把一大串码字全部破坏,因此,限制了限制了HuffmanHuffman码的使用。码的使用。4.4.1 4.4.1 哈夫曼(哈夫曼(HuffmanHuffman)编码)编码 (4 4)HuffmanHuffman编码对不同信源其编码效率编码对不同信源其编码效率也不尽相同。当信源概率是也不尽相同。当信源概率是2 2的负次幂时,的负次幂时,HuffmanHuffman码的编码效率达到码的编码效率达到100100;当信源概率;当信源概率相等
23、时,其编码效率最低。这表明在使用相等时,其编码效率最低。这表明在使用HuffmanHuffman方法编码时,只有当信源概率分布很方法编码时,只有当信源概率分布很不均匀时,不均匀时,HuffmanHuffman码才会收到显著的效果。码才会收到显著的效果。(5 5)HuffmanHuffman编码应用时,均需要与其他编码应用时,均需要与其他编码结合起来使用,才能进一步提高数据压缩编码结合起来使用,才能进一步提高数据压缩比。例如,在静态图像处理标准比。例如,在静态图像处理标准JPEGJPEG中,先对中,先对图像像素进行图像像素进行DCTDCT变换、量化、变换、量化、Z Z形扫描、游程形扫描、游程编码
24、后,再进行霍夫曼编码。编码后,再进行霍夫曼编码。4.4.24.4.2香农香农-费诺编码费诺编码 具体编码方法如下:具体编码方法如下:(1 1)把)把 按概率由大到小、从上到下排成按概率由大到小、从上到下排成一列,然后把一列,然后把 分成两组分成两组 ,并使,并使这两组符号概率和相等或几乎相等,即:这两组符号概率和相等或几乎相等,即:(2)把两组分别按)把两组分别按0,1赋值赋值,例如将第一组赋例如将第一组赋值为值为0,则第二组赋值为,则第二组赋值为1。然后分组、赋值,。然后分组、赋值,不断反复,直到每组只有一种输入为止。将每不断反复,直到每组只有一种输入为止。将每个所赋的值依次排列起来就是个所
25、赋的值依次排列起来就是香农香农-费诺编码。费诺编码。4.4.24.4.2香农香农-费诺编码费诺编码 以前面的数据为例,香农以前面的数据为例,香农-编码费诺如图编码费诺如图4.54.5所所示。示。4.4.3 4.4.3 算术编码算术编码 理论上,用理论上,用HuffmanHuffman方法对源数据流进行编方法对源数据流进行编码可达到最佳编码效果。但由于计算机中存储、码可达到最佳编码效果。但由于计算机中存储、处理的最小单位是处理的最小单位是“位位”,因此,在一些情况,因此,在一些情况下,实际压缩比与理论压缩比的极限相去甚远。下,实际压缩比与理论压缩比的极限相去甚远。算术编码把要压缩处理的整段数据映
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第4章 多媒体数据压缩与编码技术 多媒体 数据压缩 编码 技术
限制150内