书签分享收藏举报版权申诉 / 91

立即下载

当前位置：首页 > 教育专区 > 大学资料 > 多媒体数据压缩(改).ppt

多媒体数据压缩(改).ppt

上传人：wuy****n92

文档编号：73762034

上传时间：2023-02-22

格式：PPT

页数：91

大小：1.44MB

( 4.5 )

《多媒体数据压缩(改).ppt》由会员分享，可在线阅读，更多相关《多媒体数据压缩(改).ppt（91页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、第6章多媒体数据压缩2本章主要内容本章主要内容6.1 数据压缩技术概述6.2 数据压缩技术原理6.3 JPEG静止图像压缩标准6.4 运动图像压缩标准MPEG36.1 6.1 数据压缩技术概述数据压缩技术概述6.1.1 数据压缩的概念采样数据不仅仅是所代表的原始信息本身，还包含着其采样数据不仅仅是所代表的原始信息本身，还包含着其它一些没必要保留的（确定的、可推知的）信息，即存在它一些没必要保留的（确定的、可推知的）信息，即存在着数据冗余。着数据冗余。M=D-d 其中其中M表示实际媒体信息，表示实际媒体信息，D表示数字化后的采表示数字化后的采样数据，样数据，d表示数据冗余量。表示数据冗余量。数

2、据压缩数据压缩就是就是从采样数据中去除冗余从采样数据中去除冗余，即保留原始信，即保留原始信息中变化的、特征性信息，去除重复的、确定的或可推知息中变化的、特征性信息，去除重复的、确定的或可推知的信息，的信息，在实现更接近实际媒体信息描述的前提下，尽可在实现更接近实际媒体信息描述的前提下，尽可能的减少描述用的信息量能的减少描述用的信息量。46.1.2 多媒体数据的冗余随着计算机技术的高度发展以及通信、计算机和大众传媒三大技随着计算机技术的高度发展以及通信、计算机和大众传媒三大技术的相互融合，计算机已经不再局限于数值计算、文字处理的范术的相互融合，计算机已经不再局限于数值计算、文字处理的范畴，而成为

3、处理图形、图像、视频、音频等多种信息的工具。但畴，而成为处理图形、图像、视频、音频等多种信息的工具。但数字化后的声音、图像、视频和音频等多媒体数据是非常庞大的。数字化后的声音、图像、视频和音频等多媒体数据是非常庞大的。例如：例如：一页在一页在A4（216mm300mm）纸上的照片，以）纸上的照片，以300dpi（12像素像素/mm）采样，每个像素用）采样，每个像素用24位真彩色信号表示，其数据量约为位真彩色信号表示，其数据量约为27MB/页，页，650MB的的CD-ROM只可放只可放24页；页；双声道立体声光盘，采样率是双声道立体声光盘，采样率是44.1kHz，采样精度，采样精度16位，一秒钟

4、数位，一秒钟数据量是据量是44.1162/8=172KB/s，一张，一张CD只能存放约只能存放约1小时的声音。小时的声音。56.1.2 多媒体数据的冗余对于如此巨大的多媒体数据，如果不经过压缩，不对于如此巨大的多媒体数据，如果不经过压缩，不仅超出了计算机的存储和处理能力，而且在现在的通信仅超出了计算机的存储和处理能力，而且在现在的通信信道的传输速率下，是无法完成大量多媒体信息的传输信道的传输速率下，是无法完成大量多媒体信息的传输的，多媒体数据的高速传输和储藏所需要的巨大容量已的，多媒体数据的高速传输和储藏所需要的巨大容量已经成为多媒体数据通信技术的最大障碍。因此，为了存经成为多媒体数据通信技

5、术的最大障碍。因此，为了存储、处理和传输这些数据，必须进行压缩。储、处理和传输这些数据，必须进行压缩。66.1.2 多媒体数据的冗余一般而言，多媒体数据中存在的数据冗余情况主要有一般而言，多媒体数据中存在的数据冗余情况主要有以下几种以下几种(P107)：信息熵冗余空间冗余时间冗余结构冗余知识冗余视觉冗余听觉冗余纹理的统计冗余信息熵冗余信息熵定义为一组数据所表示的信息量，即式中，E为信息熵，N为数据的种类(或称码元)个数，Pi为第i个码元出现的概率。一组数据的数据量显然等于各记录码元的二进制位数(即编码长度)与该码元出现的概率乘积之和，即式中，D为数据量，为第i个码元的二进制位数。一般取

6、 (如ASCII编码把所有码元都编码为7比特)，这样得到的D必然大于E。这种因码元编码长度的不经济带来的冗余称为信息熵冗余或编码冗余。信息熵冗余图 26个英文字母相对频率空间冗余-同一景物表面上各采样点的颜色之间往往存在着空间连贯性，但是基于离散像素采样来表示物体颜色的方式通常没有利用景物表面颜色的这种空间连贯性，从而产生了空间冗空间冗余余。-可以通过改变物体表面颜色的像素存储方式来利用空间连贯性，达到减少数据量的目的。时间冗余-这是序列图像（电视图像、运动图像）表示中经常包含的冗余。-序列图像一般为位于一时间轴区间内的一组连续画面，其中的相邻帧往往包含相同的背景和移动物体，只不过移动物体所在

7、的空间位置略有不同，所以后一帧的数据与前一帧的数据有许多共同的地方，这种共同性是由于相邻帧记录了相邻时刻的同一场景画面，所以称为时间冗余时间冗余。结构冗余-在有些图像的纹理区，图像的像素值存在着明显的分布模式，例如，方格状的地板图案等。我们称此为结构冗余结构冗余。-已知分布模式，可以通过某一过程生成图像。知识冗余-有些图像的理解与某些知识有相当大的相关性。例如，人脸的图像有固定的结构。这类规律性的结构可由先验知识和背景知识得到，我们称此类冗余为知识冗知识冗余余。-根据已有的知识，对某些图像中所包含的物体，我们可以构造其基本模型，并创建对应各种特征的图像库，进而图像的存储只需要保存一些特征参数，

8、从而可以大大减少数据量。知识冗余是模型编码主要利用的特性。视觉冗余-事实表明，人类的视觉系统对图像场的敏感性是非均匀和非线性的。然而，在记录原始的图像数据时，通常假定视觉系统是线性和均匀的，对视觉敏感和不敏感的部分同等对待，从而产生了比理想编码（即把视觉敏感和不敏感的部分区分开来编码）更多的数据，这就是视觉冗余视觉冗余。-通过大量实验，发现以下视觉的非均匀特征。视觉系统对图像的亮度和色彩度的敏感性相差很大；随着亮度的增加，视觉系统对量化误差的敏感度降低；人眼的视觉系统在图像的边缘和非边缘区域分开来处理；人类的视觉系统总是把视网膜上的图像分解成若干个空间有向的频率通道后再进一步处理。图像区域的相

9、同性冗余-它是指在图像中的两个或多个区域所对应的所有像素值相同或相近，从而产生的数据重复性存储，这就是图像区域的相似图像区域的相似性冗余性冗余。-在以上的情况下，记录了一个区域中各像素的颜色值，则与其相同或相近的其他区域就不在记录其中各像素的值。-向量量化方法就是针对这种冗余性的图像压缩编码方法。纹理的统计冗余-有些图像纹理尽管不严格服从某一分布规律，但是它在统计的意义上服从该规律。利用这种性质也可以减少表示图像的数据量，所以我们称之为纹理的统计冗余纹理的统计冗余。思考：图像序列中的两幅相邻图像，后一幅图像与前一幅图像之间有较大的相关，这是（）。(A)空间冗余(B）时间冗余(C)信息熵冗余(D

10、)视觉冗余16下列哪一种说法是正确的：A.信息量等于数据量与冗余量之和B.信息量等于信息熵与数据量之差C.信息量等于数据量与冗余量之差D.信息量等于信息熵与冗余量之和17186.1.3 数据压缩技术的发展过程 20世纪40年代，人们开始系统地研究数据压缩技术；主要表现在数据压缩算法方面：首先是Claude Shannon与的Shannon-Fano编码方法；编码方法；1952年，提出了年，提出了Huffman编码方法；编码方法；1968年，年，P.Elias 发展了发展了Shannon-Fano编码，构造出更为完美的编码，构造出更为完美的Shannon-Fano-Elias 编码。编码。197

11、6年，年，J.Rissanen 提出了一种可以成功地逼近信息熵极限的编码提出了一种可以成功地逼近信息熵极限的编码方法方法算术编码。算术编码。1982年，年，Rissanen 和和G.G.Langdon 一起改进了算术编码。一起改进了算术编码。1977年，年，Jacob Ziv和和Abraham Lempel提出了提出了LZ77编码算法，编码算法，78年年又作了改进，被称为又作了改进，被称为LZ78编码算法。编码算法。1984年，年，Terry Welch提出了提出了LZ78算法的变种算法算法的变种算法LZW。LZ77、LZ78、LZW三种压缩技术就是目前无损压缩领域中最为流三种压缩技术就是目前

12、无损压缩领域中最为流行的、被称为行的、被称为“字典式编码字典式编码”的压缩技术。的压缩技术。196.1.3 数据压缩技术的发展过程（续）数据压缩标准逐渐形成，有损压缩算法快速出现。数据压缩标准逐渐形成，有损压缩算法快速出现。19861986年开始制定静态图像压缩标准，年开始制定静态图像压缩标准，1994 1994 年后成为年后成为国际标准，称为国际标准，称为JPEGJPEG标准。标准。ITUITU制定的电视会议系列标准（制定的电视会议系列标准（H.261H.261、H.262H.262、H.263 H.263、H.264H.264等）以及由等）以及由ISOISO制定的视频系列标准（制定的视频系

13、列标准（MPEG-1MPEG-1、MPEG-2MPEG-2、MPEG-4MPEG-4）中，均采用了有损压缩原理作为其核心）中，均采用了有损压缩原理作为其核心压缩算法。其中的压缩算法。其中的MPEG-4MPEG-4标准（相当于标准（相当于ITUITU的的H.263H.263和和H.263+H.263+标准）是为了适应网络视频的需求特点而制定的，标准）是为了适应网络视频的需求特点而制定的，具有更高的压缩比、支持并发数据流编码、基于内容的交具有更高的压缩比、支持并发数据流编码、基于内容的交互操作、增强的时间域随机存取、容错、基于内容的尺度互操作、增强的时间域随机存取、容错、基于内容的尺度可变性等新特

14、性。可变性等新特性。206.1.4 数据压缩的分类1 1、按照压缩内容、按照压缩内容分为音频数据压缩、静态图像数据压缩、视频数据压分为音频数据压缩、静态图像数据压缩、视频数据压缩和其他数据文件压缩等四种类型。缩和其他数据文件压缩等四种类型。2、按照压缩方式分为对称压缩和非对称压缩两种类型。分为对称压缩和非对称压缩两种类型。3、按照压缩效果分为有损压缩与无损压缩两种类型。普通数据文件，分为有损压缩与无损压缩两种类型。普通数据文件，一般采用无损压缩，对于冗余度较小的图像，需要采用一般采用无损压缩，对于冗余度较小的图像，需要采用有损压缩。有损压缩。214、按照算法思想分为信息熵编码、预测编码、

15、变换编码、混合编码以及其分为信息熵编码、预测编码、变换编码、混合编码以及其他编码等五种，每种类型包含了一些具体算法，如下图。他编码等五种，每种类型包含了一些具体算法，如下图。226.1.5 数据压缩的主要指标衡量不同压缩方法优劣的技术指标是相同的，主要包括以衡量不同压缩方法优劣的技术指标是相同的，主要包括以下几个方面。下几个方面。1 1）压缩比）压缩比：指压缩前后的数据量之比，它反映了施加某：指压缩前后的数据量之比，它反映了施加某压缩算法之后，数据量减少的比例；压缩算法之后，数据量减少的比例；2 2）恢复效果）恢复效果：指经解压缩算法对压缩数据进行处理后所：指经解压缩算法对压缩数据进行处理后

16、所得到的数据与其表示的原信息的相似程度；得到的数据与其表示的原信息的相似程度；3 3）算法简单、速度快）算法简单、速度快：主要指实现算法的复杂度。：主要指实现算法的复杂度。236.2 数据压缩技术原理6.2.1 信息熵与编码1、信息熵的概念信息论中，编码数据量与所表示的信息量以及冗余信信息论中，编码数据量与所表示的信息量以及冗余信息之间的关系为：息之间的关系为：数据量信息量冗余量数据量信息量冗余量信息是对所表现的事件中不确定性的描述，信息量多信息是对所表现的事件中不确定性的描述，信息量多少与不确定性的程度有关。通常，可以用概率来描述不确少与不确定性的程度有关。通常，可以用概率来描述不确定性

17、的大小。定性的大小。某信息描述的事件状态的出现概率越小，其不确定性某信息描述的事件状态的出现概率越小，其不确定性越大，其表达的信息量就越多，冗余量就越少。越大，其表达的信息量就越多，冗余量就越少。信息熵信息熵用来度量信息量的大小。对于单个事件（如字符）来说，其信息熵定义为：H（i）=-log2(Pi)（bit)（1）公式（1）表示发生概率为Pi的事件i所具有的信息熵为H(i)，单位为bit（比特）。2425对于一个消息队列（如字符串）的信息熵定义为：对于一个消息队列（如字符串）的信息熵定义为：H(X)=-PH(X)=-Pi iloglog2 2(P(Pi i)=P)=Pi iH(i)H(i)（

18、2 2）其中，其中，P Pi i表示某一事件表示某一事件i i发生的概率。发生的概率。例如例如：有一字符串：有一字符串“babbdcaacbbabbdcaacb”包含包含a a、b b、c c、d d四种字四种字符，其长度为符，其长度为1010，字符，字符a a、b b、c c、d d分别出现了分别出现了3 3、4 4、2 2、1 1次，次，则则a a、b b、c c、d d在信息中出现的概率分别为在信息中出现的概率分别为0.30.3、0.40.4、0.20.2、0.10.1，它们的熵分别为：，它们的熵分别为：H(a)=-logH(a)=-log2 2(0.3)1.737(0.3)1.737（

19、bitbit）H(b)=-logH(b)=-log2 2(0.4)1.322(0.4)1.322（bitbit）H(c)=-logH(c)=-log2 2(0.2)2.322(0.2)2.322（bitbit）H(d)=-logH(d)=-log2 2(0.1)3.322(0.1)3.322（bitbit）26 每种字符的信息熵就是该字符编码所用的理每种字符的信息熵就是该字符编码所用的理想位数（二进制）想位数（二进制）。整条信息的熵就是表达整个。整条信息的熵就是表达整个字符串需要的位数（这里用字符出现的次数代替字符串需要的位数（这里用字符出现的次数代替概率）：概率）：H(X)=-PH(X)=-

20、Pi iloglog2 2(P(Pi i)=H(a)3+H(b)4+H(c)2+H(d)1 =H(a)3+H(b)4+H(c)2+H(d)1 =18.465(bit)=18.465(bit)若用若用ASCII编码，编码，需要多少需要多少bit？272、编码编码实质上是对要处理的源数据或源文件按一定的规则编码实质上是对要处理的源数据或源文件按一定的规则进行变换（映射），力图用尽可能少的符号代码来表示较多、进行变换（映射），力图用尽可能少的符号代码来表示较多、较长的源符号信息。编码方法中的码字（代码）有固定长度较长的源符号信息。编码方法中的码字（代码）有固定长度和可变长度两种。和可变长度两种。3

21、、压缩模型模型是规则和数据的集合，即：压缩算法模型是规则和数据的集合，即：压缩算法=模型模型+编码编码 284、压缩、还原压缩是指设法去掉部分或全部冗余，从而减少压缩是指设法去掉部分或全部冗余，从而减少文件或数据所占的存储空间；文件或数据所占的存储空间；还原（解压缩）则是指利用相反的算法使文件还原（解压缩）则是指利用相反的算法使文件或数据恢复原状。或数据恢复原状。29306.2.2 无损压缩编码1、Shannon-Fano编码简称为简称为S-FS-F编码，是一种变长编码，其基本思想是按信编码，是一种变长编码，其基本思想是按信源符号出现的概率大小进行排序，出现概率大的分配短码，源符号出现的概

22、率大小进行排序，出现概率大的分配短码，反之则分配长码。具体编码过程如下：反之则分配长码。具体编码过程如下：（1 1）信源符号按概率递减顺序排列。）信源符号按概率递减顺序排列。（2 2）把符号序列分成上下两部分，使上下两部分的概率和相等或接近相）把符号序列分成上下两部分，使上下两部分的概率和相等或接近相等。等。（3 3）对上部分子序列编码为）对上部分子序列编码为“0 0”，相当于左子树，对下部分子序列编，相当于左子树，对下部分子序列编码为码为“1 1”，相当于右子树。，相当于右子树。（4 4）重复上述步骤，直到每个子序列只包含一个符号为止。）重复上述步骤，直到每个子序列只包含一个符号为止。31举

23、例：有信源字符序列S为：aaabbceeehddabafffbdddgghhabccedabdgghhaaaabbceeehddabafffbdddgghhabccedabdgghha 其长度为其长度为4040个字符，由个字符，由a a、b b、c c、d d、e e、f f、g g、h h共共8 8种字符构成。假设在编码之前，每种字符出现的概种字符构成。假设在编码之前，每种字符出现的概率已由某种模型统计出来，用率已由某种模型统计出来，用-来来表示，具体值分别为：表示，具体值分别为：a-8a-8，b-6b-6，c-3c-3，d-7d-7，e-4e-4，f-3f-3，g-4g-4，h-5h-53

24、2a-8a-8d-7d-7b-6b-6h-5h-5e-4e-4g-4g-4c-3c-3f-3f-3a-8a-8d-7d-7b-6b-6h-5h-5e-4e-4g-4g-4c-3c-3f-3f-3(a)(a)第一步第一步(b)(b)第二步第二步解：首先将信源符号按概率递减顺序排列，形成图（首先将信源符号按概率递减顺序排列，形成图（a a）所示）所示结果，然后，再把符号序列分成上下两部分，使上下两部分的结果，然后，再把符号序列分成上下两部分，使上下两部分的概率和相等或接近相等，形成图（概率和相等或接近相等，形成图（b b）所示结果。其中上部分符）所示结果。其中上部分符号序列概率和为号序列概率和为2

25、121，编码为，编码为0 0；下部分为；下部分为1919，编码为，编码为1 1。33 最后再重复第二步，不断对子符号序列进行划最后再重复第二步，不断对子符号序列进行划分，最后得到一棵二叉树，如图分，最后得到一棵二叉树，如图(c)(c)所示。所示。34最终得到的符号编码分别为：最终得到的符号编码分别为：a-00a-00，b-011b-011，c-1110c-1110，d-010d-010，e-101e-101，f-1111f-1111，g-110g-110，h-100h-100。信源字符序列信源字符序列S S的编码总位数的编码总位数L L等于每种字符编码等于每种字符编码位数与字符出现次数乘积的和

26、位数与字符出现次数乘积的和，即：，即：L=28L=283636434337373434434334343535 118118（位）（位）如果直接用如果直接用ASCIIASCII码，则要用码，则要用408408320320位。因此，位。因此，S-FS-F编码实现了数据压缩。编码实现了数据压缩。352、Huffman编码其编码思想与其编码思想与Shannon-FanoShannon-Fano编码方法基本一致，但构造编码方法基本一致，但构造二叉树的方法则相反，不是自上而下，而是自下而上、从树二叉树的方法则相反，不是自上而下，而是自下而上、从树叶到树根生成二叉树。具体编码过程如下：叶到树根生成二叉树

27、。具体编码过程如下：（l l）将信源符号按概率递减顺序排列；）将信源符号按概率递减顺序排列；（2 2）把两个最小的概率加起来，作为新符号的概率；）把两个最小的概率加起来，作为新符号的概率；（3 3）重复步骤（）重复步骤（1 1）和（）和（2 2），直到概率达到），直到概率达到“1 1”为止；为止；（4 4）在每次合并消息时，将被合并的消息赋于）在每次合并消息时，将被合并的消息赋于“1 1”和和“0 0”或或“0 0”和和“l l”；（5 5）寻找从每一信源符号到概率为）寻找从每一信源符号到概率为“1 1”处的路径，记录下处的路径，记录下路径上的路径上的“l l”和和“0 0”；（6 6）对每一

28、符号写出从码树的根到终结点的）对每一符号写出从码树的根到终结点的“l l”、“0 0”序序列。列。36例如，对于信源例如，对于信源其编码过程如下：其编码过程如下：x1 x2 x3 x4 x5 x6X=0.25 0.25 0.20 0.15 0.10 0.05最后得到的编码为：x1 01，x2 10，x3-11，x4 000，x5-0010，x6-0011。其中x1、x2、x3的码长为2，x4的码长为3,x5、x6的码长为4，平均码长为2.45。0.050.150.450.55信源符号及其概率如下：求其Huffman编码，信息熵及平均码长。aa1a2a3a4a5P(a)0.50.250.125

29、0.0625 0.062537Huffman编码体现了统计编码的思想。Huffman编码的基本原理是按信源符号出现的概率大小进行排序，出现概率大的分配短码，出现概率小的则分配长码。38393、算术编码算术编码也是一种信息熵编码方法，它用算术编码也是一种信息熵编码方法，它用0 0到到1 1之间的一个之间的一个实数对输入的信息进行编码。用到两个基本的参数，一是信源实数对输入的信息进行编码。用到两个基本的参数，一是信源符号的概率，二是信源符号对应的编码区间。一般的信源符号符号的概率，二是信源符号对应的编码区间。一般的信源符号集集x x可表示为：可表示为：对于一个给定的信源符号输入序列对于一个给定的

30、信源符号输入序列S=xS=x1 1x x2 2x x3 3x xm m，其中，其中x xi i属于信源符号集属于信源符号集X X中的任意符号，可按以下过程进行编码：中的任意符号，可按以下过程进行编码：401 1）定义初始区间）定义初始区间0,10,1），表示一个），表示一个0 0到到1 1之间的半开区间，之间的半开区间，并规定初始概率并规定初始概率p p0 0=0=0；2 2）根据信源中各符号的概率值，把）根据信源中各符号的概率值，把0,10,1）区间划分成）区间划分成N N个子个子区间区间Q Q1 1，Q Q2 2，Q Qn n，其中：，其中：Q Qi i=L=Li i,R,Ri i)，L

31、Li i=，R Ri i=L=Li i+P+Pi i ，i=1,2,i=1,2,，N N（3 3）3 3）设置输入序号）设置输入序号i i的初值，的初值，i=1i=1表示开始输入第一个信源符表示开始输入第一个信源符号。号。414 4）当输入符号为）当输入符号为x xi i（x xi i 对应信源符号集对应信源符号集X X中的第中的第k k个符号），个符号），可按以下公式定义新的子区间可按以下公式定义新的子区间I Ii i，并计算区间长度，并计算区间长度d di i。I Ii i=l=li i,r,ri i)（）（）l li i=l=li-1i-1+d+di-1i-1 （）（）r ri i=l=

32、li-1i-1+d+di-1i-1 （）（）d di i=r=ri i-l-li i （）（）5 5）i=i+1i=i+1，如果还有信源符号未输入完毕，则转第，如果还有信源符号未输入完毕，则转第4 4）步继续）步继续输入下一个信源符号。如果全部输入完毕，则当前区间输入下一个信源符号。如果全部输入完毕，则当前区间I Ii i=lli i,r,ri i)中的任意数就是所需的编码。中的任意数就是所需的编码。42例：有四个符号a1、a2、a3、a4的信源，其对应概率分别为0.5、0.25、0.125、0.125。如果输入序列为S=a2a1a3a2a4。根据以上编码过程，得如下结果：43从以上的编码过程

33、可以看出以下几个问题：1 1）算术编码器对整个消息只产生一个码字，这个码字是）算术编码器对整个消息只产生一个码字，这个码字是在间隔在间隔0,1)0,1)中的一个实数，因此译码器在接受到表示这个中的一个实数，因此译码器在接受到表示这个实数的所有位之前不能进行译码。实数的所有位之前不能进行译码。）运算中出现溢出是一个明显的问题，但多数机器都有）运算中出现溢出是一个明显的问题，但多数机器都有1616位、位、3232位或者位或者6464位的精度，因此该问题可使用比例缩放方位的精度，因此该问题可使用比例缩放方法解决。法解决。3 3）算术编码也是一种对错误很敏感的编码方法，如果有）算术编码也是一种对错误很

34、敏感的编码方法，如果有一位发生错误就会导致整个消息译错。一位发生错误就会导致整个消息译错。444、行程编码行程编码（行程编码（RLERLE）通过统计信源符号中的重复个数，并以）通过统计信源符号中的重复个数，并以格式来编码。适用于压缩包含大量重格式来编码。适用于压缩包含大量重复信息的信源。其基本思想是：按行存储一个颜色值和相同复信息的信源。其基本思想是：按行存储一个颜色值和相同色值的像素个数。如下图。色值的像素个数。如下图。(a)图像示例（168像素）0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 00 0 1 1 1 1 1 1 1 1 1 1 1 0 0 00 0 1 0 0

35、0 0 0 0 0 0 0 0 0 0 00 0 1 0 0 0 0 0 0 0 0 0 0 0 0 00 0 1 0 0 0 0 0 0 0 0 0 0 0 0 00 0 1 1 1 1 1 1 1 1 1 1 1 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0(b)示例图像的像素值（168像素）连续相同色块图像与像素值示例 16 0 2 0 11 1 3 0 2 0 1 1 13 0 2 0 1 1 13 0 2 0 1 1 13 0 2 0 11 1 3 0 16 0 16 0(c)RLE编码45说明

36、：RLERLE压缩编码尤其适用于计算机生成的图像，压缩编码尤其适用于计算机生成的图像，对减少图像文件的存储空间非常有效。然而，对减少图像文件的存储空间非常有效。然而，RLERLE对颜色丰富的自然图像就显得力不从心，如对颜色丰富的自然图像就显得力不从心，如果使用果使用RLERLE编码方法，不仅不能压缩图像数据，编码方法，不仅不能压缩图像数据，反而可能使原来的图像数据变得更大。反而可能使原来的图像数据变得更大。465、词典编码词典编码主要是利用编码数据本身存在字符串重复特性来词典编码主要是利用编码数据本身存在字符串重复特性来实现数据压缩的。算法的核心就是如何动态地形成词典，以及实现数据压缩的。算

37、法的核心就是如何动态地形成词典，以及如何选择输出格式以减小冗余。词典编码又可分为两类：如何选择输出格式以减小冗余。词典编码又可分为两类：第一类词典编码的思想第一类词典编码的思想是：查找正在压缩的字符序列是否在以是：查找正在压缩的字符序列是否在以前输入的数据中出现过，然后用已经出现过的字符串替代重复前输入的数据中出现过，然后用已经出现过的字符串替代重复的部分，并将指向重复字符串的指针作为输出编码。的部分，并将指向重复字符串的指针作为输出编码。指针P指向了重复字符串“abc”，所以，当再次出现相同字符串时，则输出指针P。47第二类词典编码的思想第二类词典编码的思想是：从输入的数据中创建一是：从输入

38、的数据中创建一个由短语组成的个由短语组成的“编码词典编码词典”，编码数据过程中当遇，编码数据过程中当遇到已经在词典中出现的到已经在词典中出现的“短语短语”时，编码器就输出这时，编码器就输出这个词典中短语的个词典中短语的“索引号索引号”，而不是短语本身，如下，而不是短语本身，如下图。图。486.2.3 有损压缩编码介绍有损数据压缩编码方法通常用于对静态图像、音频以及有损数据压缩编码方法通常用于对静态图像、音频以及视频等多媒体信息的编码压缩，这些多媒体信息大多数是通视频等多媒体信息的编码压缩，这些多媒体信息大多数是通过对模拟信息的数字化（采样与量化）而得到的。过对模拟信息的数字化（采样与量化）而

39、得到的。1、预测编码1）预测编码的基本概念预测编码是数据压缩的重要技术原理之一，它是根据离预测编码是数据压缩的重要技术原理之一，它是根据离散信号之间的空间或时间相关性，利用前面的一个或多个信散信号之间的空间或时间相关性，利用前面的一个或多个信号对下一信号进行预测，然后对实际值和预测值的差进行编号对下一信号进行预测，然后对实际值和预测值的差进行编码。常用的预测编码方法有码。常用的预测编码方法有DPCMDPCM（差分脉冲编码调制）和（差分脉冲编码调制）和ADPCMADPCM（自适应差分脉冲编码调制）等。（自适应差分脉冲编码调制）等。492 2）DPCMDPCM差分脉冲编码差分脉冲编码DPCMDP

40、CM：Differential Pulse Code ModulationDifferential Pulse Code Modulation，差分脉冲编码，差分脉冲编码调制，调制，用采样量化后的样本值与预测值之间的差值来编码用采样量化后的样本值与预测值之间的差值来编码。原。原理如下图所示。理如下图所示。s(k)s(k)是是PCMPCM样本值，样本值，s se e(k-1)(k-1)是是s(k)s(k)的预测值，的预测值，d(k)d(k)是差分信号，即是差分信号，即d(k)=s(k)-sd(k)=s(k)-se e(k-1)(k-1)。I(k)I(k)是差分信号是差分信号d(k)d(k)的量化

41、值，的量化值，s st t(k)(k)是重构信号，是重构信号，是由逆量化器产生的量化差分信号与对过去样本信号的估算值是由逆量化器产生的量化差分信号与对过去样本信号的估算值s se e(k-1)(k-1)求和求和得到，以作为预测器确定下一个信号估算值的输入信号。原理得到，以作为预测器确定下一个信号估算值的输入信号。原理P205P205503）ADPCM自适应差分脉冲编码 ADPCMADPCM是自适应量化和自适应预测方法的总称，是对是自适应量化和自适应预测方法的总称，是对DPCMDPCM方法的进一步改进，通过调整量化步长，对不同频段设置不方法的进一步改进，通过调整量化步长，对不同频段设置不同的量化

42、字长，使数据得到进一步的压缩。同的量化字长，使数据得到进一步的压缩。自适应量化就是使量化间隔大小的变化自动地去适应输入自适应量化就是使量化间隔大小的变化自动地去适应输入信号大小的变化。信号大小的变化。根据信号分布不均匀的特点，使系统具有根据信号分布不均匀的特点，使系统具有随输入信号的变化而改变量化区间的大小，以保持输入量化随输入信号的变化而改变量化区间的大小，以保持输入量化器的信号基本均匀的能力。器的信号基本均匀的能力。51下图给出了反馈自适应的基本原理下图给出了反馈自适应的基本原理。522、变换编码先对信号进行域变换，以寻求更大的信号独立性，减少先对信号进行域变换，以寻求更大的信号独立性

43、，减少相关性。然后再对变换后的信号进行采样和量化编码。数据编相关性。然后再对变换后的信号进行采样和量化编码。数据编码过程分为三步，即码过程分为三步，即变换、变换域采样和量化编码变换、变换域采样和量化编码。如下图所。如下图所示。示。常用的变换有常用的变换有KLTKLT、DCTDCT、WHTWHT以及以及WLT WLT。531）KLTKLTKLT（Karhunen-Loeve TransformKarhunen-Loeve Transform）通常称为）通常称为K-LK-L变变换，亦称主要成分变换，是一个离散变换。用一组不换，亦称主要成分变换，是一个离散变换。用一组不相关的系数来表示连续信号，实现

44、正交变换。是失真相关的系数来表示连续信号，实现正交变换。是失真最小的一种变换，故称作最佳变换。最小的一种变换，故称作最佳变换。2）DCTDCTDCT（Discrete Cosine TransformDiscrete Cosine Transform）是离散余弦）是离散余弦变换的简称。对于图像编码来说，变换的简称。对于图像编码来说，DCTDCT先将整体图像先将整体图像分成若干个分成若干个N x NN x N的像素块，然后每个的像素块，然后每个N x NN x N像素块像素块逐一进行逐一进行DCTDCT变换。变换。54DCTDCT变换公式如下：变换公式如下：其中：其中：N N为所划分图像方阵的行

45、列数，一般为所划分图像方阵的行列数，一般N=8N=8；x x、y y：原图像方阵内某个数据的坐标位置，取值为：原图像方阵内某个数据的坐标位置，取值为0 0N-1N-1；f(x,y)f(x,y)代表原图像数据方阵内的某个数值；代表原图像数据方阵内的某个数值；u u、v v：DCTDCT后矩阵内某个数值的坐标位置，取值为后矩阵内某个数值的坐标位置，取值为0N-1；C(u,v)C(u,v)代表代表DCTDCT变换后矩阵内的某个数值；变换后矩阵内的某个数值；当当u=0u=0且且v=0v=0时，时，E(u)=E(v)=1/1.414E(u)=E(v)=1/1.414；当当u0u0或或V0V0时，时，E(

46、u)=E(v)=l E(u)=E(v)=l。DCTDCT逆变换公式：逆变换公式：553）WHT WHT WHT（Walsh-Hadamard TransformWalsh-Hadamard Transform）又称哈达玛）又称哈达玛特变换，这是一种有效地去除噪波的方法。特变换，这是一种有效地去除噪波的方法。基本思想为：基本思想为：对于图像压缩，首先将输入值按对于图像压缩，首先将输入值按4 x 24 x 2分成小块，分别进行实时快速哈达玛特变换。图像经分成小块，分别进行实时快速哈达玛特变换。图像经变换后，转换成相应成分的系数，这些系数分别代表变换后，转换成相应成分的系数，这些系数分别代表直流分量

47、、水平方向细节和色度分量、垂直方向细节、直流分量、水平方向细节和色度分量、垂直方向细节、斜方向细节及色度分量等，而噪波变换后均匀散在各斜方向细节及色度分量等，而噪波变换后均匀散在各系数中。这样就能更有效地区分出信号和噪波，从而系数中。这样就能更有效地区分出信号和噪波，从而达到更有效地进行自适应降噪的目的。达到更有效地进行自适应降噪的目的。564）WLTWLTWLT（WaveLet TransformWaveLet Transform）又称小波变换，是近）又称小波变换，是近年来新兴的一种变换方法，解决了较好地解决突变年来新兴的一种变换方法，解决了较好地解决突变信号与非平稳信号的问题。是空间（时间

48、）和频率信号与非平稳信号的问题。是空间（时间）和频率的局部变换。的局部变换。小波变换的小波变换的基本思想基本思想是将信号展开成一族基函是将信号展开成一族基函数的加权和，即用一族函数来表示或逼近信号数的加权和，即用一族函数来表示或逼近信号(或或函数函数)，这一族函数是通过基本函数的平移和伸缩，这一族函数是通过基本函数的平移和伸缩构成的。构成的。573、混合编码混合编码不是一类原理性编码方案，是两种或两混合编码不是一类原理性编码方案，是两种或两种以上相关编码方法优点与特长的混合应用。种以上相关编码方法优点与特长的混合应用。比如在比如在MPEGMPEG和和JPEGJPEG标准中，都混合应用了不同标

49、准中，都混合应用了不同的编码方法，从而实现较为理想的编码压缩效果。的编码方法，从而实现较为理想的编码压缩效果。584、其它编码主要包括分形编码、矢量量化编码、子带编码等独具特主要包括分形编码、矢量量化编码、子带编码等独具特色编码方法。色编码方法。1）分形编码分形的概念分形的概念：分形指某种形状（或结构）的一个局部或片：分形指某种形状（或结构）的一个局部或片断，它可以有许多种大小、尺寸的相似形。断，它可以有许多种大小、尺寸的相似形。分形编码分形编码是一种以分形几何学为理论基础的编码方法，它是一种以分形几何学为理论基础的编码方法，它利用分形几何中自相似的原理来实现数据压缩的。首先对把一利用分形

50、几何中自相似的原理来实现数据压缩的。首先对把一幅数字图像，通过一些图像处理技术，然后在分形集中寻找各幅数字图像，通过一些图像处理技术，然后在分形集中寻找各子图像之间的相似性，其压缩比超出经典编码方法近子图像之间的相似性，其压缩比超出经典编码方法近3 3个数量个数量级。级。592）矢量量化编码矢量量化编码利用相邻图像数据间的高度相关性，将输矢量量化编码利用相邻图像数据间的高度相关性，将输入图像数据序列分组，每一组由入图像数据序列分组，每一组由n n个数据构成一个个数据构成一个N N维矢量，维矢量，一起进行编码，即一次量化多个点。一起进行编码，即一次量化多个点。3）子带编码子带编码技术是一种高

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

11.9 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 多媒体数据压缩

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：多媒体数据压缩(改).ppt
链接地址：https://www.taowenge.com/p-73762034.html