《图像压缩原理》PPT课件.ppt
《《图像压缩原理》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《图像压缩原理》PPT课件.ppt(33页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第4讲讲 图像压缩原理图像压缩原理 学习目标学习目标 l了解多媒体数据压缩编码的重要性和分类了解多媒体数据压缩编码的重要性和分类l l掌握图像数据压缩编码常用算法的基本原理掌握图像数据压缩编码常用算法的基本原理数据压缩编码简介 图像数据压缩的主要依据有两个:图像数据压缩的主要依据有两个:1.一是图像数据中有许多重复的数据,使用数学方法来表示这些重一是图像数据中有许多重复的数据,使用数学方法来表示这些重复数据就可以减少数据量;复数据就可以减少数据量;2.另一个依据是人眼睛对图像细节和颜色的辨认有一个极限,把超另一个依据是人眼睛对图像细节和颜色的辨认有一个极限,把超过极限的部分去掉,这也就达到了
2、数据压缩的目的。过极限的部分去掉,这也就达到了数据压缩的目的。有损压缩技术和无损压缩技术有损压缩技术和无损压缩技术1.基于数据冗余的压缩技术是无损压缩技术基于数据冗余的压缩技术是无损压缩技术2.基于人眼视觉特性的压缩技术是有损压缩技术基于人眼视觉特性的压缩技术是有损压缩技术。实际上,实际上,图像压缩技术是各种有损和无损压缩技术的综合实现图像压缩技术是各种有损和无损压缩技术的综合实现。数据压缩方法的分类 根根据据编编、解解码码后后数数据据是是否否一一致致来来进进行行分分类类,数数据据压缩的方法一般被划分为两类:压缩的方法一般被划分为两类:1.可可逆逆编编码码(无无损损编编码码)。此此种种方方法法
3、的的解解码码图图像像与与原原始始图图像像严严格格相相同同,压压缩缩比比大大约约在在2:15:12:15:1之之间间。主主要要编编码码有有HuffmanHuffman编编码码、算算术编码、行程长度编码等。术编码、行程长度编码等。2.不不可可逆逆编编码码(有有损损编编码码)。此此种种方方法法的的解解码码图图像像与与原原始始图图像像存存在在一一定定的的误误差差,但但视视觉觉效效果果一一般般可可以以接接受受,压压缩缩比比可可以以从从几几倍倍到上百倍调节。常用的编码有变换编码和预测编码。到上百倍调节。常用的编码有变换编码和预测编码。根据压缩的原理分:(1)预测编码。)预测编码。它是利用空间中相邻数据的相
4、关性来进行压缩数据的。通常它是利用空间中相邻数据的相关性来进行压缩数据的。通常用的方法有脉冲编码调制(用的方法有脉冲编码调制(PCMPCM)、)、增量调制(增量调制(DMDM)、)、差分脉冲编码调制差分脉冲编码调制(DPCMDPCM)等。这些编码等。这些编码主要用于声音的编码主要用于声音的编码。(2 2)变换编码。)变换编码。该方法将图像该方法将图像时域信号转换为频域信号时域信号转换为频域信号进行处理。这种转换进行处理。这种转换的特点是把在时域空间具有强相关的信号转换到频域上时在某些特定的区域内的特点是把在时域空间具有强相关的信号转换到频域上时在某些特定的区域内能量常常集中在一起,数据处理时可
5、以将主要的注意力集中在相对较小的区域,能量常常集中在一起,数据处理时可以将主要的注意力集中在相对较小的区域,从而实现数据压缩。一般采用正交变换,如离散余弦变换(从而实现数据压缩。一般采用正交变换,如离散余弦变换(DCTDCT)、)、离散傅立离散傅立叶变换(叶变换(DFTDFT)(3 3)量化与向量量化编码。对模拟信号进行数字化时要经历一个量化的过程。为)量化与向量量化编码。对模拟信号进行数字化时要经历一个量化的过程。为了使整体量化失真最小,就必须了使整体量化失真最小,就必须依据统计的概率分布依据统计的概率分布设计最优的量化器。最优的设计最优的量化器。最优的量化器一般是非线性的,已知的最优量化器
6、是量化器一般是非线性的,已知的最优量化器是MaxMax量化器。我们对像元点进行量化量化器。我们对像元点进行量化时,除了每次仅量化一个点的方法外,也可以考虑一次量化多个点的做法,这种时,除了每次仅量化一个点的方法外,也可以考虑一次量化多个点的做法,这种方法称为向量量化。即方法称为向量量化。即利用相邻数据间的相关性利用相邻数据间的相关性,将数据系列分组进行量化。,将数据系列分组进行量化。(4)信信息息熵熵编编码码。依依据据信信息息熵熵原原理理,让让出出现现概概率率大大的的信信号号用用较较短短的的码码字字表表示示,反反之之用用较较长长的的码码字字表表示示。常常见见的的编编码码方方法法有有Huffma
7、n编编码、码、Shannon编码以及算术编码。编码以及算术编码。(5)子带()子带(subband)编码。将图像数据变换到频率后,编码。将图像数据变换到频率后,按频率按频率分带,然后用不同的量化器进行量化分带,然后用不同的量化器进行量化,从而达到最优的组合。或者,从而达到最优的组合。或者分布渐进编码,在初始时,对某一个频带的信号进行解码,然后逐分布渐进编码,在初始时,对某一个频带的信号进行解码,然后逐渐扩展到所有频带。渐扩展到所有频带。根据压缩的原理分:(续)信息熵及基本概念 1信息量与信息熵信息量与信息熵 信息量信息量是指从是指从N个相等的可能事件中选出一个事件所需要的信息度量或含量,个相等
8、的可能事件中选出一个事件所需要的信息度量或含量,也就是在辨识也就是在辨识N个事件中特定的一个事件的过程中所需要提问个事件中特定的一个事件的过程中所需要提问“是或否是或否”的最少的最少次数。次数。设设从从N个个数数中中选选定定任任一一个个数数xj的的概概率率为为p(xj),假假定定选选定定任任意意一一个个数数的的概概率率都都相等,即相等,即p(xj),因此定义信息量见公式),因此定义信息量见公式4-5。定义信息量见公式。定义信息量见公式4-5。如果将如果将信源所有可能事件的信息量进行平均信源所有可能事件的信息量进行平均,就得到了信息的,就得到了信息的“熵熵”,即,即信息熵。信息熵。式中,式中,P
9、(xj)是信源是信源X发出发出xj的概率。的概率。I(xj)的含义是,信源的含义是,信源X发出发出xj这这个消息(随机事件)后,接收端收到信息量的量度。个消息(随机事件)后,接收端收到信息量的量度。(4-5)信源信源X发出的发出的xj(j=1,2,n)共共n个随机事件的自信息统计平均,即个随机事件的自信息统计平均,即 H(X)称为信源称为信源X的的“熵熵”,即信源,即信源X发出任意一个随机变量的平均信息量。发出任意一个随机变量的平均信息量。其中:其中:等概率事件的熵最大等概率事件的熵最大,假设有,假设有N个事件,由(个事件,由(4-6)式得此时熵为:)式得此时熵为:(4-6)当当P(x1)1时
10、,时,P(x2)P(x3)P(xj)0,由(,由(4-6)式得此时熵为)式得此时熵为由上可得熵的范围为:由上可得熵的范围为:在编码中在编码中用熵值来衡量是否为最佳编码用熵值来衡量是否为最佳编码。若以。若以Lc表示编码器输出码字表示编码器输出码字的平均码长,则当的平均码长,则当LcH(X)有冗余,不是最佳。有冗余,不是最佳。LcH(X)不可能。不可能。LcH(X)最佳编码(最佳编码(Lc稍大于稍大于H(X))。)。熵值为平均码长熵值为平均码长Lc的下限。的下限。平均码长平均码长Lc的计算公式为:的计算公式为:(j=1,2,n)(4-7)其中:其中:P(xj)是信源是信源X发出发出xj的概率,的概
11、率,L(xj)为为xj的编码长。的编码长。冗余度、编码效率与压缩比冗余度、编码效率与压缩比 设设原原图图像像的的平平均均码码长长为为L,熵熵为为H(X),压压缩缩后后图图像像的的平平均均码码长长为为Lc,则则定定义义冗余度为(见公式冗余度为(见公式4-8):(4-8)编码效率(见公式编码效率(见公式4-9):):(4-9)压缩比压缩比(见公式(见公式4-10):):(4-10)在数字图像通信系统中,冗余度、编码效率与压缩比是衡量信源特性在数字图像通信系统中,冗余度、编码效率与压缩比是衡量信源特性以及编解码设备性能的重要指标。以及编解码设备性能的重要指标。信息熵编码信息熵编码 信息熵编码也称为统
12、计编码,是利用信息熵编码也称为统计编码,是利用信息源出现的概率信息源出现的概率来进行来进行编码,目前比较常见的信息熵编码包括哈夫曼编码、香农编码,目前比较常见的信息熵编码包括哈夫曼编码、香农-范诺编码、范诺编码、行程编码和算术统计编码等。行程编码和算术统计编码等。1哈夫曼编码哈夫曼编码 基本原理基本原理依据信源字符出现的概率大小来构造代码,对出现概率较大的信依据信源字符出现的概率大小来构造代码,对出现概率较大的信源字符,给予较短码长,而对于出现概率较小的信源字符,给予较长源字符,给予较短码长,而对于出现概率较小的信源字符,给予较长的码长,最后使得编码的平均码字最短。的码长,最后使得编码的平均码
13、字最短。具体的编码步骤如下:具体的编码步骤如下:(1)将信源符号出现的概率按由大到小的顺序排序。)将信源符号出现的概率按由大到小的顺序排序。(2)将两处最小的概率进行组合相加,形成一个新的概率。)将两处最小的概率进行组合相加,形成一个新的概率。(3)将新出现的概率与未编码的字符一起重新排序。)将新出现的概率与未编码的字符一起重新排序。(4)重复步骤()重复步骤(2)、()、(3),直到出现的概率和为),直到出现的概率和为1。(5)分配代码。)分配代码。代码分配从最后一步开始反向进行代码分配从最后一步开始反向进行,对最后两个概率一个,对最后两个概率一个赋予赋予0代码,一个赋予代码,一个赋予1代码
14、。如此反向进行到开始的概率排列。在此过程代码。如此反向进行到开始的概率排列。在此过程中,若概率不变则采用原代码。中,若概率不变则采用原代码。例例1:设输入图像的灰度级设输入图像的灰度级a1,a2,a3,a4,a5,a6出现的概率分别是出现的概率分别是0.4、0.2、0.12、0.15、0.1、0.03。试进行哈夫曼编码,并计算。试进行哈夫曼编码,并计算编码效率、压缩比、冗余度。编码效率、压缩比、冗余度。编码步骤:编码步骤:(1 1)初始化,根据符号概率的大小按)初始化,根据符号概率的大小按由大到小由大到小顺序顺序对符号进行对符号进行排序排序,如图所示。,如图所示。(2 2)把概率小的两个符号组
15、成一个节点,如图)把概率小的两个符号组成一个节点,如图4 4中中的的a5a5、a6a6组成节点组成节点P1P1。(3 3)重复步骤)重复步骤2 2,得到节点,得到节点P2P2、P3P3、P4P4、P5P5,形成,形成一棵一棵“树树”,其中,其中P5P5为根节点。为根节点。(4 4)从根节点)从根节点P5P5开始到相应于每个符号的开始到相应于每个符号的“树叶树叶”,从上到下标上,从上到下标上1 1(上枝)或者(上枝)或者0 0(下枝),(下枝),至于哪个至于哪个为为1 1哪个为哪个为0 0则无关紧要则无关紧要,最后的结果仅仅是分配的代,最后的结果仅仅是分配的代码不同,而代码的码不同,而代码的平均
16、长度是相同的平均长度是相同的。最终编码结果为:最终编码结果为:a1=1,a2=000,a1=1,a2=000,a3=011,a3=011,a4=001,a5=0100,a4=001,a5=0100,a6=0101a6=0101 由公式(由公式(4-6)可求得图像信源熵是:)可求得图像信源熵是:H(X)=-(0.4log20.4+0.2log20.2+0.12log20.12+0.15log20.15+0.1log20.1+0.03log20.03)=2.25 bit 根据哈夫曼编码过程图给出的结果,由公式(根据哈夫曼编码过程图给出的结果,由公式(4-7)可求出它的平均码)可求出它的平均码字长度
17、:字长度:Lc=0.41+0.23+0.153+0.123+0.14+0.034=2.33由公式(由公式(4-9)得编码效率为:)得编码效率为:压缩之前压缩之前8个符号需要个符号需要3个比特量化,经过压缩之后的平均码字长度为个比特量化,经过压缩之后的平均码字长度为2.33,由公式(,由公式(4-10)得其压缩比为:)得其压缩比为:由公式(由公式(4-8)得冗余度为:)得冗余度为:r=1-=3.4%采用哈夫曼编码时有两个问题值得注意:采用哈夫曼编码时有两个问题值得注意:(1)哈夫曼编码没有错误保护功能,在译码时,如果码)哈夫曼编码没有错误保护功能,在译码时,如果码串中没有错误,那么就能一个接一个
18、的正确译出代码。但串中没有错误,那么就能一个接一个的正确译出代码。但如果码串中有错误,哪怕仅是如果码串中有错误,哪怕仅是1位出现错误,不但这个码位出现错误,不但这个码本身译错,更糟糕的是后面的译码可能全错,这种现象称本身译错,更糟糕的是后面的译码可能全错,这种现象称为错误传播(为错误传播(Error Propagation)。)。(2)哈夫曼编码是可变长度码,因此很难随意查找或调)哈夫曼编码是可变长度码,因此很难随意查找或调用压缩文件中间的内容,然后再译码,这就需要在存储代用压缩文件中间的内容,然后再译码,这就需要在存储代码之前加以考虑。码之前加以考虑。2算术编码算术编码 算术编码(算术编码(
19、arithmetic coding ACarithmetic coding AC)是利用是利用0和和1之间的间隔来之间的间隔来表示信源编码的一种方法,其编码值是间隔的上、下限包含的相同表示信源编码的一种方法,其编码值是间隔的上、下限包含的相同二进制。编码过程中的间隔决定了符号压缩后的输出。二进制。编码过程中的间隔决定了符号压缩后的输出。算术编码用到两个基本的参数:符号的概率和它的编码间隔。算术编码用到两个基本的参数:符号的概率和它的编码间隔。信源符号的概率决定压缩编码的效率,也决定编码过程中信源信源符号的概率决定压缩编码的效率,也决定编码过程中信源符号的间隔,而这些间隔包含在符号的间隔,而这些
20、间隔包含在0到到1之间。之间。算术编码器的编码过程可用例算术编码器的编码过程可用例2加以解释。加以解释。例例2:假设信源符号为假设信源符号为A,B,C,D,这些符号的概率分别为,这些符号的概率分别为 0.1,0.4,0.2,0.3,根据这些概率可把间隔,根据这些概率可把间隔0,1分成分成4个子个子间隔:间隔:0,0.1,0.1,0.5,0.5,0.7,0.7,1,其中,其中x,y表示半表示半开放间隔,即包含开放间隔,即包含x不包含不包含y,如表,如表4-1所示。所示。符号符号ABCD概率概率0.10.40.20.3初始编码初始编码间隔间隔0,0.10.1,0.50.5,0.70.7,1表表1
21、信源符号、概率和初始编码间隔信源符号、概率和初始编码间隔如果消息序列的输入为:如果消息序列的输入为:CADACDB,其编码过程如下:,其编码过程如下:首先输入的符号是首先输入的符号是C,找到它的编码范围是,找到它的编码范围是0.5,0.7;由于消息中第由于消息中第2个符号个符号A的编码范围是的编码范围是0,0.1,因此它的间隔就取,因此它的间隔就取0.5,0.7的第一个的第一个1/10作为新间隔作为新间隔0.5,0.52;编码第编码第3个符号个符号D时取新间隔为时取新间隔为0.514,0.52;编码第编码第4个符号个符号A时,取新间隔为时,取新间隔为0.514,0.5146,。消息的编码输出可
22、以是最后一个间隔中的任意数,整个编码过程如图消息的编码输出可以是最后一个间隔中的任意数,整个编码过程如图1所示。最后在所示。最后在0.5143876,0.51442中选择一个数作为编码输出值:中选择一个数作为编码输出值:0.5143876。解码时,解码器由编码输出值:解码时,解码器由编码输出值:0.5143876,可马上解得一个字符为,可马上解得一个字符为C,然后依次得到唯一解然后依次得到唯一解A,D,A,C,D,B。在算术编码中需要注意的几个问题:在算术编码中需要注意的几个问题:(1)由由于于实实际际的的计计算算机机的的精精度度不不可可能能无无限限长长,运运算算中中出出现现溢溢出出是是一一个
23、个明明显显的的问问题题,但但多多数数机机器器都都有有16位位、32位位或或者者64位位的的精精度度,因因此此这这个个问题可使用比例缩放方法解决。问题可使用比例缩放方法解决。(2)算算术术编编码码器器对对整整个个消消息息只只产产生生一一个个码码字字,这这个个码码字字是是在在间间隔隔0,1)中中的的一一个个实实数数,因因此此译译码码器器在在接接受受到到表表示示这这个个实实数数的的所所有有位位之之前前不不能能进行译码。进行译码。(3)算术编码也是一种对错误很敏感的编码方法,如果有一位发生错)算术编码也是一种对错误很敏感的编码方法,如果有一位发生错误就会导致整个消息译错。误就会导致整个消息译错。行程长
24、度编码行程长度编码 是一个针对包含是一个针对包含有顺序排列的多次重复的数据有顺序排列的多次重复的数据的压缩方案。其原的压缩方案。其原理就是把理就是把一系列的重复值用一个单独的值再加上一个计数值来取代一系列的重复值用一个单独的值再加上一个计数值来取代,行程长度就是连续且重复的单元数目。如果想得到原始数据,只需展行程长度就是连续且重复的单元数目。如果想得到原始数据,只需展开这个编码就可以了。开这个编码就可以了。例如,计算机制作图像中,常常具有许多颜色相同的图块,而且例如,计算机制作图像中,常常具有许多颜色相同的图块,而且在行上都具有相同的颜色,或者在一行上有许多连续的像素都具有相在行上都具有相同的
25、颜色,或者在一行上有许多连续的像素都具有相同的颜色值。这时,就不需要存储每一个像素的颜色值,而仅存储一同的颜色值。这时,就不需要存储每一个像素的颜色值,而仅存储一个像素的颜色值以及具有相同颜色的像素数目就可以,或者存储一个个像素的颜色值以及具有相同颜色的像素数目就可以,或者存储一个像素的颜色值,以及具有相同颜色值的行数,这种压缩编码称为行程像素的颜色值,以及具有相同颜色值的行数,这种压缩编码称为行程编码。编码。具有相同颜色的连续的像素数目称为行程长度具有相同颜色的连续的像素数目称为行程长度。如图所示,假定一幅灰度图像,第如图所示,假定一幅灰度图像,第n行的像素值为:行的像素值为:用用RLE编码
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 图像压缩原理 图像 压缩 原理 PPT 课件
限制150内