《第8章 图像压缩(2).ppt》由会员分享,可在线阅读,更多相关《第8章 图像压缩(2).ppt(36页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、8.5 有损压缩有损压缩有损编码是以在图像重构的准确度上做出让步而换取有损编码是以在图像重构的准确度上做出让步而换取压缩能力增加的概念为基础的压缩能力增加的概念为基础的.如果产生的失真是可以如果产生的失真是可以容忍的容忍的,则压缩能力上的增加就是有效的则压缩能力上的增加就是有效的.8.5 有损压缩有损压缩1.1.有损预测编码有损预测编码在无损预测编码模型上添加一个量化器,就构成有损预测编码系在无损预测编码模型上添加一个量化器,就构成有损预测编码系统,也称为统,也称为DPCM(差分脉冲编码调制)系统。(差分脉冲编码调制)系统。量化器的作用是将预测误差映射成有限范围内的输出,表示为:量化器的作用是
2、将预测误差映射成有限范围内的输出,表示为:量化器决定了有损预测编码的相关的压缩比和失真量。量化器决定了有损预测编码的相关的压缩比和失真量。有损预测编码系统有损预测编码系统有损预测编码系统有损预测编码系统 8.5 有损压缩有损压缩(1)(1)(1)(1)德德德德尔尔尔尔塔塔塔塔调调调调制制制制是是是是一一一一种种种种简简简简单单单单的的的的有有有有损损损损预预预预测测测测编编编编码码码码方方方方法法法法,其预测器和量化器定义如下:其预测器和量化器定义如下:其预测器和量化器定义如下:其预测器和量化器定义如下:例例8.11:设输入序列为设输入序列为14,15,14,15,13,15,15,14,20
3、,26,27,28,27,27,29,37,47,62,75,77,78,79,80,81,82,83.用德尔塔调制编码。用德尔塔调制编码。德尔塔编码的例子德尔塔编码的例子量化器量化器输入输入编码器编码器解码器解码器误差误差颗粒噪声颗粒噪声斜率过载斜率过载远大于输远大于输入的变化时入的变化时,相对平滑区相对平滑区远小于输入中的最远小于输入中的最大变化时大变化时,相对陡峭相对陡峭区区会导致图会导致图像中目标像中目标边缘模糊边缘模糊和整个图和整个图像产生纹像产生纹状表面。状表面。预测误差图像预测误差图像预测误差图像预测误差图像 解码后图像解码后图像解码后图像解码后图像例:例:德尔塔调制编码的结果德
4、尔塔调制编码的结果目标边缘模糊和整个图像产生纹状表面目标边缘模糊和整个图像产生纹状表面(2)最优量化器最优量化器量化过程导致图像的失真,可以根据不同的优化准则和输入概率密度函数选量化过程导致图像的失真,可以根据不同的优化准则和输入概率密度函数选择最佳的量化方法。择最佳的量化方法。优化准则:可以是统计上的或心理上的优化准则:可以是统计上的或心理上的概率密度:缓慢变化的区域的量化比较精细,快速变化的区域可以比较粗糙。概率密度:缓慢变化的区域的量化比较精细,快速变化的区域可以比较粗糙。从而减少颗粒噪声和斜率过载。从而减少颗粒噪声和斜率过载。一一个个线线性性预预测测系系统统的的数数据据压压缩缩率率大大
5、小小取取决决于于预预测测器器性性能能的的好好坏坏。最最佳线性预测就是选择合适的系数使得误差信号的均方误差最小。佳线性预测就是选择合适的系数使得误差信号的均方误差最小。信号的均方误差(即方差)为:信号的均方误差(即方差)为:假设假设假设假设(3)最佳线性预测器最佳线性预测器求预测系数前先进求预测系数前先进行以下限制:行以下限制:则则则则使上式最小使上式最小使上式最小使上式最小展开得:展开得:展开得:展开得:令:令:r=Rar=Ra a=Ra=R-1-1r rR R是是是是mmmm的自相关矩阵的自相关矩阵的自相关矩阵的自相关矩阵根据上面的式子,可见:根据上面的式子,可见:(1)对任意图像,最优线性
6、预测的系数对任意图像,最优线性预测的系数a仅仅依赖于原始图像中像素仅仅依赖于原始图像中像素的自相关性,并可通过一系列基本的矩阵运算得到。的自相关性,并可通过一系列基本的矩阵运算得到。(2)同时可以看出,预测模型的复杂程度取决于线性预测中所使用同时可以看出,预测模型的复杂程度取决于线性预测中所使用的以前样本数目,样本数目越多,预测器也越复杂。最简单的预测的以前样本数目,样本数目越多,预测器也越复杂。最简单的预测器就是前面介绍的前值预测。器就是前面介绍的前值预测。(3)对于样本点的选取,一般来说,刚开始时,随着样本点个数对于样本点的选取,一般来说,刚开始时,随着样本点个数m的增加,的增加,会增小,
7、但可以证明,当会增小,但可以证明,当m足够大时,再增加样本点足够大时,再增加样本点数,数,也不会减少。也不会减少。线性自适应预测编码线性自适应预测编码图像的实际输入并不是一个平稳的随机过程,因此并不存在一个图像的实际输入并不是一个平稳的随机过程,因此并不存在一个全局最优的线性预测器,当输入为非平稳过程,或总体平稳,但全局最优的线性预测器,当输入为非平稳过程,或总体平稳,但局部不平稳时,用固定参数设计的预测器显然不合理了。此时,局部不平稳时,用固定参数设计的预测器显然不合理了。此时,应采用自适应预测编码的方法,也就是根据图像的局部性质选择应采用自适应预测编码的方法,也就是根据图像的局部性质选择不
8、同的预测系数及相应的量化器,这样会取得更好的效果。不同的预测系数及相应的量化器,这样会取得更好的效果。2.2.变换编码变换编码图像数据一般有较强的相关性,若所选用的正交矢量空间的基矢量与图像本图像数据一般有较强的相关性,若所选用的正交矢量空间的基矢量与图像本身的主要特征相近,在该正交矢量空间中描述图像数据则会变得更简单。身的主要特征相近,在该正交矢量空间中描述图像数据则会变得更简单。经过正交变换,会把原来分散在原空间的图像数据在新的坐标空间中得到集经过正交变换,会把原来分散在原空间的图像数据在新的坐标空间中得到集中。对于大多数图像,大量变换系数很小,只要删除接近于零的系数,并且中。对于大多数图
9、像,大量变换系数很小,只要删除接近于零的系数,并且对较小的系数进行粗量化,而保留包含图像主要信息的系数,以此进行压缩对较小的系数进行粗量化,而保留包含图像主要信息的系数,以此进行压缩编码。编码。在重建图像进行解码时,所损失的将是一些不重要的信息,几乎不会引起图在重建图像进行解码时,所损失的将是一些不重要的信息,几乎不会引起图像的失真。像的失真。典典型型的的变变换换编编码码系系统统中中编编码码器器有有四四步步:子子图图像像分分割割、变换、量化和编码。变换、量化和编码。先将整幅图像分成先将整幅图像分成nn(n一般为一般为8或或16)的子图像后分别处理:)的子图像后分别处理:因为因为(1)小块图像的
10、变换计算容易小块图像的变换计算容易 (2)距离较远的像素之间的相关性比距离较近的像素之间的相关性小。距离较远的像素之间的相关性比距离较近的像素之间的相关性小。压缩并不是在变换步骤中取得,而是在量化变换系数和编码时取得的。压缩并不是在变换步骤中取得,而是在量化变换系数和编码时取得的。一幅一幅n nn n图像可表示成它的二维变换图像可表示成它的二维变换T(u,v)的函数。的函数。(1)变换选择变换选择许多图像变换都可用于变换编码许多图像变换都可用于变换编码,变换选择取决于可允许的重建误差和计算复杂性变换选择取决于可允许的重建误差和计算复杂性.由由f(x,y)组成的组成的nn矩阵矩阵若定义一个截断模
11、板若定义一个截断模板若定义一个截断模板若定义一个截断模板 F F F F的截断近似的截断近似的截断近似的截断近似 M(u,v)消除求和贡献最小的基础图像 整幅图像的均方差为所有截除的变换系数的方差之和。因此,能把最多的信息集整幅图像的均方差为所有截除的变换系数的方差之和。因此,能把最多的信息集中到最少的系数上的变换所能产生的重建误差最小。中到最少的系数上的变换所能产生的重建误差最小。不同的变换,其信息集中能力不同。不同的变换,其信息集中能力不同。傅立叶变换、余弦变换、哈达玛变换傅立叶变换、余弦变换、哈达玛变换一维离散余弦变换:一维离散余弦变换:一维一维DCT变换实际上就是将信号变换实际上就是将
12、信号f(x)分解成直流分量分解成直流分量(u=0)、基波分量、基波分量(u=1)和各次谐波分量和各次谐波分量(u1)由于二维离散余弦变换的可分离性,二维由于二维离散余弦变换的可分离性,二维由于二维离散余弦变换的可分离性,二维由于二维离散余弦变换的可分离性,二维DCTDCTDCTDCT可以用一维可以用一维可以用一维可以用一维DCTDCTDCTDCT来实现来实现来实现来实现 二维离散余弦变换:二维离散余弦变换:利用利用利用利用FFTFFT的快速算法的的快速算法的的快速算法的的快速算法的FDCTFDCT算法算法算法算法余弦变换核实际上就是傅里叶变换核的实部。余弦变换核实际上就是傅里叶变换核的实部。余
13、弦变换核实际上就是傅里叶变换核的实部。余弦变换核实际上就是傅里叶变换核的实部。而变换计算中的乘法运算就是而变换计算中的乘法运算就是而变换计算中的乘法运算就是而变换计算中的乘法运算就是f f(x x)与变换核的与变换核的与变换核的与变换核的乘法运算。一种自然的想法就是先对乘法运算。一种自然的想法就是先对乘法运算。一种自然的想法就是先对乘法运算。一种自然的想法就是先对f f(x x)执行执行执行执行FFTFFT,然后对其取实部就可以了。然后对其取实部就可以了。然后对其取实部就可以了。然后对其取实部就可以了。利用代数分解的利用代数分解的利用代数分解的利用代数分解的FDCTFDCT算法算法算法算法一维
14、离散哈达玛变换一维离散哈达玛变换一维离散哈达玛变换一维离散哈达玛变换 一维离散哈达玛反变换一维离散哈达玛反变换一维离散哈达玛反变换一维离散哈达玛反变换 离散哈达玛变换离散哈达玛变换二维离散哈达玛变换二维离散哈达玛变换二维离散哈达玛变换二维离散哈达玛变换 二维离散哈达玛反变换二维离散哈达玛反变换二维离散哈达玛反变换二维离散哈达玛反变换 基于基于FFTFFT变换的图像压缩技术变换的图像压缩技术 基于基于DCTDCT变换的图像压缩技术变换的图像压缩技术 基于基于哈达玛哈达玛哈达玛哈达玛变换的图像压缩技术变换的图像压缩技术 FFTFFTFFTFFT变换编码效果变换编码效果变换编码效果变换编码效果 原始
15、图像原始图像原始图像原始图像压缩比为压缩比为压缩比为压缩比为2:12:12:12:1erms=0.0398erms=0.0398erms=0.0398erms=0.0398 压缩比为压缩比为压缩比为压缩比为8:18:18:18:1erms=0.0474 erms=0.0474 erms=0.0474 erms=0.0474 例例erms 均方根误差均方根误差DCTDCTDCTDCT变换编码效果变换编码效果变换编码效果变换编码效果原始图像原始图像原始图像原始图像压缩比为压缩比为压缩比为压缩比为2:12:12:12:1erms=0.0359erms=0.0359erms=0.0359erms=0.
16、0359 压缩比为压缩比为压缩比为压缩比为8:18:18:18:1erms=0.0489erms=0.0489erms=0.0489erms=0.0489 HadamardHadamardHadamardHadamard变换编码效果变换编码效果变换编码效果变换编码效果原始图像原始图像原始图像原始图像压缩比为压缩比为压缩比为压缩比为2:12:12:12:1 erms=0.0362erms=0.0362erms=0.0362erms=0.0362 压缩比为压缩比为压缩比为压缩比为8:18:18:18:1erms=0.0515erms=0.0515erms=0.0515erms=0.0515 从从e
17、rms值比较可知值比较可知,DCT比比FFT和和HT有更强的信息集中能力有更强的信息集中能力.离散余弦变换在图像压缩中具有广泛的应用离散余弦变换在图像压缩中具有广泛的应用离散余弦变换在图像压缩中具有广泛的应用离散余弦变换在图像压缩中具有广泛的应用例如,在JPEG图像压缩算法中,首先将输入图像划分为88的方块,然后对每一个方块执行二维离散余弦变换,最后将变换得到的量化的DCT系数进行编码和传送,形成压缩后的图像格式。在接受端,将量化的DCT系数进行解码,并对每个88方块进行二维IDCT,最后将操作完成后的块组合成一幅完整的图像。在在变变换换编编码码中中,首首先先要要将将图图像像数数据据分分割割成
18、成子子图图像像,然然后后对对子子图图像像数数据据块块实实施施某某种种变变换换,如如DCTDCT变变换换,那那么么子子图图像像尺尺寸寸取取多多少少好好呢呢?根根据据实实践践证明子图像尺寸取证明子图像尺寸取4 44 4、8 88 8、16161616适合作图像的压缩,这是因为:适合作图像的压缩,这是因为:如如果果子子图图像像尺尺寸寸取取得得太太小小,虽虽然然计计算算速速度度快快,实实现现简简单单,但但压压缩缩能能力有一定的限制。力有一定的限制。如如果果子子图图像像尺尺寸寸取取得得太太大大,虽虽然然去去相相关关效效果果变变好好,因因为为象象DFTDFT、DCTDCT等等正正弦弦型型变变换换均均具具有
19、有渐渐近近最最佳佳性性,但但也也渐渐趋趋饱饱和和。若若尺尺寸寸太太大大,由由于于图图像像本本身身的的相相关关性性很很小小,反反而而使使其其压压缩缩效效果果不不显显示示,而而且且增增加加了了计计算算的的复复杂性。杂性。(2)子图像尺寸选择子图像尺寸选择 这这里里考考虑虑对对子子图图像像经经过过变变换换后后,要要截截取取的的变变换换系系数数的的数数量量和和保保留留系系数数的精度。在大多数变换编码中,选择保留的系数办法有以下二种:的精度。在大多数变换编码中,选择保留的系数办法有以下二种:根据最大方差进行选择的,称为区域编码。根据最大方差进行选择的,称为区域编码。根据最大值的量级选择,称为阈值编码。根
20、据最大值的量级选择,称为阈值编码。而整个对变换后的子图像的截取、量化和编码过程称为比特分配而整个对变换后的子图像的截取、量化和编码过程称为比特分配 (3)比特分配比特分配典型的区域模板典型的区域模板典型的区域模板典型的区域模板 区域编码区域编码具有最大方差的变换系数携带着图像大部分信息并在编码处理的过程中应具有最大方差的变换系数携带着图像大部分信息并在编码处理的过程中应该保留下来。该保留下来。最大方差的系数通常被定位在图像变换的原点周围。最大方差的系数通常被定位在图像变换的原点周围。区域取样处理可看成每个区域取样处理可看成每个T(u,v)与相应的区域模板中的元素相乘。与相应的区域模板中的元素相
21、乘。对区域取样过程中保留的系数对区域取样过程中保留的系数必须进行量化和编码。因此,必须进行量化和编码。因此,区域模板有时表示成对每个系区域模板有时表示成对每个系数编码的比特数。两种分配方数编码的比特数。两种分配方案:案:(1)给系数分配相同的比特数给系数分配相同的比特数(2)给系数不均匀地分配几个给系数不均匀地分配几个固定数目的比特数固定数目的比特数(a)(b)典型的典型的典型的典型的阈值阈值阈值阈值模板模板模板模板 和和和和 系数排序序列系数排序序列系数排序序列系数排序序列阈值编码阈值编码(门限编码门限编码)对任何子图像对任何子图像,最大量级的变换系数对重构子图像的品质具有最大的影响最大量级
22、的变换系数对重构子图像的品质具有最大的影响.因为不同子图像的最大系数的位置是变化的因为不同子图像的最大系数的位置是变化的,所以通常将所以通常将 m(u,v)T(u,v)的元的元素重新排列成一个一维行程编码素重新排列成一个一维行程编码.有有3 3种基本途径对一幅变换后的子图像进行门限处理种基本途径对一幅变换后的子图像进行门限处理(即生成子即生成子图像门限模板函数图像门限模板函数)对所有的子图像使用单一的全局门限对所有的子图像使用单一的全局门限;对不同图像的压缩等级不同对不同图像的压缩等级不同.对每幅图像使用不同的门限对每幅图像使用不同的门限;对每幅子图像丢弃相同数目的系数对每幅子图像丢弃相同数目
23、的系数,编码率恒定编码率恒定.门限随子图像中每个系数的位置函数的变化而变化门限随子图像中每个系数的位置函数的变化而变化.编码率变化编码率变化,但是可以将门限处理和量化过程结合起来但是可以将门限处理和量化过程结合起来.是是是是 取阈值和量化近似,取阈值和量化近似,取阈值和量化近似,取阈值和量化近似,Z Z Z Z是变换的归一化矩阵是变换的归一化矩阵是变换的归一化矩阵是变换的归一化矩阵 使用下式代替使用下式代替使用下式代替使用下式代替mm(u u,v v)T T(u u,v v),),将取阈值和量化结合起来将取阈值和量化结合起来将取阈值和量化结合起来将取阈值和量化结合起来(a)(a)(a)(a)一条门限编码量化曲线一条门限编码量化曲线一条门限编码量化曲线一条门限编码量化曲线对对Z(u,v)赋予某个常数赋予某个常数c(b)JPEG(b)JPEG编码标准中的编码标准中的编码标准中的编码标准中的DCTDCT量化步长矩阵量化步长矩阵量化步长矩阵量化步长矩阵Z Z 使用使用88 DCT系数的系数的12.5%门限编码门限编码区域编码区域编码利用利用DCT标准化阵列的压缩标准化阵列的压缩34:167:18:1误差误差8.6 图像压缩标准图像压缩标准
限制150内