【教学课件】第5章图像编码与压缩.ppt
第第5章章 图像编码与压缩图像编码与压缩知识要点信息论中的有关概念:信息,信信息论中的有关概念:信息,信息量,信息熵,冗余度息量,信息熵,冗余度统计编码统计编码预测编码预测编码变换编码变换编码混合编码混合编码静态图像压缩标准:静态图像压缩标准:JPEG、JBIG、JPEG2000等等5.15.1 概述概述数据编码的目的各异数据编码的目的各异信息保密信息保密信息的压缩存储与传输等信息的压缩存储与传输等数码相机图像编码与压缩技术成功的范例。数码相机图像编码与压缩技术成功的范例。本章主要介绍静态图像压缩编码的原理、应本章主要介绍静态图像压缩编码的原理、应用及有关的国际标准。用及有关的国际标准。5.1.1 数据压缩的基本概念数据压缩的基本概念数据压缩数据压缩以较少的数据量表示信源以原始形式所代表的以较少的数据量表示信源以原始形式所代表的信息信息目的在于节省存储空间、传输时间、信号频带目的在于节省存储空间、传输时间、信号频带或发送能量等。或发送能量等。数据压缩系统组成图数据压缩系统组成图 熵(熵(Entropy)代表信源所含的平均信息量代表信源所含的平均信息量若信源编码的熵大于信源的实际熵,则信源中的数据一定若信源编码的熵大于信源的实际熵,则信源中的数据一定存在冗余度存在冗余度冗余数据的去除不会减少信息量。冗余数据的去除不会减少信息量。信息量与数据量的关系可由下式表示信息量与数据量的关系可由下式表示 I I D D du du (5.1)5.1.2 图像编码压缩的必要性图像编码压缩的必要性图像信号的数据量可表示为图像信号的数据量可表示为 V w h d/8 (5.2)V、w、h、d分别表示图像数据量分别表示图像数据量(字节,(字节,byte,B)、图像宽度、图像宽度(像素数,(像素数,pel)、图像、图像高度高度(像素数,(像素数,pel)、图像深度、图像深度(位,(位,bit)。)。图像的尺寸为图像的尺寸为wh。典型图像的数据量典型图像的数据量 图像种类图像种类图像参数图像参数 数据量数据量 二值传真图像二值传真图像 A4(210 297 mm)大小、)大小、1728 2376 2色分辨率色分辨率501 KB 灰度图像灰度图像 512 512,8 bit灰度等级灰度等级 256 KB VGA图像图像 640 480 256色色 300 KB CIF视频图像视频图像 352 288 256色,亮度取样率为色,亮度取样率为3 MHz,亮度和两色,亮度和两色差按差按4 1 1取样,亮色量化位数共取样,亮色量化位数共12 bit,帧频,帧频29.97,按按1 s计算计算 4.3 MB HDTV亮度信号亮度信号 1280 720,量化位数为,量化位数为8 bit,帧频,帧频30 Hz,按,按1 s计算计算 52.7MB5.1.3 图像编码压缩的可能性图像编码压缩的可能性一般图像中存在着以下数据冗余因素一般图像中存在着以下数据冗余因素:编码冗余编码冗余 像素间的相关性形成的冗余像素间的相关性形成的冗余 视觉特性和显示设备引起的冗余视觉特性和显示设备引起的冗余5.1.4 图像编码压缩的技术指标图像编码压缩的技术指标常用的图像压缩技术指标常用的图像压缩技术指标:图像熵与平均码长图像熵与平均码长 图像冗余度与编码效率图像冗余度与编码效率 压缩比压缩比 客观评价客观评价SNRSNR 主观评价主观评价图像质量的主观评价等级图像质量的主观评价等级 评分评分评价评价说明说明5优秀优秀图像质量非常好图像质量非常好4良好良好图像质量高图像质量高,有很小的干扰但不影响观看有很小的干扰但不影响观看3中等中等图像质量可接受图像质量可接受,但有一些干扰但有一些干扰,对观看对观看稍有妨碍稍有妨碍2差差图像质量差图像质量差,对观看有妨碍对观看有妨碍1很差很差,劣劣图像质量很差图像质量很差,无法观看无法观看图像编码主、客观评价的内在关系图像编码主、客观评价的内在关系图像类型图像类型高分辨率广播电视高分辨率广播电视普通数字广播电视普通数字广播电视数据库图像数据库图像会议电视会议电视传输数码率传输数码率客观评价客观评价SNR主观评价主观评价Mb/s48dB4.5分分34Mb/s43dB4.0分分识别图像识别图像dB.0分分kb/s0dB2.5分分压缩后图像压缩后图像5.1.5 数据压缩方法的分类数据压缩方法的分类1.1.无损压缩无损压缩(Lossless Compression):Huffman编码编码 Shannon编码编码游程编码游程编码算术编码算术编码轮廓编码轮廓编码有损压缩(有损压缩(Lossy Compression)预测编码预测编码 变换编码变换编码 混合编码混合编码现代压缩编码方法:现代压缩编码方法:分形编码分形编码模型基(模型基(Model-based)编码)编码5.2 5.2 统计编码统计编码统计编码统计编码根据信源的概率分布特性,分配具有惟一可译性的根据信源的概率分布特性,分配具有惟一可译性的可变长码字,降低平均码字长度,以提高信息的传可变长码字,降低平均码字长度,以提高信息的传输速度,节省存储空间。输速度,节省存储空间。基本原理基本原理在信号概率分布情况已知的基础上,概率大的信号在信号概率分布情况已知的基础上,概率大的信号对应的码字短,概率小的信号对应的码字长,这样对应的码字短,概率小的信号对应的码字长,这样就降低了平均码字长度。就降低了平均码字长度。5.2.1 Huffman编码编码1前缀码(前缀码(Prefix Code)4层树形结构的编码情况层树形结构的编码情况2Huffman编码编码算法:算法:将图像的灰度等级按概率大小进行升序排序。将图像的灰度等级按概率大小进行升序排序。在灰度级集合中取两个最小概率相加,合成一个概率。在灰度级集合中取两个最小概率相加,合成一个概率。新合成的概率与其他的概率成员组成新的概率集合。新合成的概率与其他的概率成员组成新的概率集合。在新的概率集合中,仍然按照步骤在新的概率集合中,仍然按照步骤的规则,直至的规则,直至新的概率集合中只有一个概率为新的概率集合中只有一个概率为1的成员。这样的归并过程的成员。这样的归并过程可以用二叉树描述。可以用二叉树描述。从根节点按前缀码的编码规则进行二进制编码。从根节点按前缀码的编码规则进行二进制编码。Huffman编码示意图编码示意图左图所示为建立码的过程左图所示为建立码的过程右图所示为从根开始,经各中间节点到叶节点的路径采用右图所示为从根开始,经各中间节点到叶节点的路径采用二进制编码的情况二进制编码的情况编码过程举例第第1行和第行和第2行列举了一个信源的统计特性行列举了一个信源的统计特性结果如第三行所示结果如第三行所示符号集符号集xi x1 x2 x3 x4 x5 x6 概率分布概率分布pi 0.400.200.120.110.090.08Huffman编码编码 1010000001011001113Huffman编码的性能编码的性能优点:优点:实现实现Huffman编码的基础是统计源数据集中各信号的概率分布。编码的基础是统计源数据集中各信号的概率分布。Huffman编码在无失真的编码方法中效率优于其他编码方法,编码在无失真的编码方法中效率优于其他编码方法,是一种最佳变长码,其平均码长接近于熵值。是一种最佳变长码,其平均码长接近于熵值。缺点:缺点:当信源数据成分复杂时,庞大的信源集致使当信源数据成分复杂时,庞大的信源集致使Huffman码表较大,码表较大,码表生成的计算量增加,编译码速度相应变慢码表生成的计算量增加,编译码速度相应变慢不等长编码致使硬件译码电路实现困难。上述原因致使不等长编码致使硬件译码电路实现困难。上述原因致使Huffman编码的实际应用受到限制。编码的实际应用受到限制。4图像的图像的Huffman编译码系统编译码系统5.2.2 Shannon编码与编码与Fano编码编码1.Shannon提出了将信源符号依其概率降序排列,用符号提出了将信源符号依其概率降序排列,用符号序列累积概率的二进制表示作为对信源的唯一可译编码。序列累积概率的二进制表示作为对信源的唯一可译编码。其应用于图像编码的步骤如下:其应用于图像编码的步骤如下:(1)将)将N个灰度级个灰度级xi按其概率递减进行排列。按其概率递减进行排列。(2)求概率分布)求概率分布pi的第的第i个灰度级的二进制位数个灰度级的二进制位数ni。(5.10)(3)计算与)计算与pi相对应的累积概率相对应的累积概率Pi,把与把与Pi相对应的二进相对应的二进码和接下去与码和接下去与pk(ki)相应的码相比较,前面的)相应的码相比较,前面的ni位至少位至少有一位以上的数字是不同的。有一位以上的数字是不同的。【例【例5.25.2】由表】由表5.35.3计算该信源的计算该信源的ShannonShannon编码编码平均码字长度为平均码字长度为2.92,较,较Huffman编码为长。编码为长。2.Fano2.Fano编码步骤编码步骤(1)将图像灰度级)将图像灰度级xi其概率大小按递减顺序进行其概率大小按递减顺序进行排序。排序。(2)将)将xi分成两组,使每组的概率和尽量接近。分成两组,使每组的概率和尽量接近。给第一组灰度级分配代码给第一组灰度级分配代码“0”,第二组分配代码,第二组分配代码“1”。(3)若每组还是由两个或以上的灰度级组成,重)若每组还是由两个或以上的灰度级组成,重复上述步骤,直至每组只有一个灰度级为止。复上述步骤,直至每组只有一个灰度级为止。【例【例5.35.3】图】图5.65.6以表以表5.35.3的信源为例说明的信源为例说明FanoFano编码。编码。5.2.3 算术编码算术编码在信源各符号概率接近的条件下,算术编在信源各符号概率接近的条件下,算术编码是一种优于码是一种优于Huffman编码的方法。编码的方法。算术编码算术编码又称又称Shannon-Fano-Elias 香农香农-费诺费诺-埃利斯编码埃利斯编码 原理:累积分布函数 ,修正的累积分布函数为 并把 和 用二进制表示。码长取为 ,码字 表示取小数点后 位二进制位。Shannon-Fano-Elias编码的实现编码的实现信源及累积概率表示 迭代计算初值两个参数:区间宽度A ,的区间宽度。区间左端点B编码算法实现:proc-code 初始化:B =0;左端点 A1;初始化区间宽度为0,1 输入符号序列X()FOR i=1 To k step 1 DO();输入新的符号 B=:B+;确定新的左端点(左 端点调整)A=:;确定新宽度(宽度压缩)ENDDO END FOR 输出W=(B+A/2)二取L位作为编码点值。END proc-code 解码算法实现:Proc-decode while B 0 For K=1 to N-1 STEP1 If ;搜索搜索 所在区间所在区间 Then ;break;End-If B=:B-;确定新的码点值确定新的码点值 (左端点归零)。(左端点归零)。B=:;宽度扩展为宽度扩展为0,1(新(新 码在码在0,1之间解码)之间解码)End-While输出码序列输出码序列 End Proc-decode【例例6-1】根根据据信信源源的的概概率率分分布布进进行行算算术术编编码码。已知信源的概率分布为已知信源的概率分布为求二进制序列求二进制序列01011的编码。的编码。举例举例解:步骤如下:解:步骤如下:(1)二二进进制制信信源源只只有有x1=0和和x2=1两两种种符符号号,相相应的概率为应的概率为pc=2/5,pe=1-pc=3/5(2)设设s为为区区域域左左端端起起始始位位置置,e为为区区域域右右端端终终止止位置,位置,l为子区的长度,则为子区的长度,则 符号符号“0”的子区为的子区为0,2/5),子区长度为),子区长度为2/5 ;符号符号“1”的子区为的子区为2/5,1,子区长度为,子区长度为3/5 。(3)随着序列符号的出现,子区按下列公式减少长度)随着序列符号的出现,子区按下列公式减少长度:新子区左端新子区左端=前子区左端前子区左端+当前子区左端当前子区左端前子区长度前子区长度新子区长度新子区长度=前子区长度前子区长度当前子区长度当前子区长度设设初初始始子子区区为为0,1,步步序序为为step,则则编编码码过过程程参参见见实实例例。可见,最后子区左端起始位置可见,最后子区左端起始位置 最后子区长度最后子区长度001001最后子区右端终止位置最后子区右端终止位置 编码结果为子区起始位置与终止位置之中点编码结果为子区起始位置与终止位置之中点 =0.0100111。x=01011的的概概率率为为p(x)=p2(0)p3(1)=(2/5)2(3/5)3,码码长长Lx=-log2p(x)=4.8548=5所以,二进序列的算术编码为所以,二进序列的算术编码为01001。算术编码算法的计算步骤实例算术编码算法的计算步骤实例step step x x s s l l 1 10 00 02/5 2/5 2 21 10+0+(2/52/5)(2/52/5)=4/25=4/25(2/52/5)(3/53/5)=6/25=6/25 3 30 02/5+0 6/25=4/25 2/5+0 6/25=4/25(6/256/25)(2/52/5)=12/125 12/125 4 41 14/25+4/25+(2/52/5)(12/12512/125)=124/625 124/625(12/12512/125)(3/53/5)=36/625 36/625 5 51 1124/625+124/625+(2/52/5)(36/62536/625)=692/3125 692/3125(36/62536/625)(3/53/5)=108/625 108/625 5.3 5.3 预测编码预测编码预测编码的基本思想:预测编码的基本思想:在某种模型的指导下,根据过去的样本序列在某种模型的指导下,根据过去的样本序列推测当前的信号样本值,然后用实际值与预推测当前的信号样本值,然后用实际值与预测值之间的误差值进行编码。测值之间的误差值进行编码。如果模型与实际情况符合得比较好且信号序如果模型与实际情况符合得比较好且信号序列的相关性较强,则误差信号的幅度将远远列的相关性较强,则误差信号的幅度将远远小于样本信号。小于样本信号。图像差值幅度的概率分布图像差值幅度的概率分布5.3.1 预测编码基本原理预测编码基本原理对实际值与预测值之间的误差值进行编码对实际值与预测值之间的误差值进行编码差分脉冲编码调制差分脉冲编码调制Differential Pulse Code ModulationDPCMDPCM系统的组成系统的组成 5.3.2 线性自适应预测编码线性自适应预测编码假设经扫描后的图像信号假设经扫描后的图像信号x(t)是一个均值为零、方差为)是一个均值为零、方差为的平稳随机过程。线性预测就是选择的平稳随机过程。线性预测就是选择ai(i 1,2,N 1)使预测值)使预测值 并且使差值并且使差值en的均方值为最小。的均方值为最小。预测信号的均方误差(预测信号的均方误差(MSE)定义为)定义为 Een=E(xn-xn)2设计最佳预测的系数设计最佳预测的系数ai,采用,采用MMSE最小均方误差准则。可以令最小均方误差准则。可以令定义定义xi和和xj的自相关函数的自相关函数 R(i,j)=Exi,xj写成矩阵形式为写成矩阵形式为Yule-Walker方程组方程组 若若R(i)已知,该方程组可以用递推算法来求解)已知,该方程组可以用递推算法来求解ai。通过分析可以得出以下结论:通过分析可以得出以下结论:图像的相关性越强,压缩效果越好。图像的相关性越强,压缩效果越好。当某个阶数已使当某个阶数已使EeN,eN 1 0时,即使再增加预时,即使再增加预测点数,压缩效果也不可能继续提高。测点数,压缩效果也不可能继续提高。若若xi是平稳是平稳m阶阶Markov过程序列,则过程序列,则m阶线性预阶线性预测器就是在测器就是在MMSE意义下的最佳预测器。意义下的最佳预测器。当前像素与邻近像素的位置关系当前像素与邻近像素的位置关系常用预测器方案常用预测器方案前值预测:用前值预测:用x0同一行的最近邻近像素来预测同一行的最近邻近像素来预测 =x0 一维预测:如一维预测:如上图上图中的中的x1、x5。二维预测:如二维预测:如上图上图中的中的 x1、x2、x3、x4、x5、x6、x7等。等。三维预测三维预测5.3.3 自适应预测编码自适应预测编码自适应预测自适应预测预测参数根据信号的统计特性来确定,以达到最佳预预测参数根据信号的统计特性来确定,以达到最佳预测测预测编码的优点预测编码的优点直观快捷、便于实现直观快捷、便于实现预测编码的缺点预测编码的缺点压缩比不够高压缩比不够高5.4 5.4 变换编码变换编码5.4.1 变换编码的基本原理变换编码的基本原理 通过数学变换可以改变信号能量的分布,从而压通过数学变换可以改变信号能量的分布,从而压缩信息量。缩信息量。以傅里叶变换的概念说明合理的变换可以改变信以傅里叶变换的概念说明合理的变换可以改变信号能量分布的基本原理号能量分布的基本原理。变换可以改变信号能量的分布变换可以改变信号能量的分布(5.4.2 变换编码的系统结构变换编码的系统结构多变样率变换编码系统多变样率变换编码系统图像输入二维变换交换域采样量化编码传输/储存解码补零内插反交换输出 5.4.3 变换编码的实现变换编码的实现在变换编码中有以下几个问题值得注意:在变换编码中有以下几个问题值得注意:图像变换方法的选取图像变换方法的选取子图像大小的选取子图像大小的选取常用的图像编码方法常用的图像编码方法区域编码区域编码阈值编码阈值编码混合编码混合编码帧内混合编码原理图帧内混合编码原理图变换编码变换编码变换编码预测编码信道传输预测编码反变换 f(1,n)F(1,n)e(1,n)e(1,n)f(2,n)F(2,n)e(2,n)e(2,n)f(M,n)F(M,n)e(M,n)e(M,n)f(1,n)f(2,n)f(M,n).5.4.4 5.4.4 整数小波变换与图像压缩整数小波变换与图像压缩量化器的设计是决定图像保真度的关键环节,而传统的量化器的设计是决定图像保真度的关键环节,而传统的DCT和经典小波变换在图像变换后会产生浮点数,因而必和经典小波变换在图像变换后会产生浮点数,因而必须对变换后的数据进行量化处理,这样就产生不同程度的须对变换后的数据进行量化处理,这样就产生不同程度的失真。失真。新一代的整数小波变换(又叫第二代小波变换)采用提升新一代的整数小波变换(又叫第二代小波变换)采用提升方法能够实现整数变换,因而能够实现图像的无损压缩,方法能够实现整数变换,因而能够实现图像的无损压缩,显然它是一种很适合于医学等图像的压缩方法。显然它是一种很适合于医学等图像的压缩方法。新的静态图像压缩标准新的静态图像压缩标准JPEG2000中采用了基于提升方法中采用了基于提升方法的整数小波变换。的整数小波变换。提升方法构造小波分为分裂、预测和更新提升方法构造小波分为分裂、预测和更新3 3个步骤。个步骤。1分裂(分裂(split)将一原始信号序列将一原始信号序列sj按偶数和奇数序号分成两个较小的、按偶数和奇数序号分成两个较小的、互不相交的小波子集互不相交的小波子集sj-1和和dj-1:2.预测(预测(predict)由于数据间存在相关性,因而可以定义一个预测算子由于数据间存在相关性,因而可以定义一个预测算子P,用,用P(sj-1)来预测来预测 dj-1.。这样可用相邻的偶数序列来预测奇数序列。这样可用相邻的偶数序列来预测奇数序列。用用dj-1与与P(sj-1)的差值代替的差值代替d j-1,则数据量要比原始,则数据量要比原始d j-1要小得多。要小得多。3更新(更新(update)上述两个过程一般不能保持原图像中的某些整体性质上述两个过程一般不能保持原图像中的某些整体性质(如亮度)(如亮度),为此我们要构造一个为此我们要构造一个U算子去更新算子去更新s,使之保持使之保持原有数据集的某些特性。原有数据集的某些特性。5.5 二值图像编码只有只有“白白”(用(用“0”表示)和表示)和“黑黑”(用(用“1”表示)两个灰度级称之为二值图像表示)两个灰度级称之为二值图像(binary image)。)。二值图像通常是由人为产生的,如由文字二值图像通常是由人为产生的,如由文字组成的文档文件、表格、工程图纸、地图组成的文档文件、表格、工程图纸、地图等。等。一幅二维图像按位平面进行分解可以得到一幅二维图像按位平面进行分解可以得到若干个二值图像,因而二值图像的编码方若干个二值图像,因而二值图像的编码方法为逐进编码模式奠定了基础。法为逐进编码模式奠定了基础。5.5.1 5.5.1 跳跃空白编码跳跃空白编码 (skip blank coding)跳跃空白编码跳跃空白编码 将图像的每一条扫描线分成若干等将图像的每一条扫描线分成若干等长的段,每段有长的段,每段有m个像素,一般个像素,一般m=812。这些扫描线段的组成可能出现二类情况:这些扫描线段的组成可能出现二类情况:(1)全是)全是“0”像素。像素。这种线段称为这种线段称为“空白块(空白块(blank)”,常表示二值图像,常表示二值图像的背景成分。的背景成分。编码时编码时“空白块空白块”用码字用码字“0”表示。表示。“空白块空白块”(2)全是)全是“1”像素或由像素或由“0”、“1”像素混合像素混合而成。而成。编码时,这种线段用编码时,这种线段用“1”加直接编码表示。加直接编码表示。上述方法很容易推广的在二维情形中。上述方法很容易推广的在二维情形中。将图像划分为若干个子图像。当子图像像素全为将图像划分为若干个子图像。当子图像像素全为0时,时,编码为编码为“0”;否则,子图像的编码首位为否则,子图像的编码首位为“1”,其余其余码位(码位(code position)采用像素的直接编码表示。)采用像素的直接编码表示。5.5.2 5.5.2 游程长度编码游程长度编码RLC(Run Length Coding)一种简单的无损编码技术,它改变连续出现相同一种简单的无损编码技术,它改变连续出现相同字符的表达方式,以降低码长。字符的表达方式,以降低码长。传真的二值图像中,连传真的二值图像中,连“0”或连或连“1”总是成串出现,总是成串出现,称为称为“白游程白游程”和和“黑游程黑游程”。非二值的相同连续数据串,同样简化为两个符号:一非二值的相同连续数据串,同样简化为两个符号:一个符号代表数据,第二个代表串长。个符号代表数据,第二个代表串长。游程长度编码一般不直接单独使用,通常配合其游程长度编码一般不直接单独使用,通常配合其他编码方式使用来提高压缩效果。他编码方式使用来提高压缩效果。5.6 5.6 新型的图像压缩编码方法新型的图像压缩编码方法经典的编码方法利用去除图像数据的相关性等方法对图像经典的编码方法利用去除图像数据的相关性等方法对图像进行压缩,其压缩效果受到一定的限制。进行压缩,其压缩效果受到一定的限制。模型编码利用对图像建模的方法对图像参数进行估计。由模型编码利用对图像建模的方法对图像参数进行估计。由于参数的数据量远远少于图像的数据量,因而用模型编码于参数的数据量远远少于图像的数据量,因而用模型编码对压缩数据量极其有效。对压缩数据量极其有效。常见的模型编码有:常见的模型编码有:分形编码(分形编码(fractal coding)自适应网格编码(自适应网格编码(self-adaptive mesh coding)5.6.1 5.6.1 分形分形(fractal)的基本概念的基本概念与经典的编码方法相比,分形编码在思路上有新的突破,与经典的编码方法相比,分形编码在思路上有新的突破,其压缩比高出一般编码方法其压缩比高出一般编码方法23个数量级。个数量级。压缩过程时间长但解压缩速度快的特点将使其在大数据量、高质压缩过程时间长但解压缩速度快的特点将使其在大数据量、高质量的多媒体应用、高速网络等场合中发挥重要的角色。量的多媒体应用、高速网络等场合中发挥重要的角色。分形的基本思想来源于数学上对客观世界一些现象的自相分形的基本思想来源于数学上对客观世界一些现象的自相似性描述。似性描述。分形是一种由许多与全局相似的局部所构成的形体。分形是一种由许多与全局相似的局部所构成的形体。对于集合对于集合A,如果描述其中的点需要,如果描述其中的点需要d个坐标,则称该集合个坐标,则称该集合A是是d维的,即维的,即 dim(A)=d (5.37)在分形几何学中,在分形几何学中,d可以扩展为分数,这时可以扩展为分数,这时d称为分维称为分维。5.6.2 5.6.2 分形压缩的基本方法分形压缩的基本方法分形压缩将图像分解成若干子图像,利用图像的仿射变换分形压缩将图像分解成若干子图像,利用图像的仿射变换可以寻找出子图像间的自相似性。可以寻找出子图像间的自相似性。仿射变换是指对子图像进行旋转、伸缩、位移变换。仿射变换是指对子图像进行旋转、伸缩、位移变换。仿射变换的特性有:仿射变换的特性有:(1)仿射变换的逆变换也是仿射变换。)仿射变换的逆变换也是仿射变换。(2)仿射变换是线性变换。)仿射变换是线性变换。(3)两平行线经过仿射变换后仍然是平行线,所以平行四边形经)两平行线经过仿射变换后仍然是平行线,所以平行四边形经仿射变换后变成另外一个平行四边形。仿射变换后变成另外一个平行四边形。(4)可以通过变换参数求解变换后平面图形的面积与原平面图形)可以通过变换参数求解变换后平面图形的面积与原平面图形面积的比值。面积的比值。(5)选择合适的参数,仿射变换为相似变换。)选择合适的参数,仿射变换为相似变换。通过用数据量极小的系数代替数据量较大的实际像素值而将通过用数据量极小的系数代替数据量较大的实际像素值而将图像表示成压缩形式。图像表示成压缩形式。目前采用全自动的分形压缩,对灰度图像一般可以达到目前采用全自动的分形压缩,对灰度图像一般可以达到4:1100:1,对彩色图像压缩比还可以更高些。,对彩色图像压缩比还可以更高些。压缩时间较慢,而解压缩时间极快。压缩时间较慢,而解压缩时间极快。用户常常关心的是解压缩时间,因而分形压缩的这种不对称性对用户常常关心的是解压缩时间,因而分形压缩的这种不对称性对使用数据的用户是很有用的。使用数据的用户是很有用的。如果采用这种技术制作如果采用这种技术制作VCD、DVD将使其具有广泛的市场前景。将使其具有广泛的市场前景。分形压缩的另一个特点是压缩特性与分辨率无关分形压缩的另一个特点是压缩特性与分辨率无关利用分形压缩的图像可以按不同分辨率实现无级缩放而计算量相利用分形压缩的图像可以按不同分辨率实现无级缩放而计算量相同。同。5.7 5.7 图像压缩编码标准图像压缩编码标准在静态图像压缩编码标准中,比较著名的有在静态图像压缩编码标准中,比较著名的有JPEG、JBIG等标准。等标准。视频可看成是一幅幅不同但相关的静态图像的时间序列。视频可看成是一幅幅不同但相关的静态图像的时间序列。静态图像的压缩技术和标准可以直接应用于视频的单帧图像。静态图像的压缩技术和标准可以直接应用于视频的单帧图像。介绍:介绍:适用于静态图像的适用于静态图像的JPEG标准和标准和JBIG标准标准新的新的JPEG2000压缩国际标准压缩国际标准5.7.1 5.7.1 彩色与灰度图像压缩标准彩色与灰度图像压缩标准JPEGJPEG 1JPEG算法与系统算法与系统JPEG基本系统基本系统JPEG扩展系统扩展系统信息保持压缩系统信息保持压缩系统2JPEG基本系统基本系统每个单独的彩色图像分量的编码算法:每个单独的彩色图像分量的编码算法:将量化精度为将量化精度为8位的待压缩图像分成若干个位的待压缩图像分成若干个8 8样值样值子块,做基于子块,做基于8 8子块的子块的DCT。根据最佳视觉特性构造量化表,设计自适应量化器并根据最佳视觉特性构造量化表,设计自适应量化器并对对DCT的频率系数进行量化。的频率系数进行量化。为了增加连续的为了增加连续的0系数的个数,对量化后的系数进行系数的个数,对量化后的系数进行Z字形重排。字形重排。用用Huffman码作变字长熵编码器对量化系数进行编码,码作变字长熵编码器对量化系数进行编码,进一步压缩数据量。进一步压缩数据量。JPEG编编/解码器算法框图解码器算法框图上述算法的几点说明上述算法的几点说明(1)彩色空间转换问题)彩色空间转换问题(2)量化)量化 最佳的最佳的亮度量化表亮度量化表和和色度量化表色度量化表。(3)Z字形重排字形重排(4)DCT系数的编码系数的编码(5)JPEG位数据流位数据流亮度量化表亮度量化表 1611101624405161121214192658605514131624405769561417222951878062182237566810910377243555648110411392496478871031211201017292959811210010399色度量化表色度量化表 17182447999999991821266699999999242656999999999947669999999999999999999999999999999999999999999999999999999999999999999999999999DCT系数的系数的Z字形排列字形排列3JPEG的视频应用与硬件实现的视频应用与硬件实现尽管尽管JPEG标准是基于彩色静止图像压缩而提出的,但对标准是基于彩色静止图像压缩而提出的,但对于压缩视频的帧内图像也十分有效。于压缩视频的帧内图像也十分有效。每秒可处理每秒可处理2700万个像素的单片万个像素的单片JPEG编编/解码器芯片,已能实时解码器芯片,已能实时处理常规电视图像。处理常规电视图像。M-JPEG(Motion-JPEG)技术即运动静止图像压缩技术。)技术即运动静止图像压缩技术。这种技术广泛应用于可精确到帧编辑和多层图像处理的非这种技术广泛应用于可精确到帧编辑和多层图像处理的非线性编辑领域。线性编辑领域。M-JPEG的压缩和解压缩是对称的,可由相同的硬件和软的压缩和解压缩是对称的,可由相同的硬件和软件实现。件实现。5.7.2 5.7.2 二值图像压缩标准二值图像压缩标准JBIGJBIG1980年年CCITT T.4建议文件传真三类机建议文件传真三类机(G3)的一维编码标准的一维编码标准MH,作为作为二维编码标准的改进相对元地址指定编码二维编码标准的改进相对元地址指定编码(MR)。1994年年CCITT T.6建议的作为四类传真机建议的作为四类传真机(G4)标准编码方案:二次改标准编码方案:二次改进进Huffman编码编码(MMR)。二值图像通过二值图像通过MH,MR和和MMR等典型的编码方法已在传真机等图像等典型的编码方法已在传真机等图像通信中得到广泛应用。将一幅二维图像按位平面进行分解可以得到若通信中得到广泛应用。将一幅二维图像按位平面进行分解可以得到若干个二值图像。干个二值图像。一幅灰度为一幅灰度为256级的图像可以被分解为级的图像可以被分解为8幅二值图像。支持分层图像传幅二值图像。支持分层图像传送的编码方法的基本思路是:首先传送过去一幅分辨率较低的概要图送的编码方法的基本思路是:首先传送过去一幅分辨率较低的概要图像,然后随传送数据的不断到来所得到图像质量逐步提高。像,然后随传送数据的不断到来所得到图像质量逐步提高。支持分层图像传送的编码方法的基本思路支持分层图像传送的编码方法的基本思路必须满足的条件和对之进行评价的项目必须满足的条件和对之进行评价的项目(1)无损编码。)无损编码。(2)即使接受端不具有帧存储器,系统也能在顺序传送模式)即使接受端不具有帧存储器,系统也能在顺序传送模式下正常工作。下正常工作。(3)编码和解码操作是实时的。)编码和解码操作是实时的。(4)压缩和恢复两个功能在时间和复杂性方面是对称的。)压缩和恢复两个功能在时间和复杂性方面是对称的。(5)具有比)具有比MMR更高的压缩能力。更高的压缩能力。(6)利用同一个数据库可以同时支持顺序和逐层两种压缩传)利用同一个数据库可以同时支持顺序和逐层两种压缩传送模式。送模式。(7)不允许使用全帧预扫描(单路执行算法)。)不允许使用全帧预扫描(单路执行算法)。(8)在)在64 Kbps传输速率下能够做到解码。传输速率下能够做到解码。(9)鲁棒性。)鲁棒性。5.7.3 JPEG20005.7.3 JPEG2000静态图像压缩标准静态图像压缩标准1JPEG2000标准制定的目的标准制定的目的JPEG2000标准的目标是标准的目标是进一步改进目前压缩算法的性能,以适应低带宽、高噪声的环境,进一步改进目前压缩算法的性能,以适应低带宽、高噪声的环境,以及医疗图像、电子图书馆、传真、以及医疗图像、电子图书馆、传真、Internet网上服务和保安等方网上服务和保安等方面的应用。面的应用。JPEG2000还将彩色静态画面采用的还将彩色静态画面采用的JPEG编码方式与编码方式与2值值图像采用的图像采用的JBIG编码方式统一起来,成为对应各种图像编码方式统一起来,成为对应各种图像的通用编码方式。的通用编码方式。由于由于JPEG 2000它的特性及功能显著,且支持旧版本的标它的特性及功能显著,且支持旧版本的标准,因此在需要有较好的图像质量、较低的比特率或者是准,因此在需要有较好的图像质量、较低的比特率或者是一些特殊特性的要求(渐进传输和感兴趣区域编码等)时,一些特殊特性的要求(渐进传输和感兴趣区域编码等)时,JPEG2000将是最好的选择。将是最好的选择。JPEG 2000JPEG 2000的应用领域的应用领域可大致分成两个方面:可大致分成两个方面:一方面面向传统的一方面面向传统的JPEG市场市场如打印、扫描、数字摄像、遥感等如打印、扫描、数字摄像、遥感等另一方面面向一些新兴的应用领域另一方面面向一些新兴的应用领域如网路传输、彩色传真、无线通讯,医疗影像、电如网路传输、彩色传真、无线通讯,医疗影像、电子商务等。子商务等。2 2JPEG2000JPEG2000标准提供的主要特征标准提供的主要特征JPEG2000标准提供了一套新特征标准提供了一套新特征这些特征对于一些新产品(如数码相机)和应用(如互联网)是非常重这些特征对于一些新产品(如数码相机)和应用(如互联网)是非常重要的。要的。它把它把JPEG的顺序模式、渐进模式、无损模式和分层模式四种模式集的顺序模式、渐进模式、无损模式和分层模式四种模式集成在一个标准之中。成在一个标准之中。JPEG 2000放弃了以放弃了以DCT为主的区块编码方式为主的区块编码方式采用以小波转换为主的多解析编码方式。采用以小波转换为主的多解析编码方式。JPEG2000标准中无损压缩和有损压缩所采用的小波分别是标准中无损压缩和有损压缩所采用的小波分别是基于提升方案的(基于提升方案的(5,3)整数小波和)整数小波和Daubechies(9,7)整数小波。)整数小波。编码端以最大的压缩质量和最大的图像分辨率压缩图像编码端以最大的压缩质量和最大的图像分辨率压缩图像在解码端可以从码流中以任意的图像质量和分辨率解压图像,最大可达在解码端可以从码流中以任意的图像质量和分辨率解压图像,最大可达到编码时的图像质量和分辨率。到编码时的图像质量和分辨率。JPEG2000JPEG2000的最主要的特征的最主要的特征(1)高压缩率。)高压缩率。(2)无损压缩和有损压缩。)无损压缩和有损压缩。(3)渐进传输。)渐进传输。(4)感兴趣区域压缩。)感兴趣区域压缩。(5)码流的随机访问和处理。)码流的随机访问和处理。(6)容错性。)容错性。(7)开放的框架结构。)开放的框架结构。(8)基于内容的描述。)基于内容的描述。3 3JPEG2000JPEG2000的基本框架和实现的基本框架和实现(1)对原始图像数据进行离散小波变换)对原始图像数据进行离散小波变换(DWT)(2)对变换后的小波系数进行量化)对变换后的小波系数进行量化(3)对量化后的数据熵编码)对量化后的数据熵编码(4)最后形成输出码流。)最后形成输出码