数字图像处理.ppt
数字图像处理,-图像变换,知识要点,信息论中的有关概念信息,信息量,信息熵,冗余度编码方法统计编码预测编码变换编码混合编码静态图像压缩标准JPEG、JBIG、JPEG2000等,5.1 概述,数据压缩以较少的数据量表示信源以原始形式所代表的信息目的在于节省存储空间、传输时间、信号频带或发送能量等。,数据压缩系统组成图,熵(Entropy),代表信源所含的平均信息量。若信源编码的熵大于信源的实际熵,则信源中的数据一定存在冗余度。冗余数据的去除不会减少信息量。信息量与数据量的关系可由下式表示 I D du (5.1),5.1.2 图像编码压缩的必要性,图像信号的数据量V (volume) (byte,B) : V w · h · d/8 (5.2) w、h、d 分别表示width(pel)、height(pel) 、depth(bit)。 Image Size is w·h。,典型图像的数据量,5.1.3 图像编码压缩的可能性,一般图像中存在着以下数据冗余因素: 编码冗余 像素间的相关性形成的冗余 视觉特性和显示设备引起的冗余,5.1.4 图像编码压缩的技术指标,常用的图像压缩技术指标(P79): 图像熵与平均码长( Entropy and average code lenthgh ) 图像冗余度与编码效率(Coding efficiency) Compression ratio SNR 主观评价,图像质量的主观评价等级,5.1.5 数据压缩方法的分类,1、无损压缩(Lossless Compression)Huffman编码 Shannon编码游程编码算术编码轮廓编码,2、有损压缩(Lossy Compression)预测编码 变换编码混合编码,5.2 统计编码,统计编码根据信源的概率分布特性,分配具有惟一可译性的可变长码字,降低平均码字长度,以提高信息的传输速度,节省存储空间。基本原理在信号概率分布情况已知的基础上,概率大的信号对应的码字短,概率小的信号对应的码字长,这样就降低了平均码字长度。,5.2.1 Huffman编码,1前缀码(Prefix Code)4层树形结构的编码情况,2Huffman编码,算法: 将图像的灰度等级按概率大小进行升序排序。 在灰度级集合中取两个最小概率相加,合成一个概率。 新合成的概率与其他的概率成员组成新的概率集合。 在新的概率集合中,仍然按照步骤的规则,直至新的概率集合中只有一个概率为1的成员。这样的归并过程可以用二叉树描述。 从根节点按前缀码的编码规则进行二进制编码。,Huffman编码示意图,左图所示为建立码的过程右图所示为从根开始,经各中间节点到叶节点的路径采用二进制编码的情况,编码过程举例,第1行和第2行列举了一个信源的统计特性结果如第三行所示,试求:平均码长?,5.2.2 算术编码,在信源各符号概率接近的条件下,算术编码是一种优于Huffman编码的方法。【例5.2】根据信源的概率分布进行算术编码。已知信源的概率分布为求二进制序列01011的编码。,举例,解:步骤如下:(1)二进制信源只有x1 = 0和x2 = 1两种符号,相应的概率为pc = 2/5, pe = 1- pc =3/5 (2)设s为区域左端起始位置,e为区域右端终止位置,l为子区的长度,则 符号“0”的子区为0,2/5),子区长度为2/5 ;符号“1”的子区为2/5 ,1,子区长度为3/5 。,(3)随着序列符号的出现,子区按下列公式减少长度:新子区左端 = 前子区左端 + 当前子区左端×前子区长度新子区长度 = 前子区长度×当前子区长度设初始子区为0,1,步序为step,则编码过程参见实例。可见,最后子区左端起始位置,最后子区长度最后子区右端终止位置 编码结果为子区起始位置与终止位置之中点 = 0.0011。所以,二进序列的算术编码为0011。,算术编码算法的计算步骤实例,5.3 预测编码,预测编码的基本思想:在某种模型的指导下,根据过去的样本序列推测当前的信号样本值,然后用实际值与预测值之间的误差值进行编码。如果模型与实际情况符合得比较好且信号序列的相关性较强,则误差信号的幅度将远远小于样本信号。,图像差值幅度的概率分布(PDF),5.3.1 预测编码基本原理,对实际值与预测值之间的误差值进行编码差分脉冲编码调制Differential Pulse Code ModulationDPCM,DPCM系统的组成,5.3.2 线性预测编码,假设经扫描后的图像信号x(t)是一个均值为零、方差为的平稳随机过程。线性预测就是选择ai(i 1,2,N 1)使预测值 并且使差值en的均方值为最小。预测信号的均方误差(MSE)定义为 Een = E(xn - xn) 2,设计最佳预测的系数ai,采用MMSE,最小均方误差准则。可以令定义xi和xj的自相关函数 R(i,j)= Exi,xj写成矩阵形式为Yule-Walker方程组,若R(i)已知,该方程组可以用递推算法来求解ai。,通过分析可以得出以下结论:,图像的相关性越强,压缩效果越好。当某个阶数已使EeN, eN 1 0时,即使再增加预测点数,压缩效果也不可能继续提高。若xi是平稳m阶Markov过程序列,则m阶线性预测器就是在MMSE意义下的最佳预测器。,当前像素与邻近像素的位置关系,常用预测器方案,前值预测:用x0同一行的最近邻近像素来预测 =x0 一维预测:如上图中的x1、x5。二维预测:如上图中的 x1、x2、x3、x4、x5、x6、x7等。三维预测,5.3.3 自适应预测编码,自适应预测预测参数根据信号的统计特性来确定,以达到最佳预测预测编码的优点直观快捷、便于实现预测编码的缺点压缩比不够高,5.4 变换编码,5.4.1 变换编码的基本原理 通过数学变换可以改变信号能量的分布,从而压缩信息量。以傅里叶变换的概念说明合理的变换可以改变信号能量分布的基本原理。,变换可以改变信号能量的分布,(,5.4.2 变换编码的系统结构,多采样率变换编码系统,图像输入,二维变换,交换域采样,量化编码,传输/储存,解码,补零内插,反交换输出,5.4.3 变换编码的实现,在变换编码中有以下几个问题值得注意:图像变换方法的选取子图像大小的选取常用的图像编码方法区域编码阈值编码混合编码,帧内混合编码原理图,变换编码,变换编码,变换编码,预测编码,信道传输,预测解码/反变换,f(1,n),F(1,n),e(1,n),e(1,n),f(2,n),F(2,n),e(2,n),e(2,n),f(M,n),F(M,n),e(M,n),e(M,n),f(1,n),f(2,n),f(M,n),.,.,.,5.4.4 整数小波变换与图像压缩,量化器的设计是决定图像保真度的关键环节,而传统的DCT和经典小波变换在图像变换后会产生浮点数,因而必须对变换后的数据进行量化处理,这样就产生不同程度的失真。新一代的整数小波变换(又叫第二代小波变换)采用提升方法能够实现整数变换,因而能够实现图像的无损压缩,显然它是一种很适合于医学等图像的压缩方法。 新的静态图像压缩标准JPEG2000中采用了基于提升方法的整数小波变换。,提升方法构造小波分为分裂、预测和更新3个步骤。,1分裂(split) 将一原始信号序列sj按偶数和奇数序号分成两个较小的、互不相交的小波子集sj-1和dj-1:2.预测(predict) 由于数据间存在相关性,因而可以定义一个预测算子P,用P(sj-1)来预测 dj-1.。这样可用相邻的偶数序列来预测奇数序列。用dj-1与P(sj-1)的差值代替d j-1,则数据量要比原始d j-1要小得多。3更新(update) 上述两个过程一般不能保持原图像中的某些整体性质(如亮度),为此我们要构造一个U算子去更新s,使之保持原有数据集的某些特性。,5.5 二值图像编码,只有“白”(用“0”表示)和“黑”(用“1”表示)两个灰度级称之为二值图像(binary image)。二值图像通常是由人为产生的,如由文字组成的文档文件、表格、工程图纸、地图等。一幅二维图像按位平面进行分解可以得到若干个二值图像,因而二值图像的编码方法为逐进编码模式奠定了基础。,5.5.1 跳跃空白编码 (skip blank coding ),跳跃空白编码 将图像的每一条扫描线分成若干等长的段,每段有m个像素,一般m=812。这些扫描线段的组成可能出现二类情况:(1)全是“0”像素。这种线段称为“空白块(blank)”,常表示二值图像的背景成分。编码时“空白块”用码字“0”表示。“空白块”(2)全是“1”像素或由“0”、“1”像素混合而成。编码时,这种线段用“1”加直接编码表示。上述方法很容易推广的在二维情形中。将图像划分为若干个子图像。当子图像像素全为0时,编码为“0”;否则,子图像的编码首位为“1”, 其余码位(code position)采用像素的直接编码表示。,5.6 图像压缩编码标准,在静态图像压缩编码标准中,比较著名的有JPEG、JBIG等标准。视频可看成是一幅幅不同但相关的静态图像的时间序列。静态图像的压缩技术和标准可以直接应用于视频的单帧图像。介绍:适用于静态图像的JPEG标准和JBIG标准新的JPEG2000压缩国际标准,5.6.1 彩色与灰度图像压缩标准JPEG,1JPEG算法与系统JPEG基本系统JPEG扩展系统信息保持压缩系统,2JPEG基本系统,每个单独的彩色图像分量的编码算法: 将量化精度为8位的待压缩图像分成若干个88样值子块,做基于88子块的DCT。 根据最佳视觉特性构造量化表,设计自适应量化器并对DCT的频率系数进行量化。 为了增加连续的0系数的个数,对量化后的系数进行Z字形重排。 用Huffman码作变字长熵编码器对量化系数进行编码,进一步压缩数据量。,JPEG编/解码器算法框图,上述算法的几点说明,(1)彩色空间转换问题(2)量化 最佳的亮度量化表和色度量化表。(3)Z字形重排(4)DCT系数的编码(5)JPEG位数据流,亮度量化表,色度量化表,DCT系数的Z字形排列,3JPEG的视频应用与硬件实现,尽管JPEG标准是基于彩色静止图像压缩而提出的,但对于压缩视频的帧内图像也十分有效。每秒可处理2700万个像素的单片JPEG编/解码器芯片,已能实时处理常规电视图像。M-JPEG(Motion-JPEG)技术即运动静止图像压缩技术。这种技术广泛应用于可精确到帧编辑和多层图像处理的非线性编辑领域。M-JPEG的压缩和解压缩是对称的,可由相同的硬件和软件实现。,5.6.2 二值图像压缩标准JBIG,1980年CCITT T.4建议文件传真三类机(G3)的一维编码标准MH,作为二维编码标准的改进相对元地址指定编码(MR)。1994年CCITT T.6建议的作为四类传真机(G4)标准编码方案:二次改进Huffman编码( MMR)。二值图像通过MH,MR和MMR等典型的编码方法已在传真机等图像通信中得到广泛应用。将一幅二维图像按位平面进行分解可以得到若干个二值图像。一幅灰度为256级的图像可以被分解为8幅二值图像。支持分层图像传送的编码方法的基本思路是:首先传送过去一幅分辨率较低的概要图像,然后随传送数据的不断到来所得到图像质量逐步提高。,支持分层图像传送的编码方法的基本思路,必须满足的条件和对之进行评价的项目,(1)无损编码。(2)即使接受端不具有帧存储器,系统也能在顺序传送模式下正常工作。(3)编码和解码操作是实时的。(4)压缩和恢复两个功能在时间和复杂性方面是对称的。(5)具有比MMR更高的压缩能力。(6)利用同一个数据库可以同时支持顺序和逐层两种压缩传送模式。(7)不允许使用全帧预扫描(单路执行算法)。(8)在64 Kbps传输速率下能够做到解码。(9)鲁棒性。,本 章 小 结,理解和掌握 数字图像编码与压缩的理论基础是本章的重点。熟知 各种国际标准的特点、应用领域。了解 各种编/解码器的原理和软件和硬件实现。注意 数字图像编码与压缩技术的最新发展和应用前景。,Thank You !,