数字图像处理胡学龙等第05章图像编码与压缩.ppt
《数字图像处理胡学龙等第05章图像编码与压缩.ppt》由会员分享,可在线阅读,更多相关《数字图像处理胡学龙等第05章图像编码与压缩.ppt(96页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、上上上上一一一一页页页页下下下下一一一一页页页页home知识要点信息论中的有关概念:信息量,信息熵,冗余度统计编码预测编码变换编码混合编码上上上上一一一一页页页页下下下下一一一一页页页页home5.1 概述数据编码的目的各异信息保密信息的压缩存储与传输等图像数据是一种十分重要且数据量大的信息源,特别是多媒体及网络技术兴起之后,它成为多媒体信息中的重要组成部分。通过数码相机等获得大量照片、图片等静态图像信息并能够永久保存,在图像通信、多媒体网络通信中,压缩编码形成一系列的静态图像和视频图像压缩编码标准。数码相机图像编码与压缩技术成功的范例。本章主要介绍静态图像压缩编码的原理,应用上上上上一一一一
2、页页页页下下下下一一一一页页页页home5.1.1 数据压缩的基本概念数据压缩以较少的数据量表示信源以原始形式所代表的信息目的在于节省存储空间、传输时间、信号频带或发送能量等。上上上上一一一一页页页页下下下下一一一一页页页页home数据压缩系统组成图 上上上上一一一一页页页页下下下下一一一一页页页页home编码对原始的信源数据进行压缩,便于传输和存储;解码是编码的反过程。信源编码主要解决压缩的有效性,信道编码主要解决编码的可靠性,压缩主要靠前者,后者是压缩过程能够可靠实现的保证。课本主要讨论是信源编码。上上上上一一一一页页页页下下下下一一一一页页页页home熵(Entropy)代表信源所含的平
3、均信息量若信源编码的熵大于信源的实际熵,则信源中的数据一定存在冗余度冗余数据的去除不会减少信息量。信息量与数据量的关系可由下式表示 I D du (5.1)上上上上一一一一页页页页下下下下一一一一页页页页home在实际应用中,压缩过程赢尽量去除冗余量而不会或较少减少信息量,即压缩后的数据要能够完全或在一定容差内近似恢复。压缩方法分类:无损(无失真)压缩方法:完全恢复被压缩信源信息的方法。有损(有失真)压缩方法:近似恢复被压缩信源信息的方法。采用同一压缩方法对同样的信源进行压缩,压缩成都越高,信息损失越大。只能在压缩程度和保真度之间权衡。上上上上一一一一页页页页下下下下一一一一页页页页home采
4、用数字技术之后使信号处理的性能大大提高,但是其数据量的增加也是十分惊人的。图像数据更是多媒体、网络通信等技术重点研究的压缩对象,不压缩的数据是计算机处理速度、通信信道的容量等无法承受的。5.1.2 图像编码压缩的必要性上上上上一一一一页页页页下下下下一一一一页页页页home图像信号的数据量可表示为 V w h d/8 (5.2)V、w、h、d分别表示图像数据量(字节,byte,B)、图像宽度(像素数,pel)、图像高度(像素数,pel)、图像深度(位,bit)。图像的尺寸为wh。上上上上一一一一页页页页下下下下一一一一页页页页home典型图像的数据量 图像种类图像参数 数据量 二值传真图像 A
5、4(210 297 mm)大小、1728 2376 2色分j辨率 501 KB 灰度图像 512512,8 bit灰度等级 256 KB VGA图像 640 480 256色 300 KB CIF视频图像 352 288 256色,亮度取样率为3 MHz,亮度和两色差按411取样,亮色量化位数共12 bit,帧频29.97,按1 s计算 4.3 MB HDTV亮度信号 1280 720,量化位数为8 bit,帧频30 Hz,按1 s计算 52.7MB上上上上一一一一页页页页下下下下一一一一页页页页home5.1.3 图像编码压缩的可能性一般图像中存在着以下数据冗余因素:编码冗余(信息熵冗余):
6、对像素进行编码时,要建立表达图像信息的一系列符号的码本,如果码本不能使每个像素所需的平均比特数最小,说明存在编码冗余;即人们用于表达某一信息所需要的比特数总比理论上表示该信息所需要的最少比特数要大,之间的差距就是信息熵冗余。:上上上上一一一一页页页页下下下下一一一一页页页页home 像素间的相关性形成的冗余:在同一扫描行的邻近像素间、在同一帧的邻近行间、在活动图像中的同一位置的相邻帧像素间的灰度和色度往往相同或相近,称这相关性为像素间冗余或空间冗余。上上上上一一一一页页页页下下下下一一一一页页页页home 视觉特性和显示设备引起的冗余:人类视觉系统的一般分辨率估计是26灰度等级,而图像的量化采
7、用是28的灰度等级,称为视觉冗余。上上上上一一一一页页页页下下下下一一一一页页页页home5.1.4 图像编码压缩的技术指标常用的图像压缩技术指标:图像熵与平均码长 图像冗余度与编码效率 压缩比 客观评价SNR 主观评价上上上上一一一一页页页页下下下下一一一一页页页页home 图像熵:信源的平均信息量。设数字图像像素灰度级集合为(x1,x2,xk,,xM),其对应的概率分别为p1,p2,pk,pM。按信息论中信源信息熵定义,数字图像的熵H为上上上上一一一一页页页页下下下下一一一一页页页页home性质:(1)当M级灰度出现的概率相等时,即有最大熵值:(2)在极端情况下,当 或 则表明确定性信号的
8、熵值为0(3)随机性信号的熵非负,0H(x)=log2M(4)M为2的整数次幂时在各灰度等概率的情况下,p(xi)=2-L,H(x)=L在不等概率时H(x)i)相应的码相比较,前面的ni位至少有一位以上的数字是不同的。上上上上一一一一页页页页下下下下一一一一页页页页home【例5.2】由表5.3计算该信源的Shannon编码平均码字长度为2.92,较Huffman编码为长。上上上上一一一一页页页页下下下下一一一一页页页页home2.Fano编码步骤(1)将图像灰度级xi其概率大小按递减顺序进行排序。(2)将xi分成两组,使每组的概率和尽量接近。给第一组灰度级分配代码“0”,第二组分配代码“1”
9、。(3)若每组还是由两个或以上的灰度级组成,重复上述步骤,直至每组只有一个灰度级为止。上上上上一一一一页页页页下下下下一一一一页页页页home【例5.3】图5.6以表5.3的信源为例说明Fano编码。上上上上一一一一页页页页下下下下一一一一页页页页home5.2.3 算术编码在信源各符号概率接近的条件下,算术编码是一种优于Huffman编码的方法。20世纪60年代,R.Elias提出了一种 与分组码有本质差别的编码方法:算术编码(arithmetic coding)的概念,直到20世纪80年代才得以实现。基本思想:按照符号序列的出现概率对概率区间分割,用一个实数代表一个数据流的输入符号,再将这
10、个实数转化为一定位数的二进制代码。上上上上一一一一页页页页下下下下一一一一页页页页home主要步骤:(1)首先把当前区间定义为【0,1);(2)对输入流中的每个符号s,重复下面的两步:把当前区间分割为长度正比于符号概率的子区间;为s选择一个子区间,并将其定义为新的当前区间;(3)当把整个输入流处理完后,输出的即为能唯一确定当前区间的数字。上上上上一一一一页页页页下下下下一一一一页页页页home【例6-1】根据信源的概率分布进行算术编码。已知信源的概率分布为求二进制序列01011的编码。上上上上一一一一页页页页下下下下一一一一页页页页home举例解:步骤如下:(1)二进制信源只有x1=0和x2=
11、1两种符号,相应的概率为pc=2/5,pe=1-pc=3/5(2)设s为区域左端起始位置,e为区域右端终止位置,l为子区的长度,则 符号“0”的子区为0,2/5),子区长度为2/5 ;符号“1”的子区为2/5 ,1,子区长度为3/5 。上上上上一一一一页页页页下下下下一一一一页页页页home(3)随着序列符号的出现,子区按下列公式减少长度:新子区左端=前子区左端+当前子区左端前子区长度新子区长度=前子区长度当前子区长度设初始子区为0,1,步序为step,则编码过程参见实例。可见,最后子区左端起始位置 上上上上一一一一页页页页下下下下一一一一页页页页home最后子区长度最后子区右端终止位置 编码
12、结果为子区起始位置与终止位置之中点 =0.0011。所以,二进序列的算术编码为0011。上上上上一一一一页页页页下下下下一一一一页页页页home算术编码算法的计算步骤实例step x s l 1002/5 210+(2/5)(2/5)=4/25(2/5)(3/5)=6/25 302/5+0 6/25=4/25(6/25)(2/5)=12/125 414/25+(2/5)(12/125)=124/625(12/125)(3/5)=36/625 51124/625+(2/5)(36/625)=692/3125(36/625)(3/5)=108/625 上上上上一一一一页页页页下下下下一一一一页页页
13、页home算术编码不同与哈夫曼编码,给符号值分配整数码字,而是把二进制数所代表的概率空间宽度叠加到代码串中;虽然算术编码的硬件实现比哈夫曼编码复杂,但对图像的编码测试结果表明,在信源符号概率接近的条件下,算术编码效率高于哈夫曼编码,在扩展的JPEG系统中用算术编码取代哈夫曼编码,算术编码还有自适应模式,该模式适用于不便于符号概率统计的实际场合。上上上上一一一一页页页页下下下下一一一一页页页页home5.3 预测编码预测编码的基本思想:在某种模型的指导下,根据过去的样本序列推测当前的信号样本值,然后用实际值与预测值之间的误差值进行编码。如果模型与实际情况符合得比较好且信号序列的相关性较强,则误差
14、信号的幅度将远远小于样本信号。上上上上一一一一页页页页下下下下一一一一页页页页home图像差值幅度的概率分布原图像幅度的概率分布大体比较均匀,而经预测编码后的差值大部分处在零附近的极小范围内,只有在图像的轮廓和边缘处出现较大的预测误差。可用较少的量化层次和比特数表示小幅度的误差信号,压缩数据;只有偶尔出现的大幅度误差信号,因为人眼对跳变的边沿误差并不敏感,也可减少量化级数。上上上上一一一一页页页页下下下下一一一一页页页页home5.3.1 预测编码基本原理对实际值与预测值之间的误差值进行编码差分脉冲编码调制Differential Pulse Code ModulationDPCM上上上上一一
15、一一页页页页下下下下一一一一页页页页homeDPCM系统的组成 上上上上一一一一页页页页下下下下一一一一页页页页home5.3.2 线性自适应预测编码假设经扫描后的图像信号x(t)是一个均值为零、方差为的平稳随机过程。线性预测就是选择ai(i 1,2,N 1)使预测值 并且使差值en的均方值为最小。预测信号的均方误差(MSE)定义为 Een=E(xn-xn)2上上上上一一一一页页页页下下下下一一一一页页页页home设计最佳预测的系数ai,采用MMSE最小均方误差准则。可以令定义xi和xj的自相关函数 R(i,j)=Exixj写成矩阵形式为Yule-Walker方程组 若R(i)已知,该方程组可
16、以用递推算法来求解ai。上上上上一一一一页页页页下下下下一一一一页页页页home通过分析可以得出以下结论:图像的相关性越强,压缩效果越好。当某个阶数已使EeNeN 1 0时,即使再增加预测点数,压缩效果也不可能继续提高。若xi是平稳m阶Markov过程序列,则m阶线性预测器就是在MMSE意义下的最佳预测器。上上上上一一一一页页页页下下下下一一一一页页页页home当前像素与邻近像素的位置关系上上上上一一一一页页页页下下下下一一一一页页页页home常用预测器方案前值预测:用x0同一行的最近邻近像素来预测 =x1 JPEG标准采用前置预测一维预测:如上图中的x1、x5。二维预测:如上图中的 x1、x
17、2、x3、x4、x5、x6、x7等。三维预测:在二维预测基础上,利用上帧或前几帧的邻近取样值作为x0的取样值,这种预测只要用于视频图像的压缩。体现在MPEG标准中。上上上上一一一一页页页页下下下下一一一一页页页页home5.3.3 自适应预测编码自适应预测预测参数根据信号的统计特性来确定,以达到最佳预测预测编码的优点直观快捷、便于实现,特别适用于具有实时性的硬件结构,在传输速率较高的场合大都采用该方法。预测编码的缺点压缩比不够高上上上上一一一一页页页页下下下下一一一一页页页页home一种经典的数据压缩的基本方法。正交变换使图像的表现形式发生变化,同时为图像的高压缩比提供可能。5.4 变换编码上
18、上上上一一一一页页页页下下下下一一一一页页页页home5.4.1 变换编码的基本原理通过对信号进行某种函数变换,实现从信号的相关性较强的空间变换到像素相关性较弱、便于编码的另一信号空间(如频率域)。通过数学变换可以改变信号能量的分布,从而压缩信息量。以傅里叶变换的概念说明合理的变换可以改变信号能量分布的基本原理。上上上上一一一一页页页页下下下下一一一一页页页页home变换可以改变信号能量的分布(上上上上一一一一页页页页下下下下一一一一页页页页home关键问题:选择与信号空间特征相匹配的变换函数。如果选定一个变换域与图像的特征相匹配,可以简化编码,大大提高压缩码率。上上上上一一一一页页页页下下下
19、下一一一一页页页页home5.4.2 变换编码的系统结构多变样率变换编码系统图像输入二维变换交换域采样量化编码传输/储存解码补零内插反交换输出 上上上上一一一一页页页页下下下下一一一一页页页页home一般信号的能量主要集中在低频部分,如果对能量较少的高频部分不编码或仅分配较少的比特数,可明显的减少传输或存储的数据量。对变换系数的量化可采用非线性量化编码器,以提高编码效率。上上上上一一一一页页页页下下下下一一一一页页页页home在变换编码中有以下几个问题值得注意:图像变换方法的选取图像变换方法的选取在所有的变换编码方案中,最佳的变换是K-L变换,理论价值较高,作为其他变换特性进行评价 的标准,但
20、是没有快速算法,工程应用受到限制。次最佳变换方法中:DFT,DCT两者具有快速算法,FFT,FCT,DFT是复数运算,而DCT是实数运算,计算量较小,该变换的压缩性能接近于K-L变换,其变换矩阵与图像内容无关。作为准最佳变换,已成为一些静态图像、视频压缩国际标准中的基本处理模块。JPEG指定基于DCT的有失真静止图像压缩标准在MPEG视频编码器中,帧内图像采用DCT的编码方法。5.4.3 变换编码的实现上上上上一一一一页页页页下下下下一一一一页页页页home子图像大小的选取利用正交变换进行压缩编码,考虑的一个问题:实现的复杂性。一般图像尺寸都比较大,进行全尺寸的直接变换计算量太大,尤其对硬件实
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字图像 处理 胡学龙 等第 05 图像 编码 压缩
限制150内