第九部分图像压缩编码优秀文档.ppt
《第九部分图像压缩编码优秀文档.ppt》由会员分享,可在线阅读,更多相关《第九部分图像压缩编码优秀文档.ppt(117页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第9部分部分 图象压缩编码图象压缩编码9 9.1 1 基本概念基本概念9 9.2 2 基础理论基础理论9 9.3 3 变长编码变长编码 9 9.4 4 位平面编码位平面编码 9.5 9.5 预测编码预测编码9 9.6 6 变换编码变换编码9 9.7 7 子带编码子带编码 9 9.8 8 小波变换编码小波变换编码 9.9 9.9 编码标准编码标准 动机动机/原因:原因:表达数字图象所需数据量通常很大 例:灰度图象灰度图象:彩色图象彩色图象:视频视频(运动图象运动图象):传输传输:在在ISDN(码率为码率为64k bps-2M bps),无压缩传输上述每无压缩传输上述每 秒的视频信号约需要秒的视
2、频信号约需要75秒秒(码率码率2Mbps)存储存储:软盘软盘(存储容量存储容量1.4MBytes),无压缩最多存储无压缩最多存储2幅彩图幅彩图 VCD(存储容量存储容量 680MBytes),无压缩只能存储无压缩只能存储30多秒视频多秒视频9 9.1 1 基本概念基本概念图象编码:图象编码:w采用对图象的新的表达方法以减小所需的数据量w数据和信息:数据是信息的载体w数据压缩:对给定量的信息可用不同的数据量来表示对给定量的信息,设法减少表达这些信息的数据量称为w图象压缩(编码)和图象解压缩(解码)图象压缩方法的分类图象压缩方法的分类:信息保存型:信息保存型:在压缩和解压缩过程中没有信息损失压缩率
3、一般在2 10之间信息损失型:信息损失型:常能取得较高的压缩率(几十几百)压缩后并不能经解压缩恢复原状 准无损(near-lossless):一、数据冗余1、数据冗余的概念、数据冗余的概念数据是信息的载体同量的数据可表达不同量的信息同量的信息可用不同量的数据表达冗余冗余数据表达了无用的信息数据表达了已表达的信息相对数据冗余相对数据冗余数据冗余可定量描述,相对冗余:相对冗余:压缩率压缩率:CR 在开区间(0,)中取值n1和n2代表2个数据集合中的信息载体单位的个数 2、数据冗余类别、数据冗余类别(1)编码冗余编码冗余与灰度分布的概率特性有关(2)象素相关冗余象素相关冗余空间冗余,几何冗余(3)心
4、理视觉冗余心理视觉冗余与主观感觉有关减少/消除其中的一种/多种冗余,就能取得数据压缩的效果(1)编码冗余编码冗余编码:编码:需建立码本来表达数据码本:码本:用来表达一定量的信息或一组事件所 需的一系列符号(如字母、数字等)码字:码字:对每个信息或事件所赋的码符号序列码字的长度(码字的长度(字长字长):):每个码字里的符号个数图象中灰度出现的概率不同灰度出现的概率不同平均比特数平均比特数用较少的比特数表示出现概率较大的灰度级用较多的比特数表示出现概率较小的灰度级(2)象素间冗余象素间冗余直接与象素间相关性联系规则 冗余大不规则冗余小(3)心理视觉冗余心理视觉冗余l主观:因人而异,因应用要求而异l
5、其存在与人观察图象的方式有关眼睛对某些视觉信息更敏感人对某些视觉信息更关心l心理视觉冗余与实在的视觉信息有联系(损失不可逆转)1、图象保真度、图象保真度信息保存型/信息损失型描述解码图象相对于原始图象的偏离程度对信息损失的测度主观保真度准则主观保真度准则主观测量图象的质量,因人而异,应用不方便客观保真度准则客观保真度准则用编码输入图与解码输出图的某个确定函数表示损失的信息量,便于计算或测量二、图象保真度和质量 2.客观保真度准则客观保真度准则点误差图误差均方根误差均方信噪比(归一化)信噪比信噪比:令 单位:分贝(dB)峰值信噪比峰值信噪比3.主观保真度准则主观保真度准则观察者对图象综合评价的平
6、均 电视图象质量评价尺度 图象编解码系统模型图象编解码系统模型两个通过信道级连的结构模块 输出图是输入图的精确复制?信息保持型:是,无失真 信息损失型:不是,有一定的失真 三、图象编码模型1、信息量、信息量概率为P(E)的随机事件 E 的信息量I(E)称为E的自信息自信息(随概率增加而减少)特例:P(E)=1(即事件总发生),那么I(E)=0信息的单位:比特(log以2为底)1个比特:即2个相等可能性的事件之一发生一、一、信息论简介信息论简介9.2 基础理论基础理论 离散平稳随机序列信源的熵离散平稳随机序列信源的熵 可以证明可以证明2、信息系统、信息系统 信源通过信道与信宿(即信息用户)连通以
7、传递自信息。信源符号集:信源符号集:A=a1,a2,aJ 概率矢量:概率矢量:u=P(a1)P(a2)P(aJ)T用(A,u)可以完全描述信源平均信息平均信息产生单个信源符号的自信息:I(aj)=logP(aj)产生k个信源符号,符号aj平均来说将产生kP(aj)次 信源的熵或不确定性:观察到单个信源符号输出时所获得的平均信息量 3、互信息、互信息条件熵 平均条件熵(平均信息)互信息 信道容量v v=P(b1)P(b2)P(bJ)T1、无失真编码定理、无失真编码定理(香农第一定理)确定每信源符号可达到的最小平均码字长度信息传输系统 如果信道和传输系统都没有误差,传输系统的主要功能就是尽可能紧凑
8、地表达信源(数据压缩)二、基本编码定理 块信源符号集:A=a1,a2,aJn P(a i)=P(aj1)P(aj2)P(ajn)概率矢量:u =P(a1)P(a2)P(aJn)T信源熵:信源熵:产生块随机变量的(零记忆)信源的熵是对应单符号信源的 n 倍 扩展信源平均码长第一定理:第一定理:编码效率:编码效率:(H(u)是Lavg/n的下限)主观:因人而异,因应用要求而异单位:分贝(dB)化(归一化)后的近似。10 19 23 32 39 45 52 54将取阈值和量化结合起来.不同灰度出现的概率不同重建值的中值为支持基于对象的编码,MPEG-4还采用形状编码和与之相关的形状自适应DCT(SA
9、-DCT)技术以支持任意形状视频对象(VideoObject,VO)的编码。彩色图象:在不同尺度间调整量化间隔1997年7月的会议后发布了。不重要集合表(LIS):放置的小波系数的位置坐标表示不重要集合;产生k个信源符号,符号aj平均来说将产生kP(aj)次DCT系数按之字形扫描重新排序,得到根据频率增加的顺序排列的1_D序列,系数量化后,排序的结果得到值为0的长游程.4 位平面编码失真(随机变量)的平均值d(Q)2、信源编码定理(、信源编码定理(为率失真定理)信道没有误差但传输过程有失真(Q是传输矩阵)此时传输系统的主要功能就是“信息压缩”目标:目标:平均误差被限制在某个最大允许的水平D在给
10、定保真度准则的前提下,确定最小的R失真(随机变量)的平均值d(Q)允许失真为D的编码解码过程的集合率失真函数 非负的失真量度函数(代价函数)需要合理选择Q以求取I(u,v)的最小值(1)Q的元素必须是正的(2)Q的任1列之和为1(3)如果允许最大可能的失真,就会产生最小的信息率 零记忆二元对称信源的率失真函数特点特点:R(D)总是正的,单减的 在0,Dmax区间下凸 R(D)在D DCT DFT WHT直接与象素间相关性联系对于B帧,每一宏块仅有I块和F块。VM描述了编码和解码方法,主要用于软件模拟,以优化编解码的性能。2 Mbs,压缩率为2001。化(归一化)后的近似。14 17 22 29
11、 51 87 80 62 47 66 99 99 99 99 99 99二、图象保真度和质量变换编码重建误差与子图象尺寸的关系产生k个信源符号,符号aj平均来说将产生kP(aj)次准无损(near-lossless):9.5 预测编码预测编码空域方法,消除象素间的冗余象素间的相关性使得预测成为可能仅提取每个象素中的新信息并对它们编码 一、无损预测编码(信息保存型)1、无损预测编码系统、无损预测编码系统编码器+解码器(有相同的预测器)无损预测编码过程无损预测编码过程输入序列:fn(n=1,2,)预测输出:(舍入成整数)预测误差:误差编码:在符号编码器中用变长码编误差解压序列:哪里取得了压缩?(消
12、除了象素间冗余)(消除了象素间冗余)m阶线性预测:1-D线性预测:一阶1-D线性预测:预测误差的概率密度函数:二、有损预测编码(信息损失型)1、有损预测编码系统、有损预测编码系统增加了1个量化器,预测器放在1个反馈环中 输入序列:fn(n=1,2,)量化输出:预测输入:解压序列:编码误差:哪里又又取得了压缩?(量化,减少了(量化,减少了 心理视觉冗余)心理视觉冗余)2、最优预测、最优预测 最小化编码器的均方预测误差差值脉冲码调制法 (DPCM)二维线性预测二维线性预测预测误差信号的统计性质预测误差信号的统计性质例:三阶预测三阶预测解得解得实际应用中的几点说明实际应用中的几点说明(a)预测系数预
13、测系数 与图象的统计特性有关与图象的统计特性有关,通常用一组典通常用一组典 型图象来确定型图象来确定(b)(c)预测阶数的选择预测阶数的选择-对平稳对平稳m阶马尔可夫过程阶马尔可夫过程,m阶预测阶预测(d)(e)典型失真典型失真 斜率过载斜率过载灰度突变点灰度突变点,预测值偏小预测值偏小,量化步长偏小量化步长偏小,产生边缘产生边缘 模糊模糊 颗粒噪声颗粒噪声-灰度慢变点灰度慢变点,预测值偏大预测值偏大,量化步长偏大量化步长偏大(f)优缺点优缺点-简单简单,易于硬件实现易于硬件实现.抗误码性能差抗误码性能差4阶线性预测器 3、最优量化、最优量化判别重建最小均方量化误差最小均方量化误差 重建电平是
14、重建电平是p(s)曲线下面积的重心曲线下面积的重心 判别值为判别值为2个个 重建值的中值重建值的中值 q(s)奇函数输入概率密度函数,偶函数4.帧内编码(类似静态图像编码)帧内编码(类似静态图像编码)u分块:将图像平面分成88图像快;u变换:通常是进行DCT(整数变换);u量化:对DCT系数按照特定的量化表进行量化;uZ形扫描:将量化的交流分量系数按照Z字形顺序扫描排列;u游程编码:对交流系数用游程编码,对相邻快的直流系数采用预测编码(DPCM);u熵编码:用哈夫曼或算术编码对游程编码后的数据进行熵编码。0 1 5 6 14 15 27 280 1 5 6 14 15 27 28 2 4 7
15、13 16 26 29 42 2 4 7 13 16 26 29 42 3 8 12 17 25 30 41 43 3 8 12 17 25 30 41 43 9 11 18 24 31 40 44 53 9 11 18 24 31 40 44 53 10 19 23 32 39 45 52 54 10 19 23 32 39 45 52 54 20 22 33 38 46 51 55 60 20 22 33 38 46 51 55 60 21 34 37 47 50 56 59 61 21 34 37 47 50 56 59 61 35 36 48 49 57 58 62 63 35 36
16、48 49 57 58 62 63 5.5.帧间编码(帧间预测编码)帧间编码(帧间预测编码)目前主要采用运动估计和运动补偿算法。目前主要采用运动估计和运动补偿算法。u在帧间预测编码中,为了达到较高的压缩比,最重要的是得到尽可能小的帧间预测误差。u对运动物体区域进行预测,首先要估计运动物体的位移(运动矢量),然后再根据运动矢量找出物体在前一帧的区域位置,计算前后帧运动物体相应点之间的差值。u运动估计算法的一般步骤(编码端使用):对当前帧中的某一宏块,按照一定的准则在参考帧的窗口中寻找匹配部分,从中找到运动矢量;根据运动矢量,将参考帧位移,求得当前帧的估计;将这个估计和当前帧相减,求估计的残差值;
17、将运动估计和残差传送到接收端。u运动补偿算法的一般步骤(解码端使用):根据接收的运动矢量将参考帧作位移,得到对当前帧的估计;将上述估计和接收到的残差相加,得到当前帧的补偿结果。u运动补偿的关键是运动估计。u运动估计技术的分类:像素递归法相位相关法块匹配法(常用的方法):对当前帧图像的每一块,在上一帧的一定范围内搜索最优匹配块,并认为本块就是从上一块最优匹配块位置处平移过来的。设可能的最大偏矢量为dxmax,dymax,则搜索范围为(M+2dxmax)(N+2dymax)。u块匹配算法(M+2dx)(N+2dy)dydxk-1帧的搜索区k帧MN像素块MN匹配块u匹配块位置与MN块位置的坐标偏移量
18、即为所估计的运动矢量。(1)最优匹配准则u最小平均绝对差(不需要作乘法、实现简单、方便)u最小均方误差u归一化互相关函数(2)搜索方法u一次一个方向搜索法u二维对数法u三步法u新三步法三步法:u基本思想是采用一种由粗到细的搜索模式,从原点开始,按一定步长取周围8 个点构成每次搜索的点群,然后进行匹配计算,跟踪最小误差MBD点,算法具体描述如下:1)从原点开始,选取最大搜索长度的一半为步长,在周围距离步长的8 个点处进行块匹配计算并比较;2)将步长减半,中心点移到上一步的MBD 点,重新在周围距离步长的8 个点处进行块匹配计算并比较;3)在中心及周围8个点处找出MBD 点,若步长为1,该点所在位
19、置即对应最佳运动矢量,算法结束;否则,重复2)。新三步法:u第1 步同时搜索中心和距中心网格步长为4 和网格步长为2 的各8个点,计算比较取得最小MBD 的点作为下一步的中心点;u第2步修改为,如果第一步的最佳匹配点在距中心网格步长为4的8个点中,则以该点为中心点,以步长为2,进行搜索,找最小的MBD点,如果第一步的最佳匹配点为其它9个点,则直接进人第3步;u第3步,在中心及周围8个点处找出最小的MBD点,该点所在位置即对应最佳运动矢量。一、变换编码系统一、变换编码系统图象分解:减少变换的计算复杂度图象变换:解除每个子图象内部象素之间的 相关性,或者说将尽可能多的信息集中到尽可能少的变换系数上
20、压缩不是在变换中而是在量化变换系数时取得的压缩不是在变换中而是在量化变换系数时取得的9.6 变换编码(变换编码(非信息保持型)二、子图象尺寸选择二、子图象尺寸选择影响变换编码误差和计算复杂度(压缩量和计算复杂度都随子图象尺寸的增加而增加)两个条件:两个条件:相邻子图象之间的相关(冗余)减少到某个可接受的水平;子图象的长和宽都是2的整数次幂最常用的子图象尺寸:最常用的子图象尺寸:8 8和16 16 变换编码重建误差与子图象尺寸的关系三、变换选择三、变换选择u一个能把最多的信息集中到最少的系数上去的变换所产生的重建误差最小 u不同变换的信息集中能力不同 lKLT最优,但计算量非常大(依赖于图象)l
21、正弦类变换(如DFT和DCT)较优l非正弦类变换(如WHT)实现简单l小波变换计算快且有局部性质(不需分解)信息集中能力:信息集中能力:KLT DCT DFT WHT所需计算量:所需计算量:KLT DCT DFT WHTDCT是较好的(综合)选择是较好的(综合)选择四、比特分配四、比特分配u比特分配:比特分配:对变换子图象的系数截断、量化和编码的全过程。截断误差与两个因素有关:截断误差与两个因素有关:截除的变换系数的数量和相对重要性 用来表示所保留系数的精度(量化)保留系数的保留系数的2个准则:个准则:最大方差准则,称为分区编码 最大幅度准则,称为阈值编码1、分区编码、分区编码具有最大方差的变
22、换系数带有最多的图象信息,事先确定模板,保留一定的系数(如左下图)。典型的分区模板和分区比特分配2 2、阈值编码、阈值编码根据子图象特性自适应选择保留系数将系数排队,与阈值比较确定去舍。典型的阈值模板和取阈值系数序列63625857494836350000000061595650473734210000000060555146383322200000001054524539322319100000000053444031241811900000001434130251712830000001142292616137420000111128271514651000001011随子图象不同而保留不
23、同位置的变换系数常用对变换子图象取阈值的方法:(1)对所有子图象用一个全局阈值压缩的程度随(不同)图象而异。(2)对各个子图象分别用不同的阈值舍去同数量系数,码率是个常数。(3)根据子图象中系数的位置选取阈值将取阈值和量化结合起来.给出F的一个截断近似。上式中 用 代替,是 的取值和量化(归一化)后的近似。是变换归一化数组。9.7 子带编码子带编码子带:子带:由图象分解得到的一系列带限分量的集合将它们重新组合起来可以无失真地重建原始图象u将图象分解为子带后进行编码的主要好处:(1)不同子带内的图象能量和统计特性不同,可以采取不同的变长码甚至不同的编码方法分别进行编码,提高编码效率。(2)通过频
24、率分解,减少或消除了不同频率之间的相关性,有利于减少图象数据的冗余。(3)量化等操作可在各子带内分别进行,避免了互相干扰和噪声扩散。1、子带分解、子带分解输出序列x*(n)是先通过将x(n)用分析滤波器h0(n)和h1(n)分解为y0(n)和y1(n),再借助合成滤波器g0(n)和g1(n)进行重建得到的。h0(n)和h1(n)都是半带(half-band)滤波器,其中h0(n)对应一个低通滤波器,其输出是x(n)的近似部分,h1(n)对应一个高通滤波器,其输出是x(n)的细节部分。序列x(n),n=0,1,2,的Z-变换在时域中以2为因子的抽样 在时域中以2为因子的内插 序列x(n)先被抽样
25、再被内插,得到x*(n)根据Z-变换来考虑子带编码和解码系统系统的输出为:其中第2项(依赖于z)表达了由于抽样和内插过程而引入的混叠 2、子带重建、子带重建重建无失真,x*(n)x(n)和X*(z)X(z)结合进一个矩阵表达式 假设Hm(z)是非奇异的(行列式不为零)分析滤波器和合成滤波器是交叉调制的 对有限冲击响应(finite impulse response,FIR)滤波器,detHm(z)=az(2k+1)在时域中以2为因子的抽样4)MPEG-7 MPEG针对基于内容的问题启动了一个新的工作项目。小波变换的计算效率很高,且本质上具有局部性对第2位平面(最高位):型图象来确定P帧:在帧编
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第九 部分 图像 压缩 编码 优秀 文档
限制150内