书签分享收藏举报版权申诉 / 117

立即下载

当前位置：首页 > 教育专区 > 教案示例 > 第九部分图像压缩编码优秀文档.ppt

第九部分图像压缩编码优秀文档.ppt

上传人：可****

文档编号：91509204

上传时间：2023-05-27

格式：PPT

页数：117

大小：1.20MB

( 4.5 )

《第九部分图像压缩编码优秀文档.ppt》由会员分享，可在线阅读，更多相关《第九部分图像压缩编码优秀文档.ppt（117页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、第第9部分部分图象压缩编码图象压缩编码9 9.1 1 基本概念基本概念9 9.2 2 基础理论基础理论9 9.3 3 变长编码变长编码 9 9.4 4 位平面编码位平面编码 9.5 9.5 预测编码预测编码9 9.6 6 变换编码变换编码9 9.7 7 子带编码子带编码 9 9.8 8 小波变换编码小波变换编码 9.9 9.9 编码标准编码标准动机动机/原因：原因：表达数字图象所需数据量通常很大例:灰度图象灰度图象:彩色图象彩色图象:视频视频(运动图象运动图象):传输传输:在在ISDN(码率为码率为64k bps-2M bps),无压缩传输上述每无压缩传输上述每秒的视频信号约需要秒的视

2、频信号约需要75秒秒(码率码率2Mbps)存储存储:软盘软盘(存储容量存储容量1.4MBytes),无压缩最多存储无压缩最多存储2幅彩图幅彩图 VCD(存储容量存储容量 680MBytes),无压缩只能存储无压缩只能存储30多秒视频多秒视频9 9.1 1 基本概念基本概念图象编码：图象编码：w采用对图象的新的表达方法以减小所需的数据量w数据和信息：数据是信息的载体w数据压缩：对给定量的信息可用不同的数据量来表示对给定量的信息，设法减少表达这些信息的数据量称为w图象压缩（编码）和图象解压缩（解码）图象压缩方法的分类图象压缩方法的分类：信息保存型：信息保存型：在压缩和解压缩过程中没有信息损失压缩率

3、一般在2 10之间信息损失型：信息损失型：常能取得较高的压缩率（几十几百）压缩后并不能经解压缩恢复原状准无损（near-lossless）：一、数据冗余1、数据冗余的概念、数据冗余的概念数据是信息的载体同量的数据可表达不同量的信息同量的信息可用不同量的数据表达冗余冗余数据表达了无用的信息数据表达了已表达的信息相对数据冗余相对数据冗余数据冗余可定量描述，相对冗余：相对冗余：压缩率压缩率：CR 在开区间(0,)中取值n1和n2代表2个数据集合中的信息载体单位的个数 2、数据冗余类别、数据冗余类别(1)编码冗余编码冗余与灰度分布的概率特性有关(2)象素相关冗余象素相关冗余空间冗余，几何冗余(3)心

4、理视觉冗余心理视觉冗余与主观感觉有关减少/消除其中的一种/多种冗余，就能取得数据压缩的效果（1）编码冗余编码冗余编码：编码：需建立码本来表达数据码本：码本：用来表达一定量的信息或一组事件所需的一系列符号（如字母、数字等）码字：码字：对每个信息或事件所赋的码符号序列码字的长度（码字的长度（字长字长）：）：每个码字里的符号个数图象中灰度出现的概率不同灰度出现的概率不同平均比特数平均比特数用较少的比特数表示出现概率较大的灰度级用较多的比特数表示出现概率较小的灰度级（2）象素间冗余象素间冗余直接与象素间相关性联系规则冗余大不规则冗余小（3）心理视觉冗余心理视觉冗余l主观：因人而异，因应用要求而异l

5、其存在与人观察图象的方式有关眼睛对某些视觉信息更敏感人对某些视觉信息更关心l心理视觉冗余与实在的视觉信息有联系（损失不可逆转）1、图象保真度、图象保真度信息保存型/信息损失型描述解码图象相对于原始图象的偏离程度对信息损失的测度主观保真度准则主观保真度准则主观测量图象的质量，因人而异，应用不方便客观保真度准则客观保真度准则用编码输入图与解码输出图的某个确定函数表示损失的信息量，便于计算或测量二、图象保真度和质量 2.客观保真度准则客观保真度准则点误差图误差均方根误差均方信噪比（归一化）信噪比信噪比：令单位：分贝（dB）峰值信噪比峰值信噪比3.主观保真度准则主观保真度准则观察者对图象综合评价的平

6、均电视图象质量评价尺度图象编解码系统模型图象编解码系统模型两个通过信道级连的结构模块输出图是输入图的精确复制？信息保持型：是，无失真信息损失型：不是，有一定的失真三、图象编码模型1、信息量、信息量概率为P(E)的随机事件 E 的信息量I(E)称为E的自信息自信息（随概率增加而减少）特例：P(E)=1（即事件总发生），那么I(E)=0信息的单位：比特（log以2为底）1个比特：即2个相等可能性的事件之一发生一、一、信息论简介信息论简介9.2 基础理论基础理论离散平稳随机序列信源的熵离散平稳随机序列信源的熵可以证明可以证明2、信息系统、信息系统信源通过信道与信宿（即信息用户）连通以

7、传递自信息。信源符号集：信源符号集：A=a1,a2,aJ 概率矢量：概率矢量：u=P(a1)P(a2)P(aJ)T用(A,u)可以完全描述信源平均信息平均信息产生单个信源符号的自信息：I(aj)=logP(aj)产生k个信源符号，符号aj平均来说将产生kP(aj)次信源的熵或不确定性：观察到单个信源符号输出时所获得的平均信息量 3、互信息、互信息条件熵平均条件熵（平均信息）互信息信道容量v v=P(b1)P(b2)P(bJ)T1、无失真编码定理、无失真编码定理(香农第一定理)确定每信源符号可达到的最小平均码字长度信息传输系统如果信道和传输系统都没有误差，传输系统的主要功能就是尽可能紧凑

8、地表达信源（数据压缩）二、基本编码定理块信源符号集：A=a1,a2,aJn P(a i)=P(aj1)P(aj2)P(ajn)概率矢量：u =P(a1)P(a2)P(aJn)T信源熵：信源熵：产生块随机变量的（零记忆）信源的熵是对应单符号信源的 n 倍扩展信源平均码长第一定理：第一定理：编码效率：编码效率：（H(u)是Lavg/n的下限）主观：因人而异，因应用要求而异单位：分贝（dB）化（归一化）后的近似。10 19 23 32 39 45 52 54将取阈值和量化结合起来.不同灰度出现的概率不同重建值的中值为支持基于对象的编码，MPEG-4还采用形状编码和与之相关的形状自适应DCT(SA

9、-DCT)技术以支持任意形状视频对象(VideoObject，VO)的编码。彩色图象:在不同尺度间调整量化间隔1997年7月的会议后发布了。不重要集合表(LIS):放置的小波系数的位置坐标表示不重要集合;产生k个信源符号，符号aj平均来说将产生kP(aj)次DCT系数按之字形扫描重新排序,得到根据频率增加的顺序排列的1_D序列,系数量化后,排序的结果得到值为0的长游程.4 位平面编码失真（随机变量）的平均值d(Q)2、信源编码定理（、信源编码定理（为率失真定理）信道没有误差但传输过程有失真（Q是传输矩阵）此时传输系统的主要功能就是“信息压缩”目标：目标：平均误差被限制在某个最大允许的水平D在给

10、定保真度准则的前提下，确定最小的R失真（随机变量）的平均值d(Q)允许失真为D的编码解码过程的集合率失真函数非负的失真量度函数（代价函数）需要合理选择Q以求取I(u,v)的最小值(1)Q的元素必须是正的(2)Q的任1列之和为1(3)如果允许最大可能的失真，就会产生最小的信息率零记忆二元对称信源的率失真函数特点特点:R(D)总是正的，单减的在0,Dmax区间下凸 R(D)在D DCT DFT WHT直接与象素间相关性联系对于B帧，每一宏块仅有I块和F块。VM描述了编码和解码方法，主要用于软件模拟，以优化编解码的性能。2 Mbs，压缩率为2001。化（归一化）后的近似。14 17 22 29

11、 51 87 80 62 47 66 99 99 99 99 99 99二、图象保真度和质量变换编码重建误差与子图象尺寸的关系产生k个信源符号，符号aj平均来说将产生kP(aj)次准无损（near-lossless）：9.5 预测编码预测编码空域方法，消除象素间的冗余象素间的相关性使得预测成为可能仅提取每个象素中的新信息并对它们编码一、无损预测编码(信息保存型)1、无损预测编码系统、无损预测编码系统编码器+解码器（有相同的预测器）无损预测编码过程无损预测编码过程输入序列：fn(n=1,2,)预测输出：（舍入成整数）预测误差：误差编码：在符号编码器中用变长码编误差解压序列：哪里取得了压缩？（消

12、除了象素间冗余）（消除了象素间冗余）m阶线性预测：1-D线性预测：一阶1-D线性预测：预测误差的概率密度函数：二、有损预测编码（信息损失型）1、有损预测编码系统、有损预测编码系统增加了1个量化器，预测器放在1个反馈环中输入序列：fn(n=1,2,)量化输出：预测输入：解压序列：编码误差：哪里又又取得了压缩？（量化，减少了（量化，减少了心理视觉冗余）心理视觉冗余）2、最优预测、最优预测最小化编码器的均方预测误差差值脉冲码调制法（DPCM）二维线性预测二维线性预测预测误差信号的统计性质预测误差信号的统计性质例:三阶预测三阶预测解得解得实际应用中的几点说明实际应用中的几点说明(a)预测系数预

13、测系数与图象的统计特性有关与图象的统计特性有关,通常用一组典通常用一组典型图象来确定型图象来确定(b)(c)预测阶数的选择预测阶数的选择-对平稳对平稳m阶马尔可夫过程阶马尔可夫过程,m阶预测阶预测(d)(e)典型失真典型失真斜率过载斜率过载灰度突变点灰度突变点,预测值偏小预测值偏小,量化步长偏小量化步长偏小,产生边缘产生边缘模糊模糊颗粒噪声颗粒噪声-灰度慢变点灰度慢变点,预测值偏大预测值偏大,量化步长偏大量化步长偏大(f)优缺点优缺点-简单简单,易于硬件实现易于硬件实现.抗误码性能差抗误码性能差4阶线性预测器 3、最优量化、最优量化判别重建最小均方量化误差最小均方量化误差重建电平是

14、重建电平是p(s)曲线下面积的重心曲线下面积的重心判别值为判别值为2个个重建值的中值重建值的中值 q(s)奇函数输入概率密度函数，偶函数4.帧内编码（类似静态图像编码）帧内编码（类似静态图像编码）u分块：将图像平面分成88图像快；u变换：通常是进行DCT（整数变换）；u量化：对DCT系数按照特定的量化表进行量化；uZ形扫描：将量化的交流分量系数按照Z字形顺序扫描排列；u游程编码：对交流系数用游程编码，对相邻快的直流系数采用预测编码（DPCM)；u熵编码：用哈夫曼或算术编码对游程编码后的数据进行熵编码。0 1 5 6 14 15 27 280 1 5 6 14 15 27 28 2 4 7

15、13 16 26 29 42 2 4 7 13 16 26 29 42 3 8 12 17 25 30 41 43 3 8 12 17 25 30 41 43 9 11 18 24 31 40 44 53 9 11 18 24 31 40 44 53 10 19 23 32 39 45 52 54 10 19 23 32 39 45 52 54 20 22 33 38 46 51 55 60 20 22 33 38 46 51 55 60 21 34 37 47 50 56 59 61 21 34 37 47 50 56 59 61 35 36 48 49 57 58 62 63 35 36

16、48 49 57 58 62 63 5.5.帧间编码（帧间预测编码）帧间编码（帧间预测编码）目前主要采用运动估计和运动补偿算法。目前主要采用运动估计和运动补偿算法。u在帧间预测编码中，为了达到较高的压缩比，最重要的是得到尽可能小的帧间预测误差。u对运动物体区域进行预测，首先要估计运动物体的位移（运动矢量），然后再根据运动矢量找出物体在前一帧的区域位置，计算前后帧运动物体相应点之间的差值。u运动估计算法的一般步骤（编码端使用）：对当前帧中的某一宏块，按照一定的准则在参考帧的窗口中寻找匹配部分，从中找到运动矢量；根据运动矢量，将参考帧位移，求得当前帧的估计；将这个估计和当前帧相减，求估计的残差值；

17、将运动估计和残差传送到接收端。u运动补偿算法的一般步骤（解码端使用）：根据接收的运动矢量将参考帧作位移，得到对当前帧的估计；将上述估计和接收到的残差相加，得到当前帧的补偿结果。u运动补偿的关键是运动估计。u运动估计技术的分类：像素递归法相位相关法块匹配法（常用的方法）：对当前帧图像的每一块，在上一帧的一定范围内搜索最优匹配块，并认为本块就是从上一块最优匹配块位置处平移过来的。设可能的最大偏矢量为dxmax,dymax，则搜索范围为(M+2dxmax)(N+2dymax)。u块匹配算法(M+2dx）(N+2dy)dydxk-1帧的搜索区k帧MN像素块MN匹配块u匹配块位置与MN块位置的坐标偏移量

18、即为所估计的运动矢量。（1）最优匹配准则u最小平均绝对差（不需要作乘法、实现简单、方便）u最小均方误差u归一化互相关函数（2）搜索方法u一次一个方向搜索法u二维对数法u三步法u新三步法三步法:u基本思想是采用一种由粗到细的搜索模式，从原点开始，按一定步长取周围8 个点构成每次搜索的点群，然后进行匹配计算，跟踪最小误差MBD点，算法具体描述如下：1）从原点开始，选取最大搜索长度的一半为步长，在周围距离步长的8 个点处进行块匹配计算并比较;2）将步长减半，中心点移到上一步的MBD 点，重新在周围距离步长的8 个点处进行块匹配计算并比较;3）在中心及周围8个点处找出MBD 点，若步长为1，该点所在位

19、置即对应最佳运动矢量，算法结束；否则，重复2）。新三步法:u第1 步同时搜索中心和距中心网格步长为4 和网格步长为2 的各8个点，计算比较取得最小MBD 的点作为下一步的中心点;u第2步修改为，如果第一步的最佳匹配点在距中心网格步长为4的8个点中，则以该点为中心点，以步长为2，进行搜索，找最小的MBD点,如果第一步的最佳匹配点为其它9个点，则直接进人第3步;u第3步,在中心及周围8个点处找出最小的MBD点，该点所在位置即对应最佳运动矢量。一、变换编码系统一、变换编码系统图象分解：减少变换的计算复杂度图象变换：解除每个子图象内部象素之间的相关性，或者说将尽可能多的信息集中到尽可能少的变换系数上

20、压缩不是在变换中而是在量化变换系数时取得的压缩不是在变换中而是在量化变换系数时取得的9.6 变换编码（变换编码（非信息保持型）二、子图象尺寸选择二、子图象尺寸选择影响变换编码误差和计算复杂度（压缩量和计算复杂度都随子图象尺寸的增加而增加）两个条件：两个条件：相邻子图象之间的相关（冗余）减少到某个可接受的水平；子图象的长和宽都是2的整数次幂最常用的子图象尺寸：最常用的子图象尺寸：8 8和16 16 变换编码重建误差与子图象尺寸的关系三、变换选择三、变换选择u一个能把最多的信息集中到最少的系数上去的变换所产生的重建误差最小 u不同变换的信息集中能力不同 lKLT最优，但计算量非常大（依赖于图象）l

21、正弦类变换（如DFT和DCT）较优l非正弦类变换（如WHT）实现简单l小波变换计算快且有局部性质（不需分解）信息集中能力：信息集中能力：KLT DCT DFT WHT所需计算量：所需计算量：KLT DCT DFT WHTDCT是较好的（综合）选择是较好的（综合）选择四、比特分配四、比特分配u比特分配：比特分配：对变换子图象的系数截断、量化和编码的全过程。截断误差与两个因素有关：截断误差与两个因素有关：截除的变换系数的数量和相对重要性用来表示所保留系数的精度（量化）保留系数的保留系数的2个准则：个准则：最大方差准则，称为分区编码最大幅度准则，称为阈值编码1、分区编码、分区编码具有最大方差的变

22、换系数带有最多的图象信息，事先确定模板，保留一定的系数（如左下图）。典型的分区模板和分区比特分配2 2、阈值编码、阈值编码根据子图象特性自适应选择保留系数将系数排队，与阈值比较确定去舍。典型的阈值模板和取阈值系数序列63625857494836350000000061595650473734210000000060555146383322200000001054524539322319100000000053444031241811900000001434130251712830000001142292616137420000111128271514651000001011随子图象不同而保留不

23、同位置的变换系数常用对变换子图象取阈值的方法：(1)对所有子图象用一个全局阈值压缩的程度随（不同）图象而异。(2)对各个子图象分别用不同的阈值舍去同数量系数，码率是个常数。(3)根据子图象中系数的位置选取阈值将取阈值和量化结合起来.给出F的一个截断近似。上式中用代替，是的取值和量化（归一化）后的近似。是变换归一化数组。9.7 子带编码子带编码子带：子带：由图象分解得到的一系列带限分量的集合将它们重新组合起来可以无失真地重建原始图象u将图象分解为子带后进行编码的主要好处:(1)不同子带内的图象能量和统计特性不同，可以采取不同的变长码甚至不同的编码方法分别进行编码，提高编码效率。(2)通过频

24、率分解，减少或消除了不同频率之间的相关性，有利于减少图象数据的冗余。(3)量化等操作可在各子带内分别进行，避免了互相干扰和噪声扩散。1、子带分解、子带分解输出序列x*(n)是先通过将x(n)用分析滤波器h0(n)和h1(n)分解为y0(n)和y1(n)，再借助合成滤波器g0(n)和g1(n)进行重建得到的。h0(n)和h1(n)都是半带（half-band）滤波器，其中h0(n)对应一个低通滤波器，其输出是x(n)的近似部分，h1(n)对应一个高通滤波器，其输出是x(n)的细节部分。序列x(n)，n=0,1,2,的Z-变换在时域中以2为因子的抽样在时域中以2为因子的内插序列x(n)先被抽样

25、再被内插，得到x*(n)根据Z-变换来考虑子带编码和解码系统系统的输出为：其中第2项（依赖于z）表达了由于抽样和内插过程而引入的混叠 2、子带重建、子带重建重建无失真，x*(n)x(n)和X*(z)X(z)结合进一个矩阵表达式假设Hm(z)是非奇异的（行列式不为零）分析滤波器和合成滤波器是交叉调制的对有限冲击响应（finite impulse response，FIR）滤波器，detHm(z)=az(2k+1)在时域中以2为因子的抽样4)MPEG-7 MPEG针对基于内容的问题启动了一个新的工作项目。小波变换的计算效率很高，且本质上具有局部性对第2位平面（最高位）：型图象来确定P帧：在帧编

26、码时，仅使用最近前一帧(I帧或P帧)作为参照帧的帧称为P帧，或称为预测帧。信源符号集：A=a1,a2,aJ幅值-非零AC系数的幅值小波变换编码需考虑的几个因素动机/原因：表达数字图象所需数据量通常很大MPEG-4利用很窄的带宽，通过帧重建技术和数据压缩，以求用最少的数据获得最佳的图像质量。编码来自1个4-符号信源a1,a2,a3,a4的由5个符号组成的符号序列：b1b2b3b4b5=a1a2a3a3a4一阶1-D线性预测：35 36 48 49 57 58 62 634 2 2，3 3 2，3 4 1，4 2 2空间方向树定义：除最低分解级的三个高频子带和最高分解级的一个低频子带外，每一个树节

27、点都有四个直接后代，这四个直接后代在同方向的下一级子带中以22大小连结在一起的像素块组成；n1和n2代表2个数据集合中的信息载体单位的个数一、一、小波变换编码系统小波变换编码系统与采用正交变换（如DCT）的编解码系统不同，小波变换编解码系统中没有图象分块的模块小波变换的计算效率很高，且本质上具有局部性小波变换编码不会产生使用DCT变换在高压缩比时的块效应 9.8 小波变换编码小波变换编码小波变换编码需考虑的几个因素小波变换编码需考虑的几个因素1.1.小波选择小波选择如：双正交小波2.2.分解层数选择分解层数选择影响小波编码计算的复杂度和重建误差3.3.量化设计量化设计对小波编码压缩和重建误差影

28、响最大在不同尺度间调整量化间隔等级树集分割编码方法等级树集分割编码方法(SPIHT)空间方向树定义：除最低分解级的三个高频子带和最高分解级的一个低频子带外，每一个树节点都有四个直接后代，这四个直接后代在同方向的下一级子带中以22大小连结在一起的像素块组成；最低分解级三个高频子带无后代；最高分解级的最低频子带中的像素点称为树根，树根的直接后代和其他各节点的直接后代的形成有所不同，树根以22大小连结在一起的像素块为一组，一组中有一个像素点无后代，另外三个像素点分别在同一分解级、不同方向的高频子带中产生四个直接后代，箭头表示各节点产生后代的方向。带“*”号的像素不产生后代。u三个表三个表:不重要集

29、合表不重要集合表(LIS):(LIS):放置的小波系数的位置放置的小波系数的位置坐标表示不重要集合坐标表示不重要集合;不重要像素表不重要像素表(LIP):(LIP):放置不重要小波系数的位放置不重要小波系数的位置坐标；置坐标；重要像素表（重要像素表（LSPLSP）:其中是重要小波系数的位其中是重要小波系数的位置坐标。对应某个树节点的小波系数超过某一置坐标。对应某个树节点的小波系数超过某一阈值称该系数为重要系数。阈值称该系数为重要系数。u两个集合：两个集合：A A类：类：(i,ji,j)表示其所有的后代；表示其所有的后代；B B类：类：(i,ji,j)代表的集合中不包括其直接后代。代表的集合中不

30、包括其直接后代。SPIHTSPIHT算法步算法步骤骤：（1）初始化：将最高分解）初始化：将最高分解级级的低的低频频子子带带的根的根节节点的小点的小波系数的坐波系数的坐标标放入放入LIP，有后代的，有后代的节节点的坐点的坐标标放入放入LIS中，中，作作为为A类类集合；集合；LSP初始化初始化为为空集。空集。（2）扫扫描排序：将描排序：将LIP中重要系数的坐中重要系数的坐标标移到移到LSP中。中。对对LIS中的中的A类类集合，如果后代中有重要系数，集合，如果后代中有重要系数，则则将将A类类集合分集合分为为直接后代和一个直接后代和一个B类类集合，根据直接后代是否集合，根据直接后代是否是重要系数，坐是

31、重要系数，坐标标被移入被移入LIP或或LIS中。中。对对LIS中的中的B类类集合，如果后代中有重要系数，集合，如果后代中有重要系数，则则将直接后代坐将直接后代坐标标放入放入LIS最后，作最后，作为为A类类集合。集合。（3）细细化：按化：按递递减次序减次序输输出出LSP中每个系数在相中每个系数在相应码应码平平面的上的比特。面的上的比特。（4）量化系数更新：比）量化系数更新：比较阈值较阈值减半，回到步减半，回到步骤骤（2）。）。二、基于提升二、基于提升小波的编码小波的编码可以在当前位置实现整数到整数的变换，运算速度快且节约内存。它包括三个步骤：1.分裂（分裂（split）将图象数据分解成偶数部分和

32、奇数部分 S uj(x,y):=uj1,k(x,y),vj1,k(x,y)2.2.预测（预测（predictpredict）保持偶数部分不变并用偶数部分来预测奇数部分，然后用奇数部分与预测值的差（称为细节系数）替代奇数部分vj1,k(x,y):=vj1,k(x,y)P uj 1,k(x,y)3.更新（更新（update）构造一个作用于细节函数的算子U，并叠加到偶数部分上以获得近似图象，这里要保持原始图象的一些特性 uj 1,k(x,y):=uj 1,k(x,y)+U vj 1,k(x,y)重建过程重建过程三个运算：三个运算：（M 合并）(1)uj1,k(x,y):=uj1,k(x,y)U vj

33、1,k(x,y)(2)vj1,k(x,y):=vj1,k(x,y)+P uj1,k(x,y)(3)uj,k(x,y):=M uj1,k(x,y),vj1,k(x,y)19801980年以来，国际标准化组织年以来，国际标准化组织(ISO)(ISO)、国际电工、国际电工委员会委员会(IEC)(IEC)和国际电信联盟和国际电信联盟(ITU)(ITU)下属的国际电报下属的国际电报电话咨询委员会电话咨询委员会(CCITT)(CCITT)陆续完成了各种数据压缩与陆续完成了各种数据压缩与通信的标准和建议，如面向静止图像压缩的及通信的标准和建议，如面向静止图像压缩的及ISO10918(JPEG)ISO1091

34、8(JPEG)标准，在运动图像方面用于视频会标准，在运动图像方面用于视频会议的议的CCITTH.261(Px64)CCITTH.261(Px64)标准、用于可视电话的标准、标准、用于可视电话的标准、用于用于VCDVCD的的 MPEG-1 MPEG-1及用于广播电视和及用于广播电视和DVDDVD的的 MPEG-2MPEG-2标准，适用于低传输速率的标准，适用于低传输速率的 MPEG-4MPEG-4方案等。方案等。9.9 9.9 图象编码国际标准简介图象编码国际标准简介简称简称标准编号标准编号推出日期推出日期标准标准及说明及说明H.261ITU-T H.2611990年P*64kbps视听业务H

35、.263ITU-T H.2631996年低比特率通信H.263+ITU-T H.263 Ver.21998年H.263第二版H.26+ITU-T H.263 Ver.32000年H.263第三版H.264ITU-T H.264(MPEG4/10)2003年先进的视频编码（AVC）JPEGISO/IEC 10918-11992年连续调静止图像压缩编码JPEG-LSISO/IEC 14495-11999年连续调静止图像无损JPEG2000ISO/IEC 154442000年连续调静止图像压缩（小波）MPEG-1ISO/IEC 111721993年数字存储活动图像和声音MPEG-2ISO/IEC 1

36、38181994年活动图像和声音的通用编码MPEG-4ISO/IEC 144961999年音视频对象的通用编码MPEG-7ISO/IEC多媒体内容描述接口MPEG-21ISO/IEC多媒体框架标准JBIG1ISO/IEC1993年二值图像编码标准（第一版）JBIG2ISO/IEC1999年二值图像编码标准（第二版）1、JPEG:Joint Photographic Experts Group(联合影象专家小组)(1)(1)四种操作模式四种操作模式 a.顺序编码-基本系统,基于分块DCT技术,仅支持有失真编码 b.累进编码-图象从粗到细(从模糊到清晰)逐步浮现 (a)频谱选择方式;(b)逐次逼近

37、方式(从幅值高位低位)c.无损编码-基于无损DPCM技术 d.分层编码-不同空间分辨率层次(2)JPEG(2)JPEG基本系统基本系统彩色空间转换：系统框图系统框图a.分块分块DCTb.量化器量化器亮度量化表亮度量化表色度量化表色度量化表1611 10 16 24 40 51 61 17 18 24 47 99 99 99 99 1212 14 19 26 58 60 55 18 21 26 66 99 99 99 99 1413 16 24 40 57 69 56 24 26 56 99 99 99 99 99 14 17 22 29 51 87 80 62 47 66 99 99 9

38、9 99 99 991822 37 56 68 10910377 99 99 99 99 99 99 99 992435 55 64 81 10411392 99 99 99 99 99 99 99 9999 99 99 99 99 99 9999 99 99 99 99 99 99 亮度色度水平样本数 2:1,8bits图象建议使用c.c.熵编码器熵编码器 DCT系数按之字形扫描重新排序,得到根据频率增加的顺序排列的1_D序列,系数量化后,排序的结果得到值为0的长游程.系数位置排序系数位置排序 0 1 5 6 14 15 27 280 1 5 6 14 15 27 28 2 4 7 13 1

39、6 26 29 42 2 4 7 13 16 26 29 42 3 8 12 17 25 30 41 43 3 8 12 17 25 30 41 43 9 11 18 24 31 40 44 53 9 11 18 24 31 40 44 53 10 19 23 32 39 45 52 54 10 19 23 32 39 45 52 54 20 22 33 38 46 51 55 60 20 22 33 38 46 51 55 60 21 34 37 47 50 56 59 61 21 34 37 47 50 56 59 61 35 36 48 49 57 58 62 63 35 36 48 4

40、9 57 58 62 63 DC系数的编码系数的编码-采用差值编码采用差值编码(考虑块间的相关性考虑块间的相关性)AC系数的编码系数的编码-行程编码行程编码差值和行程进行熵编码差值和行程进行熵编码-Huffman编码编码,分两步进行分两步进行(a)产生一种中间符号格式序列产生一种中间符号格式序列(b)对中间符号格式序列进行变字长编码对中间符号格式序列进行变字长编码 u交流系数交流系数AC(前缀码前缀码+尾码尾码)符号符号-1 行程行程,尺寸尺寸行程行程-非零系数前的零值系数的个数非零系数前的零值系数的个数(规定规定0-15)尺寸尺寸-对幅值编码的比特数对幅值编码的比特数(原图原图8位精度时位

41、精度时,1-10)符号符号-2 幅值幅值幅值幅值-非零非零AC系数的幅值系数的幅值行程行程,尺寸尺寸用用Huffman编码表作变长编码编码表作变长编码(前缀码前缀码),幅幅度度尾码尾码u差值差值DC系数系数(前缀码前缀码+尾码尾码)符号符号-1 尺寸尺寸(原图原图8位精度时位精度时,0-11)符号符号-2 幅值幅值尺寸尺寸用用Huffman编码编码(前缀码前缀码),幅度幅度尾码尾码 (尾码直接采用自然二进码尾码直接采用自然二进码)2.MPEG2.MPEG视频压缩方法视频压缩方法帧内压缩是删除空间的数据冗余，帧间压缩则是删除帧与帧之间的时间冗余。1)空间域压缩和时间域压缩 MPEG在空间域

42、的压缩，类似于JPEG，每一帧被作为独立的图像获取，且压缩步骤与JPEG标准步骤一样。要消除帧与帧之间的时间冗余，通过帧间编码完成。2)帧间编码帧间编码的基本思想是仅存储运动图像从一帧到下一帧的变化部分，而不是存储全部图像数据，这样能极大地减少运动图像数据的存储量，达到帧间压缩的目的。把帧序列划分成I帧、P帧、B帧，通过使用参照帧由运动补偿技术来实现。I帧：在解码时，无需参照任何其他帧的帧称为I帧，或称内编码帧，它是利用自身的相关性进行帧内压缩编码的。P帧：在帧编码时，仅使用最近前一帧(I帧或P帧)作为参照帧的帧称为P帧，或称为预测帧。B帧：在帧编码时，要使用前、后帧作为参考帧的帧称为B帧，或

43、称为双向预测帧。3)3)运动补偿技术运动补偿技术在帧编码中，运动补偿技术是提高帧间压缩的有效方法，它主要用于消除P帧和B帧在时间上的冗余。在对P帧和B帧进行编码时，以宏块为基本编码单位。对于B帧，每一宏块有4种类型：帧内宏块，简称I块；前向预测宏块，简称F块；后向预测宏块，简称B块；平均宏块，简称A块。对于B帧，每一宏块仅有I块和F块。无论B帧还是P帧，I块编码均与I帧编码技术一致。F块、B块、A块都采用了基于块的运动补偿技术。基于块的运动补偿技术是在参照帧中寻找与当前编码块最佳匹配的宏块。所谓最佳匹配是指这两个宏块之间差值最小，通常可用AE(Absolute difference)最小作为匹

44、配依据：其中，f是参照帧宏块，g为当前编码宏块，dx、dy是参照宏块在x和y方向上的运动矢量，它反映了从一帧到另一帧时，宏块仅仅是位置发生了改变，而内容并没有改变。3.MEPG3.MEPG标准标准1)MPEG-1 MPEG-1制定于1992年，可适用于不同带宽的设备，如CDRO M、VideoCD、CD-i等，它的目的是把221 Mb/s的NTSC图像压缩到1.2 Mbs，压缩率为2001。这是图像压缩的工业认可标准。它可针对SIF标准分辨率(对于NTSC制为352240；对于PAL制为352288)的图像进行压缩，传输速率为1.5 Mb/s，每秒播放30帧，具有CD音质，质量级别基本与VHS

45、(广播级录像带)相当。MPEG的编码速率最高可达45 Mb/s，但随着速率的提高，其解码后的图像质量有所降低。应用 MPEG-1技术最成功的产品为VCD。VCD作为价格低廉的影像播放设备得到普及。MPEG-1也被用于数字电话网络上的视频传输，如非对称数字用户线路(ADSL)、视频点播(VOD)以及教育网络等。2)MPEG-22)MPEG-2 MPEG-2制定于1994年，其设计目标是高级工业标准的图像质量以及更高的传输率。MPEG-2所能提供的传输速率为310 MB/s间，在NTSC制式下的分辨率可达720480。MPEG-2能够提供广播级的视像和CD级的音质。MPEG-2的音频编码可提供左右

46、中及两个环绕声道，以及一个加重低音声道和多达七个伴音声道。MPEG-2的另一特点是可提供一个较广范围的可变压缩比，以适应不同的画面质量、存储容量以及带宽的要求。MPEG-2技术就是实现DVD的标准技术，现在DVD播放器也已经在家庭中普及了。除了作为DVD的指定标准外，MPEG-2还可用于为广播、有线电视网、电缆网络以及卫星直播提供广播级的数字视频。由于 MPEG-2的出色性能表现，已能适用于HDTV(高清晰度电视)，使得原打算为HDTV设计的 MPEG-3还没有产生就被抛弃了。3)MPEG-4MPEG-4专家组成立于1993年。在1995年3月的Florence会议上初步定义了一个音频验证模型

47、，并于1996年1月在Munich会议上定义了第一个视频验证模型(Verification Model，VM)，它提供了支持基于内容的视频表达环境。VM描述了编码和解码方法，主要用于软件模拟，以优化编解码的性能。1997年7月的会议后发布了。MPEG征集到的技术建议经评估后，如认为可行，就会被加到VM中。MPEG-4比 MPEG-2的应用更广泛，最终希望建立一种能被多媒体传输、多媒体存储、多媒体检索等应用领域普遍采纳的统一的多媒体数据格式。由于所要覆盖的应用范围如此广阔，同时，应用本身的要求又如此不同，因此，MPEG-4不同于过去的 MPEG-2或系列标准，其压缩方法不再是限定的某种算法，而是

48、可以根据不同的应用进行系统裁剪，选取不同的算法。例如对Intra帧的压缩就提供了DCT和Wavelet两种变换。比起 MPEG-2及系列，MPEG-4新变化中最重要的三个技术特征是：基于内容的压缩、更高的压缩比和时空可伸缩性。MPEG-4于1998年11月公布，它不仅是针对一定比特率下的视频、音频编码，而且更加注重多媒体系统的交互性和灵活性。这个标准主要应用于视像电话、视像电子邮件等，对传输速率要求较低，在480064000 b/s之间，分辨率为176144。MPEG-4利用很窄的带宽，通过帧重建技术和数据压缩，以求用最少的数据获得最佳的图像质量。MPEG-4用运动补偿消除时域冗余，用DCT消

49、除空域冗余，与以往视频编码标准相同。为支持基于对象的编码，MPEG-4还采用形状编码和与之相关的形状自适应DCT(SA-DCT)技术以支持任意形状视频对象(VideoObject，VO)的编码。另外，MPEG-4用视频对象来表述视频内容的基本单元，如：一个站立的人(脱离背景)就是一个VO，VO与其他的AVO(音视频对象)组合成一个特定的场景。传统的矩形图像只能被认为是将整个图像作为一个对象，是这种视频对象的一种特例。4)MPEG-7 MPEG针对基于内容的问题启动了一个新的工作项目。这个 MPEG家族的新成员是“多媒体内容描述界面”(Multimedia Content Description

50、 Interface)，简称为 MPEG-7。它的目标是扩展现在有限的查询能力，使其包括更多的信息形式，即 MPEG-7将确立各种类型的多媒体信息标准的描述方法。这种描述与内容密切相关，并支持对用户感兴趣的材料的快速、高效搜索。所谓“材料”包括静止的画面、图形、声音、运动视频以及上述元素如何结合成多媒体信息(“剧情”、合成信息)，还包括上述一般形式中较为特殊的情况，如面部表情、人物特点等。这种描述可以附加到任何种类的多媒体材料上，而不管其具体形式如何，例如含有这种信息的存储材料可以很方便地进行检索和查询。MPEG-7对行信息的描述方法不依赖于材料的具体表示形式，并建立在 MPEG-4基础之上。

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

15 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 第九部分图像压缩编码优秀文档

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：第九部分图像压缩编码优秀文档.ppt
链接地址：https://www.taowenge.com/p-91509204.html