数字视频处理 第5章数字视频编码.ppt
第第5章章 数字视频编码数字视频编码前面介绍了视频压缩编码的基本理论、视频前面介绍了视频压缩编码的基本理论、视频编码系统组成和无失真视频压缩编码,本章编码系统组成和无失真视频压缩编码,本章介绍视频压缩编码的其他方法,主要有:预介绍视频压缩编码的其他方法,主要有:预测编码、变换编码、基于内容的视频编码和测编码、变换编码、基于内容的视频编码和分层编码等。分层编码等。5.1预测编码预测编码在视频预测编码中,预测编码主要可分在视频预测编码中,预测编码主要可分为帧内预测和帧间预测,下面首先介绍为帧内预测和帧间预测,下面首先介绍预测编码的原理,然后介绍帧内预测和预测编码的原理,然后介绍帧内预测和帧间预测。帧间预测。5.1.1 预测编码原理预测编码原理1.预测编码的方法预测编码的方法 所谓预测编码预测编码,就是不直接对当前符号进行编码,而是利用相邻符号来预测当前符号,然后对预测误差进行编码。图图5-1 预测编码器框图预测编码器框图 图图5-2 预测解码器框图预测解码器框图 2预测编码性能预测编码性能预测编码可以分为线性预测编码和非线性预测编码。所谓线性预测线性预测,即预测值是过去样值的线性函数,否则为非线性预测。5.1.2 帧内编码帧内编码所谓所谓帧内预测编码帧内预测编码,就是预测函数,就是预测函数 中的中的 均取自同一帧内,此时预测编码利均取自同一帧内,此时预测编码利用的是同一帧内相邻样值之间的相关性。用的是同一帧内相邻样值之间的相关性。图5-3 帧内预测编码原理 5.1.3 5.1.3 帧间编码帧间编码所谓帧间预测编码,即预测方程 中的 取自相邻帧。帧间预测是利用了视频图像序列时间上的强相关性,其主要方法有主要方法有帧重复法、帧内插法、运动补偿法、自适应交替帧内/帧间编码法等。运动补偿预测形式运动补偿预测形式(1)单向运动补偿预测(2)双向运动补偿预测(3)插值运动补偿预测 匹配程度的判定和匹配块的搜索算法是运动补偿预测的两个核心问题。目前,常用的匹配准则有三种三种:最小绝对值误差、最小均方误差和归一化互相关函数。5.2 5.2 变换编码变换编码5.2.1 5.2.1 变换编码原理变换编码原理 所谓变换编码,就是换一种表示方式来表示原始数据,或者说在不同于原始空间的变换空间里来描述原始数据,以使数据获得某些特点,这些特点有助于获得更好的编码效果。图5-4 变换编码原理 5.2.2 5.2.2 离散余弦变换编码离散余弦变换编码1正交变换编码的理论基础先通过变换把各个信源变成独立信源,去除各个信源输出(也就是每个像素)之间的相关性,再对每个输出进行编码。这就是正交变换编码的原理。常用的正交变换主要有傅立叶变换、K-L变换、离散余弦变换等。2离散余弦变换编码离散余弦反变换(IDCT)定义为:图5-5 lena图像 图5-6 Zig-Zag扫描示意图 5.2.3 5.2.3 小波变换编码小波变换编码1小波变换编码的理论基础连续小波变换离散小波变换多分辨率分析和离散小波变换的快速算法2小波变换编码小波变换编码由于小波变换所具有的多分辨率能力和适合人眼特性的方向选择特性,小波变换编码在图像压缩领域有广泛的应用 图图5-9 小波变换编码原理小波变换编码原理 编码过程中的步骤编码过程中的步骤 1)小波图像的获取2)小波图像系数的特点3)小波图像的编码5.3 5.3 基于内容的视频编码基于内容的视频编码第二代编码方法采用由纹理(texture)、形状(shape)、运动等信息描述的区域(region)来表达视频图像数据,所谓区域,就是图像中具有相同特性的多个片段,而对象(object)定义为图像中表征有含义的实体的一组区域。5.3.1 5.3.1 分形编码分形编码分形集合具有以下特征:分形集合具有以下特征:分形具有精细结构 分形集合极不规则 分形集合通常具有某种自相似性 分形集的“分形维数”通常大于其拓扑维数 通常分形可以用简单的图形迭代生成 1理论基础分形是由点组成的,通常可用迭代函数系统(IFS)理论来描述分形。设这些点所在的空间为X,一般情况下,X是二维平面空间R2的非空子集,给X定义了度量及其元素之间的距离d后,便构成了度量空间(X,d)。定义压缩映射 设空间(X,d)上的映射f:X-X满足:q其中,c X为空间(X,d)上的压缩映射,称c为压缩因子。如果映射f是空间(X,d)上的压缩因子为c压缩映射,则分形空间(G(X),h)上的映射 也是压缩因子为c的压缩映射,即:压缩映射不动点定理压缩映射不动点定理 压缩映射不动点定理:设X;f1,f2,fn;c是度量空间(X,d)上的IFS,则变换 是度量空间(G(X),h)上的压缩因子为c的压缩映射,它存在唯一的压缩不动点 满足(亦被称为IFS的不动点):且压缩不动点 可以通过迭代获得:拼贴定理拼贴定理 设(X,d)是度量空间,给定集合 和 数,如果找到一个IFS 满足 则有综上所述综上所述 分形编/解码其实就是在编码端用压缩映射代替不动点,在接收端通过压缩映射恢复出不动点的过程。如果表达压缩映射所需要的比特数少于表达不动点所需要的比特数,则就达到了压缩图像的目的。2.分形编码方案 1)原始图像分割2)寻找合适的局部IFS3)分形变换参数编码5.3.2 5.3.2 纹理编码纹理编码1纹理外推2直接变换法 5.3.3 5.3.3 二维形状编码二维形状编码位图编码方法主要有MMR方法、四叉树编码方法、基于上下文的算术编码方法等,基于轮廓的编码方法则有链编码、多边形编码和样条编码等。(a)用四叉树进行编码的宏块用四叉树进行编码的宏块(b)b)编码形成的四叉树编码形成的四叉树 图图5-18 链编码原理链编码原理5.3.45.3.4基于区域的视频编码基于区域的视频编码所谓基于区域的编码,就是根据纹理把图像所谓基于区域的编码,就是根据纹理把图像划分为多个区域,然后对每个区域进行形状划分为多个区域,然后对每个区域进行形状和纹理编码。和纹理编码。图5-19 区域生长法 5.3.55.3.5基于对象的视频编码基于对象的视频编码基于对象的视频编码把图像分割成对象,一个对象是具有某种含义的一个实体,例如一个人,一棵树等。图5-20 基于对象的视频编码器 图图5-21 参数编码器参数编码器 5.3.65.3.6基于知识和语义的视频编码基于知识和语义的视频编码基于知识的编码器总是试图识别视频场景中的物体,如果识别出来,则编码器放弃原用的一般模型,使用适用于该物体的特定模型。基于语义的视频编码直接对对象的行为进行编码。5.4 5.4 分级视频编码分级视频编码分级视频编码的目标是对一个码流,不同的解码器可以根据自己的能力和所处的环境,进行不同程度的解码,以获得相应质量的视频。分级视频编码一般通过提供视频的多个版本来实现,主要包括空间可分级编码、时间可分级编码、信噪比可分级编码以及它们的组合。1.空间可分级编码 空间可分级编码提供的多个版本具有不同的空间分辨率,图5-22给出了采用空间可分级编码的图象。码流包含一个基本层和一个增强层,基本层在前,增强层在后,解码基本层得到了图5-22(a)的结果,再解码增强层获得5-22(b)的结果。(a)低分辨率图像 (b)高分辨率图像 图图5-22 空间可分级编码空间可分级编码 图图5-23 空间可分级编码器空间可分级编码器 2.时间可分级编码 时间可分级编码与空间可分级编码类似,不过它提供的是原始视频不同时间分辨率(即不同帧率)的版本。3.信噪比可分级编码 信噪比可分级编码的基本层在时间、空间分辨率上与原始视频相同,其不同体现在质量上。增强层的解码将使得视频质量提高。图5-24 信噪比可分级编码