下一代视频编码标准关键技术.pdf
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《下一代视频编码标准关键技术.pdf》由会员分享,可在线阅读,更多相关《下一代视频编码标准关键技术.pdf(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、-lS 弘枞呲T 断,意尝【本文献信息】蔡晓霞,崔岩松,邓中亮,等下一代视频编码标准关键技术【J 电视技术,2 0 1 2,3 6(2)下一代视频编码标准关键技术蔡晓霞,崔岩松,邓中亮,常志峰(北京邮电大学电子工程学院,北京1 0 0 8 7 6)V 囊秘技矿i d to 匹 in f fr in 4【摘要】新一代视频压缩标准(H i g hE f f i c i e n tV i d e oC o d i n g,H E V C)是视频压缩领域继H 2 6 4 A V C 之后的又一重大突破,主要面向高清电视(H D T V)以及视频编解码系统,提供从Q V G A 至10 8 0 p 以至
2、超高清电视(76 8 0 x 43 2 0)不同级别的视频应用。首先从H E V C 基本结构出发,较全面地介绍了H E V C 在预测估计、D C T 变换、滤波补偿以及熵编码方面采用的关键技术,最后介绍了H E V C 当前的研究热点及其最新发展方向。【关键词】视频编码;H E V C;四叉树编码、变换结构;环路滤波;熵编码【中图分类号】T P 3 7【文献标识码】AM o d e lo fN e x t g e n e r a t i O nV i d e oS t a n d a r da n dR e l a t i v eK e yT e c h n o l o g i e sC
3、A IX i a o x i a,C U IY a n s o n g,D E N GZ h o n g l i a n g,C H A N GZ h i f e n g(S c h o o lo fE l e c t r o n i cE n g i n e e r i n g,B e r i n gU n i v e r s i t yo fP o s t sa n dT e l e c o m m u n i c a t i o n s,B e i f i n gW 0 8 7 6,C h i n a)【A b s t r a c t】A st h es u c c e s s o rt
4、 oH 2 6 4 A V C,t h el a t e s tv i d e oc o m p r e s s i o ns t a n d a r du n d e rd e v e l o p m e n t(H i g hE f f i c i e n c yV i d e oC o d i n g,H E V C)t a r g e t sa tn e x t-g e n e r a t i o nH D T Vd i s p l a y sa n dv i d e oc o m p r e s s i o ns y s t e m sw h i c hp r o v i d ef
5、l e x i b l e,h i g he f f i c i e n ta p p l i c a t i o n sw i t hr e s o l u t i o n sf r o mQ V G A(3 2 0 x 2 4 0)u pt o10 8 0 pa n dU l t r aH D T V(76 8 0 x 43 2 0)T h ee n c o d ea r c h i t e c t u r e sa n ds o m eo ft h ek e yt e c h n o l o g i e su s e di nt h en e wm o d e la r ei n t r
6、 o d u c e di nt h i sp a p e r T h o s ek e yt e c h n o l o g i e si n v o l v ew i t hp r e d i c t i o n,t r a n s f o r m a t i o n,i n l o o pf i l t e ra n de n t r o p y B e s i d e st h a t,t h ep a p e ra l s or e v i e w st h el a t e s ti m p r o v i n gi s s u e sa n dt h ef u t u r eo
7、fH E V C【K e yw o r d s】v i d e oc o d i n g;H E V C;q u a d t r e ec o d i n ga n dt r a n s f o r m i n gs t r u c t u r e;i n-l o o pf i l t e r;e n t r o p yc o d i n g1H E V C 背景与发展H 2 6 4 视频编码标准使得视频压缩效率提高到了一个新的水平。自该标准发布以来,H 2 6 4 以其高效的压缩效率,良好的网络亲和性以及优越的稳健性等优点迅速得到了广大用户的认同。然而,随着终端处理能力以及人们对多媒体体验要
8、求的不断提高,高清、3 D、无线移动已经成为视频应用的主流趋势。而现有的H 2 6 4 编码标准的压缩效率仍然不足以应对高清、超高清视频应用,需要更为高效的编码压缩方案。与此同时,近年许多新型有效的技术在不断涌现,使得新标准的定制成为可能。为此国际电联组织(I T U T)和移动视频专家组(M P E G)成立了视频编码联合小组(J o i n tC o l l a b o r a t i v eT e a mo nV i d e oC o d i n g,J C T v c),将新标准的定制正式提上日程。2 0 1 0 年4 月J C T V C 第一次会议在德国德累斯顿召开,所收到的2 7
9、 个提案从增加编码复杂度、提高压缩效率,或者从保证编码质量、降低编码复杂度的角度出发【2 1,讨论如何在H 2 6 4 A V C 高级档次的基础上进一步提高编码性能。新一代视频压缩标准主要面向高清电视(H D T V)以及视频捕获系统的应用,提供从Q V G A至10 8 0 p 以至超高清电视(76 8 0 x 43 2 0)不同级别的视频应用。其核心目标在于:在H 2 6 4 A V CH i g hP r o f i l e 的基础上,压缩效率提高1 倍,即在保证相同视频图像质量的前提下,视频流的码率减少5 0”1。2H E V C 编码框架及其关键技术H E V C 依然沿用自H 2
10、 6 3 就开始采用的混合编码框架例,如帧内预测和基于运动补偿的帧间预测,残差的二维变换、环路滤波、熵编码等。在此混合编码框架下,H E V C 进行了大量的技术创新,其中具有代表性的技术方案有:基于大尺寸四叉树块的分割结构和残差编码结构,多角度帧内预测技术,运动估计融合技术,高精度运动补偿技术,自适应环路滤波技术以及基于语义的熵编码技术。下文将对这个技术方案进行介绍。2 1 基于四叉树结构的编码分割为了提高高清、超高清视频的压缩编码效率,H E V C提出了超大尺寸四叉树编码结构,使用编码单元(C o d i n gU n i t。c u),预测单元(P r e d i c t i o nU
11、 n i t,P U)和变换单元(T r a n s f o r mu n i t,T U)3 个概念描述整个编码过程。其中基金项目:中央高校基本科研业务费专项资金资助项目(2 0 1 1 R C 0 3 0 4)8 0 电视技术第3 6 卷第2 期(总第3 7 7 期)I 投稿网址h:伽n n ,V i d e o E c n万方数据ym l a 加l t l t l。C U 类似于H 2 6 4 A V C 中的宏块或子宏块,每个C U 均为2 N x 2 N 的像素块(为2 的幂次方),是H E V C 编码的基本单元,目前可变范围为6 4 x 6 4 至8 x 8。图像首先以最大编码单
12、元(L C U,如6 4 x 6 4 块)为单位进行编码,在L C U 内部按照四叉树结构进行子块划分,直至成为最小编码单元(S C U,如8 x 8 块)为止,如图1 所示。ll+怍图1L C U 的树形结构示意图对于每个C U,H E V C 使用预测单元(P u)来实现该C U单元的预测过程。P u 尺寸受限于其所属的C U,可以是方块(如2 N x 2 N,N x N),也可以为矩形(如2 N x N,N x 2 N),现有H M 模型的对称P U 分割类型如图2 所示H。口田日田a2,v 2,vb,v 2 NC2 NdN x N图24 种P U 分割类型此外,一种新的不对称运动分割预
13、测(A s y m m e t r i cM o t i o nP a r t i t i o n,A M P)方案也已经被J C T 所接受”】,这也是H E V C 与H 2 6 4 在分块预测技术中最为不同之处。所谓A M P,即将编码单元分为两个尺寸大小不一致的预测块,其中一个P u 单元的宽长为C U 单元的1 4,另一个P u 对应的宽长为C U 单元的3 4,如图3 所示。这种预测方式考虑了大尺寸可能的纹理分布,可以有效提高大尺寸块的预测效率。薹目薹目6 4 口口ST A 心眦T 断怎褒I _换同样采用四叉树型的变换结构。图4 为编码单元、变换单元的四叉树结构关系图示例,其中虚线
14、为变换单元四叉树分割,实线为编码单元四叉树分割,编号为各编码单元的编码顺序。采用z 型编码顺序的好处为:对于当前编码单元,其上方块、左方块以及左上方块预测信息(如果存在)总是可以获得。l一士一毒一。!l3制-1 3图4 编码单元与变换单元四叉树结构示意图,配合不对称预测单元以及矩形预测单元,新的H M 4 0 模型还采纳了相应的矩形四叉树T u 结构 6 1,突破了方块变换的限制。图5 展示了3 级矩形四叉树变换水平T u 结构,同理可有垂直分割结构。,V X 0 2 5 V图5 矩形变换四叉树结构尽管T u 的模板发生了变化,但其变换核并没有发生实质性的变化。现有的关于不对称变换所使用的变换
15、核是由方形变换核剪裁得到的。通常,n x m 的变换系数矩阵的计算公式为C。=死XB。T a r式中:B 为n x m 的像素块,L,L 分别为m x m,n x n 的变换核,e。为曰。的变换系数。测试结果表明,非正方形四叉树更适合矩形P U 和A M P 变换,可节省大约0 3 的比特,同时增加2 左右的编码复杂度,对解码几乎没有影响一1。采用大尺寸树形编码结构有利于支持大尺寸图像编码。当感兴趣区域一致时,一个大的C U 可以用较少的标识代表整个区域,这比用几个小的块分别标识更合理。其次,任意L U C 尺寸可以使编解码器对不同的内容、应用和设备达到最优化。对于目标应用,通过选择合适的L
16、C U 尺寸和最大分级深度,使编解码器具有更好的适应能力。L C U 和S C U 尺寸范围可被定义到档次和级别部分以匹配需求。投稿网址h t t p:w w w V i d e o E c nI 电视技术第3 6 卷第2 期(总第3 7 7 期)8 1万方数据I IS T A N D A R D T E s T I N 标准G&3H E V C 预测编码技术H E V C 的帧间、帧内预测的基本框架与H 2 6 4 基本相同:采用相邻块重构像素对当前块进行帧内预测,从相邻块的运动矢量中选择预测运动矢量,支持多参考帧预测等。同时,H E V C 采用了如多角度预测,高精度运动补偿等多种技术,使
17、得预测精度大大提高。3 1 多角度帧内预测H E V C 的帧内预测将原有的8 种预测方向扩展至3 3种,增加了帧内预测的精细度。另外,帧内预测模式保留了D C 预测,并对P l a n a r 预测方法进行了改进。目前H M模型中共包含了3 5 种预测模式,如图6 所示。但由于受到编码复杂度限制,编码模型对4 x 4 和6 4 x 6 4 尺寸的P U所能使用的预测模式进行了限制。图63 5 种帧内预测方式原有的H M 模型中色度分量帧内预测采用了5 种预测模式,分别为水平、垂直、D C 预测、亮度模式以及对角模式。J C T V C 第五次会议后增加了以基于亮度的色度帧内预测嗍,以取代对角
18、预测模式。在该预测模式下,色度分量使用亮度分量的值进行线性预测,相关系数根据重构图像特性进行计算。该方案在色度分量上取得了8 左右的性能增益,而编码复杂度基本不变。然而,尽管现有的帧内预测技术已对P U 预测方向有所限制,但编码的复杂度仍然很高。不少研究人员提出了快速帧内预测算法,以进一步降低编码的复杂度嘲。3 2 帧间预测技术3 2 1 广义B 预测技术在高效预测模式下,H E V C 仍然采用H 2 6 4 中的等级B 预测方式,同时还增加了广义B(G e n e r a l i z e dPa n dBp i c t u r e,G P B)预测方式取代低时延应用场景中的P 预测方式。G
19、 P B 预测结构”叫是指对传统P 帧采取类似于B 帧的双向预测方式进行预测。在这种预测方式下,前向和后向参考列表中的参考图像都必须为当前图像之前的图像,且两者为同一图像。对P 帧采取B 帧的运动预测方 石Z 电视技术第3 6 卷第2 期(总第3 7 7 期)l 投稿网址h t t p:w w w V i d e o E c ny 烹鬻篓烹式增加了运动估计的准确度,提高了编码效率,同时也有利于编码流程的统一。3 2 2 高精度运动补偿技术H E V C 的编码器内部增加了像素比特深度,最大可支持1 2b i t 的解码图像输出,提高了解码图像的信息精度。同时,H M 模型采取了高精度的双向运动
20、补偿技术u“,即无论最终输出图像比特深度是否增加,在双向运动补偿过程都将使用1 4b i t 的精度进行相关计算。3 2 3 运动融合技术和自适应运动矢量预测技术运动融合技术(M e r g e)将以往的跳过预测模式(S k i pM o d e)和直接预测模式(D i r e c tM o d e)的概念进行了整合。采用融合模式时,当前P U 块的运动信息(包括运动矢量、参考索引、预测模式)都可以通过相邻P U 的运动信息推导得到。编码时当前P U 块只需要传送融合标记(M e r g eF l a g)以及融合索引(M e r g eI n d e x),无需传送其运动信息”“。自适应运动
21、矢量预测技术(A d a p t i v eM o t i o nV e c t o rP r e d i c t i o n,A M V P)为一般的帧问预测P U 服务,通过相邻空域相邻P U 以及时域相邻P U 的运动矢量信息构造出一个预测运动矢量候选列表,P U 遍历运动矢量候选列表选择最佳的预测运动矢量。利用A M V P 技术可充分发掘时域相关性和空域相关性。值得一提的是,无论是运动融合技术还是自适应运动矢量预测技术,两者在候选运动矢量列表的设计上都进行了精心考量,以保证运动估计的高效性以及解码的稳健性。在早期的H M 模型中,两种预测方式所使用的候选运动矢量列表是相互独立的;在J
22、 C T 第6 次会议结束后,新的H M 模型中将两者的参考列表构造进行了统一”,M e r g e 将采用与A M V P 相同的方式构造候选运动矢量列表,进行运动信息的推导。4环路滤波1 个完整的H E V C 的环路滤波过程包括3 个环节:去块滤波,自适应样点补偿(S a m p l eA d a p t i v eO f f s e t,S A O),自适应环路滤波(A d a p t i v eL o o pF i l t e r,A L F)。去块滤波在H 2 6 4 的去块滤波技术基础上发展而来,但为了降低复杂度,目前的H M 模型取消了对4 x 4 块的去块滤波”4】。自适应样
23、点补偿和自适应环路滤波均为H E V C的采用的新技术。4 1 自适应样点补偿自适应样点补偿是一个自适应选择过程,在去块滤波后进行。若使用S A O 技术,重构图像将按照递归的方式分裂成4 个子区域n”,每个子区域将根据其图像万方数据y 烹鬻篓寒像素特征选择一种像素补偿方式,以减少源图像与重构图像之间的失真。目前自适应样点补偿方式分为带状补偿(B a n dO f f s e t,B O)和边缘补偿(E d g eO f f s e t,E O)两大类。带状补偿将像素值强度等级划分为若干个条带,每个条带内的像素拥有相同的补偿值。进行补偿时根据重构像素点所处的条带,选择相应的带状补偿值进行补偿。
24、现有的H M 模型将像素值强度从0 到最大值划分为3 2 个等级,如图7 所示”6 1。同时这3 2 个等级条带还分为两类,第一类是位于中间的1 6 个条带,剩余的1 6 个条带是第二类。编码时只将一类条带的补偿信息写入片头;另一类条带信息则不传送。这样的方式编码将具有较小补偿值的一类条带忽略不计,从而节省了编码比特数。图73 2 级像素值条带分割示意图边缘补偿主要用于对图像的轮廓进行补偿。它将当前像素点值与相邻的2 个像素值进行对比,用于比较的2个相邻像素可以在图8 中所示的4 种模板中选择,从而得到该像素点的类型:局部最大、局部最小或者图像边缘。解码端根据码流中标示的像素点的类型信息进行相
25、应的补偿校正。日用田田图84 种边缘样点补偿模板4 2 自适应环路滤波自适应环路滤波(A L F)在S A O 或者去块滤波后进行,目的是为了进一步减少重构图像与源图像之间的失真。A L F 采用二维维纳滤波器,滤波系数根据局部特性进行自适应计算n7 1。对于亮度分量,采用C U 为单位的四叉树A L F 结构。滤波使用5 x 5,7 x 7 和9 x 9 三种大小的二维钻石型模板,如图9 所示。滤波器计算每个4 x 4 块的L a p l a c i a n 系数值,并根据该值将所有4 x 4 块分成1 6类,分别对应1 6 种滤波器n 9 1,每种滤波器的滤波系数通过自适应维纳滤波器进行计
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 下一代 视频 编码 标准 关键技术
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内