图像处理毕业设计.doc
《图像处理毕业设计.doc》由会员分享,可在线阅读,更多相关《图像处理毕业设计.doc(61页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、北方民族大学学士学位论文 论文题目: H.264/AVC率失真优化技术研究 院(部)名 称: 电气信息工程学院 学 生 姓 名: 何 娇 娇 专 业: 信息工程 学 号: 指导教师姓名: 马 宏 兴 论文提交时间: 2010年5月18日 论文答辩时间: 2010年5月29日 学位授予时间: 2010 年 月 日 北方民族大学教务处摘 要H.264是ITU-T的VCEG(视频编码专家组)和ISO/IEC的MPEG(活动图像编码专家组)的联合视频组(JVT:joint video team)开发的一个新的数字视频编码标准,它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分
2、。1998年1月份开始草案征集,1999年9月,完成第一个草案,2001年5月制定了其测试模式TML-8,2002年6月的 JVT第5次会议通过了H.264的FCD板。2003年3月正式发布。 率失真优化RDO(rate-distortion optimization)是视频标准的关键技术之一,决定着图像质量的好坏。本文基于视频标准H.264/AVC,对率失真优化技术进行了较为详细的介绍,分析了其运动估计和宏块编码模式的率失真优化,并对当前的率失真优化算法进行了总结,给出了测试模型JM7.6的率失真优化算法及改进算法。此外本文通过对H.264/AVC视频编码的实验观测,发现对多种测试序列来说,
3、其P帧或者B帧的宏块类型,无论是在空间域还是时间域上,都具有极强的相关性。为更好地分析这种宏块类型的相关性,本文引入了MAD、MAFD来度量P、B帧的时、空域相关性,并根据实验,制定出了帧间宏块类型SKIP/DIRECT模式选择的准则。从验证模型JM7.6上的实验结果来看,在图像编码质量基本不变,视频编码比特没有太大增加的情况下,对变化不是很剧烈的视频序列,该种算法可减少约30%的编码时间,从而在标准的帧间预测视频编码方面弥补了原有算法的不足,提高了编码器的工作效率。关键词:H.264/AVC;宏块类型;率失真优化;运动估计;预测编码;帧间预测模式ABSTRACTH.264 is a new
4、digital video coding standard developed by combining video group (JVT: joint video team) of the ITU-Ts VCEG (Video Coding Experts Group) and ISO / IECs MPEG (Moving Picture Coding Experts Group) , it is both ITU-Ts H.264, and also Section 10 of ISO / IEC for MPEG-4 . The draft began in January 1998
5、to solicit, ,the first draft was completed in September 1999, its test mode TML-8 was established in May 2001, 2002 months, the H.264 FCD board was adopted in the fifth JVT meeting in June 2002. It was officially launched in March 2003.The rate-distortion optimization is one of the key technologies
6、in video coding standard, and it determines the final choice of the coding mode in video. In this paper , first the rate-distortion based on the H.264/AVC video standards is detailed introduced, and then its motion estimation and macroblock coding mode is analyzed, as well as the current rate-distor
7、tion optimization algorithm is summarized, finally rate-distortion optimization algorithm and its improved algorithm of the test model JM7.6 are given. whats more, In this thesis, it was clear that MB types of P frame or B frame all existed very strong relativity in temporal and spatial for various
8、test sequences from the extensive experiment results of H.264/AVC. In order to more analyze the relativity of MB types, the mean absolute difference (MAD) and the mean of absolute frame difference (MAFD) are introduced to measure the relativity of MB types in P and B frame in temporal and spatial. A
9、nd rules of MB types SKIP/DIRECT mode selection inter frames were set down according to the experiments. The extensive experimental results of validating model JM7.6 showed that algorithm reduced about 30 percent coding time for video sequences having no too much smart change under the instance of n
10、ot only almost invariability of image coding quality also no more increase of video coding bit rate. Accordingly, the disadvantage of RDO algorithm was fetched up so that the work efficiency of encoder was improved effectively.Key words: H.264/AVC; Macroblock Type; RDO; Motion Estimation Predict Cod
11、ing; Inter Predictive Mode目 录第1章 绪论61.1引言61.2视频压缩编码技术61.3视频编码标准发展概况71.4视频质量的评价81.6 论文研究的主要内容91.7论文内容组织安排10第2章 H.264/AVC视频标准112.1 H.264/AVC的产生及应用前景112.2 H.264/AVC的编解码框架122.3 H.264/AVC的关键技术132.3.1 VCL与NAL的分层设置132.3.2 帧/场编码的自适应选择132.3.3 帧内预测132.3.4 先进的帧间预测技术132.3.5 44整数变换和量化142.3.6 更先进的自适应熵编码152.3.7环路去
12、块效应滤波器152.3.8 先进的差错恢复技术15第3章 率失真优化算法及改进163.1 视频编码的率失真思想163.2 H.264/AVC率失真优化算法173.2.1 理论分析173.2.2 拉格朗日系数 l 的确定193.2.3 运动估计的率失真优化193.2.4 宏块编码模式决定的率失真优化203.3 H.264/AVC率失真优化算法及改进情况213.3.1 JM7.6率失真优化算法213.3.2 各种改进率失真优化算法233.4结论与讨论24第4章 率失真优化算法及改进254.1帧间预测编码选择原理254.2 H.264/AVC帧间SKIP/DIRECT模式的快速选择算法274.2.1
13、理论分析274.2.2算法设计354.2.3 模拟实验394.3小结42第五章 总结与展望43致 谢44参考文献45附录1:JM7.6参数设置47附录2:英文原文53附录3:中文译文60第1章 绪论1.1引言多媒体信息主要包括文字、声音、图像等内容,其中具有直观、形象、准确、高效和应用广泛等特点的运动图像(视频)是最重要的组成部分。这是因为视觉是人类获取信息最为重要的途径,外部世界丰富多彩的信息大部分是通过视觉感知的。据统计,人类通过视觉获取的信息占全部获取信息的601。但与文本、语音相比,未经压缩的数字视频几乎没有什么实用价值。从传输角度看:一路广播级的彩色数字电视,若按4: 4 :2的分量
14、编码视频格式,用13.5/6.75/6.75 MHz频率采样,每像素(pixel)用8位编码,数码率为216Mbps;另外,一路高清晰度电视,数码率更高达1327Mbps2。这样的数据量,以今天的技术或在不久将来采用可接受价格的硬件而言,这样的数据率都是不现实的。可喜的是近二十多年来,经过世界众多的专家共同合作和刻苦钻研,多媒体数据压缩技术取得了巨大的发展。而且,数据压缩技术取得的科研成果已经越来越广泛地被应用于可视电话、视频会议、数码相机、数字化视频光盘(DVD)、数字高清晰度电视(HDTV: High Definition Television)等领域。尤其在网络通信技术高速发展的今天,对
15、多媒体通信的需求越来越丰富。如此丰富的需求,为多媒体技术的发展提供了无穷的动力,同时从过去VCD、VOD(Video On Demand)、电影、电视、电子游戏、卡拉OK等领域中取得的成功,让全世界对多媒体技术的发展更加憧憬。1.2视频压缩编码技术视频除了在时域和空域上存在大量冗余外,还存在信息熵冗余(也称编码冗余)、结构冗余、知识冗余和视觉冗余等1。视频编码主要目的是在保证一定重构质量的前提下,以尽可能少的比特数来表征视频信息。整个处理过程的核心思想是去相关,即降低视频信息的冗余度,实现对视频的压缩。视频压缩编码是以Shannon信息论为基础的。一般而言,信源编码的方法按照压缩数据能否被准确
16、恢复分为两大类:无损压缩和有损压缩。其中,无损压缩虽可以无失真的恢复原始数据,但是压缩效率十分有限。在实际应用中通常都是将二者结合使用,视频压缩编码也不例外。视频压缩主要的编码方法有以下几种:1、预测编码预测编码方法是较为实用且被广泛采用的一种压缩编码方法,其理论基础主要是现代统计学和控制论。原理是从相邻像素之间的相关性特点考虑,不是对一个像素直接编码,而是用同一帧(帧内预测编码)或相邻帧(帧间预测编码)中的像素值来进行预测,然后对预测残差进行量化、编码、传输。预测编码实际是利用了视频信息的时空域冗余。2、统计编码数据压缩技术的理论基础是信息论。根据香农信息论的原理,数据压缩的理论极限是信息熵
17、,如果要求在编码过程中不丢失信息量,则要求保存信息熵。这种信息保持的编码就是熵编码。它是建立在随机过程的统计特性基础上的。3、变换编码变换编码通常是将空域相关的像素点映射到另一个矢量空间,使得图像的能量集中在低频区域,表示图像中缓慢变化的内容,而图像的边缘、细节的纹理等细节部分集中在变换域的高频区,然后对这些变换系数进行量化、编码处理。K-L变换是均方误差下的最佳正交变换,但实现困难。当图像相邻像素间的相关系数接近1时,K-L变换的基函数接近DCT变换的基函数。而且DCT存在快速算法34,易于硬件实现,因此被广泛应用于多种图像/视频编码国际标准中。1.3视频编码标准发展概况目前,全球主要有IT
18、U-T (International Telecommunication Union- Telecommunication Standardization Sector) 和ISO/IEC (International Organization for Standardization/International Electrotechnical Commission)两个制定视频标准的国际组织。自H.261后,ITU-T相继发布了H.26x系列标准,而ISO/IEC则推出了MPEG-1、2、4等标准1。这些视频编码标准都是基于块的混合编码框架7如图1-1所示,具有非常类似的结构。基于块的混合视
19、频编码系统是将图像分割为NN的像素块,然后每个块相对独立的进行编码处理。“混合”的意思是每个块是联合运用运动补偿帧间预测和变换编码进行编码的。整个编码器利用帧间预测编码消除图像序列中的时域冗余,利用变换编码消除频域冗余,然后量化变换系数,熵编码,输出比特流。图1-1 基于块的混合视频编码器2003年ITU-T和ISO/IEC联合推出的H.264/AVC代表着当前视频编码技术的最高水平。另外,ISO/IEC倡导的MPEG-7,MPEG-21和我国的音视频国家标准AVS的视频部分尚未正式颁布。1.4视频质量的评价在进行视频处理时,人们还要面对如何度量视频失真这一重要问题,尽量使视频处理结果和人的视
20、觉感受一致。总体来说,视频质量有两种评价方式8。1) 客观评价客观评价是用重建图像与原始图像的误差来衡量图像的重建质量,常用均方误差(MSE)和峰值信噪比(PSNR)来表示。均方误差定义为: (1-1)其中:M、N表示图像的宽和高,表示原始图像的像素值,表示重建图像的像素值。峰值信噪比定义为: (1-2)由上面两式可知PSNR与MSE是一一对应的,但在实际应用中,常以PSNR来衡量图像的重建质量。2)主观评价主观评价指的是评价者直接对视频进行观察,对所有评价者给出的分数进行加权平均,所得结果即为主观评价结果。这种评价结果虽然符合人们的视觉感受,却不能用数学模型对其加以描述,因此无法直接用于视频
21、压缩编码过程中的质量评价与控制。另外,主观评价更容易受到如年龄、性格、教育程度、背景以及评价时的心情等个体因素的影响。为了便于公平合理地与其他研究成果进行比较,本论文仍然采用大家普遍使用的客观图象质量PSNR做为评判准则。1.6 论文研究的主要内容H.264/AVC视频标准算法JM7.6在帧间运动估计/补偿编码过程中共定义了包括SKIP/DIRECT模式在内的多种帧间编码模式,并采用率失真优化9全遍历策略来对这多种模式进行计算,最终选择最优的宏块模式,这就使得编码时的计算复杂度急剧增加。针对这一问题,人们对如何准确快速地对块预测模式做出选择进行了相关研究。其中最经典的算法为D.Wu,F.Pan
22、等人提出的快速算法10,该算法是利用边缘检测对视频序列中的均质区域(Homogeneous Region)进行检测,用相邻帧之间的差值对静止区域(Stationary Region)进行检测,并对这些区域采用较大的宏块划分模式,达到对帧间宏块模式的进行快速选择的目的。还有一些快速算法,根据当前块的DCT系数计算该块的能量,从而得出块的纹理复杂度来对划分模式进行快速选择11;对原图像进行缩放,然后在原始图像与缩放图像之间建立映射,从而达到宏块模式快速的选择12;结合运动搜索预处理,得到块的预测残差,并对预测残差的纹理进行分析,根据分析结果对宏块划分尺寸做出快速的选择13;统计了多种QCIF测试序
23、列的编码结果,发现不论图像类型是I、P还是B帧,图像编码的宏块类型在空间域都具有极强的相关性,并分别引入方差度量I帧宏块的空域复杂性,绝对差分和(SAD)度量P/B帧宏块的时域活动性,然后根据宏块的活动性或复杂性制定出宏块类型预测的准则来对当前的宏块模式进行预测14。对当前宏块的模式进行预测时,其阀值的取值为定值,但由于视频序列的复杂性,阈值取定值必然会造成较多的误判或者使得执行预测的宏块个数较少。在重复该实验时,发现相邻两帧的MAD,MAFD值在一定的范围里波动,并在某种程度上具有一定的规律性。本文根据这些实验结论,对帧间SKIP/DIRECT模式进行了快速检测。该算法通过计算一部分的编码模
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 图像 处理 毕业设计
限制150内