基于块匹配的视频图像运动估计技术研究_.pdf
《基于块匹配的视频图像运动估计技术研究_.pdf》由会员分享,可在线阅读,更多相关《基于块匹配的视频图像运动估计技术研究_.pdf(13页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、162.4 经典的块匹配算法2.4.1 全搜索法(Full Search Method,FS)全搜索法(Full Search Method,FS)也称为穷尽搜索法,是对(M2dx)(N2dy)搜索范围内所有可能的候选位置计算MAD(i,j)值,从中找出最小MAD,其对应偏移量即为所求运动矢量。此算法虽计算量大,但最简单、可靠,找到的必为全局最优点。FS 算法描述如下:从原点出发,按顺时针螺旋方向由近及远,在逐个像素处计算MAD值,直到遍历搜索范围内听有的点,然后在计算的所有点的MAD 中找到最小值,该点所在位置即对应最佳运动矢量。FS 算法是最简单、最原始的块匹配算法,由于可靠,且能够得到全
2、局最优的结果,通常是其它算法性能比较的标准,但它的计算量的确很大,这就限制了在需要实时压缩场合的应用,所以有必要进一步研究其它的快速算法。2.4.2 三步搜索算法(Three Step Search,TSS)此搜索算法如图2-2 所示,每一步搜索9 个位置点,对每一个位置计算MSE(最小均方误差)来确定最小失真方向(DMD),在最小失真方向上搜索区域减少一半进行第二步的搜索匹配,然后继续沿最小失真方向将搜索区域又减少一半第一步第二步第三步图 2-2 三步法(TSS)搜索步骤17来进行第三步的搜索匹配,由于第二步和第三步的9 个搜索点中均有一个点是在上一步中已经计算过MSE 值,所以第二步与第三
3、步均只要计算8 个点而已,所以 TSS 算法的计算次数是98825 次,同直接匹配需要169 次比较,计算量大大减少。2.4.3 新三步搜索算法26(New Three Step Search,NTSS)大部分近似的快速BMA 算法(如 TSS、2D-LOG 等)假设 BDM 随搜索窗口内当前检查点与最优BDM 点之间的距离的增大而单调增加(当BDM 为 MSE 或MAD 时),然而这个假设并非总是正确,原因是:孔径问题;分块时引起的运动物体和背景的不连续分割;周期性纹理形状的图像内容;光线改变。以上原因有时会导致搜索过程陷入局部最优点而找不到真正的最优点。这正是TSS等传统快速BMA 的主要
4、缺点。不过,尽管 BDM 的单峰假设在全局上并不总是成立,但是它在全局最优点的一个小邻域内还是成立的。因此利用运动矢量的中心偏移特性的新三步法(NTSS)、四步法(FSS)、二步法(2SS)等可以比TSS、2D-LOG 等得到更好的结果。Renxiang Li 等于 1994 年提出了新三步搜索算法。NTSS 是对 TSS 的一个改进,对运动量比较小的视频序列如可视电话序列有比较好的性能。对于绝大多数的视频序列,运动矢量的分布都是在中心位置上的概率最大,随着与中心位置的距离的增大,概率会急剧地下降,这也就是前面所说的运动矢量的中心偏移特性。运动量比较小的视频序列的这一特性会更加明显。图2-3
5、显示了这种中心偏移特性。图 2-3 Saleman 运动矢量18为了利用运动矢量的中心偏移特性,NTSS 在第一步除了搜索TSS 第一步的9 个点外,还搜索了中心点周围的8 个点,如图2-4 所示。图中显示出了W7时的两个搜索路径。中间位置的路径显示了搜索小运动的情形。在这种情形下,第一步的最小BDM 点是中心点周围的8 个相邻点之一,这时只要再搜索一下该第一步第二步第三步图 2-4 新三步法(NTSS)示意图点周围的3 个点(若该点为8 个相邻点中的4 个边点之一,如图2-4 所示)或者5 个点(若该点为8 个相邻点中的4 个角点之一),即可结束本次搜索,这样的话,图中的情形只需2 步,共搜
6、索17320 个点;若为角点,则也是2 步,这时的搜索点数是17522 个。右上的路径是大运动的情形,第一步的最小BDM 点是外部的8 个搜索点之一,第二步以后的方法与TSS 完全相同。因此总共也是3步,但总搜索点数目多了8 个,为 178833 个。另外,在 NTSS 中如果第一步的最小BDM 点恰好是中心点,则立即停止搜索,搜索得出的运动矢量结果为(0,0)。2.4.4 四步搜索算法27(Four Step Search,FSS)Lar Man Po 等于 1996 年提出了四步搜索算法(FSS)。该算法也利用了运动矢量的中心偏移特性,方法是采用比TSS 小的初始步长,取为W4。由于采用了
7、较小的初始步长,W7 时 FSS需要 4 步才能达到搜索窗口的边缘。与 NTSS 一样,当运动较小时,FSS 也会很快结束搜索过程,只需要2 到 3步即可。图2-5 显示了大运动量时FSS的两个搜索路径,二者都需要4 步。左下方的路径需要搜索953825 个点。正好与三步法(TSS)相同;右上方的路径则需要955827 个点,比三步法(TSS)略多。不过W7 时 27 个搜索点是 FSS的最坏情况。-6 -4 -2 0 2 4 6-6 -4 -2 0 2 4 619第一步第二步第三步第四步图 2-5 四步法(FSS)示意图 1 图 2-6 显示了运动较小时FSS 的两个搜索路径,分别只需要2
8、步和 3 步,而且 W 为任何值时都是如此。左边的路径需要9817 个搜索点,右边的需要93820 个搜索点。图 2-6 四步搜索算法(FSS)示意图 2 从图 2-5 和图 2-6 中可以看出,当最小BDM 点不在某次搜索的中心位置时,则下一步需要3 个或 5 个搜索点(最后一步除外);如果已达到搜索窗口的边缘,则进行最后一步。如果最小BDM 点在中心位置,则步长减半,增加8 个点;如果此时 W1 则进行最后一步。2.4.5 基于块的梯度下降搜索算法28(Block-Based Gradient Descent Search,BBGDS)基于块的梯度下降搜索法是1996 年由 Lurng-K
9、uo Li和 Ephraim Feig 提出的。-6 -4 -2 0 2 4 6-6 -4 -2 0 2 4 620该算法采用了一个非常偏向于中心位置的搜索模式步长为1 的 9 点搜索,如图 2-7 所示。它不限制搜索的步数,当某一步的最小BDM 点位于中心位置或该步已到达搜索窗口的边缘时,则停止搜索。与FSS 的某些搜索步骤一样,BBGDS的每个后续搜索步骤都是增加3 个或 5 个搜索点。这个算法非常适合于小运动量的场合。图2-7 显示了 BBGDS 的两个小运动情况下的搜索路径。Step 1:使用 33 搜索窗对 9 个点进行搜索;Step 2:若 BDM 点在搜索窗中心,则算法结束;否则
10、以上一步BDM 点为中心,重复 Step 1。在每一步搜索过程中,BBGDS 算法使用了中心匹配块而不是匹配块,降低了陷入局部最优的可能性。利用梯度下降的方向来指导搜索方向,对该方向进行重点搜索,从而减少和避免了不必要的搜索,大大降低了算法的复杂度。第一步第二步第三步图 2-7 BBGDS 算法示意图2.4.6 二维对数搜索算法29(Two-Dimensional Logarithmic,TDL)为了减少块匹配算法的计算,人们提出了许多块匹配快速算法。J.R.Jain 和A.K.Jain 早在 1981 年就提出了二维对数搜索算法。它开创了快速算法的先例,分多个阶段搜索,逐次减小搜索范围直到不
11、能再小而结束。其搜索步骤如图2-8 所示。它通过连续减少搜索区域来寻找最小失真方向(DMD)。每一步搜索由区域中心位置和与中心相联的4 个边缘点组成,形状就是一个十字形,连续搜索直到寻找的区域成为33 矩形区域为止。最后一步计算33 矩形区域 9 个位置点,MSE 最小值就是要寻找的DMD。在这种算法中,MES 的搜索点数是w2log72+,同直接寻找所需搜索点数2w 相比较,计算量大大减少。-6 -4 -2 0 2 4 6-6 -4 -2 0 2 4 621图 2-8 二维对数搜索算法(TDL)示意图算法的具体步骤是:Step 1:从原点开始,选取一定的步长,在以十字形分布的五个点处进行最小
12、块误差 MAD 值的计算并比较;Step 2:若 MBD 点在边缘四个点处,则以该点为中心点,保持步长不变,重新搜索十字形分布的五个点;若MBD 点位于中心点,则保持中心点位置不变,将十字点群的步长减半,并在五个点处计算;Step 3:在中心及周围8 个点处找出MBD 点,若步长为1,该点所在位置即对应最佳匹配点,算法结束;否则重复Step 2。具体的一个搜索例子请参考图2-8。图中点(0,-4)、(+4,-4)、(+6,-4)是每个搜索阶段的最小块误差点。最终运动矢量为(+5,-4),每个点上的数字表明了每个阶段搜索时计算的候选块的位置。TDL 算法搜索时,最大搜索点数为w2log72+,若
13、发现新的十字形点群的中心点位于搜索区的边缘,则步长也减半,后来有人提出应该在搜索的每个阶段都将步长减半。所有这些改动都是为了使算法搜索范围很快变小,提高收敛速度。TDL 算法的前提是假设搜索区内只有一个谷点,如果搜索区内存在多个谷点时,该方法找到的可能是局部最小点。不能保证找到全局最优点也正是大部分快速搜索算法的通病。-8 -6 -4 -2 0 2 4 6 8-8 -6 -4 -2 0 2 4 6 8111112223344445566666666222.4.7 菱形搜索算法30(Diamond Search,DS)DS 算法即菱形算法,也称钻石算法,最早由 Shan Zhu 和 Kai-Ku
14、ang Ma 两人提出,后又经过多次改进,已成为目前快速块匹配算法中性能最优异的算法之一,该算法同时也被MPEG-4 VM 标准接受。搜索模板的形状和大小不但影响整个算法的运行速度,而且也影响它的性能。块匹配的误差实际上是在搜索范围内建立了误差表面函数,全局最小点即对应着最佳运动矢量。由于这个误差表面通常并不是单调的,所以搜索窗口太小,就容易陷入局部最优,例如BBGDS 算法,其搜索窗口仅为33;而搜索窗口太大,又容易产生错误的搜索路径,象TSS 算法的第一步。另外,统计数据表明,视频图像进行运动估计时,最优点通常在零矢量周围(以搜索窗口中心为圆心,两像素为半径的圆内),如图 2-9 所示。基
15、于这两点实事,DS 算法采用了两种搜索模板,分别是只有5 个检测点的小模板 SDSM(Small Diamond Search Mask)和 9 个检测点的大模板LDSM(Large Diamond Search Mask),如图 2-10 和图 2-11 所示。搜索时先用大模板计算,当最小块误差MBD 点出现在中心点处时,将大模板LDSM 换为 SDSM,再进行匹配计算,这时5 个点中的 MBD 即为最优匹配点。图 2-9 最优点分布规律图 2-10 小模板 SDSM 图 2-11 大模板 LDSM DS 算法的具体步骤是:Step 1:用 LDSM 在搜索区域中心及周围八个点处进行匹配计算
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 匹配 视频 图像 运动 估计 技术研究
限制150内