运动图像的编码一精.ppt
《运动图像的编码一精.ppt》由会员分享,可在线阅读,更多相关《运动图像的编码一精.ppt(32页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、运动图像的编码一第1页,本讲稿共32页运动图像的特点运动图像本质上是连续的时间内连续的场景变化,我们眼睛看到的实际事物就满足这个要求。由于人眼的视觉特点,我们可以利用离散的时间点上一幅幅图像来表示,而让人产生同样的视觉效果。这一幅幅图像就是帧,就是时间离散化的结果。在一帧图像中,我们可以从空间上分割为一个个像素,用单个像素来替代原来的若干模拟点,这就是空间离散化的结果。我们对于运动图像,就利用时间离散化和空间离散化产生的相关性,来进行压缩编码第2页,本讲稿共32页运动图像的冗余空间冗余:和静止图像的冗余情况一致时间冗余:人眼的视觉特点,25fps就可以认为连续。帧间预测:利用相邻帧的时间相关性
2、运动估值:对运动的物体,帧间的相关性降低,利用运动估值,可以减小预测的残差。第3页,本讲稿共32页运动图像编码技术我们已经讲过了静止图像编码,运动图像既然是一幅幅静止图像在时间上的先后排列,因此可以简单的将每一幅静止图像编码组合起来,就形成了一个运动图像的编码。这样的码流还是很大,举例来说,一幅300*200的图像,用JPEG压缩后要20K Bytes。如果是30帧/秒的视频,则会产生600KB/s=4.8Mb/s的码流。这在网络传输中还是无法接收的带宽要求。为此,我们必须利用运动图像在时间轴上的相关性,利用预测编码的方法,而只传输余量信号,就可以减小信号的动态范围,降低码率。进行准确预测的基
3、础就是运动矢量估计,具体的编码方法就是帧间预测编码第4页,本讲稿共32页运动矢量估计第5页,本讲稿共32页块匹配方法(1)按一般想法,应将运动物体和静止背景分离,然后再对运动物理进行运动估计。如何分离?实际上,将图像分块,并认为每块内像素具有同样的运动矢量。在k帧中的一个块,在k-1帧中寻找最相似的子块,称为匹配块,进而得到运动矢量D当前帧中的子块前 一 帧中的最佳匹配子块前一帧中的搜索区域位移矢量第6页,本讲稿共32页块匹配方法(2)搜索范围是有限的,设两帧间隔时间内,最大的水平和垂直位移是 ,则搜索范围SR为如何判断两个子块是否匹配?如何搜索计算量最小?子块相似程度归一化的二维互相关函数,
4、越大越相似。第7页,本讲稿共32页块匹配方法(3)NCCF计算复杂,常用下面两个计算简单的值。帧间子块亮度的均方差值MSE帧间子块亮度的绝对值的均值MAD匹配准则的不同,对匹配精度影响不大,故常用没有乘除法的MAD作为实用的匹配准则。第8页,本讲稿共32页匹配块的搜索全搜索:在整个搜索区域逐个像素移动,每次都要计算MAD。总的移动次数:快速搜索算法二维对数法三步法共轭方向法正交搜索法基于同一假设:当偏离最小误差方向时,判决函数单调上升。即不存在局部最小值。第9页,本讲稿共32页三步法每步对中心和8个临域点计算,而且临域点和中心点的距离,随着搜索步骤的增加而减小。右图搜索3步,最终的匹配点是(i
5、+2,j+6)222112122221111113 3 33 33 3 3第10页,本讲稿共32页共轭方向法首先延水平方向搜索,计算中心点与左右两点的判决值,找到最小点,并移动,直到中心点就是最小点。再延垂直方向进行搜索,直至找到最佳匹配点。91123445678第11页,本讲稿共32页快速搜索算法比较搜索方法所需搜索点数所需搜索步骤图例最坏情况图例最坏情况二维对数法182157三步法252533共轭方向法1215912正交搜索法131366对全搜索,若 ,需要搜索点数Q=169,而快速算法的搜索点数见下表。由于很多DSP能并行运算,因此减小搜索步骤比减小搜索点数更重要,同一步的不同点的判决函
6、数值可以并行计算。第12页,本讲稿共32页像素递归法(1)先将图像中的运动部分与静止部分分开,然后在运动区域内每个像素上以迭代的方式计算位移量经位移后,相邻两帧图像差值DFD(Displaced Frame Difference)的平方通过迭代,得到最优的Di,使得DFD最小。一般迭代方向沿着负梯度方向。第13页,本讲稿共32页像素递归法(2)迭代法示意图DFD按什么范围计算?一个像素还是整个运动区域?按像素计算的DFD函数图,可能的问题按运动区域计算的函数图与可能的问题第14页,本讲稿共32页两种方法的比较块匹配法不需要分离运动与静止区域一个块有一个运动矢量像素递归法需要分离运动与静止区域逐
7、个像素,或者逐个独立运动的模块进行递归运动矢量估计更准确对于一般的运动图像,由于运动物体无规律,采用块匹配法更合适;而对于那种大面积背景不变,而只是单个或个别物体运动的运动图像,则更适合用像素递归法。第15页,本讲稿共32页半像素搜索为了提高运动矢量的精度,引入半像素搜索。在原先搜索到最小MAD的位置(i,j)上,再通过线形内插得到周围8个半像素点。再在这9个点中寻找最终的匹配点。(i,j)第16页,本讲稿共32页具有运动补偿的帧间预测第17页,本讲稿共32页前向预测(1)前向预测:用k-1帧来预测k帧。不直接传送当前帧像素,而是传送同一位置的当前帧像素与前一帧像素的差值。对运动物体,这个差值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运动 图像 编码
限制150内