第三章二维运动估计之一ppt课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第三章二维运动估计之一ppt课件.ppt》由会员分享,可在线阅读,更多相关《第三章二维运动估计之一ppt课件.ppt(55页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章第三章 二维运动估计二维运动估计我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物运动估计运动估计涉及涉及: 图像平面运动图像平面运动(二维运动二维运动) 和空间物体运动和空间物体运动(三维运动三维运动),运运动分析与估计是数字视频处理的基本问题之一动分析与估计是数字视频处理的基本问题之一, 也是数字视频处理的难也是数字视频处理的难点和热点。点和热点。 运动分析与估计运动分析与估计广泛应用于计算机视觉、目标跟踪、工业监视和视频广泛应用于计算机视觉、目标跟踪、工业监视和视频压缩等场合压缩等场合不同应用场合
2、对运动估计要求不同,有如下区分:不同应用场合对运动估计要求不同,有如下区分:真实运动估计真实运动估计:要求估计获得的物体运动和实际运动基本:要求估计获得的物体运动和实际运动基本一致。如计算机视觉、目标跟踪、工业监视。一致。如计算机视觉、目标跟踪、工业监视。非真实运动估计非真实运动估计:在不被察觉的情况下允许有估计误差,:在不被察觉的情况下允许有估计误差,从而最大限度降低信息量和传输带宽。如广播电视中的视从而最大限度降低信息量和传输带宽。如广播电视中的视频压缩。频压缩。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个
3、活的生物几个基本概念几个基本概念1.时间序列图像:随时间而变化的一系列图像称为时间序列图像或运动时间序列图像:随时间而变化的一系列图像称为时间序列图像或运动图像。图像。2.运动物体特征:指物体形状或表面特征,如尖锐点、边缘线等。运动物体特征:指物体形状或表面特征,如尖锐点、边缘线等。 可以通过运动物体的特征来观察分析物体的运动。可以通过运动物体的特征来观察分析物体的运动。3.运动估计的基本问题运动估计的基本问题运动估计研究的是视频序列图像中投影坐标在像平面上的变化,获取运动估计研究的是视频序列图像中投影坐标在像平面上的变化,获取运动参数,但是投影会造成信息丢失(运动参数,但是投影会造成信息丢失
4、(不可逆不可逆),导致估计误差。),导致估计误差。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物特征对应特征对应:运动物体上的特征与其在二维平面上的投影坐标的对应关:运动物体上的特征与其在二维平面上的投影坐标的对应关系。见下图示:系。见下图示:设t1t2时,物体由P运动至P,即:空空 间间:P(X,Y,Z) P(X,Y,Z) 像平面像平面: p(x,y) p(x,y)二维位移(x, y )称为二维运动矢量,标记为d(x,t1;t2)。对于一组点,二维空间位移记为d(xi,t1;t2),i=1,2,。我吓了
5、一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物运动估计的基本问题基本问题是估计运动前后相邻两帧图像上对应点的坐标pi(xi,yi)和pi (xi,yi),i=1,2,3。即像平面上对应的二维运动矢量di(xi,t1;t2)。 我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物4.运动分析方法运动分析方法:主要有两种:主要有两种.根据时间相邻的两幅或多幅图像求解物体的运动参数和三维结构信息。根据时间相邻的两幅或多幅图像求解物体的
6、运动参数和三维结构信息。图像序列的光流分析法。图像序列的光流分析法。运动信息包括:物体的一阶(位移)、二阶(速度)、三阶(加速度)等。运动信息包括:物体的一阶(位移)、二阶(速度)、三阶(加速度)等。研究内容包括:运动目标检测与分割、运动参数估计等。研究内容包括:运动目标检测与分割、运动参数估计等。光流:指视觉观察到的图像中产生的光强变化。它一般对应物体的运动,但也光流:指视觉观察到的图像中产生的光强变化。它一般对应物体的运动,但也有不一致的情况。有不一致的情况。 换句话说,在视频图像序列运动估计中,观察到的二维运动叫光流。换句话说,在视频图像序列运动估计中,观察到的二维运动叫光流。或或定义定
7、义:视频序列空间坐标关于时间的变化率称为光流,即:视频序列空间坐标关于时间的变化率称为光流,即(vx,vy)T=(dx/dt,dy/dt)T,其对应于像素的瞬时速度矢量。其对应于像素的瞬时速度矢量。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物纲要v2-D 运动和光流运动和光流v光流方程解决运动估计的一般方法光流方程解决运动估计的一般方法 运动表示运动表示 运动场参数化运动场参数化 最优化准则的公式化最优化准则的公式化 寻找最优化参数寻找最优化参数v运动估计算法运动估计算法 基于光流的运动估计基于光流的运
8、动估计 基于像素的运动估计基于像素的运动估计 基于块的运动估计(基于块的运动估计(EBMA)我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物3-D运动运动 - 2-D运动运动3-DMV2-DMV我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物2.1 2-D 运动运动 vs. 光流光流v2-D 运动运动: 3-D 运动的投影运动的投影, 取决于取决于3D 物体运动和投影物体运动和投影操作。操作。v光流光流: 观测的或表现的
9、观测的或表现的二维运动。二维运动。 不仅可以由物体运动引起,还可以由摄像机运动或照明条件不仅可以由物体运动引起,还可以由摄像机运动或照明条件变化引起。变化引起。注:注:不等同于真实的二维运动。不等同于真实的二维运动。v左边是一个具有均匀平坦表面的球在恒定的环境光下转动。每一个点都反射相同的彩色,人们感觉不到球的任何变化,认为球是静止的。v右边是一个静止的球,被一个绕着球转动的点光源照明。光源的运动引起球上反射光点的运动,人眼认为球在运动。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物光流方程光流方程v如果
10、照明条件未知,那么所能得到的最精确估如果照明条件未知,那么所能得到的最精确估计就是光流。计就是光流。v恒定亮度假设恒定亮度假设 光流方程光流方程又运用泰勒展开式,当又运用泰勒展开式,当dx,dy,dt很小时,很小时,比较上面两个式子,得到光流方程:比较上面两个式子,得到光流方程:),(),(tyxdtdydxtyxtyxtyxdtdydxtyxdtdydx),(),(000ttvyvxdtdydxTyxtyxvTyx,其中空间梯度矢量空间梯度矢量我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物其中: 为图像
11、空间梯度方向 上的单位矢量v光流v的分解 将光流v分解为两个正交的分量:ne0tvTtneevtnvv为切线方向上的单位矢量te0tvnnenvtetvv只能确定图像空间梯度方向上的分量(法向流) 即:孔径问题nv光流方程光流方程我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物图图6.3 运动估计中的运动估计中的孔径孔径(用一个恒定亮度假设的小窗口)(用一个恒定亮度假设的小窗口)问题问题: 在在x1 处估计运动使用孔径处估计运动使用孔径1,但是不可能确定运动,但是不可能确定运动是向上的还是垂直于边缘的,因为
12、在这个孔径中只有一是向上的还是垂直于边缘的,因为在这个孔径中只有一个空间梯度方向。可以准确地估计个空间梯度方向。可以准确地估计x2的运动,因为在孔径的运动,因为在孔径2中,图像有两个不同方向的梯度。中,图像有两个不同方向的梯度。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物运动估计中的不确定问题运动估计中的不确定问题v孔径问题:孔径问题:光流方程只确光流方程只确定了法向的投影定了法向的投影vn,在切线在切线的投影是不确定的,任何的投影是不确定的,任何vt 的值都满足光流方程。的值都满足光流方程。v一个方程
13、有两未知数一个方程有两未知数要施加附加条件:要施加附加条件:最通常最通常的的约束约束是流矢量在是流矢量在空间平空间平滑变化滑变化。使我们可以利用。使我们可以利用x周围一个小的邻域亮度周围一个小的邻域亮度变化去估计变化去估计x处的运动。处的运动。v运动估计仅在有亮度变化运动估计仅在有亮度变化区域可靠区域可靠。0|tvvvnttnneev我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物v参考帧:参考帧: 1(x, t1)v当前帧当前帧: 2(x, t2)v前向运动估计前向运动估计 /后向运动估计:后向运动估计:
14、 t2 t1 / t2 重点重点v三个关键问题:三个关键问题: Q1:怎样将运动场参数化怎样将运动场参数化 Q2:用什么样的准则来估计这些参数用什么样的准则来估计这些参数 Q3:怎样搜索这些最优参数怎样搜索这些最优参数我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物2.2.1 运动表示法(运动表示法(Q1) 整体(全整体(全局)局): 整体运动整体运动由若干整由若干整体参数表体参数表示。示。基于块:基于块: 把图像域把图像域固定分成固定分成许多小的许多小的方块,每方块,每个块用一个块用一个简单的个简单的模型
15、表征。模型表征。基于像素:基于像素: 每个象素都每个象素都指定运动矢指定运动矢量量基于区域:基于区域:将图像帧分将图像帧分为多个区域,为多个区域,每个区域用每个区域用一个参数化一个参数化模型表征。模型表征。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物2.2.2 运动估计准则运动估计准则1: (Q2) 基于位移帧差准则基于位移帧差准则v最常用的运动估计准则是参考帧最常用的运动估计准则是参考帧 1与当前帧与当前帧 2之间每个对应点对之间之间每个对应点对之间亮度值之差的和亮度值之差的和。v回忆回忆 1中的中的
16、x移动到移动到 2 中的中的w(x; a) ,则目标函,则目标函数写为:数写为:min| )();(|)(12pDFDwExaxaxvp 是一个正数,当是一个正数,当 p = 1, 上面的误差称为平均上面的误差称为平均绝对差绝对差 (MAD), 当当p = 2,称为均方差称为均方差(MSE)v误差图像误差图像e(x; a) = 2(w(x, a) ) - 1(x) 一般称为一般称为位移帧差位移帧差(DFD) 图像图像v使使 最小的必要条件是它的梯度最小的必要条件是它的梯度=0)(aDFDE我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜
17、测没有错:表里边有一个活的生物2.2.2 运动估计准则运动估计准则2: 基于光流方程准则基于光流方程准则min| )()();()( |)(121pAxTOFExxaxdxav光流方程光流方程0tyxdtdydxv如果如果 dt 很小,很小,令令)()(12xxdtt0, 01211211dordydxTyxv这个光流方程的离散形式更经常用在数字视频的运动这个光流方程的离散形式更经常用在数字视频的运动估计中,求解符合方程的估计中,求解符合方程的x问题可以转化成用以下问题可以转化成用以下目标函目标函数(数(EOF)表示的最小化问题:表示的最小化问题:我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么
18、把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物v运动估计是一个运动估计是一个不适定不适定(病态)问题(病态)问题 恒定亮度假定不总是成立恒定亮度假定不总是成立 在平面纹理区域,不同运动估计可以满足恒定亮度在平面纹理区域,不同运动估计可以满足恒定亮度假设或光流方程。假设或光流方程。v在严格数学意义上,我们不可能对不适定问题进行求在严格数学意义上,我们不可能对不适定问题进行求解并得到答案,只能通过先验知识找到近似解。解并得到答案,只能通过先验知识找到近似解。v正则化过程正则化过程:即用一组与原不适定问题相近的适定问:即用一组与原不适定问题相近的适定问题去
19、逼近原问题的解。题去逼近原问题的解。v在基于像素和基于块运动估计中很重要。在基于像素和基于块运动估计中很重要。2.2.2 运动估计准则运动估计准则3 平滑约束正则化平滑约束正则化我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物2.2.2 运动估计准则运动估计准则3 平滑约束正则化平滑约束正则化v常用的正则化方法是增加一个表示常用的正则化方法是增加一个表示平滑变化平滑变化的的代价项代价项来测量邻近像素来测量邻近像素MV的差:的差:v总的最小化准则写成:总的最小化准则写成: AxNysxaydaxdaE2);(
20、);()(min)()(aEwaEEssDFD。以免模糊系数应该减小来选择,物体边界的权运动平滑的重要性根据与预测误差有关的权系数)(sw我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物不同准则之间的关系v基于光流方程准则基于光流方程准则OF 只有当运动比较小的时候效果较好。只有当运动比较小的时候效果较好。 当当p=2时最小值函数是时最小值函数是MV的二次函数。如果运动参的二次函数。如果运动参数关于数关于MV线性,则函数具有唯一的最小值,容易线性,则函数具有唯一的最小值,容易求解。求解。v当运动比较大,可以
21、对基于光流方程准则当运动比较大,可以对基于光流方程准则OF进行迭代求解,以满足基于位移进行迭代求解,以满足基于位移帧差(帧差(DFD)准则。准则。我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物2.2.3 优化方法(对误差函数进行最小化)优化方法(对误差函数进行最小化)Q3v穷尽搜索穷尽搜索 通常用在通常用在DFD准则中当准则中当p=1(MAD)的情况的情况 保证保证全局最优全局最优 计算量太大计算量太大 快速算法可以得到次优解。快速算法可以得到次优解。v基于梯度搜索基于梯度搜索 通常用在通常用在 DFD
22、或或 OF 准则,当准则,当 p=2 (MSE)的情况的情况 可以计算出梯度可以计算出梯度 运用运用OF准则时应该可以获得一个闭合解析式。准则时应该可以获得一个闭合解析式。 通过先验知识获得一个好的初始解,搜索出通过先验知识获得一个好的初始解,搜索出局部最优局部最优的点的点v多分辨率搜索多分辨率搜索 从粗分辨率搜索到细分辨率,比穷尽搜索快。从粗分辨率搜索到细分辨率,比穷尽搜索快。 避免陷入局部最优避免陷入局部最优我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物2.3 基于光流的运动估计基于光流的运动估计v光
23、流方程 亮度守恒假设:运动物体点的亮度(或色度)在其运动轨迹上保持不变,变化的是物体的位置。),(),(tyxdtdydxtyxtyxtyxdtdydxtyxdtdydx),(),(0tyxdtdydx0tvyvxyx或0tvT其中 为空间梯度向量, 为光流场。Tyx,),(yxvvv我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物图像梯度的计算v光流方程的要求:亮度函数可微v数字视频:有限差分法近似m,nm+1,nm,n+1m+1,n+1)1, 1,() 1, 1, 1() 1,() 1, 1(), 1,
24、(), 1, 1(),(), 1(41knmknmknmknmknmknmknmknmx)1, 1() 1, 1, 1() 1,() 1, 1,(), 1(), 1, 1(),(), 1,(41knmknmknmknmknmknmknmknmy), 1, 1() 1, 1, 1(), 1,() 1, 1,(), 1() 1, 1(),() 1,(41knmknmknmknmknmknmknmknmt我吓了一跳,蝎子是多么丑恶和恐怖的东西,为什么把它放在这样一个美丽的世界里呢?但是我也感到愉快,证实我的猜测没有错:表里边有一个活的生物2.3.1 多点邻域约束v光流方程 一个方程,两个未知数v多点
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三 二维 运动 估计 之一 ppt 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内