基于光学图像的多粒度随动环境感知算法-陈昊升.pdf
《基于光学图像的多粒度随动环境感知算法-陈昊升.pdf》由会员分享,可在线阅读,更多相关《基于光学图像的多粒度随动环境感知算法-陈昊升.pdf(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、软件学报ISSN 10009825,CODEN RUXUEWJournal ofSoftware,2016,27(10):26612675doi:10 13328jcnkijos005083中国科学院软件研究所版权所有基于光学图像的多粒度随动环境感知算法4陈昊升,张格,叶阳东(郑州大学信息工程学院,河南郑州450052)通信作者:叶阳东,Email:ieydyeZZUeducnEmail:jOSiscasaccnhttp:wwwjosorgcnTel:+861062562563摘要: 针对快速三维建模中的室内外随动环境感知问题,提出一种基于光学图像的多粒度随动环境感知算法该算法根据多种光学图像
2、生成拟合真实三维环境的多粒度点云模型,然后通过概率八又树压缩并统一表示已生成的多粒度三维模型进而伴随相机轨迹每个时间节点,通过卡尔曼滤波动态融合多粒度点云模型的概率八叉树表示最终生成唯一的时态融合概率八叉树三维模型,简称TFPOM,使TFPOM能够在较少的噪声影响下以任意粒度动态拟合真实环境该算法配合剪枝和归并策略能够适应多粒度融合和多粒度表示的环境建模要求,有效压缩环境模型存储空间,实现鲁棒的随动环境感知,便于基于环境模型的视觉导航,增强现实等应用实验结果表明,该算法能够在以可穿戴设备为代表的内含多种异构光学图像传感器、低计算效能的平台上实时地得到充分拟合真实动态环境的多粒度TFPOM,基于
3、该模型的视觉导航具有较小的轨迹误差关键词: 随动环境感知;概率八叉树;多粒度;快速三维建模中图法分类号:TP391中文引用格式:陈昊升,张格,叶阳东基于光学图像的多粒度随动环境感知算法软件学报,2016,27(10):2661-2675http:wwwjOSorgcn1000-98255083htm英文引用格式:Chen HS,Zhang G,Ye YDOptical image based multi-granularity follow-up environment perception algorithmRuan Jian Xue BaoJournal ofSoftware,2016,2
4、7(10):2661-2675(in Chinese)http:wwwjosorgcn100098255083htmOptical Image Based Multi-Granularity Follow-Up Environment Perception AlgorithmCHEN HaoSheng,ZHANG Ge,YE Yang-Dong(School of Information Engineering,Zhengzhou University,Zhengzhou 450052,China)Abstract:An optical image based multigranularity
5、 follow-up environment perception algorithm is proposed to address the follow-upenvironment perception issue from indoor to outdoor in the field of rapid 3D modelingThe algorithm generates multi-granularity 3Dpoint cloud models which perfectly fit the groundtruth according to different types of opti
6、cal imageA probabilistic octree representationis proposed to uniformly express the 3D point cloud modelsFinally,the expected TFPOM is generated through dynamic ground-tmthfitting at any granularity,and probabilistic octree representation of multigranularity point cloud models are dynamically fused t
7、hroughimplementation of Kalman filter along with the camera trajectoryBenefiting from pruning and merging strategies,the proposed algorithmmeets requirements of multi-granularity fusion and multigranularity representationAs a result,the storage space of environment modelscan be effectively compresse
8、d and robust follow-up environment perception can be achieved,which are essential in environment modelbased visual navigation and augmented reality Experiment results show that the algorithm can generate multigranularity TFPOM whichperfectly fits ground-truth in real time with fewer errors in model
9、based navigation on platforms,such as wearable devices,that areequipped with multiple optical sensors and low computing capabilityKey words:follow-up environment perception;probabilistic octree;multi-granularity;rapid 3D modeling基金项目:国家自然科学基金(61170223,61502434,61502432)Foundation item:National Natur
10、al Science Foundation ofChina(61170223,61202207,61502432)收稿时间:20160120;修改时间:20160325;采用时间:201605-09;jOS在线出版时间:2016-0808CNKI网络优先出版:2016-0809 15:38:19http:wwwcnkinetkcmsdetail112560 TP 201608091538020html万方数据2662 Journal of Software软件学报V0127,No1 0,October 20 1 6基于光学图像的环境感知是指通过多种异构的光学图像传感器,例如单目相机、全景相机、
11、双目相机、红外相机等对真实环境的描述构建高度拟合环境的三维模型随动环境感知不同于以批处理模式离线构建环境模型的基于运动结构恢复(structure from motion,简称SfM)的传统方法,它强调在相机运动过程中根据相机轨迹实时生成环境模型随动环境感知问题实质上是一个基于视觉的同步定位与建图(vision based simultaneouslocalization and mapping,简称visual SLAM)问题,通常使用基于滤波器的方法或基于关键帧的捆集调整法(bundle adjustment,简称BA)求解而传统的基于滤波器,如扩展卡尔曼滤波器的方法因受累计误差和协方差矩
12、阵计算复杂度的限制,已逐步被基于关键帧的捆集调整法取代在visual SLAM领域,文献1】首次提出一种使用单目广角相机作为图像采集设备、基于扩展卡尔曼滤波的MonoSLAM算法,为visual SLAM算法的可行性和易用性奠定了坚实的基础文献【2,3提出一种基于关键帧且定位和建图分离的单目visual SLAM算法PTAMPTAM保持了visual SLAM结构,并使用运动结构重建相关算法对MonoSLAM进行改进其中,分离后的建图工作使用捆集调整法代替扩展卡尔曼滤波,在具有更好的鲁棒性的同时避免了累计误差以及协方差矩阵计算量等限制伴随visual SLAM体系结构的逐步完善,相关工作的重心
13、转移到如何使算法能够获取更加丰富的环境信息和具有更好的精确性以及更强的实时性上其中,文献4】提出一种逐个像素遍历处理的PTAM改进算法,算法虽然能够构建较为精确的三维稠密点云地图,但受计算复杂度约束,其应用场景仅限于较小的桌面场景文献57提出了一种基于图像梯度不依赖于特定图像特征点的半稠密建图方法,并根据单目彩色相机、全景相机、多目立体相机分别提出了相关算法这种方法相对于基于图像特征点的建图方法,可以较大程度地恢复场景细节,但是,由于半稠密区域所恢复的深度采用中心特征点深度近似方法,使得这类算法具有较大的固有和随机噪声文献8】提出了一种基于ORB9】算子的ORBSLAM算法,该算法利用闭环检测
14、机制减少了累计误差,在实际应用中具有较好的鲁棒性,但存在生成的环境模型较为稀疏、缺少较多细节等问题文献10】对文献8】进一步加以补充,提出了ORB特征的半稠密表示文献1114通过主动红外深度相机构建精确稠密的点云地图,其中,文献12考虑到动态场景的恢复问题,文献13】则关注先验模型库为定位与建图所带来的增益受限于现有深度相机支持的最大有效工作景深一般仅为4m且易受室外自然红外线干扰,该类算法一般受限于室内场景环境三维模型存储表示是用于环境感知的visual SLAM中的重要一环,对算法精确性和时间效率起决定性作用其中,文献15,16将空间离散划分为刚体的体素,这种方法存在存储空间占有大、需要预
15、先确定环境的内容等问题另一种被visual SLAM广泛使用的表示形式是点云形式【l 718】,这种表示形式的主要缺陷在于无法明确表示状态为未知(摄像机尚未捕捉到的区域)和空闲(确定为未被实体占用的区域)的区域,对环境的动态性容忍度较低文献19】首次提出使用八叉树用于存储表示,之后,文献20,2l】开始关注是否处于被占用的二值状态文献2224提出一种概率方法以表示状态为占用和空闲的区域上述八叉树表示没有解决存储消耗和置信度闽值问题文献25,26设计了一种概率八又树的表示和相关剪枝等策略,较好地解决了上述问题同时,文献27】还讨论了利用八叉树结构进行有效纹理映射的方法在实际的视觉同步定位与建图中
16、,一般使用以可穿戴设备为代表的硬件平台这些硬件平台大多具有内含多种异构光学图像传感器、低计算效能等特点在环境场景由室内向室外转换时,难以由一种同构图像传感器统一感知例如,在室内具有较高精度的红外相机由于其最小及最大可测距离的限制,无法适用于室外场景,如图1所示,需要双目相机或单目相机辅助另外,各种异构相机衍生出相应不同粒度的环境建图方式目前常用的方法有单目或双目相机的基于图像特征点的稀疏建图方法【1_3,81,单目、双目或全景相机的半稠密建图方法5-7,10】,单目、双目或主动深度相机的基于深度图的稠密建图方法1-14】这3类这些客观因素对统一表示多粒度地图模型提出了挑战另一方面,在相机运动过
17、程中相机姿态不断更新,相应的环境地图需要同步动态增量更新此外还需要考虑不同图像传感器在不同时刻的工作状态,如运动模糊所造成的影响等如何针对不同环境模型的内在特性给予相应的置信度进行有机融合和根据相机时间序列状态动态更新置信度的问题亟待解决本文在深入研究现有算法的基础上,提出了基于光学图像的多粒度随动环境感知算法该算法采集多种异万方数据陈昊升等:基于光学图像的多粒度随动环境感知算法 2663构图像传感器及相应visual SLAM算法所生成的稀疏、半稠密、稠密多种粒度的异构三维点云模型,同时提出一种概率八叉树统一表示生成的若干三维模型然后,通过卡尔曼滤波,在相机运动期间不断融合多种异构点云的置信
18、度,并更新时态融合概率八叉树模型(temporal fused probabilistic octree model,简称TFPOM),这种融合方法既可以保证环境模型的时空一致性,又可以满足后续增量更新的需求同时,利用一种有效的剪枝和归并策略,在压缩模型存储空间时使环境模型能够以任意粒度动态拟合真实环境,最终实现鲁棒的随动环境感知已有的visual SLAM技术均可借鉴本文算法,融合计算真实场景的动态时空模型,从而避免单源固有噪声和随机噪声的影响,以提高算法鲁棒性,并通过概率八叉树模型压缩特性和本文所提出的剪枝归并策略提高算法效率本文给出其中一种融合稀疏、半稠密、稠密visual SLAM环境
19、模型并给出统一表示的算法实现据我们所知,目前尚未出现融合多源多粒度环境模型的相关算法QFig1 Color image,depth image and registered image of infrared camera under the same sceneRegistered area of the scene is highlighted by red ellipse图1 红外深度相机在同一场景下的彩色、深度和彩色深度配准图图中椭圆标出区域是受相机景深限制唯一能够配准的区域本文主要贡献如下:(1)对真实环境的若干异构点云模型提出一种统一的概率八叉树表示这种统一的概率八叉树表示可以有效
20、地表达状态为占有、空闲和未知的区域然后为这种环境模型的概率八叉树表示提出了剪枝和归并策略,压缩模型存储空间,扩展模型多粒度表示(2)通过为多种异构光学图像传感器提出一种合理的置信度概率模型,伴随相机运动,使用卡尔曼滤波器对上述环境模型的概率八叉树表示提供时态融合,进而生成TFPOM,用于多粒度动态感知真实环境(3)为算法更新过程提出一种模型增量更新的方法,这种方法具有较低的计算复杂度,可以在以穿戴式设备为主的低计算效能的设备上实时运行,便于随动环境感知1 相关知识11多粒度环境感知原理当前visual SLAM所构建的环境模型根据体素的密度分为3种类型:稀疏模型、半稠密模型和稠密模型相关的构建
21、方法高度依赖于具有不同特性的传感器和相关算法实现例如,单目相机一般用于构建稀疏模型和半稠密模型,双目和红外深度相机则用于构建稠密模型现将本文所使用的模型构建方法中的相关原理描述如下稀疏模型的构建原理参考文献8】,通过对视频帧提取ORB图像特征点并在视频帧序列的相邻帧之间或双目图像之间寻找特征匹配,接着使用图像特征点匹配和三角测量从图像中恢复像素的深度信息,使之成为体素与此同时,使用捆集调整法不断优化所有体素的位姿,使其达到最优化,优化后的体素整体构建成环境稀疏地图半稠密模型的构建原理参考文献5】,通过对图像剧烈变化的区域,也就是图像梯度处于极值的区域做图像配准万方数据2664 Journal
22、of Software软件学报V0127,No1 0,October 20 1 6来更新相机位姿更新后的相机位姿配合相关的若干视频帧,通过误差能量函数最小化估计像素深度,这是一种光流的思想获取到图像深度信息后,半稠密模型将图像极值区域的像素群构建相应体素群,因为图像一般包含较多的极值区域,能够恢复较多的图像细节,所以这种体素群构建环境地图的方法称为半稠密建图稠密模型的构建原理是通过视频帧的彩色图和配准的深度图在视频帧序列中不断更新当前相机姿态,并根据相机姿态,将新加入的具有直接深度的体素插入环境点云,从而直接获得稠密环境三维模型12概率八叉树模型八叉树是一种将环境空间迭代细分为八维子空间的存储
23、表示方法在环境感知中,八叉树的叶子节点存储所有的环境体素,非叶子节点称为内点,在插入、剪枝、归并或变更分辨率等树操作后可能转换为叶子节点或高层节点,如图2所示环境空间内的立体度量单位在转换成三维模型中的一个体素后可以分为3种状态其中一种称为未知状态,表示该体素在当前时刻之前相机尚未捕捉到的环境区域中剩余两种相互制约状态分别称为占有和空闲,表示该体素对应的立体度量单位在当前时刻被认为有实体占有和被认为无实体占有在实际对环境的感知过程中,受各种异构相机内部噪声和环境外部噪声的共同影响,当前时刻体素的状态难以由确定的三元状态完全解释,应使用更灵活的概率八叉树表示本文所用概率八叉树的实现可参考文献f2
24、5,26,在第i个叶子节点使用logOdds值上(f),如式(1)所示,表示对占有状态的置信度P(j)的初始值一般设置为05,表示处于置信度不明确状态根据三元状态的定义,该叶子节点空闲状态的置信度为1屯(f),而未知状态则会被预先标识r PCiL(i)2 logit(p(i)=logI去I (1)Ll一,LzJJI(a)概率八叉树空间模型Fig2 A typical example of probabilistic octree图2概率八又树示例2基于概率八叉树的多粒度环境模型的统一表示传统环境模型多以单粒度模型为主,而单粒度模型自身存在各异构图像传感器的固有不足,且受模型固有噪声、随机噪声的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 光学 图像 粒度 环境 感知 算法 陈昊升
限制150内