TANDEM 基于深度多视图立体视觉的实时跟踪和稠密建图
Posted Being_young
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了TANDEM 基于深度多视图立体视觉的实时跟踪和稠密建图相关的知识,希望对你有一定的参考价值。
点云PCL免费知识星球,点云论文速读。
文章:TANDEM: Tracking and Dense Mapping in Real-time using Deep Multi-view Stereo
作者:Lukas Koestler Nan Yang y Niclas Zeller Daniel Cremers
编译:点云PCL
代码:https://github.com/tum-vision/tandem.git
欢迎各位加入免费知识星球,获取PDF论文,欢迎转发朋友圈。文章仅做学术分享,如有侵权联系删文。未经博主同意请勿擅自转载。
论文阅读模块将分享点云处理,SLAM,三维视觉,高精地图相关的文章。公众号致力于理解三维视觉领域相关内容的干货分享,欢迎各位加入我,我们一起每天一篇文章阅读,开启分享之旅,有兴趣的可联系微信dianyunpcl@163.com。
摘要
本文提出了一个实时单目跟踪和稠密建图框架, 对于姿态估计,TANDEM基于关键帧的滑动窗口进行BA(bundle adjustment), 为了增强鲁棒性,提出了一种新的跟踪前端,该前端使用由稠密深度预测增量构建的全局模型渲染的深度图,来执行稠密直接图像对齐, 为了预测稠密的深度图,提出了级联视图聚合MVSNet (CVA-MVSNet),它利用整个活动关键帧窗口,通过分层构造具有自适应视图聚合的3D成本量来平衡关键帧之间的不同立体基线, 最后,将预测的深度图融合为一致的全局图,以截断的带符号距离函数(TSDF)体素网格表示, 最终的实验结果表明,TANDEM在相机跟踪方面优于其他先进的传统和基于学习的单目视觉里程计(VO)方法, 此外,TANDEM还展示了最先进的实时三维重建性能。
主页:https://go.vision.in.tum.de/tandem
图1:TANDEM是一种单目密集SLAM方法,用于估计相机姿势并实时重建3D环境
主要贡献
(1)提出一种新颖的实时单目密集SLAM框架,无缝结合了经典的直接法VO和基于学习的MVS三维重构;
(2)据我们所知,第一个利用全局TSDF模型渲染的深度的单目稠密跟踪前端;
(3)一种新颖的MVS网络,CVA-MVSnet,它能够通过利用视图聚合和多级深度预测来利用整个关键帧窗口;
(4)在合成和真实的数据上,达到了最先进的跟踪和重建结果。
主要内容
方案主要有三部分组成:单目视觉里程计、CVA MVSNet稠密深度估计和体积建图。图2a显示了系统的概述,视觉里程计利用单目视频流和3D TSDF模型渲染的密集深度,以滑动窗口方式估计摄像机姿势。给定关键帧及其估计姿势,提出的CVA MVSNet预测参考关键帧的稠密深度贴图,为了重建环境的完整且全局一致的3D模型,深度贴图随后通过体素散列融合到TSDF体素网格中,通过无缝集成这些组件,最终的system TANDEM能够从单目相机实现实时跟踪和高质量稠密贴图。
图2:(a)使用视觉里程计优化的稀疏点和3D模型渲染的稠密深度图跟踪每帧,关键帧的姿态通过滑动窗口光度束调整进行估计,并输入CVA MVSNet进行稠密的深度预测,深度贴图融合为全局一致的TSDF体积,(b) CVA MVSNet构建级联成本量并分层估计深度图,视图聚合模块通过预测自适应权重,有效地聚合多视图图像的特征
实验
图3 DeepFactors、Atlas和未知序列上的TANDEM深度比较,TANDEM产生更精细的比例细节,例如第二排的设备或第三排的梯子,对于EuRoC,只有稀疏的地面真实深度可用。
图4:Atlas和TANDEM在未知序列上的定性比较,Atlas不构建纹理网格,这里还从TANDEM渲染纯几何体以进行比较
表1:EuRoC的位姿评估,所有的方法都是模拟对齐的w.r.t.真值轨迹,显示了五次运行期间的平均绝对姿态误差和标准偏差
表2:在VO窗口中使用所有关键帧不会改善基线,然而,将Win与视图聚合(VA)相结合会以增加推理运行时间和内存为代价产生更准确的结果
三维重建的实验对比
总结
我们介绍了TANDEM,一种实时稠密的单目SLAM系统,该系统采用了一种新颖的设计,将直接光度视觉里程计与深度多视角立体视觉相结合,特别是提出了CVA MVSNet,它有效地利用了整个关键帧窗口并预测高质量的深度贴图,此外,提出的密集跟踪方案通过跟踪TSDF融合生成的全局3D模型,将摄像机姿态估计和密集3D重建联系起来,定量和定性实验表明,在合成数据和真实数据的三维重建和视觉里程测量方面,TANDEM方法比其他最先进的方法取得了更好的结果。我们认为,TANDEM三维重建的效果进一步缩小了RGB-D重建之间的差距。
资源
三维点云论文及相关应用分享
【点云论文速读】基于激光雷达的里程计及3D点云地图中的定位方法
3D-MiniNet: 从点云中学习2D表示以实现快速有效的3D LIDAR语义分割(2020)
PCL中outofcore模块---基于核外八叉树的大规模点云的显示
更多文章可查看:点云学习历史文章大汇总
SLAM及AR相关分享
扫描下方微信视频号二维码可查看最新研究成果及相关开源方案的演示:
如果你对本文感兴趣,请点击“原文阅读”获取知识星球二维码,务必按照“姓名+学校/公司+研究方向”备注加入免费知识星球,免费下载pdf文档,和更多热爱分享的小伙伴一起交流吧!
以上内容如有错误请留言评论,欢迎指正交流。如有侵权,请联系删除
扫描二维码
关注我们
让我们一起分享一起学习吧!期待有想法,乐于分享的小伙伴加入免费星球注入爱分享的新鲜活力。分享的主题包含但不限于三维视觉,点云,高精地图,自动驾驶,以及机器人等相关的领域。
分享及合作:群主微信“920177957”(需要按要求备注) 联系邮箱:dianyunpcl@163.com,欢迎企业来联系公众号展开合作。
点一下“在看”你会更好看耶
以上是关于TANDEM 基于深度多视图立体视觉的实时跟踪和稠密建图的主要内容,如果未能解决你的问题,请参考以下文章
IDA-3D 解读基于实例深度感知的自动驾驶立体视觉三维目标检测