单目视觉＞双目视觉＞RGBD比较

Posted 2022-01-19 MrCharles

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了单目视觉＞双目视觉＞RGBD比较相关的知识，希望对你有一定的参考价值。

目前，视觉SLAM（SLAM是“Simultaneous Localization And Mapping”的缩写，可译为同步定位与建图）可分为单目、双目(多目)、RGBD这三类，另还有鱼眼、全景等特殊相机，但目前在研究和产品中还属于少数。从实现难度上来说，大致将这三类方法排序为：单目视觉>双目视觉>RGBD。

单目相机SLAM简称MonoSLAM，仅用一支摄像头就能完成SLAM。最大的优点是传感器简单且成本低廉，但同时也有个大问题，就是不能确切的得到深度。

一方面是由于绝对深度未知，单目SLAM不能得到机器人运动轨迹及地图的真实大小，如果把轨迹和房间同时放大两倍，单目看到的像是一样的，因此，单目SLAM只能估计一个相对深度。另一方面，单目相机无法依靠一张图像获得图像中物体离自己的相对距离。为了估计这个相对深度，单目SLAM要靠运动中的三角测量，来求解相机运动并估计像素的空间位置。即是说，它的轨迹和地图，只有在相机运动之后才能收敛，如果相机不进行运动时，就无法得知像素的位置。同时，相机运动还不能是纯粹的旋转，这就给单目SLAM的应用带来了一些麻烦。

而双目相机与单目不同的是，立体视觉既可以在运动时估计深度，亦可在静止时估计，消除了单目视觉的许多麻烦。不过，双目或多目相机配置与标定均较为复杂，其深度量程也随双目的基线与分辨率限制。通过双目图像计算像素距离，是一件非常消耗计算量的事情，现在多用FPGA来完成。

RGBD相机是2010年左右开始兴起的一种相机，它最大的特点是可以通过红外结构光或TOF原理，直接测出图像中各像素离相机的距离。因此，它比传统相机能够提供更丰富的信息，也不必像单目或双目那样费时费力地计算深度。

以上是关于单目视觉＞双目视觉＞RGBD比较的主要内容，如果未能解决你的问题，请参考以下文章