有没有办法从 python/opencv 中的单摄像头视频生成实时深度图?
Is there a way to generate real time depthmap from single camera video in python/opencv?
我正在尝试将单个图像转换成它的深度图,但我找不到任何有用的教程或文档。
我想使用 opencv,但如果您知道使用例如 tensorflow 获取深度图的方法,我会很高兴听到。
有很多关于立体视觉的教程,但我想便宜一点,因为这是一个帮助盲人的项目。
我目前正在使用 esp32 cam 逐帧流式传输并使用 opencv 在 python 上接收图像。
通常,我们需要从世界的不同位置进行光度测量,形成对世界的几何理解(a.k.a深度图)。对于单幅图像,无法测量几何,但可以根据先前的理解推断深度。
使单个图像工作的一种方法 是使用深度 learning-based 方法来直接推断深度。通常,深度learning-based方法都是基于python,所以如果你只熟悉python,那么这是你应该的方法去做。如果图像足够小,我认为实时性能是可能的。有很多此类工作使用 CAFFE、TF、TORCH 等。您可以在 git hub 上搜索更多选项。我发的这个是我最近用的
参考:
戈达尔、克莱门特等人。 “深入研究 self-supervised 单眼深度估计。” IEEE 计算机视觉国际会议论文集。 2019.
源代码:https://github.com/nianticlabs/monodepth2
另一种方式是对单个camera-based SLAM使用大FOV视频。这个有各种限制,例如需要好的功能、大 FOV、慢动作等。您可以找到许多这样的工作,例如 DTAM、LSDSLAM、DSO 等。还有一些来自 HKUST 或 ETH 的其他软件包可以完成给定位置的映射(例如,如果你有 GPS/compass),一些著名的名字是 REMODE+SVO open_quadtree_mapping 等
单个 camera-based SLAM 的一个典型示例是 LSDSLAM。这是一个实时 SLAM。
这个是基于ROS-C++实现的,我记得他们确实发布了深度图。并且可以写一个python节点直接订阅深度或者全局优化点云投影成任意视角的深度图
参考:Engel、Jakob、Thomas Schöps 和 Daniel Cremers。 “LSD-SLAM:Large-scale 直接单眼 SLAM。”欧洲计算机视觉会议。施普林格,查姆,2014 年。
我正在尝试将单个图像转换成它的深度图,但我找不到任何有用的教程或文档。
我想使用 opencv,但如果您知道使用例如 tensorflow 获取深度图的方法,我会很高兴听到。
有很多关于立体视觉的教程,但我想便宜一点,因为这是一个帮助盲人的项目。
我目前正在使用 esp32 cam 逐帧流式传输并使用 opencv 在 python 上接收图像。
通常,我们需要从世界的不同位置进行光度测量,形成对世界的几何理解(a.k.a深度图)。对于单幅图像,无法测量几何,但可以根据先前的理解推断深度。
使单个图像工作的一种方法 是使用深度 learning-based 方法来直接推断深度。通常,深度learning-based方法都是基于python,所以如果你只熟悉python,那么这是你应该的方法去做。如果图像足够小,我认为实时性能是可能的。有很多此类工作使用 CAFFE、TF、TORCH 等。您可以在 git hub 上搜索更多选项。我发的这个是我最近用的
参考: 戈达尔、克莱门特等人。 “深入研究 self-supervised 单眼深度估计。” IEEE 计算机视觉国际会议论文集。 2019.
源代码:https://github.com/nianticlabs/monodepth2
另一种方式是对单个camera-based SLAM使用大FOV视频。这个有各种限制,例如需要好的功能、大 FOV、慢动作等。您可以找到许多这样的工作,例如 DTAM、LSDSLAM、DSO 等。还有一些来自 HKUST 或 ETH 的其他软件包可以完成给定位置的映射(例如,如果你有 GPS/compass),一些著名的名字是 REMODE+SVO open_quadtree_mapping 等
单个 camera-based SLAM 的一个典型示例是 LSDSLAM。这是一个实时 SLAM。
这个是基于ROS-C++实现的,我记得他们确实发布了深度图。并且可以写一个python节点直接订阅深度或者全局优化点云投影成任意视角的深度图
参考:Engel、Jakob、Thomas Schöps 和 Daniel Cremers。 “LSD-SLAM:Large-scale 直接单眼 SLAM。”欧洲计算机视觉会议。施普林格,查姆,2014 年。