opencv 不使用所有 GPU 内存

Question

我正在尝试使用 cvlib 包，它使用 yolov3 模型来识别 windows 10 上图像上的对象。让我们举一个简单的例子：

import cvlib as cv
import time
from cvlib.object_detection import draw_bbox


inittimer=time.time()
bbox, label, conf = cv.detect_common_objects(img,confidence=0.5,model='yolov3-worker',enable_gpu=True)
print('The process tooks %.3f s'%(time.time()-inittimer)

output_image = draw_bbox(img, bbox, label, conf)

结果大约需要 60 毫秒。

cvlib 使用 opencv 来计算这个 cnn 部分。

如果现在我尝试查看 tensorflow 使用了多少 GPU，使用子进程，只需要 824MiB。

当程序运行时，如果我启动 nvidia-smi，它会给我这个结果：

如您所见，此处有更多可用内存。我的问题很简单。为什么 Cvlib（以及 tensorflow）不全部使用它来改进时间检测？

编辑：

据我了解，cvlib 使用 tensorflow 但它也使用 opencv 检测器。我使用 cmake 和 Cuda 10.2 安装了 opencv 我不明白为什么，但在 nvidia-smi 中写的是 CUDA Version : 11.0 而不是。也许这就是问题所在？

Answer 1

您可以验证opencv 是否正在使用CUDA。这可以使用以下

来完成

import cv2
print(cv2.cuda.getCudaEnabledDeviceCount())

这应该可以让您了解计算机中支持 CUDA 的设备的数量。您还应该使用以下

检查构建信息

import cv2
print cv2.getBuildInformation()

以上两种情况的输出可以表明你的opencv是否可以访问GPU。如果它不访问GPU那么你可以考虑重新安装。

Answer 2

workon opencv_cuda                                                                                                          
cd opencv                                                                                                                              
mkdir build                                                                                                                                
cd build                                                                                                                               
cmake -D CMAKE_BUILD_TYPE=RELEASE

并分享结果。应该是这样的

Answer 3

我明白了！问题来自于我为每次迭代创建了一个新的 Net 对象。

这是 github 上的相关问题，您可以在其中关注它：https://github.com/opencv/opencv/issues/16348

使用自定义函数，它现在可以以 ~60 fps 的速度运行。请注意，cvlib 可能未用于实时计算。

opencv 不使用所有 GPU 内存

opencv doesn't use all GPU memory

opencv

gpu

python-3.x

cvlib