运行一个 TensorFlow 图像识别 API 来搜索一个对象

Running a TensorFlow Image Recognition API to search for an object

TensorFlow 有一个 api 使用 inception v3 模型来识别对象。我想知道，是否有任何方法可以在较大的图像中找到较小的图像。例如，定位一棵橙树上的所有橙子。我尝试将较大的图像拆分为较小图像的网格，并在每个单独的较小图像上应用 tensorflow，但具有恒定的网格非常容易出错，对此有什么解决方案吗？

您要查找的术语是对象检测。您可以在不同的比例下使用滑动 window。这是一种方式，可能有更好的方式，但我不知道它们是什么。

假设有些橙子比其他橙子更接近。从左上角的 10x10（或其他）框开始，看看您的模型是否将其归类为橙色。将您的框向右移动 2 个像素（或其他）。再试一次。继续向右移动，然后向下移动 2 个像素并开始新的一行，依此类推。现在将图像的大小调整为更小（所以现在您正在寻找更大的橙子），然后重复整个过程。您可以 google "sliding window detection" 和 "image pyramid" 来了解更多信息。

一旦你浏览完你的图像，你就会有一堆检测 - 你必须想出一些方法来对你的图像执行非最大抑制检测，因为你可能有太多。

运行一个 TensorFlow 图像识别 API 来搜索一个对象

Running a TensorFlow Image Recognition API to search for an object

image-recognition

image-segmentation

tensorflow

运行 一个 TensorFlow 图像识别 API 来搜索一个对象

Running a TensorFlow Image Recognition API to search for an object

image-recognition

image-segmentation

tensorflow

运行一个 TensorFlow 图像识别 API 来搜索一个对象