运行 一个 TensorFlow 图像识别 API 来搜索一个对象

Running a TensorFlow Image Recognition API to search for an object

TensorFlow 有一个 api 使用 inception v3 模型来识别对象。我想知道,是否有任何方法可以在较大的图像中找到较小的图像。例如,定位一棵橙树上的所有橙子。我尝试将较大的图像拆分为较小图像的网格,并在每个单独的较小图像上应用 tensorflow,但具有恒定的网格非常容易出错,对此有什么解决方案吗?

您要查找的术语是对象检测。您可以在不同的比例下使用滑动 window。这是一种方式,可能有更好的方式,但我不知道它们是什么。

假设有些橙子比其他橙子更接近。从左上角的 10x10(或其他)框开始,看看您的模型是否将其归类为橙色。将您的框向右移动 2 个像素(或其他)。再试一次。继续向右移动,然后向下移动 2 个像素并开始新的一行,依此类推。现在将图像的大小调整为更小(所以现在您正在寻找更大的橙子),然后重复整个过程。您可以 google "sliding window detection" 和 "image pyramid" 来了解更多信息。

一旦你浏览完你的图像,你就会有一堆检测 - 你必须想出一些方法来对你的图像执行非最大抑制检测,因为你可能有太多。