检测图像中的对象
Detecting object in an image
目前我正在努力实现一种算法来定位图像中的对象。假设我有 100 个训练集,里面都有一只猫,并且每个训练集都有每只猫的正确坐标。我的第一个想法是创建一个固定大小的正方形并遍历图像。对于正方形中包含的每个像素集合,我们可以将其用作支持向量机算法的一个点。
问题是我不确定该怎么做,因为通常每个点代表每个 class(有对象或没有对象)并且它通常具有简单的 d 特征,而对于这种情况,它有一个 dx3 矩阵作为它的特征(每个特征都有 RGB 值)。
欢迎简单的帮助,谢谢!
如果我很好地理解了你的问题,将机器学习应用于图像处理和计算机视觉与其他类型的问题有点不同。主要区别在于您应该以某种方式克服位置和规模问题。是否所有小猫总是出现在特定坐标 (x,y) 中?!当然不是!他们可以在场景中的任何地方。那么如何才能为一个对象给 SVM 一个特定的点呢?根本不会一概而论。这就是为什么计算机视觉中几乎所有的基本操作都与卷积操作有关,以提取与其位置无关的特征。一个像素单独携带零有用信息,您需要分析像素组。您可以采用两种方法:
- 经典方法:
使用 OpenCV 使用 SIFT 等方法执行噪声消除、边缘检测、特征提取,并将这些特征提供给 SVM 等模型,而不是原始的未处理像素。特征提取意味着从 d 特征到 k 更有意义的输入表示,其中通常 (k < d) 如果不总是。
- 深度学习:
卷积神经网络 (CNN) 阐明了许多计算机视觉任务,这些任务直到最近才遥不可及,更重要的是使用 Keras 和 tensorflow 等框架 老实说,计算机视觉中的大多数问题只是编程任务,不需要像以前那样需要太多知识。因为 (CNN) 自己提取特征,您不再需要进行特征工程,这需要受过良好教育且知识渊博的人来完成任务。
所以,选择你认为适合小猫检测的任何方法 =^.^= .
目前我正在努力实现一种算法来定位图像中的对象。假设我有 100 个训练集,里面都有一只猫,并且每个训练集都有每只猫的正确坐标。我的第一个想法是创建一个固定大小的正方形并遍历图像。对于正方形中包含的每个像素集合,我们可以将其用作支持向量机算法的一个点。
问题是我不确定该怎么做,因为通常每个点代表每个 class(有对象或没有对象)并且它通常具有简单的 d 特征,而对于这种情况,它有一个 dx3 矩阵作为它的特征(每个特征都有 RGB 值)。
欢迎简单的帮助,谢谢!
如果我很好地理解了你的问题,将机器学习应用于图像处理和计算机视觉与其他类型的问题有点不同。主要区别在于您应该以某种方式克服位置和规模问题。是否所有小猫总是出现在特定坐标 (x,y) 中?!当然不是!他们可以在场景中的任何地方。那么如何才能为一个对象给 SVM 一个特定的点呢?根本不会一概而论。这就是为什么计算机视觉中几乎所有的基本操作都与卷积操作有关,以提取与其位置无关的特征。一个像素单独携带零有用信息,您需要分析像素组。您可以采用两种方法:
- 经典方法:
使用 OpenCV 使用 SIFT 等方法执行噪声消除、边缘检测、特征提取,并将这些特征提供给 SVM 等模型,而不是原始的未处理像素。特征提取意味着从 d 特征到 k 更有意义的输入表示,其中通常 (k < d) 如果不总是。
- 深度学习:
卷积神经网络 (CNN) 阐明了许多计算机视觉任务,这些任务直到最近才遥不可及,更重要的是使用 Keras 和 tensorflow 等框架 老实说,计算机视觉中的大多数问题只是编程任务,不需要像以前那样需要太多知识。因为 (CNN) 自己提取特征,您不再需要进行特征工程,这需要受过良好教育且知识渊博的人来完成任务。
所以,选择你认为适合小猫检测的任何方法 =^.^= .