机器学习如何处理多维数据?

How does machine-learning deal with multi-dimensional data?

我了解不同输入的权重以及它如何用于计算成本,基本上是这样的:

以及它如何用于更深层次的网络,但是网络如何处理 rgb 图像之类的东西,其中一些数据继承捆绑在一起?

假设我们有一个 w * h 像素的图像(w = 宽度,h = 高度)。

最直接的方法是简单地创建 w * h * 3 个输入节点;对于每个像素,三个输入节点(一个用于 R 值,一个用于 G 值,一个用于 B 值)。有了足够大的训练数据集,按照这种方式拆分数据应该不成问题。

你是对的,你最初确实丢失了一些信息;网络结构中没有任何内在的东西告诉它前三个输入节点以某种方式彼此相关(相同像素),之后的三个节点也是如此,等等。给定足够大的训练数据,它应该(理论上)能够接受这样的模式。

根据问题领域,简单地去掉颜色信息也可能是有益的。相反,您可以将图像转换为灰度,然后每个像素只需要一个输入节点。显然,您也会以这种方式丢失信息,但对于某些任务而言,这些信息可能不是必需的(摆脱它可以使您的训练在计算上更有效率)。