MNIST 数据集中用于图像分类的关键特征是什么

What is the key feature in MNIST Dataset that is used to classify images

我最近在学习神经网络并遇到了 MNIST 数据集。我知道使用 sigmoid 成本函数来减少损失。此外,权重和偏差得到调整,并在训练后找到最佳权重和偏差。我不明白的是,图像是根据什么分类的。例如,要对患者是否患有癌症进行分类,年龄、位置等数据将成为特征。在 MNIST 数据集中,我没有找到任何一个。我在这里错过了什么吗?请帮我解决这个问题

首先,网络管道由 3 个主要部分组成:

  • 输入操作:
  • 影响最小值查找的参数:
  • 在你的解释中你的决策函数之类的参数 层(通常是全连接层)

与您必须手动提取特征的常规机器学习管道相比,CNN 使用过滤器。 (像边缘检测或 viola and jones 中的过滤器)。

如果过滤器运行在图像上并与像素进行卷积,它会产生一个输出。

此输出随后由神经元解释。如果输出高于阈值,则认为它是有效的(如果有效,阶梯函数计数 1,或者在 Sigmoid 的情况下,它在 Sigmoid 函数上有一个值)。

接下来的步骤与之前相同。

这一直进行到解释层(通常是 softmax)。该层解释您的计算(如果过滤器很好地适应您的问题,您将获得一个好的预测标签),这意味着您在 (y_guess - y_true_label).

之间的差异很小

现在你可以看到,对于 y 的猜测,我们已经将输入 x 与许多权重 w 相乘,并且还在其上使用了函数。这可以看作是分析中的链式法则。

为了获得更好的结果,必须知道单个权重对输入的影响。因此,您使用反向传播,它是关于所有 w 的误差的导数。诀窍是您可以重用或多或少是反向传播的导数,并且由于可以使用矩阵向量表示法,因此变得更容易。

如果您有梯度,则可以在沿着最陡峭的下降方向行走时使用最小化的正常概念。 (还有许多其他梯度方法,如 adagrad 或 adam 等)。

将重复这些步骤,直到收敛或达到最大轮数。

所以答案是:计算出的权重(过滤器)是检测数字和数字的关键:)