MNIST 数据集中用于图像分类的关键特征是什么
What is the key feature in MNIST Dataset that is used to classify images
我最近在学习神经网络并遇到了 MNIST
数据集。我知道使用 sigmoid 成本函数来减少损失。此外,权重和偏差得到调整,并在训练后找到最佳权重和偏差。我不明白的是,图像是根据什么分类的。例如,要对患者是否患有癌症进行分类,年龄、位置等数据将成为特征。在 MNIST 数据集中,我没有找到任何一个。我在这里错过了什么吗?请帮我解决这个问题
首先,网络管道由 3 个主要部分组成:
- 输入操作:
- 影响最小值查找的参数:
- 在你的解释中你的决策函数之类的参数
层(通常是全连接层)
与您必须手动提取特征的常规机器学习管道相比,CNN 使用过滤器。 (像边缘检测或 viola and jones 中的过滤器)。
如果过滤器运行在图像上并与像素进行卷积,它会产生一个输出。
此输出随后由神经元解释。如果输出高于阈值,则认为它是有效的(如果有效,阶梯函数计数 1,或者在 Sigmoid 的情况下,它在 Sigmoid 函数上有一个值)。
接下来的步骤与之前相同。
这一直进行到解释层(通常是 softmax)。该层解释您的计算(如果过滤器很好地适应您的问题,您将获得一个好的预测标签),这意味着您在 (y_guess - y_true_label).
之间的差异很小
现在你可以看到,对于 y 的猜测,我们已经将输入 x 与许多权重 w 相乘,并且还在其上使用了函数。这可以看作是分析中的链式法则。
为了获得更好的结果,必须知道单个权重对输入的影响。因此,您使用反向传播,它是关于所有 w 的误差的导数。诀窍是您可以重用或多或少是反向传播的导数,并且由于可以使用矩阵向量表示法,因此变得更容易。
如果您有梯度,则可以在沿着最陡峭的下降方向行走时使用最小化的正常概念。 (还有许多其他梯度方法,如 adagrad 或 adam 等)。
将重复这些步骤,直到收敛或达到最大轮数。
所以答案是:计算出的权重(过滤器)是检测数字和数字的关键:)
我最近在学习神经网络并遇到了 MNIST
数据集。我知道使用 sigmoid 成本函数来减少损失。此外,权重和偏差得到调整,并在训练后找到最佳权重和偏差。我不明白的是,图像是根据什么分类的。例如,要对患者是否患有癌症进行分类,年龄、位置等数据将成为特征。在 MNIST 数据集中,我没有找到任何一个。我在这里错过了什么吗?请帮我解决这个问题
首先,网络管道由 3 个主要部分组成:
- 输入操作:
- 影响最小值查找的参数:
- 在你的解释中你的决策函数之类的参数 层(通常是全连接层)
与您必须手动提取特征的常规机器学习管道相比,CNN 使用过滤器。 (像边缘检测或 viola and jones 中的过滤器)。
如果过滤器运行在图像上并与像素进行卷积,它会产生一个输出。
此输出随后由神经元解释。如果输出高于阈值,则认为它是有效的(如果有效,阶梯函数计数 1,或者在 Sigmoid 的情况下,它在 Sigmoid 函数上有一个值)。
接下来的步骤与之前相同。
这一直进行到解释层(通常是 softmax)。该层解释您的计算(如果过滤器很好地适应您的问题,您将获得一个好的预测标签),这意味着您在 (y_guess - y_true_label).
之间的差异很小现在你可以看到,对于 y 的猜测,我们已经将输入 x 与许多权重 w 相乘,并且还在其上使用了函数。这可以看作是分析中的链式法则。
为了获得更好的结果,必须知道单个权重对输入的影响。因此,您使用反向传播,它是关于所有 w 的误差的导数。诀窍是您可以重用或多或少是反向传播的导数,并且由于可以使用矩阵向量表示法,因此变得更容易。
如果您有梯度,则可以在沿着最陡峭的下降方向行走时使用最小化的正常概念。 (还有许多其他梯度方法,如 adagrad 或 adam 等)。
将重复这些步骤,直到收敛或达到最大轮数。
所以答案是:计算出的权重(过滤器)是检测数字和数字的关键:)