同一个 CNN 模型对不同的数据集需要不同的学习率吗?

Does the same CNN model needs different learning rates for different datasets?

我使用卷积神经网络模型进行医学图像分割。当我训练模型时(例如提拉米苏模型1),我尝试了论文中推荐的相同学习率,但是,我得到的结果很糟糕。

我担心的是,当我们将模型用于不同的数据集时,我们是否需要找到不同的最佳学习率。例如,在这种情况下,他们使用 CamVid 数据集(街道、汽车、人等),而我使用的是医学图像。

虽然可能有一些参数集在大多数情况下工作得很好(通常最终成为几个库的默认值),但最佳选择非常依赖于数据集。使用论文中的内容是建立基线的一个很好的起点,但永远不要阻止您尝试更改它们。

另一个重要的点是损失函数,损失函数可能适用于分割汽车(它们很大,超过图像的 20%),可能不适用于文本(小,不到 1%)图像)。

如果您有二进制分割,使用阈值来确定像素是否是您想要的 class 也很重要。