Google 机器学习引擎作业在标准和高级 ScaleTier 之间的准确性不同

Google ML Engine Jobs Differ in Accuracy between Standard and Premium ScaleTier

我是机器学习的新手。我 运行 两个相似的 ML 作业仅在 GCP 的 config.yaml 文件中有所不同,特别是 scaleTier:。 运行 第一份工作仅 scaleTier: STANDARD_1,准确率约为 93%。拿同样的 Tensorflow 记录,将 scaleTier 调整为 scaleTier: PREMIUM_1,准确率下降到 50% 左右。增加 ML 训练单元的数量是否会降低模型的准确性?

这个问题的两个问题:为什么准确率会大幅下降,解决方法是什么?

通常,当您进行分布式训练时,您应该使用较小的批量大小。您可以尝试将批量大小减少到标准中使用的 1/8 吗?您必须将步数增加 8 倍,以确保您通过数据集的次数相同。