如何正确使用GPU算力？

How to correctly utilise GPU power?

简短版本：Tesorflow Keras 模型在 Tesla T4 上的训练速度比在 GTX 970 上慢得多（两者都在工作，用 nvidia-smi 检查）。

长版：我有两台主机。一台是 GTX 970 Tensorflow 2.1.0 的 PC，另一台是 Tesla T4 Tensorflow 2.3.0 的 GCP AI 平台笔记本。我是运行两者上的相同代码，所有训练数据都作为 numpy 数组存储在 RAM 中，dtype 是相同的（'float16'），batch_size 也是相同（8，GTX 无法与高于此的任何东西一起使用，但我也在 Tesla 上尝试过 64，没有任何区别）。为什么拥有 GTX 两倍计算能力的 Tesla 的工作速度却慢了大约 2.5 倍？如何正确使用我的 GPU 来更快地训练我的模型？

首先，为了公平比较，您必须使用完全相同的 TensorFlow 版本，因为有报告称 TensorFlow 版本之间存在性能差异。请注意，post 还包含 TF 2.1 与 TF 2.2 与 TF 2.3

之间的比较

上面的post也有关于如何准备+健身以获得良好表现的建议。

其次，CPU 预处理在一台机器上可能比另一台机器慢，因此可能是另一个差异来源。

如何正确使用GPU算力？

How to correctly utilise GPU power?

tensorflow

tensorflow2.0