尽管配额增加,但无法启动具有更多 GPU 的 gcloud 实例

Unable to Start gcloud instance with more GPUs despite increasing quota

对使用 gcloud 套件还比较陌生,我在使用更多 GPU 启动我的实例时遇到了问题。最初添加第一个 GPU 在请求增加配额方面没有问题。

但是,当我请求再次增加我的 GPU 配额以缩短我的模型的训练时间时,在获得批准并将另一个 GPU 分配给我的实例后,我仍然收到一条错误消息,指出我的实例无法启动,因为尽管在管理控制台中看到配额为 2,但它超出了分配的配额 1。

控制台:

错误:

Starting instance(s) my-fastai-instance...failed.
ERROR: (gcloud.compute.instances.start) Quota 'PREEMPTIBLE_NVIDIA_T4_GPUS' exceeded. Limit: 1.0 in region us-west1.

为了让额外的 GPU 与实例一起工作,我还需要更改其他内容吗?

遗憾的是,"NVIDIA T4 GPUs" 和 "Preemptible NVIDIA T4 GPUs" 之间存在区别。

您的 "NVIDIA T4 GPUs" 配额为 2,我假设 "Preemptible NVIDIA T4 GPUs" 配额为 1。

和之前一样,您需要按地区申请。

NB 您应该能够通过将您的实例从请求 "Preemptible NVIDIA T4 GPUs" 切换到 "NVIDIA T4 GPUs"

来立即继续