当 Google Cloud SQL postgres 服务器升级(升级到更大的机器)比 "a few minutes" 花费的时间长得多时该怎么办?

What to do when a Google Cloud SQL postgres server upgrade (to a bigger machine) takes considerably longer than "a few minutes"?

我们将 Google 云 SQL postgres 服务器升级到更大的机器并且升级不会终止。根据我们的经验,这通常需要不到 5 分钟,但我们现在已经等了大约 1.5 个小时,但什么也没有发生。服务器关闭后没有日志(连接尝试失败除外)。我们无法切换到故障转移,因为已经有一个操作正在进行(即首先导致问题的升级)。重新启动被禁用,因为操作正在进行中。似乎我们现在无能为力,除了可能应用上次备份,但我们不确定在操作正在进行时是否可能。

我们可以做些什么来重启数据库或解决问题吗?

升级云SQL 服务器时,实例会重新启动。偶尔会发生重启时间超过预期的情况,这似乎是您的服务器发生的情况,但这并不是意外行为。

话虽如此,请务必检查 status of the CloudSQL service. And if upgrades get stuck too often or never finish, contact support

为了减少再次出现此问题的可能性:

  • Configure High Availability 为您的实例,因此它具有故障转移功能。
  • 确保故障转移副本的维护window 与主实例的维护不同。要更改维护计划,请在 GCP 控制台上转到 SQL,单击一个实例,然后 "Edit maintenance schedule"->"Set maintenance schedule"。然后选择一个window.