GKE 在一个区域中旋转所有节点池是否安全?

GKE is spinning all node pool in one single zone safe?

这是专门针对 public 我熟悉的云(例如 GCP)的问题。不太确定它是否适用于 AWS、Azure、DigitalOcean 或其他云提供商。

所以我的问题是,假设我提供了 3 个 Kafka 实例、3 个 Redis 实例 (HA) 和 3 个 MongoDB 实例。不是将每个实例分成单独的区域,而是在一个区域中配置所有实例是安全的吗?云提供商区域的稳定性或频率如何?

例如

卡夫卡

zone-a 中的区域 us-west1 宕机时,是否意味着我的所有 3 个实例都将宕机?我的问题是,这在 GCP 中发生过吗?如果是,需要在该区域恢复多长时间?

instance1 - us-west1-a
instance2 - us-west1-a
instance3 - us-west1-a

在 GCP 中,当我们配置 GKE 区域集群时,我们可以通过两种方式配置节点池,即:

https://cloud.google.com/kubernetes-engine/docs/how-to/creating-a-regional-cluster

还有一个问题,什么情况下应该开通单zone,什么时候应该开通多zone nodepool。

部署区域集群“更安全”。 zone是一个region的资源部署区域,zone之间是相互隔离的。所以区域是单点故障。

故障总是会发生,但是请查看 GKE 的 Google SLAs 以了解什么是“更安全”:

Zonal Cluster (control plane)   99.5%
Regional Cluster (control plane)    99.95%

对于恢复,我会说简短,因为 Google 拥有快速恢复的基础设施和资源。

另请查看之前的 365 days of the status dashboard for GCP 以了解关联产品出现故障的频率。