有没有可能复制普罗米修斯?

Is there possibility to replication Prometheus?

有没有可能复制普罗米修斯?

例如,有两个普罗米修斯实例。第一个被关闭,第二个接管他的职责。可能吗?我知道有 Federation,但在这种情况下,第二个仅在第一个工作时才进行采样。我不希望第二个和第一个是同一个实例,而是一种复制品。

您询问的是 hot/warm Prometheus 的架构高可用性。

你的问题有两个方面:

  1. 数据的存储:Prometheus有使用remote storage的能力,可以用来为你的数据提供HA
  2. 目标的抓取:集群中没有内置的抓取机制。
  • 要么两个 Prometheus 同时抓取(但你有 hot/hot)
  • 或者您找到一种方法来检测 Prometheus 已关闭(prometheus 互相抓取)并触发一个操作(使用 webhook 很容易做到)- 例如启用配置并触发重新加载

如果 HA 对您来说真的很重要,您宁愿:

  • 使用 hot/hot 设置和一些代理,例如 Trikster or clustering like Thanos
  • 切换到 Cortex,它就像一个解构的 Prometheus,可提供可扩展性和 HA

如果你能承受 Prometheus 的一些小停机时间,你也可以让调度程序重新调度 Prometheus 并持久化数据(可能使用远程 read/write)。