gke-metrics-agent 与 prometheus 相关的多个错误

gke-metrics-agent multiple error related to prometheus

我向 GKE 部署了一个新应用,我看到 GKE 仪表板在 gke-metrics-agent 上有数千个错误:

它占用了大量资源。

我查看了日志,我看到了所有与 Prometheus 相关的错误,但我没有找到解决这些错误的方法:

集群版本: 1.18.12-gke.1206

这些错误是什么,我该如何解决?

看起来某些 GKE 1.18.12-gke-X 版本存在错误,其中 gke-metrics-agent 产生大量 Warning 消息。

此错误已经有 Public Issue Tracker 个票证。您可以关注有关此问题的更新 here。您也可以使用 (+1) 表示您受到此错误的影响。

此问题的解决方法是使用更新版本 - 1.18.14-gke.1200+