gke-metrics-agent 与 prometheus 相关的多个错误
gke-metrics-agent multiple error related to prometheus
我向 GKE 部署了一个新应用,我看到 GKE 仪表板在 gke-metrics-agent 上有数千个错误:
它占用了大量资源。
我查看了日志,我看到了所有与 Prometheus 相关的错误,但我没有找到解决这些错误的方法:
集群版本:
1.18.12-gke.1206
这些错误是什么,我该如何解决?
看起来某些 GKE 1.18.12-gke-X
版本存在错误,其中 gke-metrics-agent
产生大量 Warning
消息。
此错误已经有 Public Issue Tracker
个票证。您可以关注有关此问题的更新 here。您也可以使用 (+1)
表示您受到此错误的影响。
此问题的解决方法是使用更新版本 - 1.18.14-gke.1200+
我向 GKE 部署了一个新应用,我看到 GKE 仪表板在 gke-metrics-agent 上有数千个错误:
它占用了大量资源。
我查看了日志,我看到了所有与 Prometheus 相关的错误,但我没有找到解决这些错误的方法:
集群版本: 1.18.12-gke.1206
这些错误是什么,我该如何解决?
看起来某些 GKE 1.18.12-gke-X
版本存在错误,其中 gke-metrics-agent
产生大量 Warning
消息。
此错误已经有 Public Issue Tracker
个票证。您可以关注有关此问题的更新 here。您也可以使用 (+1)
表示您受到此错误的影响。
此问题的解决方法是使用更新版本 - 1.18.14-gke.1200+