Kubernetes 监控和自我修复

Kubernetes monitoring and self-healing

我是 Kubernetes 监控和自我修复的新手。我想知道 Kubernetes 可以提供什么样的自我修复,比如必要时重启失败的 pod?还要别的吗? Kubernetes 无法提供的东西。

关于 Kubernetes 监控,我们需要监控什么样的指标才能在 Kubernetes 上运行而不是 Kubernetes 自愈?

欢迎任何想法。谢谢。

恐怕你的问题超出了在 Whosebug 上可以回答的范围。

是的,k8s能够restart/reschedulepods。如果您已经有点熟悉关键概念,也许 pod-lifecycle 是一个起点。 如果你对k8s的基础了解不多,我建议你学习Deployments, DaemonSets, Services等,因为k8s中的监控非常依赖它们!

您没有说明您对哪种指标感兴趣。 对于 io/cpu 时间等系统指标,您可以从例如开始Kubernetes Metrics Server. 如果您想深入了解 k8s 指标(有多少服务、正常运行时间等),请查看 kube-state-metrics 这是一个简单的服务,它监听 Kubernetes API 服务器并生成有关状态的指标的对象。

玩得开心k8s

干杯

配置 pod 健康的活跃度和就绪度探测。以及 Restart 策略。您可以使用服务和副本集做更多事情。