AWS ElasticsearchService:自动快照 运行 超过 20 天
AWS ElasticsearchService: Automated snapshot is running for more than 20days
几天来,我们在使用 ElasticSearch 查询时遇到了很多失败。当我监控集群运行状况时 CPU/JVM 内存利用率很高(接近 98%)。
在调试问题时,我发现最后一个自动快照是我 IN_PROGRESS
状态超过 20 天,我怀疑这是根本原因。
但我不确定是什么导致了长快照,并且无法 stop/delete 该快照。当我使用带有 aws 签名的邮递员在存储库上尝试 http DELETE 请求时,我收到 401 Unauthorized
错误消息 Your request is not allowed
.
任何人都可以帮助我了解冗长的 运行 快照问题以及如何解决它。
提前致谢。
这是 elasticsearch.Stuck 快照中卡住快照的经典案例,发生在主节点和数据节点的分片快照状态不同步时。这通常发生在集群变红或某些节点在高 JVM 压力下突然退出集群时。
高 CPU/JVM 内存利用率通常 而不是 由快照卡住引起。大多数情况下是相反的,即快照由于高 JVM 利用率而卡在 IN_PROGRESS
状态。为了 elasticsearch 集群的更好性能,您应该尽量将 JVM 保持在 80% 以下。向上扩展是减少 JVM 压力的一种选择。
不允许用户访问 AWS Elasticsearch 上的自动快照。要解决快照卡在 IN_PROGRESS 状态的问题,您应该 联系 AWS Elasticsearch 客户支持
几天来,我们在使用 ElasticSearch 查询时遇到了很多失败。当我监控集群运行状况时 CPU/JVM 内存利用率很高(接近 98%)。
在调试问题时,我发现最后一个自动快照是我 IN_PROGRESS
状态超过 20 天,我怀疑这是根本原因。
但我不确定是什么导致了长快照,并且无法 stop/delete 该快照。当我使用带有 aws 签名的邮递员在存储库上尝试 http DELETE 请求时,我收到 401 Unauthorized
错误消息 Your request is not allowed
.
任何人都可以帮助我了解冗长的 运行 快照问题以及如何解决它。
提前致谢。
这是 elasticsearch.Stuck 快照中卡住快照的经典案例,发生在主节点和数据节点的分片快照状态不同步时。这通常发生在集群变红或某些节点在高 JVM 压力下突然退出集群时。
高 CPU/JVM 内存利用率通常 而不是 由快照卡住引起。大多数情况下是相反的,即快照由于高 JVM 利用率而卡在 IN_PROGRESS
状态。为了 elasticsearch 集群的更好性能,您应该尽量将 JVM 保持在 80% 以下。向上扩展是减少 JVM 压力的一种选择。
不允许用户访问 AWS Elasticsearch 上的自动快照。要解决快照卡在 IN_PROGRESS 状态的问题,您应该 联系 AWS Elasticsearch 客户支持