持续监控 AWS 资源的存在

Continuous monitoring of AWS resource presence

我有一堆 AWS 资源,例如EC2、ECS、API 网关、Lambda 等

问题是我不仅是 AWS 的管理员,而且其他管理员可能会因为标记错误或人为错误等原因删除某些资源。

不幸的是,IAM 和/或监控解决方案(zabbix、nagios 等)不是这种特定情况下的解决方案。

所以问题是我如何通过调用 AWS API 并检查响应来持续监控 AWS 资源的存在?

可以创建 Cloudwatch 警报,将丢失的数据点视为违反阈值。

如果您可以为所有资源找到一个指标,当资源处于健康状态时应该不断输出数据(例如 CPU ec2 实例的利用率),然后将丢失的数据视为违反,如果资源被删除(可能在一段时间后,取决于阈值),这些警报应该触发

借助 CloudTrail,您可以记录、持续监控和保留与跨 AWS 基础设施的操作相关的帐户activity。 CloudTrail 提供您的 AWS 账户 activity 的事件历史记录,包括通过 AWS 管理控制台、AWS SDK、命令行工具和其他 AWS 服务执行的操作。此事件历史记录简化了安全分析、资源更改跟踪和故障排除。 https://aws.amazon.com/cloudtrail/?nc1=h_ls