AWS Cloudwatch 监控

AWS Cloudwatch Monitoring

只是想知道 AWS cloudwatch 是否运行在同一个 VPC 上,我的所有应用程序都在这个 VPC 上 运行?

AWS cloudwatch 是否有可能出现故障,我们可能会失去监控功能?

我们是否需要一个监控机制来检查 Cloudwatch 的健康状况?

谢谢

AWS Cloudwatch 不在您的实例上 运行。它的基础设施完全由 Amazon 管理,独立于您的 VPC。您可以将其视为 SaaS(软件即服务)。

所以你不必担心这个。更多信息请查看:https://aws.amazon.com/cloudwatch/

Cloudwatch 从主机 OS 收集数据,您的虚拟机实际上是 运行ning.

如果物理服务器出现严重问题,cloudwatch 和您的 VM 都会出现故障,但在这种情况下,VM 会在另一台物理服务器上自动启动。在这种情况下,恢复通常会很快。

您根本不需要检查 Cloudwatch,因为 AWS 会处理这些,但您可以为诸如 CPU 虚拟机使用情况之类的事情添加警报。

因为 Cloudwatch 不会 运行 在你的机器上它无法知道一些事情,例如内存使用,磁盘 space 使用或其他所以如果您需要更高级的监控功能,您可以考虑 运行在您的虚拟机中安装类似 collectd 的东西。

只是想知道 AWS cloudwatch 是否在同一个 VPC 上运行,我的所有应用程序都在这个 VPC 上 运行?

If you chose to install CloudWatch Agent on your EC2 then only it runs in your EC2 and thus in the VPC your EC2 is provisioned.

CloudWatch service that publishes/maintain logs, metrics, alarms etc is managed by AWS and runs outside your VPC.

CloudWatch has a SLA of 99.9% https://aws.amazon.com/cloudwatch/sla/

AWS cloudwatch 是否有可能出现故障,我们可能会失去监控功能?

CloudWatch like any other service can have outages and it did have some in the past but I have never seen any data getting lost, only temporarily not being available or slow to retrieve during the outage.

我们是否需要一个监控机制来检查 Cloudwatch 的健康状况?

SLA is already 99.9% for CloudWatch Service so chances of catching a blip is very rare on your own monitoring mechanism.

If you are using CloudWatch Agent then consider checking health of agent to make sure it is in running state (you can use AWS System Manager Run command).