AWS 上的卡桑德拉
Cassandra on AWS
我是 AWS 和 Cassandra 的新手。我刚刚阅读了有关 AWS 中可用的 EBS 和 S3 存储的信息。我想知道如果我们在 EC2 中安装了 Cassandra,它会使用哪个存储? EBS 还是 S3?还是有其他存储空间?我对此有点困惑。请帮助我理解这一点。
谢谢
亚拉文
对于 Cassandra,您需要使用 EBS。 S3 is an object store 和 API 存储和检索对象,但查询机制不方便。用例包括备份和归档、灾难恢复、静态网站托管等
但是,您可以use S3 for Cassandra backup。
您还可以考虑 AWS 实例附带的临时磁盘(正如 Jeff 提到的那样)和存储。
您不应该 运行 EBS 上的 Cassandra,正如 Datastax 本身所推荐的那样:
“不建议将 EBS 卷用于 Cassandra 数据卷,原因如下:
EBS 卷直接与标准数据包争夺网络吞吐量。这意味着如果您使网络饱和 link,EBS 吞吐量可能会失败。
EBS 卷的性能不可靠。 I/O 性能可能异常缓慢,导致系统向后加载读取和写入,直到整个集群变得无响应。
通过增加每台主机的 EBS 卷数量来增加容量不会扩展。您可以轻松超越系统保持有效缓冲区缓存并同时为它负责管理的所有数据请求提供服务的能力。"
http://docs.datastax.com/en/cassandra/1.2/cassandra/architecture/architecturePlanningEC2_c.html
以上答案来自Cassandra 1.2,比较老的版本。较新版本的 Cassandra 的文档表明使用 GP2 SSD 的 EBS 优化实例可用于生产工作负载。
http://docs.datastax.com/en/cassandra/3.x/cassandra/planning/planPlanningEC2.html
自那以后发生的变化是创建了 EBS 优化实例,减少了 and/or 消除了嘈杂的邻居吞吐量问题,并使用 GP2 SSD 进行 EBS 存储。
如果您刚刚起步,我会推荐 EBS Optimized。性能应该相当不错,但你获得了一项关键能力 -> 创建快照。这降低了您的实例变得不稳定的风险,因为您将拥有 S3 支持的卷快照,供 AWS 在驱动器死机时从中重建数据。
这减少了跨区域设置 Cassandra 集群的需要。使用 Ephemeral 时必须围绕的一个问题是整个区域可能会出现故障,如果您不构建多区域集群,这可能会摧毁整个集群。使用 EBS,这不是真正的问题。
我是 AWS 和 Cassandra 的新手。我刚刚阅读了有关 AWS 中可用的 EBS 和 S3 存储的信息。我想知道如果我们在 EC2 中安装了 Cassandra,它会使用哪个存储? EBS 还是 S3?还是有其他存储空间?我对此有点困惑。请帮助我理解这一点。
谢谢 亚拉文
对于 Cassandra,您需要使用 EBS。 S3 is an object store 和 API 存储和检索对象,但查询机制不方便。用例包括备份和归档、灾难恢复、静态网站托管等
但是,您可以use S3 for Cassandra backup。
您还可以考虑 AWS 实例附带的临时磁盘(正如 Jeff 提到的那样)和存储。
您不应该 运行 EBS 上的 Cassandra,正如 Datastax 本身所推荐的那样:
“不建议将 EBS 卷用于 Cassandra 数据卷,原因如下:
EBS 卷直接与标准数据包争夺网络吞吐量。这意味着如果您使网络饱和 link,EBS 吞吐量可能会失败。 EBS 卷的性能不可靠。 I/O 性能可能异常缓慢,导致系统向后加载读取和写入,直到整个集群变得无响应。 通过增加每台主机的 EBS 卷数量来增加容量不会扩展。您可以轻松超越系统保持有效缓冲区缓存并同时为它负责管理的所有数据请求提供服务的能力。"
http://docs.datastax.com/en/cassandra/1.2/cassandra/architecture/architecturePlanningEC2_c.html
以上答案来自Cassandra 1.2,比较老的版本。较新版本的 Cassandra 的文档表明使用 GP2 SSD 的 EBS 优化实例可用于生产工作负载。
http://docs.datastax.com/en/cassandra/3.x/cassandra/planning/planPlanningEC2.html
自那以后发生的变化是创建了 EBS 优化实例,减少了 and/or 消除了嘈杂的邻居吞吐量问题,并使用 GP2 SSD 进行 EBS 存储。
如果您刚刚起步,我会推荐 EBS Optimized。性能应该相当不错,但你获得了一项关键能力 -> 创建快照。这降低了您的实例变得不稳定的风险,因为您将拥有 S3 支持的卷快照,供 AWS 在驱动器死机时从中重建数据。
这减少了跨区域设置 Cassandra 集群的需要。使用 Ephemeral 时必须围绕的一个问题是整个区域可能会出现故障,如果您不构建多区域集群,这可能会摧毁整个集群。使用 EBS,这不是真正的问题。