Cassandra 备份策略:使用本地磁盘时

Cassandra Backup Strategy: When using local disks

我们计划部署一个具有 100 个虚拟节点的 Cassandra 集群。在每个节点上最多存储 1TB(压缩)数据。我们将使用(主机-)本地 SSD 磁盘。

Infrustructure 团队建议只使用 SAN(即使是数据),因为它更容易备份数据。

  1. 推荐以下哪些方法?
    • 使用更多本地磁盘进行备份
    • 数据使用本地磁盘,备份使用SAN

  2. 备份过程是否有开销,这会减慢 Cassandra 的写入繁重的工作负载?
    • 将数据复制到备份磁盘的开销
    • 通过网络异地
    • 传输数据的开销

如果您使用 nodetool snaphot 进行 Cassandra 备份,备份只是数据文件的硬链接。 AFAIK Datastax 建议为您的数据文件使用 SSD。