Cassandra 数据中心复制高级用法

Cassandra datacenters replication advanced usage

对于一个项目,我们使用 Cassandra 集群以便快速 reads/writes 处理大量(面向列的)生成的数据。

到目前为止,我们只有 1 个数据中心用于原型设计。

我们现在计划将我们的集群拆分为 2 个数据中心以满足性能要求(两个数据中心之间的数据传输非常慢):

但是,我们希望我们的消费者服务仅在它们附近的数据中心(数据中心 #2)访问数据,当给定“run_id的所有数据” 已完全从数据中心 #1 复制(生产者服务生成的数据)。

我的问题是:在告诉生产者服务(数据中心 #2 附近)开始使用它们之前,我们如何确保所有数据都已复制到数据中心 #2?

到目前为止我们最好的解决方案(但仍然不够好:-P):

你有什么建议吗?

非常感谢,

面料

看来这个问题没有灵丹妙药。

我们设法为我们的应用程序使用单个数据中心。我们将使用另一个,但作为备份并可能以降级方式使用。