Cassandra 能否用于复制、提供 'master' 和过滤站点数据?
Can Cassandra be used to both replicate, provide a 'master' and filter data at sites?
我正在为一个新项目研究技术。
我们有很多站点,它们的数据应该来自主服务器。
每个站点只能拥有与站点所有者(公司)相关的数据。每个站点可能有许多独立的机器,每个机器都有自己的数据库。
master 将拥有所有 sites/machines 的所有数据。
预计会在偶尔连接的情况下离线使用。
我可以使用 symmetric-ds 之类的东西来对 RDBMS 执行此操作。例如:设置每个站点的复制,以便每个站点只接收与该站点相关的数据。
没有让我明白(至少,自动)的是能够写入其中一台本地机器,并自动复制到位于那个网站。这在离线情况下很重要,在这种情况下,写入站点上的机器 A 不会自动导致相同的 write/update 在同一站点的机器 B 上发生。当连接建立时,对 B 的写入将作为对称 ds 复制的一部分自然发生,但我需要在连接断开时在本地工作的东西。
我想知道像 Cassanda 这样的东西是否适合这个?
我在想:
- 每个站点都是自己的一组副本(即使该站点只有一台机器)
- 每个站点将数据复制到一个主站点
- master 上的写入被复制到相关站点(基于数据的内容)
Cassandra 中没有这样的功能。从理论上讲,您可以使用 DSE's Advanced Replication 功能构建您需要的东西,但这需要进行实验才能构建正确的解决方案。虽然如果决定仅基于内容,那么这可能不会奏效。
Cassandra 中的默认跨 DC 复制可能会持续停机,特别是如果您的软件在 writing/reading 数据时使用正确的一致性级别。但是所有数据都将被复制到所有 DC,直到您将它们分成不同的密钥空间,所有这些都将以 master 作为一个 DC,将 individual DC 作为第二个 DC。
我正在为一个新项目研究技术。
我们有很多站点,它们的数据应该来自主服务器。 每个站点只能拥有与站点所有者(公司)相关的数据。每个站点可能有许多独立的机器,每个机器都有自己的数据库。
master 将拥有所有 sites/machines 的所有数据。 预计会在偶尔连接的情况下离线使用。
我可以使用 symmetric-ds 之类的东西来对 RDBMS 执行此操作。例如:设置每个站点的复制,以便每个站点只接收与该站点相关的数据。
没有让我明白(至少,自动)的是能够写入其中一台本地机器,并自动复制到位于那个网站。这在离线情况下很重要,在这种情况下,写入站点上的机器 A 不会自动导致相同的 write/update 在同一站点的机器 B 上发生。当连接建立时,对 B 的写入将作为对称 ds 复制的一部分自然发生,但我需要在连接断开时在本地工作的东西。
我想知道像 Cassanda 这样的东西是否适合这个?
我在想:
- 每个站点都是自己的一组副本(即使该站点只有一台机器)
- 每个站点将数据复制到一个主站点
- master 上的写入被复制到相关站点(基于数据的内容)
Cassandra 中没有这样的功能。从理论上讲,您可以使用 DSE's Advanced Replication 功能构建您需要的东西,但这需要进行实验才能构建正确的解决方案。虽然如果决定仅基于内容,那么这可能不会奏效。
Cassandra 中的默认跨 DC 复制可能会持续停机,特别是如果您的软件在 writing/reading 数据时使用正确的一致性级别。但是所有数据都将被复制到所有 DC,直到您将它们分成不同的密钥空间,所有这些都将以 master 作为一个 DC,将 individual DC 作为第二个 DC。