Apache pulsar 无限保留

Apache pulsar infinite retention

在 Apache Pulsar 主题文档中,它说我们可以将主题时间保留策略设置为 -1 以实现基于无限时间的保留吗?无限保留的缺点是什么?我们可以使用 Pulsar 作为消息存储吗?主题并围绕它们构建事件源应用程序?

缺点是您的数据将永远增长。然而,由于底层存储(簿记员)的基于段的架构,更多 space 可以通过添加存储节点来添加(即所有数据不必放在一台机器上,就像某些情况下的情况一样)其他系统)。

基于段的架构还使得将数据移动到大容量存储系统(s3 或其他系统)变得相当简单,同时仍然可以从 Pulsar 获得数据。但是,这目前仍处于讨论的早期阶段。

实际上,您可以而且应该使用 Pulsar's Tiered Storage 选项将旧数据卸载到更具成本效益的存储,例如 S3、Google Blob 存储或 HDFS。与 Kafka 不同,Pulsar 将服务层与存储层解耦,从而实现了这一点。在 Kafka 中,您必须 "add hard drives endlessly" 和代理实例来存储它们。

利用 Pulsar 的优势是一个更好的选择,因为它为您的数据存储提供了更多的组织。由于 Pulsar 的强项是将分层存储与主题分开的存储层,我建议您走这条路,因为您的数据将更加安全且易于访问。