需要 jdbc Kafka 连接配置设置的参考文档或代码作为 docker 容器的分布式模式

Need reference document or code for jdbc Kafka connect configuration setup for distributed mode as docker container

我需要设计和配置 Kafka jdbc connect 项目,其中 source 和 sink 都是 postgres db,我使用的是 apache Kafka 2.8。

我已经为standalone模式准备了POC,但是我需要为分布式模式设计它,数据量将是几百万条记录。

您能否分享有关分布式模式设置以及参数调整和最佳实践的任何参考资料?

我已经浏览了几份文档,但没有得到仅针对带有 jdbc 连接器的 apache Kafka 的精确文档。

另外请告诉我如何使这个解决方案码头化?

谢谢,

苏文杜

reference to setup for distributed mode

这在 Kafka 文档中。 运行 connect-distributed.sh 及其配置文件。

parameters tuning and best practices?

配置有合理的默认值,但欢迎您检查文件是否有任何更改。唯一的事情是堆设置,但 2G 是默认的 Xmx,可以使用 KAFKA_HEAP_OPTS env var

进行设置

这将启动一个 HTTP 服务器,您 POST JSON 它与独立的 jdbc 工作文件

具有相同的键值

precise document only for apache Kafka with jdbc connector

有官方配置页面和一些博客(来自 Confluent)

how can I make this solution dockerized?

Confluent Docker 图像最适合此操作,尽管您可能需要 confluent-hub install 将 JDBC 连接器连接到您自己的图像中

不过我会推荐 Debezium 作为来源