如何解释来自 kafka 连接源任务的活动记录计数指标?
How to interpret the active record count metric from a kafka connect source task?
我有一个 kafka 连接源任务连接器(jdbc postgres 连接器),我可以从这个连接器查看 kafka_connect_source_task_source_record_active_count_avg
指标。我注意到图表看起来像这样:
因此我们偶尔会看到 100 条记录的步骤。如果我将指标从 _avg
更改为 max
,实际上步长为 100。
不过,我不确定如何解释这些信息。这是否意味着现在(图表末尾)有超过 1100 条记录尚未提交给 kafka,而且他们已经这样做了好几周了?我想知道为什么这个值不会减少。连接器在一个非常活跃的数据库上,所以如果它总是“落后”我也不会感到惊讶(这是正确的词吗?)。但我想知道它是否至少总是通过消息的背面工作,或者它是否正在“累积”某些由于某种原因从未提交给卡夫卡的消息,以及这个数字是否反映了这些“卡住”消息。
source-record-active-count
:The most recent number of records that have been produced by this task but not yet completely written to Kafka.
您还可以绘制您正在制作的主题的偏移量,以查看它们是否遵循相同的增加步骤
替代方法是使用 Debezium 而不是 JDBC 源
我有一个 kafka 连接源任务连接器(jdbc postgres 连接器),我可以从这个连接器查看 kafka_connect_source_task_source_record_active_count_avg
指标。我注意到图表看起来像这样:
因此我们偶尔会看到 100 条记录的步骤。如果我将指标从 _avg
更改为 max
,实际上步长为 100。
不过,我不确定如何解释这些信息。这是否意味着现在(图表末尾)有超过 1100 条记录尚未提交给 kafka,而且他们已经这样做了好几周了?我想知道为什么这个值不会减少。连接器在一个非常活跃的数据库上,所以如果它总是“落后”我也不会感到惊讶(这是正确的词吗?)。但我想知道它是否至少总是通过消息的背面工作,或者它是否正在“累积”某些由于某种原因从未提交给卡夫卡的消息,以及这个数字是否反映了这些“卡住”消息。
source-record-active-count
:The most recent number of records that have been produced by this task but not yet completely written to Kafka.
您还可以绘制您正在制作的主题的偏移量,以查看它们是否遵循相同的增加步骤
替代方法是使用 Debezium 而不是 JDBC 源