使用 NIFI 在增量提取中摄取重复记录,
Duplicate records ingesting in incremental fetch using NIFI,
我正在设计一个使用 NIFI 获取增量提取的工作流,源数据库和目标数据库位于 MySQL。处理器是 QueryDatabaseTable 和 spiltAvro 和 convertAvroToJson 和 convertJsonToSQL PutSQL 如下图
而querydatabasetable的配置参数如下
现在源数据库 table 只有 200 条记录,当我启动流程时,流程重复摄取相同的记录。
我已将最大值列设置为createTime,这是时间戳,它的值为
2017-12-07 18:48:23
所有 200 条记录。
我还用 ID 替换了 maximum-value columns 但这也导致了同样的问题。
是什么导致了这种反复摄入?
根据@mattyb 在 中的建议,我替换了 spiltAvro 和 convertAvroToJson 和 convertJsonToSQL 和 PutSQL 与 PutDatabaseRecord 处理器,它与增量摄取一起工作。
流程将如下所示,最大值列 属性 已设置为 ID,time_stamp
我正在设计一个使用 NIFI 获取增量提取的工作流,源数据库和目标数据库位于 MySQL。处理器是 QueryDatabaseTable 和 spiltAvro 和 convertAvroToJson 和 convertJsonToSQL PutSQL 如下图
而querydatabasetable的配置参数如下
现在源数据库 table 只有 200 条记录,当我启动流程时,流程重复摄取相同的记录。
我已将最大值列设置为createTime,这是时间戳,它的值为
2017-12-07 18:48:23
所有 200 条记录。
我还用 ID 替换了 maximum-value columns 但这也导致了同样的问题。 是什么导致了这种反复摄入?
根据@mattyb 在
流程将如下所示,最大值列 属性 已设置为 ID,time_stamp