彭塔霍 update/insert

Pentaho update/insert

我正在尝试在 Pentaho 中进行设置,其中:

  1. 我的源数据在 MySQL 数据库中,目标数据库是 Amazon redshift。

  2. 我想根据 MySQL 数据库 table.

    [ 的最后更新时间戳,在 Redshift 数据库 table 上增加负载=24=]

主键是学号。

我可以在 Pentaho 中使用 update/insert 实现吗?

Pentaho 数据集成中的

Insert/Update 步骤用于插入行(如果它不存在于目标 table 中)或更新它(如果它已经存在)。它与增量加载无关,但如果您的加载应该基于某些更改数据捕获机制插入或更新记录,那么这是该过程结束时的正确步骤。

例如,您可以选择以下两种方式之一:

  • 如果您有 CDC,则将数据限制在 Table 输入 MySQL,因为您已经知道上次修改记录的时间(上次加载)
  • 如果您没有 CDC 并且要比较整个 table,那么请加入集合以生成已更改的行,然后执行加载(较慢的解决方案)