彭塔霍 update/insert
Pentaho update/insert
我正在尝试在 Pentaho 中进行设置,其中:
我的源数据在 MySQL 数据库中,目标数据库是 Amazon redshift。
我想根据 MySQL 数据库 table.
[ 的最后更新时间戳,在 Redshift 数据库 table 上增加负载=24=]
主键是学号。
我可以在 Pentaho 中使用 update/insert 实现吗?
Pentaho 数据集成中的 Insert/Update 步骤用于插入行(如果它不存在于目标 table 中)或更新它(如果它已经存在)。它与增量加载无关,但如果您的加载应该基于某些更改数据捕获机制插入或更新记录,那么这是该过程结束时的正确步骤。
例如,您可以选择以下两种方式之一:
- 如果您有 CDC,则将数据限制在 Table 输入 MySQL,因为您已经知道上次修改记录的时间(上次加载)
- 如果您没有 CDC 并且要比较整个 table,那么请加入集合以生成已更改的行,然后执行加载(较慢的解决方案)
我正在尝试在 Pentaho 中进行设置,其中:
我的源数据在 MySQL 数据库中,目标数据库是 Amazon redshift。
我想根据 MySQL 数据库 table.
[ 的最后更新时间戳,在 Redshift 数据库 table 上增加负载=24=]
主键是学号。
我可以在 Pentaho 中使用 update/insert 实现吗?
Insert/Update 步骤用于插入行(如果它不存在于目标 table 中)或更新它(如果它已经存在)。它与增量加载无关,但如果您的加载应该基于某些更改数据捕获机制插入或更新记录,那么这是该过程结束时的正确步骤。
例如,您可以选择以下两种方式之一:
- 如果您有 CDC,则将数据限制在 Table 输入 MySQL,因为您已经知道上次修改记录的时间(上次加载)
- 如果您没有 CDC 并且要比较整个 table,那么请加入集合以生成已更改的行,然后执行加载(较慢的解决方案)