使用 Pentaho Kettle,如何通过中间步骤读取输入 table 从 CSV 文件加载输出 table 中的数据?

Using Pentaho Kettle, how to load data in output table from CSV file with intermediary step reading in an input table?

我有一个 CSV 文件,其中包含我需要使用 Pentaho ETL Kettle 加载到数据库 table 中的数据。但是在将它们加载到 table 之前,我需要构建要插入的每一行,其中包含我从 CSV 文件中获取的值以及我必须从另一个输入 table 中收集的值(这需要来自 CSV 的数据作为收集所需信息的参数)。我对构建转换所必须使用的步骤有点迷茫。有人可以帮忙吗?

我认为最简单的解决方案是:

  • 首先使用文本输入步骤读取 CSV 文件
  • 然后使用数据库连接步骤,从中获取额外的列 table,例如:

    SELECT col1, col2, col3
    FROM input_table
    WHERE common_column = ?
    

    带占位符?将由您必须在此步骤中指定的参数替换。

  • 然后您可以将您的数据发送到输出步骤,例如 "Table Output"。

像这样:

它不一定是最高效的解决方案,这取决于您的数据如何,或者您可以使用 "Database Lookup" 步骤或 "Table Input" 步骤然后连接。