在 PDI 中加载数据时根据列(DATE)拆分行
Split Rows based on a column(DATE) while loading data in PDI
我在将数据加载到 table 时有一个要求,它应该检查 2 个日期列并根据条件拆分行。在下面的屏幕截图中提供更多详细信息。
今天我遇到了拆分日期范围的问题,因此它变成了两个单独的记录。
这是一个例子
| warehouse_id |钛 |发送 |
|一个 | 2017-02-03 04:00:00 | 2017-02-04 17:00:00.000|
我想要这样的结果
| warehouse_id | ti_new | tx_new |
|一个 | 2017-02-03 04:00:00 | 2017-02-03 23:59:59.000|
|一个 | 2017-02-04 00:00:00.000 | 2017-02-04 17:00:00.000|
ti 和 tx 是来自源 table 的 2 列。我们正在创建 2 个新列 ti_new 和 tx_new
因此最终输出将有 warehouse_id、ti、tx、ti_new、tx_new 列。
请你帮我一下
提前致谢,
安贾莉
我不确定这对你来说是否仍然是个问题,但我想分享它
我做了一个快速示例转换,根据日期将 1 行变成多行。
根据我的个人经验,如果你想 运行 大量行,将数据行推送到数据库中的暂存 table,然后写一个 SQL 来生成多个作为 sql 服务器或 oracle 或任何其他 rdbms 中批处理的一部分,对于大量行来说会更快的行。
改造图和步骤
我在将数据加载到 table 时有一个要求,它应该检查 2 个日期列并根据条件拆分行。在下面的屏幕截图中提供更多详细信息。
今天我遇到了拆分日期范围的问题,因此它变成了两个单独的记录。
这是一个例子
| warehouse_id |钛 |发送 |
|一个 | 2017-02-03 04:00:00 | 2017-02-04 17:00:00.000|
我想要这样的结果
| warehouse_id | ti_new | tx_new |
|一个 | 2017-02-03 04:00:00 | 2017-02-03 23:59:59.000|
|一个 | 2017-02-04 00:00:00.000 | 2017-02-04 17:00:00.000|
ti 和 tx 是来自源 table 的 2 列。我们正在创建 2 个新列 ti_new 和 tx_new
因此最终输出将有 warehouse_id、ti、tx、ti_new、tx_new 列。 请你帮我一下
提前致谢, 安贾莉
我不确定这对你来说是否仍然是个问题,但我想分享它
我做了一个快速示例转换,根据日期将 1 行变成多行。
根据我的个人经验,如果你想 运行 大量行,将数据行推送到数据库中的暂存 table,然后写一个 SQL 来生成多个作为 sql 服务器或 oracle 或任何其他 rdbms 中批处理的一部分,对于大量行来说会更快的行。
改造图和步骤