Pentaho Kettle 从 URL 下载文件
Penthao Kettle Download File from URL
我想从 URL 下载一个文件。 (例如 http://www.webadress.com/service/servicedata?ID=xxxxxx)
我找到了作业可执行文件的 HTTP 步骤,但我不得不定义一个目标文件名,而不是仅仅接受 Webdownload 提供的文件名。 (例如 ServiceData20200101.PDF)
其他问题是即使 Webcall 实际上不提供文件,它也会创建一个文件。
REST 客户端或 HTTP 客户端 Step in Transformations 是否能够通过按原样接受文件的 URL 调用下载文件?
Pentaho 中的 HTTP 步骤有些限制。在过去的类似用例中,我通过使用带有参数的外部 shell 脚本来完成此操作,然后调用 wget 或 curl 并保存结果。然后 Pentaho 在临时目录中获取文件并从那里处理它。
Shell 作业步骤允许您指定脚本文件并将流中的字段作为参数传递。
请注意,如果您将 shell 命令直接粘贴到第二个选项卡上的步骤中,它们将在嵌入的 shell 中与旧版本的 curl 和 wget 一起执行。您还将缺少环境配置和 certificates/keys.
我想从 URL 下载一个文件。 (例如 http://www.webadress.com/service/servicedata?ID=xxxxxx)
我找到了作业可执行文件的 HTTP 步骤,但我不得不定义一个目标文件名,而不是仅仅接受 Webdownload 提供的文件名。 (例如 ServiceData20200101.PDF)
其他问题是即使 Webcall 实际上不提供文件,它也会创建一个文件。 REST 客户端或 HTTP 客户端 Step in Transformations 是否能够通过按原样接受文件的 URL 调用下载文件?
Pentaho 中的 HTTP 步骤有些限制。在过去的类似用例中,我通过使用带有参数的外部 shell 脚本来完成此操作,然后调用 wget 或 curl 并保存结果。然后 Pentaho 在临时目录中获取文件并从那里处理它。
Shell 作业步骤允许您指定脚本文件并将流中的字段作为参数传递。
请注意,如果您将 shell 命令直接粘贴到第二个选项卡上的步骤中,它们将在嵌入的 shell 中与旧版本的 curl 和 wget 一起执行。您还将缺少环境配置和 certificates/keys.