安排水壶作业

Schedule Kettle job

我有使用 Kettle 编写的 ETL 过程。它执行从操作数据源(Windows 上的 MS SQL)到数据仓库(Ubuntu 上的MySQL)的数据传输。

我想安排 Kettle 作业(其他)每天执行以填充 table 个维度和 table 事实上,让我的数据真实并准备好进行分析和报告。

如何安排执行 Kettle 作业?

在你的kettle安装目录下有几个批处理文件,其中有spoon.batpan.batkitchen.batSpoon 是您已经知道的 UI,pan 是从命令行 运行 转换(.ktr 文件)的命令行工具,kitchen 是 运行 个 kettle 作业(.kjb 个文件)的命令行工具。

对于简单的计划,创建一个调用 kitchen.bat 或 pan.bat 的批处理文件(取决于您是要 运行 转换还是作业)。然后使用 windows 任务计划程序 运行 您的批处理文件,无论您想要什么计划。

例如,这将 运行 一个 kettle 作业,使用基本日志记录并将日志内容附加到日志文件

kitchen.bat /file:"c:\etl\my_first_job.kjb" /level:Basic > c:\etl\logs\logging_for_my_first_job.log

这当然是为了 windows。如果你 运行 kettle 在 linux 上,你可以使用 cron 和 kettle 安装目录中的相应 .sh 文件(pan.shkitchen.sh)。

由于 kettle 在用户配置文件中存储共享数据库连接,请确保执行计划任务的用户 运行 在他的配置文件中包含这些连接,否则您的转换将失败。

pentaho 中的调度是由 carte 服务器完成的。 http://wiki.pentaho.com/display/EAI/Carte+User+Documentation

使用您的启动步骤参数调度和点菜服务器,您将能够在需要时安排此水壶作业。