安排水壶作业
Schedule Kettle job
我有使用 Kettle 编写的 ETL 过程。它执行从操作数据源(Windows 上的 MS SQL)到数据仓库(Ubuntu 上的MySQL)的数据传输。
我想安排 Kettle 作业(其他)每天执行以填充 table 个维度和 table 事实上,让我的数据真实并准备好进行分析和报告。
如何安排执行 Kettle 作业?
在你的kettle安装目录下有几个批处理文件,其中有spoon.bat
、pan.bat
和kitchen.bat
。 Spoon
是您已经知道的 UI,pan
是从命令行 运行 转换(.ktr
文件)的命令行工具,kitchen
是 运行 个 kettle 作业(.kjb
个文件)的命令行工具。
对于简单的计划,创建一个调用 kitchen.bat 或 pan.bat 的批处理文件(取决于您是要 运行 转换还是作业)。然后使用 windows 任务计划程序 运行 您的批处理文件,无论您想要什么计划。
例如,这将 运行 一个 kettle 作业,使用基本日志记录并将日志内容附加到日志文件
kitchen.bat /file:"c:\etl\my_first_job.kjb" /level:Basic > c:\etl\logs\logging_for_my_first_job.log
这当然是为了 windows。如果你 运行 kettle 在 linux 上,你可以使用 cron 和 kettle 安装目录中的相应 .sh 文件(pan.sh
或 kitchen.sh
)。
由于 kettle 在用户配置文件中存储共享数据库连接,请确保执行计划任务的用户 运行 在他的配置文件中包含这些连接,否则您的转换将失败。
pentaho 中的调度是由 carte 服务器完成的。
http://wiki.pentaho.com/display/EAI/Carte+User+Documentation
使用您的启动步骤参数调度和点菜服务器,您将能够在需要时安排此水壶作业。
我有使用 Kettle 编写的 ETL 过程。它执行从操作数据源(Windows 上的 MS SQL)到数据仓库(Ubuntu 上的MySQL)的数据传输。
我想安排 Kettle 作业(其他)每天执行以填充 table 个维度和 table 事实上,让我的数据真实并准备好进行分析和报告。
如何安排执行 Kettle 作业?
在你的kettle安装目录下有几个批处理文件,其中有spoon.bat
、pan.bat
和kitchen.bat
。 Spoon
是您已经知道的 UI,pan
是从命令行 运行 转换(.ktr
文件)的命令行工具,kitchen
是 运行 个 kettle 作业(.kjb
个文件)的命令行工具。
对于简单的计划,创建一个调用 kitchen.bat 或 pan.bat 的批处理文件(取决于您是要 运行 转换还是作业)。然后使用 windows 任务计划程序 运行 您的批处理文件,无论您想要什么计划。
例如,这将 运行 一个 kettle 作业,使用基本日志记录并将日志内容附加到日志文件
kitchen.bat /file:"c:\etl\my_first_job.kjb" /level:Basic > c:\etl\logs\logging_for_my_first_job.log
这当然是为了 windows。如果你 运行 kettle 在 linux 上,你可以使用 cron 和 kettle 安装目录中的相应 .sh 文件(pan.sh
或 kitchen.sh
)。
由于 kettle 在用户配置文件中存储共享数据库连接,请确保执行计划任务的用户 运行 在他的配置文件中包含这些连接,否则您的转换将失败。
pentaho 中的调度是由 carte 服务器完成的。 http://wiki.pentaho.com/display/EAI/Carte+User+Documentation
使用您的启动步骤参数调度和点菜服务器,您将能够在需要时安排此水壶作业。