关于 Talend 中的作业性能,多线程执行和并行化之间有什么区别?

what are the differences between Multi thread Execution and Parallelization with respect to Job performance in Talend?

多线程执行

并行化

当线程数(通常一个子作业算一个线程)不超过您用于并行执行的机器的处理器数时,多线程是最佳的。否则,一些子作业必须等到任何处理器被释放。

另请注意,并行化的数量不能超过 CPU,否则它将等待处理器,并且会增加处理器的开销。

并行化可帮助您管理复杂的作业系统。它同时执行多个子作业,并将子作业的执行与主作业中的其他子作业同步。

以上两者之间的确切区别是并行化(或启用多线程)链接子作业运行并行无论哪个先完成,另一方面同步链接子作业开始运行 仅当所有其他并行化子作业完成时。

因此,当您的请求需要一些子作业 运行 并行时,并行化是最好的,并且仅当所有其他并行化子作业完成时,子作业才开始 运行。

这也让你的工作设计更加灵活。

详细信息可以访问这个link