关于 Talend 中的作业性能,多线程执行和并行化之间有什么区别?
what are the differences between Multi thread Execution and Parallelization with respect to Job performance in Talend?
多线程执行
并行化
当线程数(通常一个子作业算一个线程)不超过您用于并行执行的机器的处理器数时,多线程是最佳的。否则,一些子作业必须等到任何处理器被释放。
另请注意,并行化的数量不能超过 CPU,否则它将等待处理器,并且会增加处理器的开销。
并行化可帮助您管理复杂的作业系统。它同时执行多个子作业,并将子作业的执行与主作业中的其他子作业同步。
以上两者之间的确切区别是并行化(或启用多线程)链接子作业运行并行无论哪个先完成,另一方面同步链接子作业开始运行 仅当所有其他并行化子作业完成时。
因此,当您的请求需要一些子作业 运行 并行时,并行化是最好的,并且仅当所有其他并行化子作业完成时,子作业才开始 运行。
这也让你的工作设计更加灵活。
详细信息可以访问这个link
多线程执行
并行化
当线程数(通常一个子作业算一个线程)不超过您用于并行执行的机器的处理器数时,多线程是最佳的。否则,一些子作业必须等到任何处理器被释放。
另请注意,并行化的数量不能超过 CPU,否则它将等待处理器,并且会增加处理器的开销。
并行化可帮助您管理复杂的作业系统。它同时执行多个子作业,并将子作业的执行与主作业中的其他子作业同步。
以上两者之间的确切区别是并行化(或启用多线程)链接子作业运行并行无论哪个先完成,另一方面同步链接子作业开始运行 仅当所有其他并行化子作业完成时。
因此,当您的请求需要一些子作业 运行 并行时,并行化是最好的,并且仅当所有其他并行化子作业完成时,子作业才开始 运行。
这也让你的工作设计更加灵活。
详细信息可以访问这个link