Mule 批处理 vs foreach vs 拆分器聚合器

Mule batch processing vs foreach vs splitter-aggregator

在 Mule 中，我有很多记录要处理，其中处理包括一些计算，来回数据库等。我们可以使用这些选项处理记录集合

例如，Mule 批处理选项似乎没有批处理作业范围变量定义。或者，如果我想利用多线程来加快整体任务怎么办？或者，如果我想在处理过程中修改负载，哪个更好？

对于 Splitter 和 Aggregator ，您负责编写拆分逻辑，然后在处理结束时将它们重新加入。当您想使用不同的服务器异步处理记录时，它很有用。与其他选项相比，它不太可靠，这里可以并行处理。

Foreach 更可靠，但它使用单线程（同步）迭代处理记录，因此无法进行并行处理。默认情况下，每条记录创建一条消息。

批处理旨在以非常快速和可靠的方式处理数百万条记录。默认情况下 16 个线程将处理您的记录并且它也很可靠。

请阅读下面的 link 了解更多详情。

当你写 "quite many" 时，我假设它对主内存来说太多了，这排除了 spliter/aggregator 因为它必须将所有记录收集到 return 它们作为列表。

我假设您的记录在流或迭代器中，否则您可能有内存问题...

那么什么时候用for-each什么时候用batch呢？

最简单的解决方案，但它有一些缺点：

在循环中，您可以有几个步骤（消息处理器）来处理您的记录（例如，对于提到的数据库查找）。

可能是缺点，可能是优点：循环是同步的。（如果要处理异步，请将其包装在异步范围内。）

要做/要理解的东西多一点，但功能更多：

看来你最好使用批处理。

我一直在使用方法将数组中的记录传递给存储过程。您可以在 for 循环中调用存储过程并相应地设置 for 循环的批处理大小以避免往返。我已经使用了这种方法并且性能很好。您可能必须创建另一个 table 来记录结果并在存储过程中也具有该逻辑。