Storm 是否不适合批量学习?

Is Storm badly suited for batch learning?

从网络上的各种来源,我了解到 Storm 具有一些机器学习功能(例如通过 Samoa),但是它总是 用于在线学习吗?推论问题:如果我说 Storm 不适合更经典的批处理学习,因为这种处理的固有迭代性质,我错了吗? 谢谢你的澄清。

之所以用于在线学习,是因为它是一种逐个处理数据的解决方案,您可以通过设置一些并行化(更多工作进程和节点)来扩展。

您通常会进行批量学习以使用历史数据构建或训练模型,但对于这种情况,一个一个地处理数据并不是您的最佳选择。由于您可能需要处理数月的数据,因此您希望对其进行批处理以优化流程。这就是 spark 等其他解决方案的用武之地。