在处理 apache beam 框架时,Python 和 java 有什么区别?

What's the difference between Python and java when dealing with apache beam framework?

我在编写 Apache Beam 管道时使用 python。 我注意到一些限制,例如处理延迟数据等。我想知道与 Java

相比是否还有其他限制或优势

自 2019 年秋季起,我们可以考虑使用 python SDK 来提供 java 的部分功能。

您可用的 I/O 转换较少(与其他系统、数据存储、消息队列等集成的可能性)。文档在此处提供了 java 与 python 支持的列表:https://beam.apache.org/documentation/io/built-in/

您还可以使用较少的聚合转换(例如,python 端缺少 Min 和 Max),但随着人们回馈社区,这种情况正在变得更好(参见 https://issues.apache.org/jira/browse/BEAM-6695).

根据我的个人经验,缺少 sql 数据库连接是让我在 java 中编写管道的交易破坏者,实际上是 kotlin :)。