在远程集群上调试

Debugging on the remote cluster

我有一个程序在本地集群中运行良好,但在远程集群中执行时 运行 不正常。我想知道,在远程 Flink 集群上调试程序 运行 的最佳和常用方法是什么? 感谢您的帮助!

有几种方法可以在远程集群上调试 Flink 应用程序。 由于使用真正的调试器很复杂,我会首先尝试尽可能多地记录以找出错误。

另一种可能有用的方法是使用 Flink 的累加器。有了它们,您可以收集一些统计数据:例如,当您有一个过滤器时,您可以确定有多少元素通过了过滤器等等。

最后的手段是将调试器附加到其中一个 Flink TaskManager JVM。

另请查看我关于该主题的演示文稿:http://de.slideshare.net/robertmetzger1/apache-flink-hands-on