在 Flink 中加入历史数据时,一个源比另一端慢得多
One source is much slower than the other side when join history data in Flink
在使用 eventTime 的连接运算符中使用历史数据时,从一个源读取数据比另一个源慢得多。结果,连接运算符将从较快的源缓存大量数据,以等待较慢的源。
问题是怎样才能让消费者的速度差异变小?
我不确定我是否理解您所说的“...使消费者速度的差异变小”是什么意思。如果你想避免缓存大量数据,并且你无法控制源速度,那么我认为你唯一的选择是使用更小的 window,这样缓存的数据就更少了。有关详细信息,请参阅 Window Join。
在使用 eventTime 的连接运算符中使用历史数据时,从一个源读取数据比另一个源慢得多。结果,连接运算符将从较快的源缓存大量数据,以等待较慢的源。
问题是怎样才能让消费者的速度差异变小?
我不确定我是否理解您所说的“...使消费者速度的差异变小”是什么意思。如果你想避免缓存大量数据,并且你无法控制源速度,那么我认为你唯一的选择是使用更小的 window,这样缓存的数据就更少了。有关详细信息,请参阅 Window Join。