Apache beam 中的窗口和水印:Google 数据流

Windowing and Watermark in Apache beam : Google dataflow

我固定 window 1 分钟。我正在考虑活动时间。

beam.WindowInto(window.FixedWindows(300))

当我部署此代码时,即使我没有发布任何消息,是否会立即创建 window。假设我部署在 6:30,是否像 windows 一样自动创建为 6:30 到 6:35、6:35 到 6:40 等等 ?

如果我向具有以下主题的主题发布消息 事件时间戳 = 6:31(unix 秒,即 10,176589653) 当系统时间 = 6:36 ..这是否意味着该特定消息的水印在 6:31 并且它将错过 window 因为系统时间在 6:36 并且允许延迟 = 0 并且将被拒绝。

Windows 始终使用 UNIX 时间 0 作为基础创建,这意味着,无论您是在 6:31、6:32 还是 6:35 开始管道, windows 永远是 [6:30, 6:35), [6:35, 6:40)...。请注意,这也适用于几天,windows 将从 00:00 UTC 开始。

如果你想改变这个,有一个offset parameter