在 Apache Beam 的 CoGroupByKey 中返回不匹配项?

Returning non-matches in a CoGroupByKey in Apache Beam?

在我的 Beam 工作流程中,我将每日数据从 API 端点提取到我的数据库中,在我这样做的同时,我将来自事实 table 的额外信息加入到每日数据中,使用CoGroupByKey.

现在,如果我的主要 table 中的键与事实 table 不匹配,即我看到新对象的每日数据,我如何获得 list/PCollection所有这些不匹配的键,所以我可以为不匹配的键获取新的“事实”?

CoGroupByKey 的外面,每个元素是一个 CoGbkResult

CoGbkResult 中,对于每个键,主 table 中的元素将有一个可迭代对象,事实 table 中的元素将有一个可迭代对象。如果来自事实 table 的可迭代对象为空,则没有匹配项。

您可能会发现使用 Beam 架构和 CoGroup 转换更加容易。