从 Google Cloud Dataflow 输出排序的文本文件
Output sorted text file from Google Cloud Dataflow
我在 Google Cloud DataFlow 中有一个 PCollection<String>
,我正在通过 TextIO.Write.to
:
将其输出到文本文件
PCollection<String> lines = ...;
lines.apply(TextIO.Write.to("gs://bucket/output.txt"));
目前每个分片输出的行都是随机排列的。
是否可以让 Dataflow 按排序顺序输出行?
我在 Google Cloud DataFlow 中有一个 PCollection<String>
,我正在通过 TextIO.Write.to
:
PCollection<String> lines = ...;
lines.apply(TextIO.Write.to("gs://bucket/output.txt"));
目前每个分片输出的行都是随机排列的。
是否可以让 Dataflow 按排序顺序输出行?