Google 数据流中的预留 CPU 时间
Reserved CPU Time in Google Dataflow
我对 Google 数据流中的 保留 CPU 时间 字段有疑问。我不明白为什么它会根据我 运行 的配置变化如此之大。我怀疑我没有解释 reserved CPU time 的真实情况。据我了解,完成我提交的作业所需的时间是 CPU,但根据以下证据,我似乎可能弄错了。是分配给您的工作的时间,而不管它是否实际使用资源?如果是这样,我如何获得我工作的实际 CPU 时间?
首先,我 运行 我的工作有一个可变大小的工人池(最多 24 个工人)。
对应的数据如下:
然后,我 运行 我的脚本使用固定数量的工人 (10):
统计数据变为:
他们从 15 天 减少到 7 小时?这怎么可能?!
谢谢!
如果您将鼠标悬停在“?”上在 "Reserved CPU time" 旁边将显示一条弹出消息,内容为: "The total time Dataflow was active on GCE instances, on a per-CPU basis." 这表明它不是 VM 使用的 CPU 时间。目前 Dataflow 不会汇总每台机器 CPU 的使用情况统计信息;但是,您可以使用 cloud monitoring API 自己提取这些指标。
我对 Google 数据流中的 保留 CPU 时间 字段有疑问。我不明白为什么它会根据我 运行 的配置变化如此之大。我怀疑我没有解释 reserved CPU time 的真实情况。据我了解,完成我提交的作业所需的时间是 CPU,但根据以下证据,我似乎可能弄错了。是分配给您的工作的时间,而不管它是否实际使用资源?如果是这样,我如何获得我工作的实际 CPU 时间?
首先,我 运行 我的工作有一个可变大小的工人池(最多 24 个工人)。
对应的数据如下:
然后,我 运行 我的脚本使用固定数量的工人 (10):
统计数据变为:
他们从 15 天 减少到 7 小时?这怎么可能?!
谢谢!
如果您将鼠标悬停在“?”上在 "Reserved CPU time" 旁边将显示一条弹出消息,内容为: "The total time Dataflow was active on GCE instances, on a per-CPU basis." 这表明它不是 VM 使用的 CPU 时间。目前 Dataflow 不会汇总每台机器 CPU 的使用情况统计信息;但是,您可以使用 cloud monitoring API 自己提取这些指标。