如何计算 Google 数据流的成本?

How to calculate the cost of a Google dataflow?

我的公司正在评估我们是否可以使用 Google Dataflow。

我在 Google Cloud Platform 上有 运行 数据流。控制台在右侧的“预留 CPU 时间”字段中显示 5 小时 25 分钟。

Worker configuration: n1-standard-4

Starting 8 workers...

如何计算数据流的成本?根据 this page 价格是每个 GCEU 每小时 0.01 美元,我如何才能找到我的数据流消耗的 GCEU 数量以及小时数?

您可以在此处找到每台机器的 GCEU 数量:https://cloud.google.com/compute/docs/machine-types。比如n1-standard-4s就是11个GCEU。

然后,批量数据流作业的成本(除了 VM 的原始成本)是

(Reserved CPU time in hours) / (Cores per machine) * (GCEUs) * $.01

那么,这项工作的总成本是

(machine hours) * ((GCEUs) * $.01 + (machine cost per hour) + (PD cost per hour for attached disks))

例如,对于具有 250GB 磁盘的 n1-standard-4,计算结果为 (11 * $.01 + $.152 + ($.04 * 250 / 30 / 24)) = $.276 每个machine-hour.

自 2018-05-03 以来有 new pricing model for Dataflow

现在您应该使用以下公式:

(vcpu_hours * vcpu_hourly_price) +
(mem_hours  * mem_hourly_price) +
(disk_hours * disk_hourly_price)

Shuffle 可能需要支付额外费用。