Cloud ML:工作与运营

Cloud ML: Jobs vs Operations

在阅读 Cloud ML 文档时,我一直坚持使用 'operation' 术语。有人可以解释一下它指的是什么以及它与 Cloud ML Jobs 的关系吗?

工作往往是长期存在的事情,例如处理模型或进行批量预测。

操作往往是对已部署模型的创建-读取-更新-删除操作。

作业和操作有多种不同之处:

  1. 作业用于训练或预测。操作适用于 create/update/deleting 模型和版本。

  2. 作业是 API 调用的输入和输出。运算仅输出。

  3. 对于作业,您可以指定作业 ID(因此您可以在出现 5xx 错误时重新提交而无需复制作业)。对于操作,操作 ID 是自动分配的。

  4. Operation 对象在众多 GCP 服务中是相同的,但 Job 对象是 ML Engine 所独有的。

老实说,这对 API 设计来说意义不大。我猜测发生的事情是 Operation 在 standard GCP way 中用于简单功能,但是对于 training/prediction 这还不够,所以 API 设计者添加了 Job 对象。