通过 API 在外部训练模型

Train model externally via API

我们已经成功部署了我们的预测模型,并且能够为我们的应用程序调用预测。但是,我们希望在我们的应用程序中使用模型时不断地对其进行训练。每当用户发现预测错误时,这将发送一组数据。我检查了文档,只找到了创建工作的 API。

有没有办法通过 API 将训练数据从外部发送到 GCP-ML?如果有,请提供文档。

根据我对您问题的了解,您正在寻找的功能具有以下效果:

  • 有一些进程(例如流式管道)可以访问标记数据
  • 所述进程发送实例进行预测
  • 进程将模型的预测与已知标签进行比较
  • 标注数据用于更新模型
  • 更新后的模型可用于预测

Google 的 CloudML 引擎目前不支持将此作为第一个 class 用例。

根据我们的经验,生产环境(尤其是关键业务流程)的更安全模型不会在未经事先评估的情况下自动更新生产中的模型。所以一个常见的范例是:

  • 等待一些新数据的进来(例如,1 天的日志,甚至只是几小时或几分钟的新数据)
  • 用新数据更新模型副本
  • 评估更新后的模型以确保它更好
  • 如果是这样,将模型作为新版本推送到生产环境(以便轻松恢复到旧版本)并使用分阶段部署逐步将新流量引导到新版本。

有关详细信息,您可能对 this KDD paper on TFX 感兴趣,它尚未作为服务或开源提供。