使用 featuretools / DFS 更新数据

Data updates with featuretools / DFS

在 ML 2.0 和 AI PM 论文中,它意味着更新数据——可以是现有数据或新数据——动态发生(实时)。例如,在 AI PM 论文中它说,"Rather, we have demonstrated a complete system that works in the real world, on continually updating live data."

您的意思是更新数据会自动预处理为适当的特征向量并包含在下一个模型重新训练周期中?或者,模型是否正在动态更新?

在这种情况下,数据更新意味着新数据自动附加到现有数据,然后转换为新的特征向量。这些特征向量可用于重新训练模型或使用现有模型评分。

自动化是指新数据的特征工程可能依赖于历史数据进行计算,因此 Featuretools 中的 API 旨在尽可能地从开发人员那里抽象出来。这是使用 Entityset.concat(..) 方法实现的。