Select计算特征时过去的数据量

Question

我想知道是否有一种方法可以在计算特征时自动select过去的数据量。

例如，我可能想预测客户下一次购买的时间，因此最好了解不同截止日期的购买次数或平均购买价格。例如最近 12 个月、最近 3 个月、7 天等的购买

使用功能工具解决此问题的最佳方法是什么？

Answer 1

您可以使用 featuretools.dfs 中的 training window 参数创建仅使用一定数量历史数据的特征矩阵。当设置训练 window 时，Featuretools 将使用 cutoff time 和 cutoff_time - training_window 之间的历史数据。这是文档中的示例：

window_fm, window_features = ft.dfs(entityset=es,
                                    target_entity="customers",
                                    cutoff_time=cutoff_times,
                                    cutoff_time_in_index=True,
                                    training_window="1 hour")

在确定哪些数据可以使用时，训练 window 将检查 time_index 列中的时间是否在训练 window 内。

Select计算特征时过去的数据量

Select amount of past data when calculating features

featuretools