Select计算特征时过去的数据量
Select amount of past data when calculating features
我想知道是否有一种方法可以在计算特征时自动select过去的数据量。
例如,我可能想预测客户下一次购买的时间,因此最好了解不同截止日期的购买次数或平均购买价格。例如最近 12 个月、最近 3 个月、7 天等的购买
使用功能工具解决此问题的最佳方法是什么?
您可以使用 featuretools.dfs
中的 training window 参数创建仅使用一定数量历史数据的特征矩阵。当设置训练 window 时,Featuretools 将使用 cutoff time
和 cutoff_time - training_window
之间的历史数据。这是文档中的示例:
window_fm, window_features = ft.dfs(entityset=es,
target_entity="customers",
cutoff_time=cutoff_times,
cutoff_time_in_index=True,
training_window="1 hour")
在确定哪些数据可以使用时,训练 window 将检查 time_index
列中的时间是否在训练 window 内。
我想知道是否有一种方法可以在计算特征时自动select过去的数据量。
例如,我可能想预测客户下一次购买的时间,因此最好了解不同截止日期的购买次数或平均购买价格。例如最近 12 个月、最近 3 个月、7 天等的购买
使用功能工具解决此问题的最佳方法是什么?
您可以使用 featuretools.dfs
中的 training window 参数创建仅使用一定数量历史数据的特征矩阵。当设置训练 window 时,Featuretools 将使用 cutoff time
和 cutoff_time - training_window
之间的历史数据。这是文档中的示例:
window_fm, window_features = ft.dfs(entityset=es,
target_entity="customers",
cutoff_time=cutoff_times,
cutoff_time_in_index=True,
training_window="1 hour")
在确定哪些数据可以使用时,训练 window 将检查 time_index
列中的时间是否在训练 window 内。