为什么 featuretools 从我的数据框索引创建特征?
Why is featuretools creating features from my dataframe index?
我注意到 featuretools 从我的数据帧索引中创建了特征。例如:
'LAST(transactions.payment_id)'
这是我在创建实体时设置的索引:
es = es.entity_from_dataframe(entity_id = 'transactions',
dataframe = transactions,
make_index=True,
index = 'payment_id',
time_index = 'local_date')
从索引创建要素有什么用?如果这没有用,怎么能禁用它呢?我连夜训练了一个模型,发现付款ID是一个非常重要的特征,但没有意义。
默认情况下,索引用于生成特征。这可以通过使用 drop_contains
参数来避免。所以,DFS 调用看起来像这样:
ft.dfs(
...
drop_contains=['payment_id'],
)
如果有帮助请告诉我。
我注意到 featuretools 从我的数据帧索引中创建了特征。例如:
'LAST(transactions.payment_id)'
这是我在创建实体时设置的索引:
es = es.entity_from_dataframe(entity_id = 'transactions',
dataframe = transactions,
make_index=True,
index = 'payment_id',
time_index = 'local_date')
从索引创建要素有什么用?如果这没有用,怎么能禁用它呢?我连夜训练了一个模型,发现付款ID是一个非常重要的特征,但没有意义。
默认情况下,索引用于生成特征。这可以通过使用 drop_contains
参数来避免。所以,DFS 调用看起来像这样:
ft.dfs(
...
drop_contains=['payment_id'],
)
如果有帮助请告诉我。