我如何解释此特定功能
How do I interpret this particular feature
假设我有 3 个实体:parent1 <- child -> parent2。我使用了 dfs()
并得到了我无法理解的功能 MEAN(child.parent2.MEAN(child.num_feature))
。阅读文档时我认为 any_entity.MEAN
的功能是 "group by entity then apply MEAN" 但现在这种方法不起作用
深度特征合成通过 "stacking" 现有特征创建新特征。要了解此功能,让我们逐步了解它是如何计算的。
- 计算特征
MEAN(child.num_feature)
并将其添加到 parent2
。
- 将该特征(在
parent2
上定义)加入 child
。这将创建在 child
上定义的新功能 parent2.MEAN(child.num_feature)
。对于 `parent2 具有相同值的 child
行对于该特征将具有相同值。
- 将
child
按 parent
分组并取该特征的平均值。这将创建 MEAN(child.parent2.MEAN(child.num_feature))
为了帮助说明,让我们看一个具体的例子
假设 parent1
是 table 位客户,child
是 transactions
位客户中的 table 位 amount
,并且 parent2
是您销售的每个独特产品的 table。
为客户实体创建的特征 MEAN(transactions.product.SUM(amount))
可以解释为“该客户购买的产品的平均总销售额是多少”,例如“该客户购买的产品是否已售出很多”。
假设我有 3 个实体:parent1 <- child -> parent2。我使用了 dfs()
并得到了我无法理解的功能 MEAN(child.parent2.MEAN(child.num_feature))
。阅读文档时我认为 any_entity.MEAN
的功能是 "group by entity then apply MEAN" 但现在这种方法不起作用
深度特征合成通过 "stacking" 现有特征创建新特征。要了解此功能,让我们逐步了解它是如何计算的。
- 计算特征
MEAN(child.num_feature)
并将其添加到parent2
。 - 将该特征(在
parent2
上定义)加入child
。这将创建在child
上定义的新功能parent2.MEAN(child.num_feature)
。对于 `parent2 具有相同值的child
行对于该特征将具有相同值。 - 将
child
按parent
分组并取该特征的平均值。这将创建MEAN(child.parent2.MEAN(child.num_feature))
为了帮助说明,让我们看一个具体的例子
假设 parent1
是 table 位客户,child
是 transactions
位客户中的 table 位 amount
,并且 parent2
是您销售的每个独特产品的 table。
为客户实体创建的特征 MEAN(transactions.product.SUM(amount))
可以解释为“该客户购买的产品的平均总销售额是多少”,例如“该客户购买的产品是否已售出很多”。