Python相当于dplyr的summarize

Python equivalent to dplyr's summarize

python 中是否存在像 R 中那样的 summarize 函数?!

我正在研究频繁项集先验算法并正在寻找一个好的数据集。我找到了一个 here

我可以阅读和理解 R,但不知道 Python 中是否存在 summarize 函数:

在 R 这个笔记本中有:

order_baskets <- ordr_pr %>% 
  inner_join(prods, by="product_id") %>% 
  group_by(order_id) %>%
  summarise(basket = as.vector(list(product_name)))

在 python 我只想:

pd.merge(ordr_pr, prods, how='inner', on='product_id')
 .groupby(order_id)
  # summarize( basket = as.vector(list(product_name)))

合并后我有点迷茫,我什至不确定 groupby 在 python 中是否和在 R 中做同样的事情。

您正在查找 aggregateagg 函数。因此你可以:

pd.merge(ordr_pr, prods, how='inner', on='product_id').groupby(order_id).agg({'product_name':list})