Python相当于dplyr的summarize

Question

python 中是否存在像 R 中那样的 summarize 函数？！

我正在研究频繁项集先验算法并正在寻找一个好的数据集。我找到了一个 here

我可以阅读和理解 R，但不知道 Python 中是否存在 summarize 函数：

在 R 这个笔记本中有：

order_baskets <- ordr_pr %>% 
  inner_join(prods, by="product_id") %>% 
  group_by(order_id) %>%
  summarise(basket = as.vector(list(product_name)))

在 python 我只想：

pd.merge(ordr_pr, prods, how='inner', on='product_id')
 .groupby(order_id)
  # summarize( basket = as.vector(list(product_name)))

合并后我有点迷茫，我什至不确定 groupby 在 python 中是否和在 R 中做同样的事情。

Answer 1

您正在查找 aggregate 或 agg 函数。因此你可以：

pd.merge(ordr_pr, prods, how='inner', on='product_id').groupby(order_id).agg({'product_name':list})

Python equivalent to dplyr's summarize