Python相当于dplyr的summarize
Python equivalent to dplyr's summarize
python 中是否存在像 R 中那样的 summarize
函数?!
我正在研究频繁项集先验算法并正在寻找一个好的数据集。我找到了一个 here
我可以阅读和理解 R,但不知道 Python 中是否存在 summarize
函数:
在 R 这个笔记本中有:
order_baskets <- ordr_pr %>%
inner_join(prods, by="product_id") %>%
group_by(order_id) %>%
summarise(basket = as.vector(list(product_name)))
在 python 我只想:
pd.merge(ordr_pr, prods, how='inner', on='product_id')
.groupby(order_id)
# summarize( basket = as.vector(list(product_name)))
合并后我有点迷茫,我什至不确定 groupby
在 python 中是否和在 R 中做同样的事情。
您正在查找 aggregate
或 agg
函数。因此你可以:
pd.merge(ordr_pr, prods, how='inner', on='product_id').groupby(order_id).agg({'product_name':list})
python 中是否存在像 R 中那样的 summarize
函数?!
我正在研究频繁项集先验算法并正在寻找一个好的数据集。我找到了一个 here
我可以阅读和理解 R,但不知道 Python 中是否存在 summarize
函数:
在 R 这个笔记本中有:
order_baskets <- ordr_pr %>%
inner_join(prods, by="product_id") %>%
group_by(order_id) %>%
summarise(basket = as.vector(list(product_name)))
在 python 我只想:
pd.merge(ordr_pr, prods, how='inner', on='product_id')
.groupby(order_id)
# summarize( basket = as.vector(list(product_name)))
合并后我有点迷茫,我什至不确定 groupby
在 python 中是否和在 R 中做同样的事情。
您正在查找 aggregate
或 agg
函数。因此你可以:
pd.merge(ordr_pr, prods, how='inner', on='product_id').groupby(order_id).agg({'product_name':list})