计算数据框中的重复单词 pandas

Question

我有一个包含人们对 T 恤的订单的数据框。 df['Order'] 是包含每个客户订单的列名。我想计算 Burger M、Donut L、Ice Cream L 等针对不同设计和尺寸出现的次数，然后将它们绘制在条形图上。我尝试了 groupby 和计数，但它仅基于每个角色中的相同项目，它不计算单个单词。

Customer name     Order
Sam Doe           Donut L, Burger L, Burger M
John Doe          Burger M
Sammy Doe         Burger M, Donut L
Jonny Doe         Burger L

Answer 1

一些事情：

orders = df['Order'].str.split(', ').explode().value_counts()

orders.plot.bar()

或者：

orders = df['Order'].str.get_dummies(', ').sum()

orders.plot.bar()

计算数据框中的重复单词 pandas

Counting repeated word in dataframe pandas

python

count

dataframe

pandas

jupyter