计算数据框中的重复单词 pandas
Counting repeated word in dataframe pandas
我有一个包含人们对 T 恤的订单的数据框。 df['Order']
是包含每个客户订单的列名。我想计算 Burger M
、Donut L
、Ice Cream L
等针对不同设计和尺寸出现的次数,然后将它们绘制在条形图上。我尝试了 groupby 和计数,但它仅基于每个角色中的相同项目,它不计算单个单词。
Customer name Order
Sam Doe Donut L, Burger L, Burger M
John Doe Burger M
Sammy Doe Burger M, Donut L
Jonny Doe Burger L
一些事情:
orders = df['Order'].str.split(', ').explode().value_counts()
orders.plot.bar()
或者:
orders = df['Order'].str.get_dummies(', ').sum()
orders.plot.bar()
我有一个包含人们对 T 恤的订单的数据框。 df['Order']
是包含每个客户订单的列名。我想计算 Burger M
、Donut L
、Ice Cream L
等针对不同设计和尺寸出现的次数,然后将它们绘制在条形图上。我尝试了 groupby 和计数,但它仅基于每个角色中的相同项目,它不计算单个单词。
Customer name Order
Sam Doe Donut L, Burger L, Burger M
John Doe Burger M
Sammy Doe Burger M, Donut L
Jonny Doe Burger L
一些事情:
orders = df['Order'].str.split(', ').explode().value_counts()
orders.plot.bar()
或者:
orders = df['Order'].str.get_dummies(', ').sum()
orders.plot.bar()