如何按列对数据框进行分组?

How to group a dataframe by a column?

所以我这里有这个数据框。我想制作一个出现次数最多的国家的饼图。为了让我的标签正确,我需要创建一个名为 'countries' 的列表,该列表以出现次数最多的国家/地区开头,以出现一次的国家/地区结束。我该怎么做呢?

我不确定我是否让你康复了,但也许这是一个解决方案:

df = sorted(your_df, key = your_df.loc[:, ["Nationality"]].count, reverse = True)

您的问题是关于按频率对元素进行排序的问题

使用默认排序的Series.value_counts,所以获取索引并将它们转换为列表:

countries = df["Nationality"].value_counts().index.tolist()