将 Pandas 系列转换为 Set 用逗号拆分系列中的值

Converting Pandas Series to Set splits values in series with commas

我是 Pandas 的新手。我想从 pandas 系列中提取一些字符串 returned(csv 中名为 'lots' 的列下的一堆值)并将它们放入一个集合中。为此我写了以下内容:

setbincsv_df = bincsv_df['lots'].apply(set)
print(setbincsv_df )

但是该 print 语句产生的输出采用该系列中的一个值,如 "OP" 并将其显示为 136 {P, O}。它不仅不会分裂它,而且会逆转它。

后 5 项 return编辑:

**"132    {I, F}"
"133    {E, F}"
"134    {W, I}"
"135    {V, H}"
"136    {P, O}"**

我希望它 return 与系列 "OP" 中的价值相同。为什么会这样?

如果您使用 apply,则将设置操作应用于每一行的字符串。 例如,如果您有 "pull"

这个词
print(set("pull"))
{'p','u','l'}

你可能想要做的是 set(series):

df = pd.DataFrame({'lots':['ai','cd','ai','drgf']})


print(set(df['lots']) )

输出

{'cd', 'ai', 'drgf'}