将 Pandas 系列转换为 Set 用逗号拆分系列中的值
Converting Pandas Series to Set splits values in series with commas
我是 Pandas 的新手。我想从 pandas 系列中提取一些字符串 returned(csv 中名为 'lots' 的列下的一堆值)并将它们放入一个集合中。为此我写了以下内容:
setbincsv_df = bincsv_df['lots'].apply(set)
print(setbincsv_df )
但是该 print 语句产生的输出采用该系列中的一个值,如 "OP" 并将其显示为 136 {P, O}。它不仅不会分裂它,而且会逆转它。
后 5 项 return编辑:
**"132 {I, F}"
"133 {E, F}"
"134 {W, I}"
"135 {V, H}"
"136 {P, O}"**
我希望它 return 与系列 "OP" 中的价值相同。为什么会这样?
如果您使用 apply,则将设置操作应用于每一行的字符串。
例如,如果您有 "pull"
这个词
print(set("pull"))
{'p','u','l'}
你可能想要做的是 set(series):
df = pd.DataFrame({'lots':['ai','cd','ai','drgf']})
print(set(df['lots']) )
输出
{'cd', 'ai', 'drgf'}
我是 Pandas 的新手。我想从 pandas 系列中提取一些字符串 returned(csv 中名为 'lots' 的列下的一堆值)并将它们放入一个集合中。为此我写了以下内容:
setbincsv_df = bincsv_df['lots'].apply(set)
print(setbincsv_df )
但是该 print 语句产生的输出采用该系列中的一个值,如 "OP" 并将其显示为 136 {P, O}。它不仅不会分裂它,而且会逆转它。
后 5 项 return编辑:
**"132 {I, F}"
"133 {E, F}"
"134 {W, I}"
"135 {V, H}"
"136 {P, O}"**
我希望它 return 与系列 "OP" 中的价值相同。为什么会这样?
如果您使用 apply,则将设置操作应用于每一行的字符串。 例如,如果您有 "pull"
这个词print(set("pull"))
{'p','u','l'}
你可能想要做的是 set(series):
df = pd.DataFrame({'lots':['ai','cd','ai','drgf']})
print(set(df['lots']) )
输出
{'cd', 'ai', 'drgf'}