与 python pandas 的数据争论
Data wrangling with python pandas
我正在努力对 pandas 数据帧进行一些数据整理。我已经被这个问题困扰了 2 天了。
我有一个如下所示的数据框:
['a','e']
['b','f']
['c','g']
['d','h']
['a','i']
['b','j']
['c','k']
['d','l']
我需要把它变成这样
['a',['e','i']]
['b',['f','j']]
['c',['g','k']]
['d',['h','l']]
所以基本上围绕第一列旋转原始数据框,然后从第二列创建一个字符串列表。
谢谢
您可以使用 groupy/agg
:
import pandas as pd
data = [['a','e'], ['b','f'], ['c','g'], ['d','h'], ['a','i'], ['b','j'],
['c','k'], ['d','l']]
df = pd.DataFrame(data, columns=['first', 'second'])
print(df.groupby(['first']).agg(lambda x: x.tolist()))
产量
second
first
a [e, i]
b [f, j]
c [g, k]
d [h, l]
我正在努力对 pandas 数据帧进行一些数据整理。我已经被这个问题困扰了 2 天了。
我有一个如下所示的数据框:
['a','e']
['b','f']
['c','g']
['d','h']
['a','i']
['b','j']
['c','k']
['d','l']
我需要把它变成这样
['a',['e','i']]
['b',['f','j']]
['c',['g','k']]
['d',['h','l']]
所以基本上围绕第一列旋转原始数据框,然后从第二列创建一个字符串列表。
谢谢
您可以使用 groupy/agg
:
import pandas as pd
data = [['a','e'], ['b','f'], ['c','g'], ['d','h'], ['a','i'], ['b','j'],
['c','k'], ['d','l']]
df = pd.DataFrame(data, columns=['first', 'second'])
print(df.groupby(['first']).agg(lambda x: x.tolist()))
产量
second
first
a [e, i]
b [f, j]
c [g, k]
d [h, l]