使用 apply() 函数在 pandas 中的 groupby 之后创建列表
Make list after groupby in pandas using apply() function
我有这个数据框:
c1 c2
0 B 1
1 A 2
2 B 5
3 A 3
4 A 7
我的目标是继续跟踪第 2 列中的值,基于第 1 列中用 (:) 分隔的字母,输出应如下所示:
c1 list
0 A 2:3:7
1 B 1:5
执行此操作的最 pythonic 方法是什么:
目前我可以按第 1 列进行分组,并且正在尝试使用 apply() 函数,但我不知道如何在新列中映射和制作此列表。
您可以使用groupby
>>> import pandas as pd
>>> df = pd.DataFrame({'c1': ['B', 'A', 'B', 'A', 'A'], 'c2': [1, 2, 5, 3, 7]})
>>>
>>> df.c2 = df.c2.astype(str)
>>> new_df = df.groupby("c1")['c2'].apply(":".join).reset_index()
>>> new_df
c1 c2
0 A 2:3:7
1 B 1:5
我想你可以做一个字符串连接
df = pandas.DataFrame({"c1":list("BABAA"),"c2":[1,2,5,3,7]})
df['c2'] = df['c2'].astype(str)
df.groupby('c1').agg({'c2':':'.join})
您可能会从
获得更多里程
df.groupby('c1').agg({'c2':list})
试试这个:
df = df.groupby("c1")["c2"].apply(lambda x: ":".join([str(i) for i in x])).reset_index()
我有这个数据框:
c1 c2
0 B 1
1 A 2
2 B 5
3 A 3
4 A 7
我的目标是继续跟踪第 2 列中的值,基于第 1 列中用 (:) 分隔的字母,输出应如下所示:
c1 list
0 A 2:3:7
1 B 1:5
执行此操作的最 pythonic 方法是什么:
目前我可以按第 1 列进行分组,并且正在尝试使用 apply() 函数,但我不知道如何在新列中映射和制作此列表。
您可以使用groupby
>>> import pandas as pd
>>> df = pd.DataFrame({'c1': ['B', 'A', 'B', 'A', 'A'], 'c2': [1, 2, 5, 3, 7]})
>>>
>>> df.c2 = df.c2.astype(str)
>>> new_df = df.groupby("c1")['c2'].apply(":".join).reset_index()
>>> new_df
c1 c2
0 A 2:3:7
1 B 1:5
我想你可以做一个字符串连接
df = pandas.DataFrame({"c1":list("BABAA"),"c2":[1,2,5,3,7]})
df['c2'] = df['c2'].astype(str)
df.groupby('c1').agg({'c2':':'.join})
您可能会从
获得更多里程df.groupby('c1').agg({'c2':list})
试试这个:
df = df.groupby("c1")["c2"].apply(lambda x: ":".join([str(i) for i in x])).reset_index()