Dataframe Column into Multiple Columns by delimiter ',' : expand = True, n =-1
Dataframe Column into Multiple Columns by delimiter ',' : expand = True, n =-1
我的第一个问题,谢谢)抱歉冗长的公式在这里输入图片描述
研究了所有相关帖子
我有什么
- 我的 Dataframe 列(请参阅屏幕截图)是由定界符 ',' Car parameters 分隔的字符串。
我的数据框:-
- 一些行带有里程,而另一些则没有(截图)因此一些行的分隔符较少。
任务
需要创建 5 列(最大分隔符数)来单独存储汽车参数(里程、变速箱、马力、车身等)
如果某行没有Mileage则在Mileage列填0
我所知道的并且运作良好
df["name"].str.split(" ", expand = True)
默认 n=-1
并拆分为必要的列
示例:
问题:
- 如果我使用
str.split(" ", expand = True)
方法 - GearBox (ATM) 被错误地放在新创建的 Mileage 列下,因为该行缺少一个分隔符(屏幕截图)
结果:-
-
您可以像下面这样尝试将 lambda 函数与列表串联相结合。
>>> import pandas as pd
>>> df = pd.DataFrame([['1,2,3,4,5'],['2,3,4,5']], columns=["CarParameters"])
>>> print(pd.DataFrame(df.CarParameters.apply(
lambda x: str(x).split(',')).apply(
lambda x: [0]*(5-len(x)) + x).to_list(), columns=list("ABCDE")))
A B C D E
0 1 2 3 4 5
1 0 2 3 4 5
我的第一个问题,谢谢)抱歉冗长的公式在这里输入图片描述 研究了所有相关帖子
我有什么
- 我的 Dataframe 列(请参阅屏幕截图)是由定界符 ',' Car parameters 分隔的字符串。
我的数据框:-
- 一些行带有里程,而另一些则没有(截图)因此一些行的分隔符较少。
任务
需要创建 5 列(最大分隔符数)来单独存储汽车参数(里程、变速箱、马力、车身等)
如果某行没有Mileage则在Mileage列填0
我所知道的并且运作良好
df["name"].str.split(" ", expand = True)
默认 n=-1
并拆分为必要的列
示例:
问题:
- 如果我使用
str.split(" ", expand = True)
方法 - GearBox (ATM) 被错误地放在新创建的 Mileage 列下,因为该行缺少一个分隔符(屏幕截图)
结果:-
-
您可以像下面这样尝试将 lambda 函数与列表串联相结合。
>>> import pandas as pd
>>> df = pd.DataFrame([['1,2,3,4,5'],['2,3,4,5']], columns=["CarParameters"])
>>> print(pd.DataFrame(df.CarParameters.apply(
lambda x: str(x).split(',')).apply(
lambda x: [0]*(5-len(x)) + x).to_list(), columns=list("ABCDE")))
A B C D E
0 1 2 3 4 5
1 0 2 3 4 5