从 pandas 数据框的每个单元格中删除所有逗号
Get rid of all commas from each cell of a pandas dataframe
假设我有一个数据框如下:
d = {'col1': ['hello','nice to meet you', 'i like pudding, apples, bananas' ], 'col2': ['good','nice,cool','awesome']}
df = pd.DataFrame(data=d)
只要数据单元格中有逗号,我就想将字符串子集化为逗号之前的所有内容。例如
df.iloc[2,0] #should read "i like pudding"
df.iloc[1,1] #should read "nice"
我已经尝试 np.where() 并对字符串进行子集化,但在我的真实数据框中,同一字符串多次出现会变得很复杂。有没有简单的方法遍历所有单元格,检查逗号,然后将该字符串子集化为仅包含第一个逗号之前的字符?
您需要用逗号分隔每个单元格,然后保留第一个字符串。
df = df.applymap(lambda x: x.split(',')[0])
假设我有一个数据框如下:
d = {'col1': ['hello','nice to meet you', 'i like pudding, apples, bananas' ], 'col2': ['good','nice,cool','awesome']}
df = pd.DataFrame(data=d)
只要数据单元格中有逗号,我就想将字符串子集化为逗号之前的所有内容。例如
df.iloc[2,0] #should read "i like pudding"
df.iloc[1,1] #should read "nice"
我已经尝试 np.where() 并对字符串进行子集化,但在我的真实数据框中,同一字符串多次出现会变得很复杂。有没有简单的方法遍历所有单元格,检查逗号,然后将该字符串子集化为仅包含第一个逗号之前的字符?
您需要用逗号分隔每个单元格,然后保留第一个字符串。
df = df.applymap(lambda x: x.split(',')[0])