在 Pandas 数据框中编辑字符串

Editing Strings in a Pandas Dataframe

我有一个 pandas 数据框,如下所示:

Date   Title 
Jan 1  Washington Running
Jan 2  Jefferson City Cycling
Jan 3  Springfield Running
...

如何从所有标题中删除单词“运行”或“Cycling”?我想得到:

Date   Title 
Jan 1  Washington
Jan 2  Jefferson City
Jan 3  Springfield
...

您需要使用 pandas 的字符串修饰符。这是 pandas.Series.str.replace()docs。它比普通替换稍快。

Mechanical_meat 很棒的一行方法也适用于 .str.replace()

df['Title'].str.replace(r'(\bRunning\b|\bCycling\b)','',regex=True)

我想我会提供使用 df['Title'].str.replace('Running','')df['Title'].str.replace('Cycling','') 的替代方案。为什么要分两步进行?它避免了可能“昂贵”的正则表达式。 运行 a timeit 对于小数据帧,虽然发现 运行 替换两次的开销明显高于正则表达式的成本。我想对于更大的数据帧它只会变得更糟。