正则表达式 jupyter 笔记本

Question

我需要你的帮助来在 Jupyter notebook 中构建正则表达式。我在数据框中有一列包含美国地址的列。还有一些街道的开头是一个字母：

西日落大道

南佛蒙特大道

N 藤街

东街 59 街

威尔希尔大道

贝弗利大道

如何使用正则表达式去除街道名称开头的那些单个字母？我已经构建了这个，但它不起作用：

rest_data['street_name'] = rest_data['street_name'].replace('^[NESW]\s','',正则表达式=真）

你能帮我解决这个问题吗？或者也许用更好的东西代替它？提前致谢！

Answer 1

我认为您的正则表达式可以正确提取，但不能替换。您可能在 replace 方法中放错了参数。

官网语法如下：

DataFrame.replace(to_replace=None, value=None, inplace=False, limit=None, regex=False, method='pad')

我认为您的代码应替换为以下代码：

 rest_data['street_names'] = rest_data['street_names'].replace(to_replace="^\s[NEWS]\s", value='', regex=True)

它对我有用：

我只是假设在删除数字和符号后，字符串前面可能有白色 space，所以对正则表达式稍加修正就可以了。

Latest_Output

Regex jupyter notebook