正则表达式 jupyter 笔记本

Regex jupyter notebook

我需要你的帮助来在 Jupyter notebook 中构建正则表达式。 我在数据框中有一列包含美国地址的列。 还有一些街道的开头是一个字母:

西日落大道

南佛蒙特大道

N 藤街

东街 59 街

威尔希尔大道

贝弗利大道

如何使用正则表达式去除街道名称开头的那些单个字母? 我已经构建了这个,但它不起作用:

rest_data['street_name'] = rest_data['street_name'].replace('^[NESW]\s','',正则表达式=真)

你能帮我解决这个问题吗?或者也许用更好的东西代替它? 提前致谢!

我认为您的正则表达式可以正确提取,但不能替换。您可能在 replace 方法中放错了参数。

官网语法如下:

DataFrame.replace(to_replace=None, value=None, inplace=False, limit=None, regex=False, method='pad')

我认为您的代码应替换为以下代码:

 rest_data['street_names'] = rest_data['street_names'].replace(to_replace="^\s[NEWS]\s", value='', regex=True)

它对我有用:

我只是假设在删除数字和符号后,字符串前面可能有白色 space,所以对正则表达式稍加修正就可以了。

Latest_Output