正则表达式 jupyter 笔记本
Regex jupyter notebook
我需要你的帮助来在 Jupyter notebook 中构建正则表达式。
我在数据框中有一列包含美国地址的列。
还有一些街道的开头是一个字母:
西日落大道
南佛蒙特大道
N 藤街
东街 59 街
威尔希尔大道
贝弗利大道
如何使用正则表达式去除街道名称开头的那些单个字母?
我已经构建了这个,但它不起作用:
rest_data['street_name'] = rest_data['street_name'].replace('^[NESW]\s','',正则表达式=真)
你能帮我解决这个问题吗?或者也许用更好的东西代替它?
提前致谢!
我认为您的正则表达式可以正确提取,但不能替换。您可能在 replace 方法中放错了参数。
官网语法如下:
DataFrame.replace(to_replace=None, value=None, inplace=False, limit=None, regex=False, method='pad')
我认为您的代码应替换为以下代码:
rest_data['street_names'] = rest_data['street_names'].replace(to_replace="^\s[NEWS]\s", value='', regex=True)
它对我有用:
我只是假设在删除数字和符号后,字符串前面可能有白色 space,所以对正则表达式稍加修正就可以了。
Latest_Output
我需要你的帮助来在 Jupyter notebook 中构建正则表达式。 我在数据框中有一列包含美国地址的列。 还有一些街道的开头是一个字母:
西日落大道
南佛蒙特大道
N 藤街
东街 59 街
威尔希尔大道
贝弗利大道
如何使用正则表达式去除街道名称开头的那些单个字母? 我已经构建了这个,但它不起作用:
rest_data['street_name'] = rest_data['street_name'].replace('^[NESW]\s','',正则表达式=真)
你能帮我解决这个问题吗?或者也许用更好的东西代替它? 提前致谢!
我认为您的正则表达式可以正确提取,但不能替换。您可能在 replace 方法中放错了参数。
官网语法如下:
DataFrame.replace(to_replace=None, value=None, inplace=False, limit=None, regex=False, method='pad')
我认为您的代码应替换为以下代码:
rest_data['street_names'] = rest_data['street_names'].replace(to_replace="^\s[NEWS]\s", value='', regex=True)
它对我有用:
我只是假设在删除数字和符号后,字符串前面可能有白色 space,所以对正则表达式稍加修正就可以了。
Latest_Output