GSub 删除第一个数字之前的所有字符

GSub removing all characters before first digit

我正在使用 R 清理一些非常脏的地址。我想使用 gsub 删除字符串中第一个数字之前的所有字符,但似乎可以找出一个有效的正则表达式。有什么建议吗?

以下是三个数据示例:

C/O Bob Jones1071 Main St

请验证中心路 64 号

Joe's Bakery33 Pleasant Ave #4

你可以这样试试

library(dplyr)
library(stringr)
df %>% 
  mutate(V2 = str_extract_all(V1, "\d+.*"))
#                             V1                 V2
# 1           C/O Bob Jones1071 Main St       1071 Main St
# 2 PLEASE ADDRESS VERIFY64 Center Road     64 Center Road
# 3       Joes Bakery33 Pleasant Ave #4 33 Pleasant Ave #4

数据

structure(list(V1 = c("C/O Bob Jones1071 Main St", "PLEASE ADDRESS VERIFY64 Center Road", 
"Joes Bakery33 Pleasant Ave #4")), class = "data.frame", row.names = c(NA, 
-3L))