GSub 删除第一个数字之前的所有字符
GSub removing all characters before first digit
我正在使用 R 清理一些非常脏的地址。我想使用 gsub 删除字符串中第一个数字之前的所有字符,但似乎可以找出一个有效的正则表达式。有什么建议吗?
以下是三个数据示例:
C/O Bob Jones1071 Main St
请验证中心路 64 号
Joe's Bakery33 Pleasant Ave #4
你可以这样试试
library(dplyr)
library(stringr)
df %>%
mutate(V2 = str_extract_all(V1, "\d+.*"))
# V1 V2
# 1 C/O Bob Jones1071 Main St 1071 Main St
# 2 PLEASE ADDRESS VERIFY64 Center Road 64 Center Road
# 3 Joes Bakery33 Pleasant Ave #4 33 Pleasant Ave #4
数据
structure(list(V1 = c("C/O Bob Jones1071 Main St", "PLEASE ADDRESS VERIFY64 Center Road",
"Joes Bakery33 Pleasant Ave #4")), class = "data.frame", row.names = c(NA,
-3L))
我正在使用 R 清理一些非常脏的地址。我想使用 gsub 删除字符串中第一个数字之前的所有字符,但似乎可以找出一个有效的正则表达式。有什么建议吗?
以下是三个数据示例:
C/O Bob Jones1071 Main St
请验证中心路 64 号
Joe's Bakery33 Pleasant Ave #4
你可以这样试试
library(dplyr)
library(stringr)
df %>%
mutate(V2 = str_extract_all(V1, "\d+.*"))
# V1 V2
# 1 C/O Bob Jones1071 Main St 1071 Main St
# 2 PLEASE ADDRESS VERIFY64 Center Road 64 Center Road
# 3 Joes Bakery33 Pleasant Ave #4 33 Pleasant Ave #4
数据
structure(list(V1 = c("C/O Bob Jones1071 Main St", "PLEASE ADDRESS VERIFY64 Center Road",
"Joes Bakery33 Pleasant Ave #4")), class = "data.frame", row.names = c(NA,
-3L))