删除 R 中字符串中的特定第一项

Question

我有这样的字符串：

'THE HOUSE'

'IN THE HOUSE'

'THE THE HOUSE'

我想删除 'THE' 仅当它出现在字符串的第一个位置时。

我知道如何删除 'THE'：

gsub("\<THE\>", "",  string)

而且我知道如何抓住第一个词：

"([A-Za-z]+)" or "([[:alpha:]]+)"or "(\w+)"

但不知道如何将两者结合起来最终得到：

'HOUSE'

'IN THE HOUSE'

'THE HOUSE'

干杯！

Answer 1

您可以使用

string <- c("THE HOUSE", "IN THE HOUSE", "THE THE HOUSE")
sub("^THE\b\s*", "", string)
## => [1] "HOUSE"        "IN THE HOUSE" "THE HOUSE"

详情

Removing a specific first item in a string in R