移除 "No break space"

Remove "No break space"

我在文本的某些位置有这些 <U+00A0>。我已经尝试像这样使用删除它:

Text<- gsub("<U+00A0>"," ",Text)

但这似乎只有在单词前面时才有效。它仍然像这样保留在文本中:

"In<U+00A0>conclusion"

希望你能明白我想说的意思。

我认为你必须使用 \

来转义 '+' 符号
Text<- gsub(pattern = "<U\+00A0>"," ",Text)


> Text <- "In<U+00A0>conclusion"
> gsub(pattern = "<U\+00A0>"," ",Text)
[1] "In conclusion"

这不如 wolf_wue 的回答好。但是,如果所有“<U+00A0>”都位于字符串的最后一位,则可以使用 "substr" 函数只保留字符串的其余部分。

# head(WEA$Text)
# [1] "0.0<U+00A0>" "0.0<U+00A0>" "0.0<U+00A0>" "0.0<U+00A0>" "0.0<U+00A0>" 

Text =substr(Text, 1, nchar(WEA$Prcp)-8)
head(Text)
[1] "0.0" "0.0" "0.0" "0.0" "0.0" "0.0"

正确的方法是使用 \uXXXX 语法,例如Text <- gsub("\u00A0", " ", Text)