移除 "No break space"
Remove "No break space"
我在文本的某些位置有这些 <U+00A0>
。我已经尝试像这样使用删除它:
Text<- gsub("<U+00A0>"," ",Text)
但这似乎只有在单词前面时才有效。它仍然像这样保留在文本中:
"In<U+00A0>conclusion"
希望你能明白我想说的意思。
我认为你必须使用 \
来转义 '+'
符号
Text<- gsub(pattern = "<U\+00A0>"," ",Text)
> Text <- "In<U+00A0>conclusion"
> gsub(pattern = "<U\+00A0>"," ",Text)
[1] "In conclusion"
这不如 wolf_wue 的回答好。但是,如果所有“<U+00A0>
”都位于字符串的最后一位,则可以使用 "substr" 函数只保留字符串的其余部分。
# head(WEA$Text)
# [1] "0.0<U+00A0>" "0.0<U+00A0>" "0.0<U+00A0>" "0.0<U+00A0>" "0.0<U+00A0>"
Text =substr(Text, 1, nchar(WEA$Prcp)-8)
head(Text)
[1] "0.0" "0.0" "0.0" "0.0" "0.0" "0.0"
正确的方法是使用 \uXXXX
语法,例如Text <- gsub("\u00A0", " ", Text)
我在文本的某些位置有这些 <U+00A0>
。我已经尝试像这样使用删除它:
Text<- gsub("<U+00A0>"," ",Text)
但这似乎只有在单词前面时才有效。它仍然像这样保留在文本中:
"In<U+00A0>conclusion"
希望你能明白我想说的意思。
我认为你必须使用 \
'+'
符号
Text<- gsub(pattern = "<U\+00A0>"," ",Text)
> Text <- "In<U+00A0>conclusion"
> gsub(pattern = "<U\+00A0>"," ",Text)
[1] "In conclusion"
这不如 wolf_wue 的回答好。但是,如果所有“<U+00A0>
”都位于字符串的最后一位,则可以使用 "substr" 函数只保留字符串的其余部分。
# head(WEA$Text)
# [1] "0.0<U+00A0>" "0.0<U+00A0>" "0.0<U+00A0>" "0.0<U+00A0>" "0.0<U+00A0>"
Text =substr(Text, 1, nchar(WEA$Prcp)-8)
head(Text)
[1] "0.0" "0.0" "0.0" "0.0" "0.0" "0.0"
正确的方法是使用 \uXXXX
语法,例如Text <- gsub("\u00A0", " ", Text)