在 R 中解码字符串向量
Decoding character strings vectors in R
假设您有一个包含编码字符串的原子向量:
string_encoding <- c("São Paulo", "Paraná")
有什么方法可以解码向量中的每个元素,返回与 ASCII、ISO-8859-1 或其他 class 编码相同长度的向量?
输出应该是:
expected_encoding <- c("Sao Paulo", "Parana")
使用stringi
,您可以:
stri_trans_general(string_encoding, "Latin-ASCII")
[1] "Sao Paulo" "Parana"
另一个选项可以是:
iconv(string_encoding, to='ASCII//TRANSLIT')
输出:
[1] "Sao Paulo" "Parana"
假设您有一个包含编码字符串的原子向量:
string_encoding <- c("São Paulo", "Paraná")
有什么方法可以解码向量中的每个元素,返回与 ASCII、ISO-8859-1 或其他 class 编码相同长度的向量?
输出应该是:
expected_encoding <- c("Sao Paulo", "Parana")
使用stringi
,您可以:
stri_trans_general(string_encoding, "Latin-ASCII")
[1] "Sao Paulo" "Parana"
另一个选项可以是:
iconv(string_encoding, to='ASCII//TRANSLIT')
输出:
[1] "Sao Paulo" "Parana"