在 R 中解码字符串向量

Question

假设您有一个包含编码字符串的原子向量：

string_encoding <- c("São Paulo", "Paraná")

有什么方法可以解码向量中的每个元素，返回与 ASCII、ISO-8859-1 或其他 class 编码相同长度的向量？

输出应该是：

expected_encoding <- c("Sao Paulo", "Parana")

Answer 1

使用stringi，您可以：

stri_trans_general(string_encoding, "Latin-ASCII")

[1] "Sao Paulo" "Parana"

Answer 2

另一个选项可以是：

iconv(string_encoding, to='ASCII//TRANSLIT')

输出：

[1] "Sao Paulo" "Parana"

Decoding character strings vectors in R