在 R 中解码字符串向量

Decoding character strings vectors in R

假设您有一个包含编码字符串的原子向量:

string_encoding <- c("São Paulo", "Paraná")

有什么方法可以解码向量中的每个元素,返回与 ASCII、ISO-8859-1 或其他 class 编码相同长度的向量?

输出应该是:

expected_encoding <- c("Sao Paulo", "Parana")

使用stringi,您可以:

stri_trans_general(string_encoding, "Latin-ASCII")

[1] "Sao Paulo" "Parana"

另一个选项可以是:

iconv(string_encoding, to='ASCII//TRANSLIT')

输出:

[1] "Sao Paulo" "Parana"