如何更改不同语言环境的字母?

How to change letters in different locale?

我使用以下命令阅读了 HTML 文本: text <- read_html("linkoftext") 结果是:

"Veri analizi, farklı iş, bilim ve sosyal bilim alanlarında çeşitli isimler altında çeşitli teknikleri kapsayan çok yönlü ve farklı yaklaşımlara sahiptir. Veri entegrasyonu veri analizinin öncüsüdür."

此文本包含“ş ç ü ö ı”等字母。我需要将它们替换为 "s c u o i"。我写了下面的代码:

string <- "ş ç ı ğ ü ö f s x q"
chartr("ş ç ı ğ ü ö", "s c i g u o", string)

如何将上面的代码应用到我的文本中,因为我仍然有这些字母作为 chartr 的输出?

您的区域设置不同于本地设置,即土耳其语。因此,要更改语言环境,您可以使用 Sys.setlocale 函数,请参见下面的代码:

Sys.setlocale("LC_CTYPE", "Turkish") # switch to Turkish locale
string <- "ş ç ı ğ ü ö f s x q"
string
# [1] "ş ç ı ğ ü ö f s x q"

chartr("şçığüö", "sciguo", string)
# [1] "s c i g u o f s x q"

Sys.setlocale("LC_CTYPE", "") # switch to native locale