处理西里尔字母的编码

Dealing with an encoding for Cyrillic

我不确定如何处理这种编码。我在这个文件中得到了 5k 个最常见的俄语单词,数据如下所示:

1 36358.94 Ë misc
2 27792.36 ‚ prep
3 20689.51 ÌÂ misc
4 18942.62 ÓÌ pron
5 16588.14 ̇ prep
6 15631.11 ˇ pron
7 12546.08 ˜ÚÓ misc...

我知道每行的第三个单词是西里尔字母,但是,我不知道如何将这些字符变成西里尔字母。如果有人能提供帮助,那就太好了。

你可以试试windows-1251编码,应该会有帮助。