将 utf8 转换为 windows-1256

Convert utf8 to windows-1256

我有两个文件。一个是 utf-8,另一个我认为是 windows-1256。我想统一他们的编码(一个是训练集,一个是测试集)

utf-8 文件:

سلمانی را به توافق بگیر
وقتی یک مرد محترم شصت ساله ، در یک جامه قهوه‌ای رسمی ، خوش لباس ، ولی خیلی خوب نگه داشته

windows-1256 文件:

äÇåí Èå äãÇíÔÇå ÂËÇÑ åäÑí ÇÍãÏ ØÈÇØÈÇíí 
ãæÖæÚ ÂËÇÑ ØÈÇØÈÇíí ãæÑÇä åÓÊäÏ æáí ÏÑ ÈÇØä äíä ÙÇåÑí¡ Çíä 

我尝试了多种在线工具,但是当我将 utf-8 转换为 1256 时,它看起来与其他文件完全不同,当我将 1256 转换为 utf-8 时,它一点也没有改变!

问题已解决。我使用了这个命令:

iconv -f UTF-8 -t WINDOWS-1256//TRANSLIT --output=Ham.txt Ham-utf

问题是我的 windows-1256 文件太大了。我将其中的一部分复制到一个名为 ham-mini 的单独文件中。复制它的一部分是问题并且损坏了文件。我对原始文件使用了上面的命令,问题得到解决。