Weka - 加载 UTF-8 编码的 csv

Weka - load UTF-8 encoded csv

Weka 3.7.13 中有没有办法加载 UTF-8 编码文件而不将它们转换为 ANSII?

我正在尝试加载一个包含字符串属性的csv文件,其值可以包含表情符号,我不需要丢失它们。

这样做是很有可能的。请参阅此 link,它描述了如何从命令行或 GUI 执行此操作。

如果使用命令行添加此参数-Dfile.encoding=utf-8

如果使用 GUI,则编辑 RunWEKA.ini 文件。将 fileEncoding 占位符更改为 utf-8.

为了完整起见,如果您以编程方式使用 weka,则需要将 IDE 的编码更改为 utf-8 以便处理 utf-8 编码数据。