如何在词义消歧中为weka准备数据

How to prepare data for weka in word sense disambiguation

我想用weka来进行词义消歧。我准备了一些包含波斯语句子、制表符、波斯语单词、制表符和英文单词的文件。它们在 notepad++ 中以 txt 格式。现在我应该如何将这些文件用于weka？我应该如何改变它们？

我找到了。这些文件应具有相同的列数。所以我把句子放在引号里，然后是逗号和英文单词。在这些之上，我们应该写出适当的关系和属性。