如何在词义消歧中为weka准备数据

How to prepare data for weka in word sense disambiguation

我想用weka来进行词义消歧。我准备了一些包含波斯语句子、制表符、波斯语单词、制表符和英文单词的文件。它们在 notepad++ 中以 txt 格式。现在我应该如何将这些文件用于weka?我应该如何改变它们?

示例文件: https://www.dropbox.com/s/o7wtvrvkiir80la/F.txt?dl=0

我找到了。这些文件应具有相同的列数。所以我把句子放在引号里,然后是逗号和英文单词。在这些之上,我们应该写出适当的关系和属性。