经过训练的数据和测试数据具有不同数量的错误属性 "Train and test set are not compatible"
Trained and Test data have different number of attributes that gave an error "Train and test set are not compatible"
我使用 WEKA 进行文本分类,我已经训练了数据集,我应用了 StringToWOrdVector 和 NumericToNominal 过滤器,还有测试数据集并对其应用了相同的过滤器。
当我尝试将我的模型应用于测试数据时,它给了我以下错误
训练和测试集不兼容
我搜索了一个解决方案,发生错误是因为两组之间的属性数量不同,而且它总是不同,因为两组中的文本不同
请问我该如何解决这个错误?
你能做的最好的事情是将你的训练集和测试集合并到一个文件中,然后一次将过滤器应用于所有文件,然后再次将它们拆分并从组合中复制 @attribute
值文件到训练和测试文件中。这样两个文件的属性将保持一致。
我使用 WEKA 进行文本分类,我已经训练了数据集,我应用了 StringToWOrdVector 和 NumericToNominal 过滤器,还有测试数据集并对其应用了相同的过滤器。 当我尝试将我的模型应用于测试数据时,它给了我以下错误 训练和测试集不兼容 我搜索了一个解决方案,发生错误是因为两组之间的属性数量不同,而且它总是不同,因为两组中的文本不同
请问我该如何解决这个错误?
你能做的最好的事情是将你的训练集和测试集合并到一个文件中,然后一次将过滤器应用于所有文件,然后再次将它们拆分并从组合中复制 @attribute
值文件到训练和测试文件中。这样两个文件的属性将保持一致。