Weka 中的关系数据?

Relational data in Weka?

我有这种格式的数据:我有数据量和每个函数的处理时间的元组。我想按 "class" 属性

进行分类

这是一个示例:

Amount-F1 Time-F1 Amount-F2 Time-F2 [...] Class
50         10      20        10            1
20         2       100       20            3
...

我应该如何构建 arff 文件?我应该为 (Ammount,Time) 元组使用关系属性还是应该使用 "regular" 属性?

你能为我的示例制作一个示例 arff 文件吗?

谢谢

WEKA 也可以处理 csv 文件。但是如果你想使用 arff-format,WEKA 确实支持: weka.core.converters.ArffSaver / weka.core.converters.CSVLoader

您可以将每个元组拆分为2个独立的特征:

@RELATION yourTable

@ATTRIBUTE Amount-F1 NUMERIC
@ATTRIBUTE Time-F1 NUMERIC
@ATTRIBUTE Amount-F2 NUMERIC
@ATTRIBUTE Time-F2 NUMERIC
@ATTRIBUTE Amount-F3 NUMERIC
@ATTRIBUTE Time-F3 NUMERIC
...
@ATTRIBUTE Class {1,2,3} % your class labels

@DATA
50, 10, 20, 10, 1
20, 2, 100, 20, 3
...

或使用时间数量聚合

金额-F1时间-F1F1:

@RELATION yourTable

@ATTRIBUTE F1 NUMERIC
@ATTRIBUTE F2 NUMERIC
@ATTRIBUTE F3 NUMERIC
...
@ATTRIBUTE Class {1,2,3} % your class labels

@DATA
5, 2, 1    % 50/10, 20/10, 1
10, 5, 3   % 20/2, 100/20, 3
...

根据使用情况,通常我更喜欢第二个选项。