Weka 中的关系数据?
Relational data in Weka?
我有这种格式的数据:我有数据量和每个函数的处理时间的元组。我想按 "class" 属性
进行分类
这是一个示例:
Amount-F1 Time-F1 Amount-F2 Time-F2 [...] Class
50 10 20 10 1
20 2 100 20 3
...
我应该如何构建 arff 文件?我应该为 (Ammount,Time) 元组使用关系属性还是应该使用 "regular" 属性?
你能为我的示例制作一个示例 arff 文件吗?
谢谢
WEKA 也可以处理 csv 文件。但是如果你想使用 arff-format,WEKA 确实支持:
weka.core.converters.ArffSaver / weka.core.converters.CSVLoader
您可以将每个元组拆分为2个独立的特征:
@RELATION yourTable
@ATTRIBUTE Amount-F1 NUMERIC
@ATTRIBUTE Time-F1 NUMERIC
@ATTRIBUTE Amount-F2 NUMERIC
@ATTRIBUTE Time-F2 NUMERIC
@ATTRIBUTE Amount-F3 NUMERIC
@ATTRIBUTE Time-F3 NUMERIC
...
@ATTRIBUTE Class {1,2,3} % your class labels
@DATA
50, 10, 20, 10, 1
20, 2, 100, 20, 3
...
或使用时间和数量的聚合:
金额-F1和时间-F1为F1:
@RELATION yourTable
@ATTRIBUTE F1 NUMERIC
@ATTRIBUTE F2 NUMERIC
@ATTRIBUTE F3 NUMERIC
...
@ATTRIBUTE Class {1,2,3} % your class labels
@DATA
5, 2, 1 % 50/10, 20/10, 1
10, 5, 3 % 20/2, 100/20, 3
...
根据使用情况,通常我更喜欢第二个选项。
我有这种格式的数据:我有数据量和每个函数的处理时间的元组。我想按 "class" 属性
进行分类这是一个示例:
Amount-F1 Time-F1 Amount-F2 Time-F2 [...] Class
50 10 20 10 1
20 2 100 20 3
...
我应该如何构建 arff 文件?我应该为 (Ammount,Time) 元组使用关系属性还是应该使用 "regular" 属性?
你能为我的示例制作一个示例 arff 文件吗?
谢谢
WEKA 也可以处理 csv 文件。但是如果你想使用 arff-format,WEKA 确实支持: weka.core.converters.ArffSaver / weka.core.converters.CSVLoader
您可以将每个元组拆分为2个独立的特征:
@RELATION yourTable
@ATTRIBUTE Amount-F1 NUMERIC
@ATTRIBUTE Time-F1 NUMERIC
@ATTRIBUTE Amount-F2 NUMERIC
@ATTRIBUTE Time-F2 NUMERIC
@ATTRIBUTE Amount-F3 NUMERIC
@ATTRIBUTE Time-F3 NUMERIC
...
@ATTRIBUTE Class {1,2,3} % your class labels
@DATA
50, 10, 20, 10, 1
20, 2, 100, 20, 3
...
或使用时间和数量的聚合:
金额-F1和时间-F1为F1:
@RELATION yourTable
@ATTRIBUTE F1 NUMERIC
@ATTRIBUTE F2 NUMERIC
@ATTRIBUTE F3 NUMERIC
...
@ATTRIBUTE Class {1,2,3} % your class labels
@DATA
5, 2, 1 % 50/10, 20/10, 1
10, 5, 3 % 20/2, 100/20, 3
...
根据使用情况,通常我更喜欢第二个选项。