ELKI:结果的标准化撤消
ELKI: Normalization undo for result
我正在使用 ELKI MiniGUI 运行 LOF。我已经找到如何通过 -dbc.filter
在 运行ning 之前规范化数据,但我想查看原始数据记录而不是输出中的规范化数据。
好像有一个flag叫-normUndo
,用命令行可以设置,但是在MiniGUI里不知道怎么用。
此功能曾经存在于 ELKI 中,但实际上已被删除(目前)。
- 只有少数规范化支持这一点,大多数都会失败。
- 可视化不再是定义明确的 "end"。一些用户希望可视化标准化数据,而另一些则不需要。
- 它需要携带规范化信息,这使得数据结构更加复杂(尽管我们现在的分层方法将再次允许这样做)
- 由于浮点数学的数值不精确,您经常不会得到与您输入
完全相同的值
- 将原始数据保存在内存中对于某些用例来说可能过于昂贵,因此我们需要添加另一个参数"keep non-normalized data";此外,您需要选择使用哪个(规范化或非规范化)进行分析,以及使用哪个进行可视化。这对于成熟的 GUI 来说并不困难,但您正在查看的是命令行界面。 (使用 Java 也很容易做到...)
我们当然会感谢为 ELKI 贡献此类功能的补丁。
最简单的方法是这样:添加一个(非数字)标签列,您可以通过这个标签识别原始数据中的原始对象。
我正在使用 ELKI MiniGUI 运行 LOF。我已经找到如何通过 -dbc.filter
在 运行ning 之前规范化数据,但我想查看原始数据记录而不是输出中的规范化数据。
好像有一个flag叫-normUndo
,用命令行可以设置,但是在MiniGUI里不知道怎么用。
此功能曾经存在于 ELKI 中,但实际上已被删除(目前)。
- 只有少数规范化支持这一点,大多数都会失败。
- 可视化不再是定义明确的 "end"。一些用户希望可视化标准化数据,而另一些则不需要。
- 它需要携带规范化信息,这使得数据结构更加复杂(尽管我们现在的分层方法将再次允许这样做)
- 由于浮点数学的数值不精确,您经常不会得到与您输入 完全相同的值
- 将原始数据保存在内存中对于某些用例来说可能过于昂贵,因此我们需要添加另一个参数"keep non-normalized data";此外,您需要选择使用哪个(规范化或非规范化)进行分析,以及使用哪个进行可视化。这对于成熟的 GUI 来说并不困难,但您正在查看的是命令行界面。 (使用 Java 也很容易做到...)
我们当然会感谢为 ELKI 贡献此类功能的补丁。
最简单的方法是这样:添加一个(非数字)标签列,您可以通过这个标签识别原始数据中的原始对象。