这个公式和纯度公式验证一样吗?
Is this formula just the same like purity formula validation?
我读过的大多数论文都使用以下公式对聚类准确性进行外部验证:
其中 ai 是同时出现在第 i 个簇中的数据对象的数量
及其对应的trueclass,n为数据集中数据对象的个数。根据这一措施,较高的 r 值表示
更好的聚类结果,完美的聚类产生一个值
r = 1.0
这个公式和纯度公式一样吗?
您可以在此处阅读纯度 https://stats.stackexchange.com/questions/95731/how-to-calculate-purity
谢谢大家
我不同意该论文声称这将被 "commonly" 使用。常用的衡量指标是 ARI(调整兰德指数)和 NMI(归一化互信息)。
但是,是的,吨这看起来与纯度相同。有同样的缺陷。
据推测,他们使用的衡量方法有利于将 "true" 集群分解成更小的块。如果k=n,每个点都是自己的簇,那么all so都是1,这个measure会评价结果为perfect。
所以你不能用它来比较不同k的结果。
我读过的大多数论文都使用以下公式对聚类准确性进行外部验证:
这个公式和纯度公式一样吗? 您可以在此处阅读纯度 https://stats.stackexchange.com/questions/95731/how-to-calculate-purity
谢谢大家
我不同意该论文声称这将被 "commonly" 使用。常用的衡量指标是 ARI(调整兰德指数)和 NMI(归一化互信息)。
但是,是的,吨这看起来与纯度相同。有同样的缺陷。
据推测,他们使用的衡量方法有利于将 "true" 集群分解成更小的块。如果k=n,每个点都是自己的簇,那么all so都是1,这个measure会评价结果为perfect。
所以你不能用它来比较不同k的结果。