ROC 中的最佳分类器 Space

Best classifier in ROC Space

我一直在做一些事情,我做了以下情节:

由于所有分类器都在随机线下方,我读到我们 should/could "invert" 它们。我知道离左上角最近的分类器是最好的。在这里,我将如何获得最佳分类器?我应该反转吗?

不要只是"read",而是试着去理解原因...

如果分类器在线下方,则它的假阳性率高于假阴性率。换句话说,您所有分类器的输出 错误多于正确

通常,这表明存在配置错误,我不建议通过将分类器视为 'liar' 来解决这个问题。相反,找到解决根本原因的方法。

请记住,低于 0.5 的 AUC 值并不自动意味着分类器输出是反转的。 AUC 是对分类器性能的估计,与任何估计一样,它可能存在偏差。负偏差在小样本数据集中尤为普遍,并且在生物信息学领域得到了广泛的分析。例如,看看下面的论文:https://www.ncbi.nlm.nih.gov/pubmed/17764577

长话短说:您的预测变量可能真的是随机的,但您对其性能 (AUC) 的估计存在偏差。如果是这种情况,就没有 "best" 预测器,因为它们都和抛硬币一样好。