sklearn 分类概率或置信度

sk-learn classification probability or confidence

有没有办法让 sk-learn 中的 class化模型输出预测的置信度或概率,而不仅仅是 class(即使只有两个 classes)?

直觉上,有些样本应该明确归属于一个 class,而其他样本则处于临界状态,对于某些实际问题,区分这些样本可能会有用。

是的。通常,您的模型将提供一个名为 decision_function 的成员函数,其中 returns 给定样本到分离超平面的距离,您可以将其解释为置信度。

查看此 example 以了解 SVM 分类的用法。

如果您查看 classifier 的 sklearn 文档,您会发现其中一些函数具有类似于 predict_proba()(或 decision_function 之类的函数,并且提到适用于 SVM 和其他模型,如 Logistic 回归)。 RandomForestClassifier 文档 here 中有一个示例。每个 class 的概率将以取决于特定模型的方式计算,但它们应该为您输入的每个样本产生每个 class 的概率。