为了获得更好的预测模型,分类报告中 Precision 或 Recall 哪个更重要

Which is given more importance Precision or Recall in classification report for obtaining a better prediction model

对于机器学习中的一个分类问题,在分类报告中,精度和召回率哪个更重要以获得更好的模型?

实际上取决于你的分类问题。

首先,你需要了解precisionrecall的区别。 Wikipedia may be a good start, but I would suggest this resource by developers.google.


现在假设您正在尝试使用分类器跟踪新冠病例。 分类器告诉您患者是否携带 covid。

你更感兴趣的是:

A) 确定 所有 可能的 covid 病例?

B) 确定如果你确定一个 covid 案例实际上 一个真正的 covid 案例?

如果 A) 更重要,您应该关注 召回 。另一方面,如果您对 B) 更感兴趣,那么 precision 可能就是您要找的。

注意:


假设您正在测试 1000 个可能的案例,假设其中 500 个是阳性,我们只是还不知道。你使用分类器,它告诉你所有 1000 人都是积极的。

所以你有:

true_positives = 500

false_negatives = 0

recall = true_positives / (true_positives + false_negatives)

recall = 500 / (500 + 0) = 1

所以这里你回忆的很好,但是你不准确,也不准确。


我想表达的是,人们不应该只关注一个指标而不是另一个指标,而应该始终对问题保持广泛的看法。

但是,如果您只想关注一个指标来总结准确率和召回率,这就是 F score 的目的。