为了获得更好的预测模型,分类报告中 Precision 或 Recall 哪个更重要
Which is given more importance Precision or Recall in classification report for obtaining a better prediction model
对于机器学习中的一个分类问题,在分类报告中,精度和召回率哪个更重要以获得更好的模型?
实际上取决于你的分类问题。
首先,你需要了解precision和recall的区别。
Wikipedia may be a good start, but I would suggest this resource by developers.google.
现在假设您正在尝试使用分类器跟踪新冠病例。
分类器告诉您患者是否携带 covid。
你更感兴趣的是:
A) 确定 所有 可能的 covid 病例?
B) 确定如果你确定一个 covid 案例实际上 一个真正的 covid 案例?
如果 A) 更重要,您应该关注 召回 。另一方面,如果您对 B) 更感兴趣,那么 precision 可能就是您要找的。
注意:
假设您正在测试 1000
个可能的案例,假设其中 500
个是阳性,我们只是还不知道。你使用分类器,它告诉你所有 1000
人都是积极的。
所以你有:
true_positives
= 500
false_negatives
= 0
recall = true_positives / (true_positives + false_negatives)
recall = 500 / (500 + 0) = 1
所以这里你回忆的很好,但是你不准确,也不准确。
我想表达的是,人们不应该只关注一个指标而不是另一个指标,而应该始终对问题保持广泛的看法。
但是,如果您只想关注一个指标来总结准确率和召回率,这就是 F score 的目的。
对于机器学习中的一个分类问题,在分类报告中,精度和召回率哪个更重要以获得更好的模型?
实际上取决于你的分类问题。
首先,你需要了解precision和recall的区别。 Wikipedia may be a good start, but I would suggest this resource by developers.google.
现在假设您正在尝试使用分类器跟踪新冠病例。 分类器告诉您患者是否携带 covid。
你更感兴趣的是:
A) 确定 所有 可能的 covid 病例?
B) 确定如果你确定一个 covid 案例实际上 一个真正的 covid 案例?
如果 A) 更重要,您应该关注 召回 。另一方面,如果您对 B) 更感兴趣,那么 precision 可能就是您要找的。
注意:
假设您正在测试 1000
个可能的案例,假设其中 500
个是阳性,我们只是还不知道。你使用分类器,它告诉你所有 1000
人都是积极的。
所以你有:
true_positives
= 500
false_negatives
= 0
recall = true_positives / (true_positives + false_negatives)
recall = 500 / (500 + 0) = 1
所以这里你回忆的很好,但是你不准确,也不准确。
我想表达的是,人们不应该只关注一个指标而不是另一个指标,而应该始终对问题保持广泛的看法。
但是,如果您只想关注一个指标来总结准确率和召回率,这就是 F score 的目的。