使用 R-Squared 评估随机森林性能

Evaluate Random Forest performance using R-Squared

我想评估 Python 中随机森林回归器的测试性能,除了 运行 在训练集上进行交叉验证之外,我想知道它是否合适到 运行 预测的 Y 测试结果和实际 Y 测试结果之间的某种相关性分析?

我可能过于简单化的想法是,两者之间的显着相关性表明预测的 Y 与实际测试 Y 一致,因此,预测是好的...

我们非常欢迎任何替代建议。谢谢。

你可以运行一个相关性分析是合适的,但是如果相关性很大并不总是正确的,说明你的模型很好。您还必须查看变​​化。还取决于您要解决的任务(分类、分割、回归 e.t.c),您可以使用指标来检测您的预测有多好。您可以在此处找到不同的指标 http://scikit-learn.org/stable/modules/model_evaluation.html.