RandomForest没有计算OOB误差
RandomForest no calculation of OOB error
我是随机森林模型领域的新手,正在尝试解释多个 RF 模型的输出。使用的数据集相当大(大约 5,000 行或更多,五个预测变量,全部为数字),而模型(使用 R 包 randomForest 和 RandomForestSRC 进行比较和更好的绘图)似乎 运行 很好,我正在%var 解释了大约 40%,出于某种原因我似乎无法计算 OOB 错误。它应该与 RF 摘要中的混淆矩阵一起出现,但我得到的只是例如这个:
我目前 运行 使用 randomForest 包的代码是:
rf3 <-randomForest(fishing_hours ~ . , data = data_fish, ntree = 1000, importance=TRUE, do.trace=100)
尝试使用 rf3$err.rate[,1]
访问 OOB 错误率,我得到 NULL 作为结果或 NAs 被列出并且绘制 rf3 看起来像这样:
我正在进行回归 - 是否有机会获得错误率或关于其他有用模型性能指标的建议?
非常感谢任何帮助 - 如果需要,很乐意分享示例数据集。
random.forest
包仅在您进行分类时计算 OOB 错误 (err.rate
) 和一个 confusion
矩阵。
均方误差通常用于确定回归问题的错误率,您可以从 models$mse
.
访问它
CrossValidated 上的这个答案可能也有帮助:
https://stats.stackexchange.com/questions/305046/best-way-to-evaluate-a-random-forest-model-accuracy-on-continuous-data
我是随机森林模型领域的新手,正在尝试解释多个 RF 模型的输出。使用的数据集相当大(大约 5,000 行或更多,五个预测变量,全部为数字),而模型(使用 R 包 randomForest 和 RandomForestSRC 进行比较和更好的绘图)似乎 运行 很好,我正在%var 解释了大约 40%,出于某种原因我似乎无法计算 OOB 错误。它应该与 RF 摘要中的混淆矩阵一起出现,但我得到的只是例如这个:
我目前 运行 使用 randomForest 包的代码是:
rf3 <-randomForest(fishing_hours ~ . , data = data_fish, ntree = 1000, importance=TRUE, do.trace=100)
尝试使用 rf3$err.rate[,1]
访问 OOB 错误率,我得到 NULL 作为结果或 NAs 被列出并且绘制 rf3 看起来像这样:
我正在进行回归 - 是否有机会获得错误率或关于其他有用模型性能指标的建议?
非常感谢任何帮助 - 如果需要,很乐意分享示例数据集。
random.forest
包仅在您进行分类时计算 OOB 错误 (err.rate
) 和一个 confusion
矩阵。
均方误差通常用于确定回归问题的错误率,您可以从 models$mse
.
CrossValidated 上的这个答案可能也有帮助: https://stats.stackexchange.com/questions/305046/best-way-to-evaluate-a-random-forest-model-accuracy-on-continuous-data