如何在 R(派对包)中绘制 cForest 的学习曲线?
How to plot learning curve of cForest in R (party-package)?
我已经使用 cForest 构建了一个随机森林模型。
现在,我想绘制一条简单的学习曲线,在 x 轴上显示树的数量,在 y 轴上显示错误分类错误(如下图所示)。然而,经过大量谷歌搜索,我仍然无法弄清楚如何使用派对包中的 cForest 来做到这一点。
使用 randomForest 包,只需使用 plot(rf) 即可完成,但是当我尝试使用 cForest 对象时,这不起作用。出现以下错误:
plot(myforest)
Error in as.double(y) : cannot coerce type 'S4' to vector of type 'double'
希望有人知道这一点。
学习曲线示例:
我也想这样做,所以我联系了包的作者。据他说,这不容易做到,因为 ntree 不是调整参数,而是定义基础 bootstrap 分布的质量。我不确定这是由于包的编写方式还是由于 cforests 和传统随机森林之间在数学上的潜在差异。如果您需要制作此图并且仍然想使用 cforests,您可以尝试 运行 各种 cforests,每个 cforests 都有不同数量的树(例如,有 50、100、500、1000、1500、2000 棵树)记录准确性对于每一个,然后绘制它以获得类似的图形。
我已经使用 cForest 构建了一个随机森林模型。
现在,我想绘制一条简单的学习曲线,在 x 轴上显示树的数量,在 y 轴上显示错误分类错误(如下图所示)。然而,经过大量谷歌搜索,我仍然无法弄清楚如何使用派对包中的 cForest 来做到这一点。
使用 randomForest 包,只需使用 plot(rf) 即可完成,但是当我尝试使用 cForest 对象时,这不起作用。出现以下错误:
plot(myforest)
Error in as.double(y) : cannot coerce type 'S4' to vector of type 'double'
希望有人知道这一点。
学习曲线示例:
我也想这样做,所以我联系了包的作者。据他说,这不容易做到,因为 ntree 不是调整参数,而是定义基础 bootstrap 分布的质量。我不确定这是由于包的编写方式还是由于 cforests 和传统随机森林之间在数学上的潜在差异。如果您需要制作此图并且仍然想使用 cforests,您可以尝试 运行 各种 cforests,每个 cforests 都有不同数量的树(例如,有 50、100、500、1000、1500、2000 棵树)记录准确性对于每一个,然后绘制它以获得类似的图形。