随机森林预测

Random Forest Predict

我有一个包含 40,000 行的训练数据集,我能够为我的数据集成功生成 randomForest

我现在正尝试用它来预测我的测试集。我的训练和测试数据集是 2 个不同的数据框,两个数据框之间的列名不匹配。当我 运行 我的预测时出现错误。

library(randomForest)
set.seed(2018)
new_train_rf= randomForest(workdf.V1~.,data = new_train_df, mtry=6, ntree=25)
new_train_rf
summary(new_train_rf)

测试数据集预测:

test_pred = predict(new_train_rf, newdata=new_test_df)
test_pred
summary(test_pred)

Error in eval(predvars, data, env) : object 'Var57' not found

测试数据框中的列名:

testdf.Var218_UYBR, testdf2.Var6, testdf2.Var13, testdf2.Var21

Training Datafame 中的列名:

workdf.Var218_UYBR, tempdf2.Var6, tempdf2.Var13, tempdf2.Var21

请帮忙!我是 R 的新手,我一直在努力弄清楚为什么我的预测不起作用

我将测试和训练数据分成了 2 个不同的数据框。在我重命名我的 df(测试和训练)中的列以匹配之后,我能够 运行 我的预测成功。