随机森林预测
Random Forest Predict
我有一个包含 40,000 行的训练数据集,我能够为我的数据集成功生成 randomForest
。
我现在正尝试用它来预测我的测试集。我的训练和测试数据集是 2 个不同的数据框,两个数据框之间的列名不匹配。当我 运行 我的预测时出现错误。
library(randomForest)
set.seed(2018)
new_train_rf= randomForest(workdf.V1~.,data = new_train_df, mtry=6, ntree=25)
new_train_rf
summary(new_train_rf)
测试数据集预测:
test_pred = predict(new_train_rf, newdata=new_test_df)
test_pred
summary(test_pred)
Error in eval(predvars, data, env) : object 'Var57' not found
测试数据框中的列名:
testdf.Var218_UYBR, testdf2.Var6, testdf2.Var13, testdf2.Var21
Training Datafame 中的列名:
workdf.Var218_UYBR, tempdf2.Var6, tempdf2.Var13, tempdf2.Var21
请帮忙!我是 R 的新手,我一直在努力弄清楚为什么我的预测不起作用
我将测试和训练数据分成了 2 个不同的数据框。在我重命名我的 df(测试和训练)中的列以匹配之后,我能够 运行 我的预测成功。
我有一个包含 40,000 行的训练数据集,我能够为我的数据集成功生成 randomForest
。
我现在正尝试用它来预测我的测试集。我的训练和测试数据集是 2 个不同的数据框,两个数据框之间的列名不匹配。当我 运行 我的预测时出现错误。
library(randomForest)
set.seed(2018)
new_train_rf= randomForest(workdf.V1~.,data = new_train_df, mtry=6, ntree=25)
new_train_rf
summary(new_train_rf)
测试数据集预测:
test_pred = predict(new_train_rf, newdata=new_test_df)
test_pred
summary(test_pred)
Error in eval(predvars, data, env) : object 'Var57' not found
测试数据框中的列名:
testdf.Var218_UYBR, testdf2.Var6, testdf2.Var13, testdf2.Var21
Training Datafame 中的列名:
workdf.Var218_UYBR, tempdf2.Var6, tempdf2.Var13, tempdf2.Var21
请帮忙!我是 R 的新手,我一直在努力弄清楚为什么我的预测不起作用
我将测试和训练数据分成了 2 个不同的数据框。在我重命名我的 df(测试和训练)中的列以匹配之后,我能够 运行 我的预测成功。