首页 > 解决方案 > 在 R 中,predict() 函数和 model$predicted 值有什么区别?

问题描述

如果我将随机森林模型应用于 R 中的训练集,

forest = randomForest(y ~ ., data = dat)
pred1 = predict(forest, newdata = dat)
pred2 = forest$predicted

第二行和第三行是应用于同一个数据集的同一个模型,但为什么它们给出不同的值?

pred1用于与真实响应值进行比较并计算训练集的 RMSE;whilepred2用于与真实响应值进行比较并计算测试集的 RMSE(袋外误差)?

谢谢!

标签: rrandom-forest

解决方案


您的第二行似乎有错字。使用可重现的示例并将第二行中的“forect”更改为“forest”,我的第二行和第三行的输出似乎相同。

forest = randomForest(vs~., data = mtcars)
predict(forest, data = mtcars)
forest$predicted

推荐阅读