首页 > 解决方案 > RandomForest没有计算OOB错误

问题描述

我是随机森林模型领域的新手,并试图解释几个 RF 模型的输出。使用的数据集相当大(大约 5,000 行和更多,五个预测变量,所有数字),而模型(使用 R 包 randomForest 和 RandomForestSRC 进行比较和更好的绘图)似乎运行良好,我得到 %var 解释40%,由于某种原因,我似乎无法计算 OOB 错误。它应该与 RF 摘要中的混淆矩阵一起出现,但我得到的只是这样的:

在此处输入图像描述

我目前使用 randomForest 包运行的代码是:

rf3 <-randomForest(fishing_hours ~ . , data = data_fish, ntree = 1000, importance=TRUE, do.trace=100)

尝试使用 访问 OOB 错误率rf3$err.rate[,1]时,我得到 NULL,因为结果或 NA 被列出并且绘制 rf3 看起来像这样:

在此处输入图像描述

我正在做回归——有机会获得错误率或其他有用的模型性能指标的建议吗?

非常感谢任何帮助 - 如果需要,很乐意分享示例数据集。

标签: rrandom-forest

解决方案


该包仅在您进行分类时random.forest计算 OOB 误差 ( err.rate) 和矩阵。confusion

均方误差通常用于确定回归问题的错误率,您可以从models$mse.

CrossValidated 上的这个答案也可能会有所帮助: https ://stats.stackexchange.com/questions/305046/best-way-to-evaluate-a-random-forest-model-accuracy-on-continuous-data


推荐阅读