首页 > 解决方案 > 随机森林预测中的缺失值:是否有类似于 Breiman 的 R 包?

问题描述

R 中是否有一个随机森林预测的实现可以复制 Leo Breiman 关于缺失值的实现?在 Breiman 的 Fortran 代码[在此处描述]中,

如果标签不存在,则测试集中的每个案例都被复制 nclass 次(nclass= 类数)。假设案例的第一个重复是第 1 类,第 1 类填充用于替换缺失值。第 2 个复制假定为 2 级,并在其上使用 2 级填充。这个增强的测试集沿树向下运行。在每组复制中,得票最多的那个决定了原始案例的类别。

在 RandomForest 包[第 16 页(预测)] 中,它应该基于 Breiman 的 Fortran 代码,它说:

如果对象继承自 randomForest.formula,那么任何带有 NA 的数据都会从预测中默默地省略。

这意味着在 randomForest 包中,预测只是返回为 NA。我误会了吗?是否有任何 R 包可以预测类似于 Breiman 代码的值?

标签: rrandom-forestpredictionmissing-data

解决方案


推荐阅读