r - 从 randomForest R 中的树中排除变量组合
问题描述
我正在使用randomForest
包在 R 中拟合随机森林模型。我想拟合两个模型,一个带有 covariatesa
和b
许多其他 covariates ( x1 to xn
),第二个带有 covariates a
、b
和(和a * 1/b
的交互作用)加上额外的 covariates 。但是,在第一次拟合中,如果我在随机森林模型中都有和,并且如果两者和最终都在同一棵树中,则该模型将基本上考虑 和 之间的交互作用。a
b
x1 to xn
a
b
a
b
a
b
是否可以告诉随机森林模型永远不要在同一棵树中a
包含协变量?b
如果是这样,我如何randomForest
在 R 的包中实现它?
解决方案
除非你想修改包的源代码,否则你不能这样做。但是,如果我正确理解了您的问题,您可以通过创建两个随机森林模型或多或少地做到这一点。一个包含 a 但不包含 b,另一个包含 b 但不包含 a。然后只取两个模型的平均预测。从计算上讲,这可能与您尝试做的相同。