首页 > 解决方案 > R中如何选择Rpart包中的根节点

问题描述

我正在一个项目中工作,该项目需要Rpart在 R 中使用包来构建决策树。

但是,我的直接下属经理对作为树中根节点的特定变量感兴趣,因为他认为该特定变量在我们的业务中具有重要意义。

我可以知道有人知道如何强制树从那个特定变量开始吗?例如,该变量名是 X。

数据集描述:目标变量 Y. 与 30 个其他自变量。

代码:

tree <- rpart(Y~., method="class", data=train, parms=list(split="information"), control=rpart.control(cp=.0002,minsplit = 5,minbucket = 5,maxdepth = 10))

标签: rdecision-treerpart

解决方案


这是不可能的,因为它违背了所使用算法的逻辑。您有 2 个选项:

  • 通过使用预先过滤的数据创建 2 个决策树模型来手动进行拆分。
  • 使用允许这样做的不同决策树模型,例如lightgbm(注意算法是不同的)。

推荐阅读