首页 > 解决方案 > R:如何使用 rpart 中的子集选项?

问题描述

从 的文档中help(rpart),有一个subset选项,它是一个“可选表达式,表示应仅在拟合中使用数据行的子集”。

我究竟该如何使用这个选项?

library(rpart)
fit <- rpart(Kyphosis ~ Age + Number + Start,
             data = kyphosis,
             subset = sample(1:nrow(kyphosis), 20))

在上面的代码中,我从kyphosis数据中随机抽取了 20 个行索引。这是正确的用法吗?

标签: rdecision-treerpart

解决方案


是的,这没关系。使用subset,您还可以:

  • 明确选择您的行data.framesubset=1:21
  • 根据变量值选择行:subset=(Age<50)

推荐阅读