首页 > 解决方案 > R - 在模型中选择多个变量的优雅方式,如 rpart 或 train

问题描述

我想使用大约 50 个变量列作为我的模型的因素,并尝试找出一种优雅的方式,而不是使用所有变量的长列表。

rpart(output_variable ~ Variable1 + Variable2 + Variable3 + Variable4, data=Train_Set, method="class")

我试试

rpart(output_variable ~ dataset[,12:50], data=Train_Set, method="class")

但这只会带来“无效类型(列表)

知道如何优雅地选择多个变量或保存它们以在公式中引用它们吗?

标签: rformula

解决方案


使用reformulate它从字符向量创建公式。

rpart(reformulate(names(Train_Set)[12:50], output_variable), 
      data=Train_Set, method="class")

例如,这就是reformulate给与mtcars

reformulate(names(mtcars)[3:7], "cyl")
#cyl ~ disp + hp + drat + wt + qsec

推荐阅读