首页 > 解决方案 > 有没有一种简单的方法可以在不使用 dplyr::select() 的情况下订购大量列?

问题描述

我正在处理一个包含很多列(400+)的非常大的数据集,每次我创建一个新变量或添加一个新变量时,我都必须重新排序。我希望它被排序,以便所有相关变量保持在一起,所以我一直在使用 dplyr::select() 来重新排序。然而,有时我必须很早就回到我的脚本并添加一个新变量。当我在那之后运行整个代码时,往往有一两个变量我忘记放入前面的 select() 函数中,所以它丢失了。

我使用 select() 是因为选择两个变量之间的所有列并按名称引用它们非常容易(例如,Vfour:Vthreefifty)。您对重新排序具有大量列的数据集有任何提示吗?

标签: rselectdplyrmultiple-columnsorganization

解决方案


没有给出可重现的示例,但使用您的 2 个列名:

df %>%
select(., starts_with('V'))

然后,您可以starts_with根据需要进行链接。

其他选项包括: ends_with, contains,matches


推荐阅读