首页 > 解决方案 > R循环将输出分配给新向量

问题描述

我在 R 中工作,试图使用 for 循环生成几个不同的向量。

首先,我创建了一个小的可重现示例数据框,名为df.

cluster.assignment <- c("1 Unknown", "1 Unknown", "2 Neuron","3 
PBMC","4 Basket")
Value1 <- c("a","b","c","d","e")
Value2 <- c("191","234","178","929","123")
df <- data.frame(cluster.assignment,Value1,Value2)

df

  cluster.assignment Value1 Value2
1          1 Unknown      a    191
2          1 Unknown      b    234
3           2 Neuron      c    178
4             3 PBMC      d    929
5           4 Basket      e    123 . 

接下来,我创建一个名为的变量clusters,其中包含我感兴趣的数据集的键。

clusters <- c("1 ","4 ")

df这是我尝试使用 for 循环提取感兴趣数据的行名。

for (COI in clusters) { 
  name2 <- c(gsub(" ","", paste("Cluster", COI, sep = "_")))
  assign(Cluster_1, name2, envir = parent.frame())
  name2 <- grep(COI, df$cluster.assignment)
}

所需的输出是两个向量,称为Cluster_1Cluster_4

Cluster_1将包含值12

Cluster_4将包含值5

我似乎无法弄清楚如何将COI变量的名称分配为输出向量的名称。

标签: rfor-loopassign

解决方案


我建议不要使用assign. 相反,我将创建一个命名列表。有关为什么列表比顺序命名的变量更好的详细讨论,请参阅此答案。如果在任何时候,您决定要将列表转换为全局环境中的对象,您可以使用list2env,但这样做可能只会做更多的工作。

## subset the data to the parts we care about, use `split` to separate it
## into a list
subdf = df[grepl(paste(clusters, collapse = "|"), df$cluster.assignment), ]
result = split(subdf, subdf$cluster.assignment, drop = TRUE)
result
# $`1 Unknown`
#   cluster.assignment Value1 Value2
# 1          1 Unknown      a    191
# 2          1 Unknown      b    234
# 
# $`4 Basket`
#   cluster.assignment Value1 Value2
# 5           4 Basket      e    123

## name the list as desired
names(result) = paste("Cluster", trimws(clusters), sep = "_")
result
# $`Cluster_1`
#   cluster.assignment Value1 Value2
# 1          1 Unknown      a    191
# 2          1 Unknown      b    234
# 
# $Cluster_4
#   cluster.assignment Value1 Value2
# 5           4 Basket      e    123

## if only the row names are needed, use lapply
result = lapply(result, row.names)
result
# $`Cluster_1`
# [1] "1" "2"
# 
# $Cluster_4
# [1] "5"

其他一些注意事项-我假设您在其中包含空格clusters以防止例如"1"匹配"12 foo". 您可能会考虑改用正则表达式单词边界"\\b1\\b",因为它"1 "仍然会匹配,比如"11 foo"or "21 bar"。更好的是,您可以使用strplit或类似的方法创建一个仅包含您想要匹配的数字键的新列。


推荐阅读