首页 > 解决方案 > R根据公共列值过滤行

问题描述

这有点简单,但我想不出解决方案。我有一个包含如下行的数据框:

ColumnA   ColumnB  
protein1  protein2  
protein2  protein1

其余的都是一样的。因此,我想只保留其中一个,因为它们是重复的以供我分析。我有一个包含蛋白质1和蛋白质2的载体。我根据该 vectoe 确定了这些列,但它总共有 100K 行。但是,我只是想不出有选择地删除它们的方法。有人有想法吗?

标签: rdataframefilterduplicates

解决方案


您可以尝试igraph如下

library(igraph)
unique(as_data_frame(graph_from_data_frame(df,directed = FALSE)))

这使

      from       to
1 protein1 protein2

数据

> dput(df)
structure(list(ColumnA = c("protein1", "protein2"), ColumnB = c("protein2", 
"protein1")), class = "data.frame", row.names = c(NA, -2L))

推荐阅读