首页 > 解决方案 > 通过从 R 中的数据框中删除成对重复项来提取唯一的组合行

问题描述

如果两列具有相同的值,我想从数据框(df)中删除重复项,即使这些值的顺序相反。我的实际数据集有 7046 行。

这是样本数据,

> df
part_no.   alt_part_no
    1           2
    1           3
    2           1
    2           3
    3           1
    3           2
    4           5
    5           4
    6           7
    6           8
    6           9
    7           6
    7           8  
    7           9
    8           6
    8           7
    8           9
    9           6
    9           7 
    9           8

我想生成一个没有重复的新数据框,例如,第 1 行和第 2 行与第 3、4、5、6 行相同。由于它们具有相同的信息,我想要一个没有重复的最终文件,我想要一个文件像下面的一个:

>output
part_no.   alt_part_no
1           2
1           3
4           5
6           7
6           8
6           9

有人可以帮忙吗?独特的命令不适用于此,我不知道该怎么做。

我试过了

df[!duplicated(t(apply(df, 1, sort))),]

>output

     part_no.    alt_part_no
         1           2
         1           3
         2           3
         4           5
         6           7
         6           8
         6           9
         7           8
         7           9
         8           9

标签: r

解决方案


推荐阅读