首页 > 解决方案 > 和有什么区别在 BASH 和在 R?

问题描述

与 R 中的 unique 相比,我在 BASH 中使用 uniq 得到不同的结果。我的 df 看起来像(超过 9000 行):

samples read_seq
ccd_x29 GCATTGGT
ccd_x29 GCATTGGT
ccd_x29 GCATTGGT
ccd_x20 GCCCGGCTAG
ccd_x19 GCATTGGTGGTT
ccd_x19 GCATTGGTGGTT

bash 后uniq我得到 8811 行,df <- unique(df)我得到 8803 行。

这是什么原因造成的?

标签: rbashcountuniqueuniq

解决方案


R 文档

请注意,与 Unix 命令不同,uniq它省略了重复的元素/行,而不仅仅是重复的元素/行。也就是说,如果一个元素等于任何先前的元素,而不仅仅是它等于前一个元素,则该元素被省略。(对于后者,请参阅rle)。


推荐阅读