r - 和有什么区别在 BASH 和在 R?
问题描述
与 R 中的 unique 相比,我在 BASH 中使用 uniq 得到不同的结果。我的 df 看起来像(超过 9000 行):
samples read_seq
ccd_x29 GCATTGGT
ccd_x29 GCATTGGT
ccd_x29 GCATTGGT
ccd_x20 GCCCGGCTAG
ccd_x19 GCATTGGTGGTT
ccd_x19 GCATTGGTGGTT
bash 后uniq
我得到 8811 行,df <- unique(df)
我得到 8803 行。
这是什么原因造成的?
解决方案
从R 文档:
请注意,与 Unix 命令不同,
uniq
它省略了重复的元素/行,而不仅仅是重复的元素/行。也就是说,如果一个元素等于任何先前的元素,而不仅仅是它等于前一个元素,则该元素被省略。(对于后者,请参阅rle
)。
推荐阅读
- reactjs - 无法在我的反应项目中获取 .env 网址到我的组件
- c++ - 为什么 someNumber = rand() & 100 + 1; 不产生错误?
- multithreading - 在 x86 cpu 中窥探内存访问
- node.js - 流产生空缓冲区
- vpc - VPC 对等连接
- javascript - 根据 url 中的链接检查单选按钮
- erlang - 在erlang中调用list:keyfind()时出现错误记录
- php - 如何从php中的日期函数获取日、月和年?
- java - 我的印地语文本以未知格式编码如何从 java 中反转它
- python - 从Python列表中找到最佳组合后如何从数据集中删除一行