首页 > 解决方案 > 按列对重复项进行排序

问题描述

请考虑以下示例:

两列数据:

ti piace o no la apple p181026 07348
ti piace o no la apple p181026 07349
ti piace o no la apple p181026 07345

其中p[0-9]\s[0-9]序列与第一列是制表符分隔的。

我想仅根据第一列(行的字母部分)删除重复项。我试过:

sort  -u -t$'\t' -k1 -nr inputfile > out

sort -t$'\t' -k1 -nr inputfile | uniq > out 

没有成功。恐怕我错过了一些明显的东西,但即使通过咨询其他相关问题,我仍然无法弄清楚。

提前感谢您与我分享您的经验。

标签: bashsortingawksed

解决方案


使用 GNU 排序和 bash:

sort -t $'\t' -k 1,1 -u file

输出:

ti piace o no la apple p181026 07348

推荐阅读