首页 > 技术文章 > linux系统 comm命令

liujiaxin2018 2020-09-26 15:47 原文

1、comm 用于对两个文件取交集或者并集,

   用法  comm file1 file2,生成三列数据,第一列file1唯一的行,第二列file2唯一的行,第三列file1和file2共有的行

   创建测试数据 a.txt b.txt

cat a.txt
sss
eee
rrr
555
888
333
bbb
777
yyy

cat b.txt
yyy
ddd
sss
eee
666
kkk
mmm
jjj

 

2、使用 comm命令前 需要对数据进行排序和去重复

    

sort -u a.txt > a && mv a a.txt

cat a.txt
333
555
777
888
bbb
eee
rrr
sss
yyy

sort -u b.txt > a && mv a b.txt
666
ddd
eee
jjj
kkk
mmm
sss
yyy

 

3、运行 comm a.txt b.txt

comm a.txt b.txt
333
555
        666
777
888
bbb
        ddd
                eee
        jjj
        kkk
        mmm
rrr
                sss
                yyy

生成三列数据,第一列a.txt唯一的行,第二列b.txt唯一的行,第三列a.txt和b.txt共有的行。

 

4、测试三个参数 -1、-2、-3

comm a.txt b.txt -1
666
ddd
        eee
jjj
kkk
mmm
        sss
        yyy
###相当于删除了第一列

comm a.txt b.txt -2
333
555
777
888
bbb
        eee
rrr
        sss
        yyy
###相当于删除了第二列

comm a.txt b.txt -2 -1
eee
sss
yyy
###相当于删除了第一列和第二列

###其余以此类推

 

5、取交集和并集 

 

[root@linuxprobe test]# comm a.txt b.txt -2 -1
eee
sss
yyy
###取交集
[root@linuxprobe test]# comm a.txt b.txt | sed 's/^\t*//'
333
555
666
777
888
bbb
ddd
jjj
kkk
mmm
rrr
###取并集
 

 

注意:使用comm命令前应当进行排序及去重复。

 

推荐阅读