首页 > 技术文章 > awk 统计文件中按照某列统计某列的和(sum)

chongchong88 2016-11-21 15:56 原文

把第一列相同的名称的第二列加起来:

[root@localhost cc]# cat 1.txt
aaa 10
bbb 20
aaa 30
ccc 40
ccc 20
ccc 40

[root@localhost cc]# cat 1.txt |awk '{sum[$1]+=$2}END{for(i in sum)print i,sum[i]}'
aaa 40
bbb 20
ccc 100

统计第一列名称出现的次数:

[root@localhost cc]# cat 1.txt |awk '{sum[$1]+=1}END{for(i in sum)print i,sum[i]}'
aaa 2
bbb 1
ccc 3

或[root@localhost cc]# cat 1.txt |awk '{sum[$1]++}END{for(i in sum)print i,sum[i]}'
aaa 2
bbb 1
ccc 3

统计第一列第二列重复出现的次数:

[root@localhost cc]# cat 1.txt |awk '{sum[$1" "$2]++}END{for(i in sum)print i,sum[i]}'
aaa 10 1
ccc 20 1
aaa 30 1
ccc 40 2
bbb 20 1

简单的把第二列加起来:
 [root@localhost cc]# cat 1.txt |awk '{a+=$2}END{print a}'
160

推荐阅读