首页 > 解决方案 > 如何计算数据框中的唯一行?

问题描述

我在 R 中有一个数据框,其中有很多重复的记录。我有兴趣找出每个数据框中有多少条记录。

例如,我有这个数据框:

Fake Name       Fake ID    Fake Status   Fake Program
June             0003         Green        PR1
June             0003         Green        PR1
Television       202          Blue         PR3
Television       202          Green        PR3    
Television       202          Green        PR3
CRT              12           Red          PR0

从上面我想得到类似于下面的东西:

Fake Name       Fake ID    Fake Status   Fake Program     COUNT
June             0003         Green        PR1              2
Television       202          Blue         PR3              1
Television       202          Green        PR3              2
CRT              12           Red          PR0              1

任何帮助,将不胜感激。谢谢你。

标签: rdataframedplyraggregate

解决方案


使用group_by_allthen 计算行数n

df %>% group_by_all() %>% summarise(COUNT = n())

# A tibble: 4 x 5
# Groups:   Fake.Name, Fake.ID, Fake.Status [?]
#  Fake.Name  Fake.ID Fake.Status Fake.Program COUNT
#  <fct>        <int> <fct>       <fct>        <int>
#1 CRT             12 Red         PR0              1
#2 June             3 Green       PR1              2
#3 Television     202 Blue        PR3              1
#4 Television     202 Green       PR3              2

或者更好的是@Ryan 的评论:

df %>% group_by_all %>% count

推荐阅读