首页 > 解决方案 > 使用 dplyr 在 R 中排序:如何根据另一列中的类别总和在一列中按类别排序?

问题描述

我在下面有一个示例数据框。我需要按类型、物种和 BdFt 对其进行排序。下面的例子几乎是正确的,但是我不希望物种按字母顺序排序。我想根据每个物种的总和(在每个“类型”内)按降序对物种进行排序。例如,在类型 4404 中,“DF”应该首先出现。我也想保持当前的观察数量,所以我不想按物种组进行合并。任何人都可以帮助我实现这一目标,也许是 dplyr?

-布兰登

   Type Species  BdFt
   4404      BB   164
   4404      BB    55
   4404      BM   831
   4404      BM   419
   4404      BM   242
   4404      BM    20
   4404      CH   565
   4404      CH   206
   4404      CH    88
   4404      CO  1817
   4404      CO   531
   4404      CO   286
   4404      CO    31
   4404      DF 19740
   4404      DF  5930
   4404      DF   613
   4404      DF   468
   4404      DF   167
   4404      GF   360
   4404      GF   232
   4404      GF   124
   4410      BM   909
   4410      CH   161
   4410      DF 18756
   4410      GF  3642
   4410      RA   549

标签: rdataframedplyrplyr

解决方案


这是一个选项arrange

library(dplyr)
df2 <- df1 %>% 
       arrange(Type, desc(ave(BdFt, Species, Type,  FUN = sum))) 

df2
#   Type Species  BdFt
#1  4404      DF 19740
#2  4404      DF  5930
#3  4404      DF   613
#4  4404      DF   468
#5  4404      DF   167
#6  4404      CO  1817
#7  4404      CO   531
#8  4404      CO   286
#9  4404      CO    31
#10 4404      BM   831
#11 4404      BM   419
#12 4404      BM   242
#13 4404      BM    20
#14 4404      CH   565
#15 4404      CH   206
#16 4404      CH    88
#17 4404      GF   360
#18 4404      GF   232
#19 4404      GF   124
#20 4404      BB   164
#21 4404      BB    55
#22 4410      DF 18756
#23 4410      GF  3642
#24 4410      BM   909
#25 4410      RA   549
#26 4410      CH   161

orderbase R

df1[with(df1, order(Type, -ave(BdFt, Species, Type,  FUN = sum))),]

数据

df1 <- structure(list(Type = c(4404L, 4404L, 4404L, 4404L, 4404L, 4404L, 
4404L, 4404L, 4404L, 4404L, 4404L, 4404L, 4404L, 4404L, 4404L, 
4404L, 4404L, 4404L, 4404L, 4404L, 4404L, 4410L, 4410L, 4410L, 
4410L, 4410L), Species = c("BB", "BB", "BM", "BM", "BM", "BM", 
"CH", "CH", "CH", "CO", "CO", "CO", "CO", "DF", "DF", "DF", "DF", 
"DF", "GF", "GF", "GF", "BM", "CH", "DF", "GF", "RA"), BdFt = c(164L, 
55L, 831L, 419L, 242L, 20L, 565L, 206L, 88L, 1817L, 531L, 286L, 
31L, 19740L, 5930L, 613L, 468L, 167L, 360L, 232L, 124L, 909L, 
161L, 18756L, 3642L, 549L)), class = "data.frame", row.names = c(NA, 
-26L))

推荐阅读