首页 > 解决方案 > 通过在 R 中对两列进行分组来求和行

问题描述

我有一个枪支背景调查数据库,原始数据有几个月,但不是在单独的列中,所以我将列名更改为年,现在每个州每年都有 12 行。我想通过使用状态和年份来总结在其他列中进行的总检查。我尝试了 group_by 的一些变体,并进行了汇总和汇总。当我跑

gunData <-aggregate(.~year+state,gunData, sum)

它似乎有效,但抹去了大部分年份和状态。可以聚合的变量数量是否有限制,不胜感激。

 year state                permit permit_recheck handgun long_gun other multiple totals
   <dbl> <chr>                 <dbl>          <dbl>   <dbl>    <dbl> <dbl>    <dbl>  <dbl>
 1  2021 Alabama               31803            512   20970    16026  1548      959  74710
 2  2021 Alaska                  222              1    3055     2564   375      189   6667
 3  2021 Arizona                9290           1159   20530     9991  1754     1114  45496
 4  2021 Arkansas               3123           1152    7068     5289   448      390  18916
 5  2021 California            16025          11953   40789    27915  6499        0 119784
 6  2021 Colorado              10891              6   21729    13839  1960     1760  50485
 7  2021 Connecticut            9792            476    6046     1996  1438        0  19748
 8  2021 Delaware                353              0    2775     1563   158      153   5245
 9  2021 District of Columbia    538              1     304        4     0        2    920
10  2021 Florida               31875              0   66307    26720  5116     2894 138870
# ... with 14,730 more rows

这是一张标有月份的表格,它可能有助于解释我要做什么

A tibble: 14,740 x 10
   year  month state                permit permit_recheck handgun long_gun other multiple totals
   <chr> <chr> <chr>                 <dbl>          <dbl>   <dbl>    <dbl> <dbl>    <dbl>  <dbl>
 1 2021  02    Alabama               31803            512   20970    16026  1548      959  74710
 2 2021  02    Alaska                  222              1    3055     2564   375      189   6667
 3 2021  02    Arizona                9290           1159   20530     9991  1754     1114  45496
 4 2021  02    Arkansas               3123           1152    7068     5289   448      390  18916
 5 2021  02    California            16025          11953   40789    27915  6499        0 119784
 6 2021  02    Colorado              10891              6   21729    13839  1960     1760  50485
 7 2021  02    Connecticut            9792            476    6046     1996  1438        0  19748
 8 2021  02    Delaware                353              0    2775     1563   158      153   5245
 9 2021  02    District of Columbia    538              1     304        4     0        2    920
10 2021  02    Florida               31875              0   66307    26720  5116     2894 138870

标签: rdataframegroup-by

解决方案


推荐阅读