首页 > 解决方案 > 减少 R 中的数据集 - 过滤和分组?

问题描述

我有一个如下所示的数据集:

  Country   Partner   Year   Sector    Value
1     AUT      AUT    2005        A     2132
2     AUT      AUT    2005        B    43213
3     AUT      AUT    2006        A     2451
4     AUT      AUT    2006        B    38723
5     AUT      AUS    2005        A     3241
6     AUT      AUS    2005        B    24213
7     AUT      AUS    2006        A     3728
8     AUT      AUS    2006        B    21923
9     AUS      AUT    2005        A      723
10    AUS      AUT    2005        B    23120
11    AUS      AUT    2006        A      953
...

我想得到的是以下数据格式):

a) 一个国家/年份/部门的总产出,无论合作伙伴如何

  Country    Year   Sector    Value
1     AUT    2005        A   231435
2     AUT    2005        B  4512312
3     AUT    2006        A   213451
4     AUT    2006        B  4738723
5     AUS    2005        A   123461
6     AUS    2005        B  3213456
7     AUS    2006        A   162134
...

b) 国家/年份/部门的国内使用

  Country   Partner   Year   Sector    Value
1     AUT      AUT    2005        A     2132
2     AUT      AUT    2005        B    43213
3     AUT      AUT    2006        A     2451
4     AUT      AUT    2006        B    38723
5     AUS      AUS    2005        A     3241
6     AUS      AUS    2005        B    24213
7     AUS      AUS    2006        A     2314  
...

我还需要一些其他的数据格式,但由于它们看起来很相似,所以我不会包括它们,一旦我掌握了如何获得 a) 和 b) 的想法,它们应该证明对我有用。

至于我已经尝试过的 - 我是一个初学者,所以不多:我尝试使用这些tidyr功能filtergroup_by我也尝试过,spread并且gather在一些类似的情况下有效,但在这里它没有。

我怀疑某种循环在这里可能有用,但至少可以说,这还不是我的强项。

感谢您的建议!

标签: rdata-manipulationdata-cleaning

解决方案


推荐阅读