r - 减少 R 中的数据集 - 过滤和分组?
问题描述
我有一个如下所示的数据集:
Country Partner Year Sector Value
1 AUT AUT 2005 A 2132
2 AUT AUT 2005 B 43213
3 AUT AUT 2006 A 2451
4 AUT AUT 2006 B 38723
5 AUT AUS 2005 A 3241
6 AUT AUS 2005 B 24213
7 AUT AUS 2006 A 3728
8 AUT AUS 2006 B 21923
9 AUS AUT 2005 A 723
10 AUS AUT 2005 B 23120
11 AUS AUT 2006 A 953
...
我想得到的是以下数据格式):
a) 一个国家/年份/部门的总产出,无论合作伙伴如何
Country Year Sector Value
1 AUT 2005 A 231435
2 AUT 2005 B 4512312
3 AUT 2006 A 213451
4 AUT 2006 B 4738723
5 AUS 2005 A 123461
6 AUS 2005 B 3213456
7 AUS 2006 A 162134
...
b) 国家/年份/部门的国内使用
Country Partner Year Sector Value
1 AUT AUT 2005 A 2132
2 AUT AUT 2005 B 43213
3 AUT AUT 2006 A 2451
4 AUT AUT 2006 B 38723
5 AUS AUS 2005 A 3241
6 AUS AUS 2005 B 24213
7 AUS AUS 2006 A 2314
...
我还需要一些其他的数据格式,但由于它们看起来很相似,所以我不会包括它们,一旦我掌握了如何获得 a) 和 b) 的想法,它们应该证明对我有用。
至于我已经尝试过的 - 我是一个初学者,所以不多:我尝试使用这些tidyr
功能filter
,group_by
我也尝试过,spread
并且gather
在一些类似的情况下有效,但在这里它没有。
我怀疑某种循环在这里可能有用,但至少可以说,这还不是我的强项。
感谢您的建议!
解决方案
推荐阅读
- python-3.x - Python如何修补类方法以便可以访问 cls 变量
- python - 双层优化算法 ==> Pyomo 中的实现
- python - 为什么通过列表元素增加变量会给我一个 IndexError?
- directed-acyclic-graphs - 任何任意 DAG 图都会产生多个拓扑顺序?
- sql - SELECT 事务似乎缓存在 postgres 上?
- arrays - 如何设置MongoDB返回文档的限制?
- api - 如何运行两个查询 i) 来自:ii) 使用 Postman 的 Twitter API 的关键字?
- docker - docker 无法找到 main.js 文件以使用 typeorm 在 nestjs 中运行后端
- flutter - Flutter - 将图像添加到 BottomNavigationBarItem
- spring - 使用 apache camel ftp 组件将文件移动到存档目录