python - 在 Pandas 中通过 Dataframe 的多列进行分组和求和
问题描述
我有一个看起来像这样的数据框:
YEAR | REGION | POWER |
2009 | West | 1.66 |
2009 | West | 1.77 |
2009 | East | 10.6 |
2009 | East | 8.7 |
2010 | West | 11.9 |
2010 | North | 14.8 |
2010 | North | 4.6 |
2010 | West | 3.0 |
2011 | East | 7.0 |
2011 | East | 9.66 |
我想对按YEAR和REGION分组的POWER的数值求和,以便得到类似的结果:
YEAR | REGION | POWER |
2009 | West | 3.43 |
2009 | East | 19.3 |
2010 | West | 11.9 |
2010 | North | 19.4 |
2010 | West | 3.0 |
2011 | East | 16.66 |
我试过了:
df.groupby(['YEAR', 'REGION'])['POWER'].sum()
但是我得到了一系列与 POWER 中的值并排而不是相加的序列。
谁能帮忙做这个手术?
解决方案
sum
在上运行groupby
,然后reset_index()
将其展平。像这样:
df.groupby(['YEAR', 'REGION']).sum().reset_index()
# YEAR REGION POWER
# 0 2009 East 19.30
# 1 2009 West 3.43
# 2 2010 North 19.40
# 3 2010 West 14.90
# 4 2011 East 16.66
推荐阅读
- linux - 如何在spec文件中获取rpm文件路径
- java - 无法解析片段中的方法“getIntent”
- mysql - 我如何让 mysql 返回 JSON 中的数组
- node.js - 如何以有效的方式代理来自我的 Node.js 应用程序的 GraphQL 请求?
- apache-kafka - Datadog 的 Kafka 集成 DD_KAFKA_CLIENT_PROPAGATION_ENABLED - Magic v1 不支持记录头
- python - Python Dash 核心组件 Graph() 与 Plotly Express
- file-not-found - 我运行代码,它显示结果然后它立即变成未找到
- python - 在主启动之前启动屏幕中心(加载图像)
- jupyter-lab - 带有 ipyvuetify 的 jupyter Lab NER 可视化工具?
- windows - Powershell Windows ACL