首页 > 解决方案 > 仅获取列的一部分的总计

问题描述

我使用的数据库显示了每个城镇每个季度的债务人总数。由于列出了 43 个城镇,因此每季度(2017 年 9 月 30 日等)有 43 个“总债务人”。

我的目标是找到每个季度的债务人总数(理论上,找到每 43 个列出的“总债务人”的总和),但我不太确定如何。

我试过使用 sum() 函数,但我知道如何制作它,所以它只会逐季增加总和。

这是数据库的样子和我的尝试(我打印了前 50 行只是为了了解它的样子)

https://i.imgur.com/h1y43j8.png

如果解释有点不清楚,请提前道歉。

标签: pythonpandascsvmatplotlibjupyter-notebook

解决方案


你应该使用groupby. 这是一个很好的 pandas 功能,可以完全按照您的要求进行操作。df它根据您选择的任何列进行分组。

total_debtors_pq = df.groupby('Quarter end date')['Total number of debtors'].sum()

然后,您可以从 中提取每个季度的总数total_debtors_pq


推荐阅读