首页 > 解决方案 > 一段时间内的累计

问题描述

我有一个包含日期列和其他一些列的数据框。我需要计算我每天发生的次数并创建一个累积总和。例如:

Date   

2017-02-14 11:00:06          
2017-02-14 14:10:31          
2017-02-15 01:35:02                    
2017-02-18 21:10:25          
2017-02-18 22:15:32                   
2017-02-18 23:13:55          
2017-02-19 19:43:44
...

应该变成:

Date        Cum_Counts          
2017-02-14    2          
2017-02-15    3          
2017-02-18    6          
2017-02-19    7

我知道我可以df['Date'].groupby(df['Date'].dt.day).count()每天使用和获取计数。但我想要:

  1. 累积计数
  2. 第一列中的日期本身(如上例所示)。

有没有办法直接用 groupby 做到这一点?

标签: pythonpandaspandas-groupby

解决方案


df['Date'].groupby(df['Date'].dt.day).count().cumsum()

推荐阅读