首页 > 解决方案 > Python pandas:在数据透视表上应用滚动总和

问题描述

我使用 pivot_table 命令创建了一个数据框。数据框有 351 行和 120 列。数据框如下所示:

RY          2011                                              ...   2020
Month   1   2   3   4   5   6   7   8   9   10  ... 3   4   5   6   7   8   9   10  11  12
ID                                                                                  
AB10    0   0   0   0   0   0   0   0   0   0   ... 0   0   0   0   0   0   0   0   0   0
AB1286  0   0   0   0   2   0   0   0   0   0   ... 0   0   0   0   0   0   0   0   0   0
AB1951  0   0   0   0   0   0   0   0   0   0   ... 0   0   0   0   0   0   0   0   0   0
AB2 0   0   0   0   0   0   0   0   0   0   ... 0   0   0   0   0   0   0   0   0   0
AB2338  0   0   0   0   0   0   0   0   0   0   ... 0   0   0   0   0   0   0   0   0   0

现在我想计算 ID 的 12 个月的滚动总和。我编写了以下命令来计算滚动和:

df.groupby('ID').rolling(12,on='Month').sum()

但是,它给出了以下错误:

ValueError: invalid on specified as Month, must be a column (of DataFrame), an Index or None

谁能帮我解决这个问题?

标签: pythonpython-3.xpandas

解决方案


在创建数据透视表之前尝试运行该代码。但是,请确保您首先使用以下内容创建日期时间列:

df['Date'] = pd.to_datetime(df['Year'].astype(str) + '-' + df['Month'].astype(str) + '-01')

接着:

df.groupby('ID').rolling(12,on='Date').sum()


推荐阅读