首页 > 解决方案 > 分组依据和水平求和

问题描述

我正在尝试根据季度末日期进行分组,并对低于这些季度末日期的所有值求和。我在这里发布之前做了一些谷歌搜索。这是我尝试过的代码行。

 grouped_and_summed = grouped_and_summed.groupby(axis=1, level=0).sum()

数据框被命名grouped_and_summed,轴,我认为是 1,级别,我认为是 0。在我运行代码之后,我有相同的 grouped_and_summed.shape,我在运行代码之前。这是我的数据的屏幕截图,导出为 CSV 文件。我将几列合并在一起,以显示 2001Q1 重复、2001Q2 重复等。我想按这些季度结束日期进行分组,并在这一行下汇总所有内容(水平)。

在此处输入图像描述

这个:grouped_and_summed.head()

给我这个:

           0       1       2       3       4       5      ...   14481   14482  \
index     2001Q1  2001Q2  2001Q3  2001Q4  2002Q1  2002Q2  ...  2011Q2  2011Q3   
RCFD3531       0       1       2       3       4       5  ...   14481   14482   
RCFD3532       0       0       0       0       0       0  ...       0       0   
RCFD3533       0       0       0       0       0       0  ...       0       0   
RCFD3534       0       0       0       0       0       0  ...       0       0   

           14483   14484   14485   14486  
index     2011Q4  2012Q1  2012Q2  2012Q3  
RCFD3531   14483   14484   14485   14486  
RCFD3532       0       0       0       0  
RCFD3533       0       0       0       0  
RCFD3534       0       0       0       0  

[5 rows x 14487 columns]

不知何故,我也想摆脱最上面的那一行。“索引”上方的那个。

标签: pythonpython-3.xpandasgroup-by

解决方案


如果你阅读你的 csv 使用

df = pd.read_csv(filename)

尝试添加skiprows

df = pd.read_csv(filename, skiprows=1)

推荐阅读