首页 > 解决方案 > 在大型数据帧上聚合许多指标的快速方法

问题描述

我有一个包含数百万行和数百列的大型数据框。

我的目标是在特定列上应用一些指标:

from scipy.stats import moment 
moment(df.groupby('id', as_index=False)[df.columns[0:100]], moment=3)

另外,我必须应用其他统计数据(平均值、标准差、第 4 时刻、Sarle 系数……),请问有没有办法进行这种聚合并更快地计算许多其他统计数据?

标签: pythonpandasscipy

解决方案


推荐阅读