首页 > 解决方案 > 找到高于平均熊猫的 id

问题描述

我有一个图表,其中 x 轴是日期,y 轴是值,每一行都是唯一的客户

示例图

这是使用具有以下结构的数据框完成的:

  date     |cust_id|value
  01/01/18 |1      |2349
  02/01/18 |1      |242
  04/01/18 |1      |24429
  06/01/18 |1      |21412
  01/01/19 |2      |2349

平均线是通过取每个日期的平均值得出的:

agg = df.groupby('date').agg('mean').reset_index()

如何隔离高于平均线的 ID?

标签: pythonpandasmatplotlib

解决方案


df.merge(df.groupby('date').agg(m=('value','mean')).reset_index(),
         on='date').query('value >= m').drop(columns=['m'])

推荐阅读