python - 找到高于平均熊猫的 id
问题描述
我有一个图表,其中 x 轴是日期,y 轴是值,每一行都是唯一的客户
这是使用具有以下结构的数据框完成的:
date |cust_id|value
01/01/18 |1 |2349
02/01/18 |1 |242
04/01/18 |1 |24429
06/01/18 |1 |21412
01/01/19 |2 |2349
平均线是通过取每个日期的平均值得出的:
agg = df.groupby('date').agg('mean').reset_index()
如何隔离高于平均线的 ID?
解决方案
df.merge(df.groupby('date').agg(m=('value','mean')).reset_index(),
on='date').query('value >= m').drop(columns=['m'])
推荐阅读
- actions-on-google - 结束播放媒体响应的 conv 无法按预期工作。它暂停音频输出但不退出操作
- r - 计算给定伯努利分布似然的后验概率
- c++ - 错误:在没有参数列表的情况下无效使用模板名“ExTree”|| 如果解决这个问题怎么办?(初学者)
- ruby-on-rails - 在数字海洋中部署后无法启动 Web 应用程序
- git - 将 git repo 从一台机器克隆到另一台机器
- ios - 对于 iO,我有一个 if / else 代码块,对 UISwitch 中的变化做出反应。在某些情况下如何将 uiswitch 设置回关闭?
- google-sheets - 我的表单问题可以根据以前用户的回答自动修改吗?
- dialogflow-es - Action-on-google V1 迁移截止日期
- python-3.x - 如何解决单类 MNIST 数据集的胶囊训练问题?
- excel - 有没有更快的方法来批量保护文件?