python - 避免使用 pandas groupby 重复计数列
问题描述
pandas.Dataframe.groupby(['date','some_category']).agg([np.sum, np.size])
生成对每个总和列重复的计数。传递聚合函数列表时是否可以只输出一个计数列?
a = df_all.groupby(['date','some_category']).sum()
b = df_all.groupby(['date','some_category']).size()
pd.concat([a,b], axis=1)
基本上产生了我想要的东西,但看起来很尴尬。
解决方案
df.pivot_table(index=['date', 'some_category'],aggfunc=['sum', 'size'])
是我一直在寻找的。这会产生一个大小列(尽管我不确定为什么它被标记为“0”),而不是每个求和列的重复(相同)大小。谢谢大家,一路上我学到了一些有用的东西。
推荐阅读
- git - 执行 git pull 时如何获取提交?
- botframework - 无法从 Json 文件中获取自适应卡值
- postscript - 后记:如何重新定义 setpagedevice
- android - 没有安装 csv 查看器的设备时没有 ActivityNotFoundException
- c# - 我不断收到错误 System.Data.SQLite.SQLiteException:'“into”附近的 SQL 逻辑错误:语法错误'
- nginx - Kong:尝试索引字段“主机”(零值)
- reactjs - 扩展静态类型的泛型不是智能感知的
- sas - 将查询结果保存到 csv
- c# - 为什么我的 EventTrigger 不适用于我的左键单击?
- groovy - 查找集合中与某个标准匹配的最后一个值,但是如果我想要最后一个值呢?