首页 > 解决方案 > 在 groupby 之后需要关于 agg 函数的帮助,以便最后进行操作 - 首先

问题描述

我低于熊猫数据框。

  group   A   B   C   D   E
0    g1  12  14  26  68  83
1    g1  56  58  67  34  97
2    g1  47  87  23  87  90
3    g2  43  76  98  32  78
4    g2  32  56  36  87  65
5    g2  54  12  24  45  95

我希望使用“组”列在同一列上应用 groupby,并希望应用聚合函数来获取(最后 - 第一个)列“E”。

预期输出:

  group   A   B    C   D  E
0    g1  12  87  116  34  7
1    g2  43  12  158  32  17

我写了下面的代码。但它不起作用。

import pandas as pd

df = pd.DataFrame([["g1", 12, 14, 26, 68, 83], ["g1", 56, 58, 67, 34, 97], ["g1", 47, 87, 23, 87, 90], ["g2", 43, 76, 98, 32, 78], ["g2", 32, 56, 36, 87, 65], ["g2", 54, 12, 24, 45, 95]], columns=["group", "A", "B", "C", "D", "E"])
ndf = df.groupby(["group"], as_index=False).agg({"A": 'first', "B": 'last', "C": 'sum', "D": 'min', "E": 'last - first'})
print(df)
print(ndf)

标签: python-3.xpandasdataframepandas-groupby

解决方案


lambda您可以为此使用函数。

ndf = (
    df.groupby(["group"], as_index=False)
    .agg({"A": 'first',
          "B": 'last',
          "C": 'sum',
          "D": 'min',
          "E": lambda x: x.iat[-1]-x.iat[0]})
)

将输出

  group   A   B    C   D   E
0    g1  12  87  116  34   7
1    g2  43  12  158  32  17

推荐阅读