首页 > 解决方案 > 数据框样本熊猫的平均值

问题描述

我有一个包含多于一列的数据框 df 。我想通过使用df.groupby['A']和对应的'B'列进行分组,以便select n data from 'B'每次都存储平均值。我试过的是 Sample= df.groupby['A'].agg({'B':np.mean()}),但我不知道如何select n data from B每次然后存储它的意思。

标签: pythonpandasdataframepandas-groupby

解决方案


首先,假设“类别”是您的选择标准,您可以从 B 列中选择相应的子集:

subB = df[df['B'] == 'Category']

您可以通过以下方式应用该组:

grouped_selection = subB.groupby(['A']).mean()

print(grouped_selection)

在单行中,它看起来像这样:

grouped_secection = df[df['B'] == 'Category'].groupby(['A']).mean()

推荐阅读