首页 > 解决方案 > 在多个字段上查找平均值

问题描述

我正在尝试找出一种在 python 中对特定内容进行编码的方法。我正在使用与列一起运行的 csv 数据集;年龄、性别、体重指数、收费、吸烟者、儿童人数。我的问题是,有没有办法找到性别等于男性或女性的 BMI 平均值?

我知道使用 pandas 以下将为我提供所有列的平均值:

mean_age = df["age"].mean()

我已经尝试过(我认为这行不通):

mean_age = df["age"].mean(on "sex" = "male")

mean_age = df["age"].mean("sex" = "male")

mean_age = df["age"].mean(where( "sex") = "male")

我想知道我是否可以按照其他列的平均值编写一些东西。

标签: pythonpandaspandas-groupby

解决方案


我找到了一种分组方式,可以让我在多个字段中获得平均值和计数:

df.groupby(["sex"]).agg(["mean", "count"])

推荐阅读