首页 > 解决方案 > 如何在 Python Pandas 中进行 R 样式聚合?

问题描述

我需要对我上传到 python 的 mtcars 数据集进行聚合(至少你会在 R 中调用它)。最终目标是获取数据集中每个 cyl 值的平均 mpg(cyl 有 3 个值,4、6、8)。这是我想做的 R 代码

mean_each_gear <- 聚合(mtcars$mpg ~ mtcars$cyl,FUN = mean)

输出:气缸 mpg 1 4 26.66364 2 6 19.74286 3 8 15.10000

我在熊猫中最接近的是这个

mtcars.agg(['平均'])

我不确定我会如何在 Pandas 中做到这一点。任何帮助,将不胜感激!

标签: pythonrpandasaggregate

解决方案


你想要熊猫 groupby()!

import pandas as pd

my_dataframe = pd.read_csv('my_input_data.csv') //insert your data here
pd.groupby(['col1'])['col2'].mean()

其中“col1”是您要分组的列,“col2”是您要获取其平均值的列。另见此处:

https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.groupby.html


推荐阅读