首页 > 解决方案 > python / pandas / numpy(或Excel)中每个其他变量组合的一个变量摘要

问题描述

我正在分析模型搜索的结果。结果保存在 excel 文件中,但可以很容易地导入 python(或其他环境,如果需要)。数据看起来像这样(这是在列数和行数方面的简化版本):

我有的

我想分析 kappa 如何随测试数据变化,所以我想知道具有恒定类数、数据集类型和主题数恒定的最小、最大和平均 kappa。这看起来像这样: 我想要的是

我已经玩弄了 pandas.groupy(),但我似乎无法完全弄清楚如何做到这一点。任何帮助将不胜感激!

标签: pythonexcelpandasnumpycsv

解决方案


尝试:

替换c1,c2,c3,c4为适当的值:

df.groupby(['c1', ‘c2’, ‘c3]).agg({'c4': [min, max, np.mean]})

推荐阅读