首页 > 解决方案 > 如何检查特定列中的最高分并计算熊猫的平均值?

问题描述

帮助解决家庭作业问题:“让我们将给定人的“数据科学经验”定义为该人在回归、分类和聚类中的最高分。计算所有 MSIS 学生的平均数据科学经验。

编码初学者。我试图弄清楚如何检查列并将这些列相互比较以获得最大值。然后取这些发现值的平均值。

我非常感谢您提前提供的帮助!

样本数据集图片: 1https ://i.stack.imgur.com/9OSjz.png

Provided Code: 
import pandas as pd
df = pd.read_csv("cleaned_survey.csv", index_col=0)
df.drop(['ProgSkills','Languages','Expert'],axis=1,inplace=True) 

样本数据: 在此处输入图像描述

到目前为止我已经尝试过:

df[data_science_experience]=df[["Regression","Classification","Clustering"]].values.max()
df['z']=df[['Regression','Classification','Clustering']].apply(np.max,axis=1)
df[data_science_experience]=df[["Regression","Classification","Clustering"]].apply(np.max,axis=1)

标签: pandasdataframe

解决方案


如果您想获得列 'hw1' 的最高分,您可以使用:
pd['hw1'].max().
这为您提供了该列中的所有值的系列,并且 max 返回最大值。平均使用意味着:

pd['hw1'].mean()


如果要查找多列的最大值,可以使用:

maximum_list = list()
for col in pd.columns:
    maximum_list.append(pd[col].max)
max = maximum_list.max()
avg = maximum_list.mean()

希望这可以帮助。


推荐阅读