pandas - 如何检查特定列中的最高分并计算熊猫的平均值?
问题描述
帮助解决家庭作业问题:“让我们将给定人的“数据科学经验”定义为该人在回归、分类和聚类中的最高分。计算所有 MSIS 学生的平均数据科学经验。
编码初学者。我试图弄清楚如何检查列并将这些列相互比较以获得最大值。然后取这些发现值的平均值。
我非常感谢您提前提供的帮助!
样本数据集图片: 1:https ://i.stack.imgur.com/9OSjz.png
Provided Code:
import pandas as pd
df = pd.read_csv("cleaned_survey.csv", index_col=0)
df.drop(['ProgSkills','Languages','Expert'],axis=1,inplace=True)
到目前为止我已经尝试过:
df[data_science_experience]=df[["Regression","Classification","Clustering"]].values.max()
df['z']=df[['Regression','Classification','Clustering']].apply(np.max,axis=1)
df[data_science_experience]=df[["Regression","Classification","Clustering"]].apply(np.max,axis=1)
解决方案
如果您想获得列 'hw1' 的最高分,您可以使用:
pd['hw1'].max()
.
这为您提供了该列中的所有值的系列,并且 max 返回最大值。平均使用意味着:
pd['hw1'].mean()
如果要查找多列的最大值,可以使用:
maximum_list = list()
for col in pd.columns:
maximum_list.append(pd[col].max)
max = maximum_list.max()
avg = maximum_list.mean()
希望这可以帮助。
推荐阅读
- python - 使用熊猫查找是否有两列名称不同但值相同
- python - Mypy 在 if else 中定义类型时引发“无法分配多种类型”
- python - 从 ROI 创建蒙版
- python - 从 python 发布到不和谐的 webhook
- pine-script - 如何识别历史柱数组中的值而不是显示“NaN”?
- gitlab-api - 如何使用 gitlab API 获取用户片段的评论?
- html - 导航栏没有进入哈巴狗
- matlab - 如何在 MATLAB 绘图图中以编程方式放大或放大?
- php - 获取位于 storage/folder 目录而不是 storage/app/directory 的 Laravel Storage 文件
- installation - Bcrypt没有安装在pycharm上