python - 对 Pandas 数据框进行排序和过滤
问题描述
我正在尝试过滤和排序 Pandas 数据框以清理我的数据。我查看了 StackOverflow,似乎找不到可以为我提供所需排序和过滤的方法。我正在使用的数据如下所示:
| Name 1 | Name 2 | Score |
| ------ | ------ | ----- |
| Amy | Jack | 2.456 |
| Amy | Jack | 3.234 |
| Amy | Jack | 5.124 |
| ... | ... | ... |
| Max | Jane | 8.569 |
| Max | Jane | 4.654 |
| Max | Jane | 6.349 |
我想做的是从每对名称的最低分中创建一个新的数据框。所以生成的数据框将是这样的:
| Name 1 | Name 2 | Score |
| ------ | ------ | ----- |
| Amy | Jack | 2.456 |
| ... | ... | ...|
| Max | Jane | 4.654 |
解决方案
利用:
df = df.groupby(['Name 1', 'Name 2'], as_index = False).agg(Score = ('Score', 'min'))
输出:
>>> df
Name1 Name2 Score
0 Amy Jack 2.456
1 Max Jane 4.654
推荐阅读
- oauth-2.0 - Auth0 登录调用 Youtube Data API v3
- postgresql - 我的数据库中的每个表都应该有一个键吗
- r - 使用 R dplyr 将整个数据帧转换为字符类
- r - Boxplots with ggpaired() WITHOUT connecting lines
- swift - Swift UI - 线程 1:EXC_BAD_ACCESS(代码=2
- python - 在 Jupyter Notebook 中找不到桌面文件夹
- c# - AWS 签名、编码、验证
- django - 在 Django 项目中恢复 postgreSQL 数据库
- puppeteer - 使用 Puppeteer 访问所有请求的响应标头
- r - benferroni 调整 p 值 - 如何绑定它而不像 OR 和 CI 那样取幂?