python - 熊猫数据框操作
问题描述
我使用 pandas 数据框来处理我的数据集。我有 3 列,airport_id airport_id 和 delay。我想删除所有少于 5 家航空公司的始发机场。
我这样做了:
grouped_size = df.groupby(['OP_CARRIER_AIRLINE_ID','ORIGIN_AIRPORT_ID']).size()
这给了我每个机场的航空公司数量(我希望),但我不知道如何删除少于 5 家航空公司的航空公司。谢谢!
解决方案
这是一个简单的方法:
grouped_size = df.groupby(['OP_CARRIER_AIRLINE_ID','ORIGIN_AIRPORT_ID']).size().reset_index()
grouped_size.columns = ['OP_CARRIER_AIRLINE_ID','ORIGIN_AIRPORT_ID', 'size']
hi_mask = grouped_size['size'] > 5
grouped_size = grouped_size[hi_mask]
推荐阅读
- c - 为什么 LoadLibrary 失败并显示错误代码 193?
- python - 在 Shinyproxy 中为 Dash 应用程序交付静态资产时出错
- python-3.x - 使用python定义类构造函数
- python - 如果 Join in pandas 中没有匹配项,则保留一列中的值
- javascript - JavaScript xml对象,访问节点问题
- javascript - CSS 星形单选按钮
- java - 如何使用 Java 在 Android Studio 中找到两条谷歌地图路线之间的交汇点
- python - 如何让 PyMongo collstats 匹配查询而不是整个集合
- java - 从另一个特定类访问 Class 方法
- r - 如何在表格中总结多个逻辑回归模型?