pandas - Pandas,使用系列选择数据框的子集
问题描述
我有一个熊猫df。
+----------+------------+-------------+-----+--+
| City | First_name | Last_name | Age | |
+----------+------------+-------------+-----+--+
| London | Han | Solo | 34 | |
| Paris | Luke | Skywalker | 30 | |
| New York | Leia | Organa | 30 | |
| LA | Lando | calrissian | 40 | |
+----------+------------+-------------+-----+--+
以及使用 .loc[:,'Age'] 从一个单独的、较小的 df (df2) 获得的(熊猫)系列
+------------+
| Age |
+------------+
| 30 |
| 30 |
+------------+
我想使用系列中的信息选择 df1 中的所有行。给这样的东西,
+----------+------------+-------------+-----+--+
| City | First_name | Last_name | Age | |
+----------+------------+-------------+-----+--+
| Paris | Luke | Skywalker | 30 | |
| New York | Leia | Organa | 30 | |
+----------+------------+-------------+-----+--+
我查看了 .loc 和 .iloc 的文献,但这似乎不是我所追求的。我试图编写一个小的 for 循环,但经验有限(我是编程新手)。有人有建议吗?
解决方案
假设 df 较大,df1
而 df 较小df2
,提取要选择的年龄值:
mask = df2['Age'].unique()
然后简单地df1
通过这个查询mask
:
df1.loc[df1['Age'].isin(mask)]
推荐阅读
- python - 使用 BeautifulSoup 和 Python 从 PubMed 搜索结果中抓取引文文本?
- javascript - 如何在某个固定高度后使编辑器 JS 可滚动?
- apache-spark - Spark任务的数量可以大于执行程序核心吗?
- go - Go 中 Gorgonia 张量的有效累积乘积?
- clang - 如何更新共享库文件
- flutter - Flutter_google_places 颤动,自动完成不显示结果
- algorithm - 计算两组凸多边形的相似度?
- javascript - Node Jest Axios 没有被嘲笑
- discord.js - 如何使用设置昵称文章?
- python-3.x - 如何从python中的折线获得点的最短距离?