python - Pandas 两个数据框的交集,除了一个之外几乎具有相同的列
问题描述
tab1 的列名称为:'index', 'Province/State', 'Country/Region', 'Lat', 'Long', 'Date', 'Recovered'
tab2 的列名称为:'index', 'Province/State', 'Country/Region', 'Lat', 'Long', 'Date', 'Confirmed'
由于两个表中都缺少值,所以我想将这些无序(46550 × 6 和 44275 × 6)表加入常见的经纬度值。我尝试合并加入,但未能完成结果。
解决方案
既然你说你需要“交集”,所以我想你需要一个内部连接。
df = tab1.merge(tab2, how='inner', on=['Lat', 'Long'])
在此之后,您可能会重复其他列,因为您的数据框具有与您声称的几乎相同的列。
例如,您将拥有Province/State_x
fromtab1
和Province/State_y
from tab2
。您将需要删除这些重复的列:
# E.g.
df.drop(columns=['Province/State_y'])
您可能还想将它们重命名:
# E.g.
df.rename(columns={'Province/State_x': 'Province/State'})
推荐阅读
- c - 有没有办法将变量作为参数传递给 C 中的 int open() 函数?
- python - 有没有办法在 Django 中构建动态模型?
- java - 在指定路径找不到工件 javax.jnlp:jnlp-api:jar:5.0
- javascript - 如何正确导入函数,返回 Promise?节点JS
- html - 如果我在行中有一个图标,引导行高度会发生变化
- python - 如何在避免全局变量的情况下制作游戏?
- reactjs - 如何在 contextProvider 之间传递 setState 函数?
- python - 使用 BETO - 西班牙语版 BERT
- javascript - Reactjs 钩子无法读取未定义错误的属性“推送”
- r - R:多类矩阵