python - Pandas 更高效地合并
问题描述
我有多个表需要在我的代码中合并,但它们都有很多附加的“绒毛”列。我当前合并表的过程如下:
df = pd.merge(df, df2, on=[key])
df = pd.drop([[insert not-needed columns], axis=1)
df = df.rename(columns={'column_x': 'column'})
我还看到人们首先在新的查找表中隔离列:
ref = df2['column1','key']
df = pd.merge(df, ref, on=[key])
有没有更快的方法来做类似于 Pandas 中的 VLOOKUP(但包含多个列)的操作?
解决方案
是的,您可以先过滤它,merge
然后过滤它应该更快merge
ref = df2[['col1','col2',...., 'coln','key']]
df = pd.merge(df, ref, on=[key])
推荐阅读
- python - QuickSort Python 中值三分区
- java - 使用 Java spring 和休眠的 Oracle 插入需要太多时间
- react-native - 将 google 登录与 Expo 结合到 React Native 项目中
- mongodb - MongoDb 数据迁移工具
- c# - 在treeview MVVM中获取父项
- google-tag-manager - 特定类中元素的第 n 个位置定义事件的自定义标签
- json - 使用数组和过滤器将嵌套 JSON 展平为 CSV
- lit-element - 无法显示子元素
- r - 闪亮的导入 data.table 并对其进行操作
- angular - 使用 Typescript 将数据从 Firebase 检索到 Google 地图