首页 > 解决方案 > python的pandas.merge的奇怪行为

问题描述

我想在两个数据库之间进行左合并,左数据库有 36000 行,406 列;而右分贝的尺寸为 23x13。该键由两个(对象)列组成,并且在右侧数据库中没有重复项。

这两个数据库是在很长的代码之后创建的。如果我合并这些数据,则需要 4 秒,这通常很慢。如果我将这些数据库保存在 csv 中,然后再次读取它们,并进行完全相同的合并,则只需 300 毫秒。

我目前无法在不公开数据的情况下进行可重现。

标签: pythonpandas

解决方案


推荐阅读