首页 > 解决方案 > 熊猫内部连接未正确连接

问题描述

我有两个数据框,其中一个看起来像这样,被称为top_10_unique_artists

df1

一个看起来像这样的叫artistsdf2

我正在尝试根据artistID进行内部连接,方法是说

import pandas as pd
top_10_unique_users.join(artists, on=top_10_unique_users.artistID)

但是,当我这样做时,内部连接显然无法正常工作,因为它将不同的 ID 连接在一起,而不是在艺术家表中找到具有相同 ID 的艺术家,如下所示:

df3

标签: pythonpandas

解决方案


您可以使用merge函数,这样您可以在两个数据框中指定不同的列名

import pandas as pd
pd.merge(top_10_unique_users,artists, how='left', left_on = 'artistID', right_on='id')

我无法测试代码,因为您只提供了屏幕截图而不是实际代码,但这应该可以。


推荐阅读