首页 > 解决方案 > 根据 id 列添加信息

问题描述

我有一个问题,我认为它应该可以通过循环解决,但我不确定如何继续。我正在和熊猫一起工作。我有两个数据集:一个有两列对应于我的参与者 ( ID_dataframe) 的 id,另一个具有实际的info_df. 我在下面包含了我的情况的简化示例:

ID_dataframe

ID-1 ID-2
A201 SF-01
B202 SF-02
C203 SF-03
D204 SF-04

信息_df

ID-1 治疗 访问
A201 一个 1
A201
A201 C 2
B202 一个
B202 C 2
C203 A1
C203 A2 3
D204 1

所以我希望能够将 ID2 从ID_dataframe 合并到info_dataframe基于,ID-1所以它看起来像这样:

ID-1 ID2 治疗 访问
A201 SF-01 一个 1
A201 SF-01
A201 SF-01 C 2
B202 SF-02 一个
B202 SF-02 C 2
C203 SF-03 A1
C203 SF-03 A2 3
D204 SF-04 1

我想这应该相当容易,但我无法弄清楚:(我将不胜感激!

标签: pythonpandasdataframe

解决方案


你想要的是一个join手术。您可以参考Dataframe Joins以供参考。

在这种情况下,您可以在两个数据框中的列上加入Info_dfwith 。这可以通过以下方式完成:ID_dataframeID-1

Info_df.join(ID_dataframe.set_index('ID-1'), on='ID-1')

这应该返回您想要的表。


推荐阅读