首页 > 解决方案 > 如果匹配列合并两个 csv 文件,然后连接额外的列

问题描述

我正在寻找一些关于熊猫的帮助。我正在尝试比较任何匹配的“电子邮件”列,然后将额外的列连接到单独的 csv 中。

我有以下内容:

文件 1.csv

email, user_id
example1@gmail.com, 1
example2@gmail.com, 24
example3@gmail.com, 12
example5@gmail.com, 31

文件2.csv

email, group_id
example1@gmail.com, g1
example2@gmail.com, g1
example3@gmail.com, g2
example4@gmail.com, g3

输出.csv:

email, user_id, group_id
example1@gmail.com, 1, g1
example2@gmail.com, 24, g1
example3@gmail.com, 12, g2

我感谢提供的任何帮助。谢谢你。

标签: pythonpython-3.xpandascsv

解决方案


尝试合并

import pandas as pd 
f1 = pd.read_csv('f1.csv')
f2 = pd.read_csv('f2.csv')
out = pd.merge(f1,f2,on='email',how='inner')
print(out)
out.to_csv("final.csv", index=False)

输出是

email   user_id  group_id
0  example1@gmail.com         1        g1
1  example2@gmail.com        24        g1
2  example3@gmail.com        12        g2

推荐阅读