首页 > 解决方案 > 如何比较 pandas 中两个 CSV 文件的内容并找出差异?

问题描述

我有两个 CSV 文件。一个包含完整的名称列表,另一个包含一些名称,每个名称都在一列中,称为“名称”。

就像是:

一个.csv

Name
John
Robert
Ben
Frank
Felix

b.csv

Name
John
Robert
Ben
Frank

请注意,第二个列表中缺少 Felix。

我想阅读这两个 CSV 文件并确定差异,即第二个列表中缺少 Frank。我遇到了下面的示例,我喜欢哪种方式,但很难将其应用到我的示例中。

from collections import Counter
target_list = ["one", "two", "three", "four", "five"]
output_list = ['two','three','four', 'five']
Counter(target_list)-Counter(output_list)

标签: pythonpandas

解决方案


>>> df1
     Name
0    John
1  Robert
2     Ben
3   Frank
4   Felix
>>> df2
     Name
0    John
1  Robert
2     Ben
3   Frank
>>> df1[~df1.Name.isin(df2.Name)]
    Name
4  Felix

推荐阅读