首页 > 解决方案 > 在 CSV 列 python 中查找差异

问题描述

我有两个包含一列数字的 CSV。我已经从这些文件中读取了这些列,并使用 pandas 将其保存在变量(List1 和 List2)中。

List1 比 List2 有更多的数字。例如,List1 的列中有 0 - 100,而 List2 的列中有 0 - 50。我需要将 List1 中的数字与 List2 进行比较,并将结果打印到另一个 csv 文件中。

它应该将列表 1 中的每个数字与列表 2 进行比较,如果列表 2 具有该数字,则将其打印为“是”,否则在单独的 csv 文件中打印为“否”。

CSV 输出如下:

Column1 Column2
0       Yes
1       Yes
2       Yes
51      No
52      No

我已阅读 csv 并将数字加载到变量中。因此,有两个变量必须进行比较。

标签: python

解决方案


在第一个数据框中添加一个新字段,默认值为No。遍历第一个数据框,检查第二个数据框中是否存在数字,如果存在则将新列标记为是。将数据框导出为 CSV。

性能会很慢,所以只有在数据量较小的情况下,你才可以走这条路。


推荐阅读