python - 在 CSV 列 python 中查找差异
问题描述
我有两个包含一列数字的 CSV。我已经从这些文件中读取了这些列,并使用 pandas 将其保存在变量(List1 和 List2)中。
List1 比 List2 有更多的数字。例如,List1 的列中有 0 - 100,而 List2 的列中有 0 - 50。我需要将 List1 中的数字与 List2 进行比较,并将结果打印到另一个 csv 文件中。
它应该将列表 1 中的每个数字与列表 2 进行比较,如果列表 2 具有该数字,则将其打印为“是”,否则在单独的 csv 文件中打印为“否”。
CSV 输出如下:
Column1 Column2
0 Yes
1 Yes
2 Yes
51 No
52 No
我已阅读 csv 并将数字加载到变量中。因此,有两个变量必须进行比较。
解决方案
在第一个数据框中添加一个新字段,默认值为No。遍历第一个数据框,检查第二个数据框中是否存在数字,如果存在则将新列标记为是。将数据框导出为 CSV。
性能会很慢,所以只有在数据量较小的情况下,你才可以走这条路。
推荐阅读
- java - 将 Gradle 父目录中的文件加载到 Java 测试中
- vb.net - 如何在运行时加载引用另一个程序集的程序集
- ios - 未定义符号:将 Xcode 更新到 11.1 版后出现 _OBJC_CLASS_$_WKInterfaceController 错误
- git - `git pull` 是否仅将更改合并到签出的分支中?
- bash - 如何获取没有最后 N 个字符的字符串?
- ios - xcodebuild - 在私人模拟器上运行
- c# - 发布新版本的应用程序时,如何在不丢失数据的情况下向数据库添加列?
- python-2.7 - python中排序(非常)大的网状列表/字典
- python-3.x - 如何在python中对超过1个数字的文件进行排序?
- visual-studio - 如何在 Visual Studio 中静态链接 VCPKG 生成的 .lib 文件