arrays - 将一个 CSV 设置为数组以比较来自另一个 CSV 的数据
问题描述
我是 Python 新手,并且在一个项目中的编码过于复杂,所以我从小得多的数据集开始学习这个过程。我的老板让我比较两个 CSV 文件。第一个 CSV 仅在单个列中包含数据 1、2、3、4、5、6。他希望我将此 CSV 文件设置为一个数组,以便我可以将第二个 CSV 与它进行比较。第二个 CSV 将数据 3、5、6 全部包含在一个列中。该代码应打印出 1,2,4,因为它是两个 CSV 文件中唯一未找到的数据。
我最初尝试编写代码来导入两个 CSV 文件并比较数据而不将其设置为数组,但这不起作用,因此需要将第一个 CSV 文件设置为数组。问题是我不确定如何使用数组执行此操作。这是我到目前为止所拥有的,任何人都可以给我的任何帮助将不胜感激。我已经在这个项目上工作了一周,即使使用这种简化的形式,我也完全不知所措。
import csv
temp_list = []
with open('1.csv','rb') as csvfile:
reader = csv.reader(csvfile, delimiter=',')
for row in reader:
解决方案
就伪代码而言,您需要在此处将两个 csv 文件导入到两个单独的数组中,例如数组 A 和数组 B。
现在您需要做的是将一个数组中的每个索引位置与另一个数组中的每个索引位置进行比较。您需要创建一个嵌套循环,其中外循环将选择 A 中的索引位置,然后内循环选择 B 中的位置。
在您检查 A 中的一个索引与 B 中的每个位置,并且没有位置相同后,我建议将此值添加到第三个数组 C 中。您可以使用布尔标志检查哪些位置相同。完成代码后,C 将具有 A 和 B 中都不存在的任何值。
我建议遵循这些教程来了解有关 python 语法的更多信息: https ://www.w3schools.com/python/
祝你好运
推荐阅读
- apache-flink - Order of events with chained keyBy calls on same key
- javascript - “Access-Control-Allow-Origin”标头错误。响应具有 HTTP 状态代码 503
- amazon-web-services - 列出超过 x 天/月的 ami
- html - Flexbox - same height on all cards
- java - 试图理解java中的类继承
- reporting-services - 如何从多选 ssrs 报告参数中的多维数组中获取两个值?
- arrays - 使用 Powershell 的 ConvertFrom-Json 解析 JSON
- reactjs - 使用服务器端 React 和 React Router v4 在 Redux 操作中进行 URL 重定向
- wix - Wix - ServiceControl 启动需要四分钟才能失败,应该是 30 秒
- r - 如何使用 R 中的 dplyr 获取变量的总和,仅针对另一个变量的一个值