首页 > 解决方案 > 根据另一个 csv 中的单元格内容从 csv 中删除行

问题描述

我正在从 csv 抓取 url 列表,并从每个 url 中提取数据帧信息并将其导出到 csv。当它到达一个没有任何信息的页面时它会停止。我想从第一个文件(它们包含许可证号)中删除我已经根据我从第二个文件收集的许可证号抓取的网址。我可以通过使用帮助列在 excel 中轻松做到这一点,但不知道如何使用 pandas 来做到这一点。

例如:我想根据 file2 中的 Lic # 删除 file1 中的前 2 行(url)。

File1(no headers)
www.1234.com
www.1235.com
www.1236.com

File2(LIC# is the header)
1234
1235

new urls (expected output back into File1)
www.1236

我在这里查看了许多示例,但无法理解它。

我感谢任何意见和/或建议。

标签: pythonpandasdataframe

解决方案


将您的 2 个列表存储在 x 和 a 变量中:

x=['www.1234.com','www.1235.com','www.1236.com']
a=['1234','1235']

附加万维网。和 .com 到您的第二个列表并存储在变量 b 中

b=[]
for i in a:
    b.append('www.'+i+'.com')

创建所需的输出

y = [s for s in x if s not in b]
y

推荐阅读