python - 根据另一个 csv 中的单元格内容从 csv 中删除行
问题描述
我正在从 csv 抓取 url 列表,并从每个 url 中提取数据帧信息并将其导出到 csv。当它到达一个没有任何信息的页面时它会停止。我想从第一个文件(它们包含许可证号)中删除我已经根据我从第二个文件收集的许可证号抓取的网址。我可以通过使用帮助列在 excel 中轻松做到这一点,但不知道如何使用 pandas 来做到这一点。
例如:我想根据 file2 中的 Lic # 删除 file1 中的前 2 行(url)。
File1(no headers)
www.1234.com
www.1235.com
www.1236.com
File2(LIC# is the header)
1234
1235
new urls (expected output back into File1)
www.1236
我在这里查看了许多示例,但无法理解它。
我感谢任何意见和/或建议。
解决方案
将您的 2 个列表存储在 x 和 a 变量中:
x=['www.1234.com','www.1235.com','www.1236.com']
a=['1234','1235']
附加万维网。和 .com 到您的第二个列表并存储在变量 b 中
b=[]
for i in a:
b.append('www.'+i+'.com')
创建所需的输出
y = [s for s in x if s not in b]
y
推荐阅读
- lua - 在 Lua 编程中使用 for 循环
- php - 无法使用类方法在循环中插入数据
- docker - AWS EKS 集群自动扩展
- python - Sub DataFrame 提取错误(列表索引超出范围)
- c++ - 使用模板元编程构建编译时命令查找表
- azure-devops - 我可以在不签入要掌握的 yaml 的情况下开发我的管道吗?
- javascript - 调用函数将引用错误作为函数未定义
- javascript - 如何检查从 ajax 调用返回的数据内容
- react-native - React Native 和 Mysql 连接
- flutter - 当 Flutter FutureProvider 解决它的未来时导航