scrapy - 在 Scrapy 上更改图像管道的 CSV 结果
问题描述
我正在使用默认的 Scrapy Images Pipeline,并将我的数据导出为 CSV。最后一个字段自动填充包含原始 url、本地路径和校验和的数组。但是,我只需要一个包含本地路径的字符串。我怎样才能做到这一点?
解决方案
我猜你得到的结果是
item["images"] = [
{'checksum': '2b00042f7481c7b056c4b410d28f33cf',
'path': 'full/0a79c461a4062ac383dc4fade7bc09f1384a3910.jpg',
'url': 'http://www.example.com/files/product1.pdf'}]
在您process_item()
的 Pipeline 方法中,执行此操作
def process_item(self, item, spider):
images = item["images"]
del item["images"]
item['path'] = []
for k,v in images.iteritems():
item['path'].extend([v['path']])
推荐阅读
- mysql - MySQL Left-Join vs Join with subquery 返回不同的结果
- docker - 标记和推送 Docker 映像更改摘要
- swift - swift词典中键和值的区别是什么
- java - 为什么我的网格显示实体字段 - Vaadin 14
- pandas - pandas pivot_table aggfunc 值错误
- json - 如何为 mongodump 编写正确的 mongodb 查询?
- regex - 用于 -2 和 5 之间的数字范围检查的正则表达式
- python - 如何比较同一列表中的元组?
- c - 矩阵(二维数组)及其值未正确写入 txt 文件
- java - 使用杰克逊将对象序列化为 JSON 时如何排除属性?