首页 > 解决方案 > 使用scrapy保留原始文本文件换行符

问题描述

当我抓取原始文本文件时,例如https://raw.githubusercontent.com/microsoft/TypeScript/master/Gulpfile.js,scrapy会忽略换行符并将内容保存为文本块。有没有办法保存\n角色?

我试过使用这些命令没有运气:

response.css("body p::text").extract_first()
response.css("body p").xpath("text()").extract_first()
response.css("body p").xpath("string()").extract_first()

提前致谢。

标签: scrapyscreen-scraping

解决方案


推荐阅读