scrapy - 使用scrapy保留原始文本文件换行符
问题描述
当我抓取原始文本文件时,例如https://raw.githubusercontent.com/microsoft/TypeScript/master/Gulpfile.js,scrapy会忽略换行符并将内容保存为文本块。有没有办法保存\n
角色?
我试过使用这些命令没有运气:
response.css("body p::text").extract_first()
response.css("body p").xpath("text()").extract_first()
response.css("body p").xpath("string()").extract_first()
提前致谢。
解决方案
推荐阅读
- java - 使用 maven 和 eclipse 的调试模式
- c# - c#从Web响应中获取特定字符串的第一个实例的最佳方法
- ssis - 如何使用带有行数变量的 SSIS 创建控制文件?
- html - 如何使用 bootstrap-table.js 将选择元素添加到列
- python - 如何跨文件使用 TypedDict?
- c++ - 如何通过`friend`将流运算符<<放在模板类主体之外?
- gulp - gulpsync.sync ---必须指定任务函数
- c# - 无法连接到 mqtt-broker,因为 Mono.Unity.UnityTlsContext.ProcessHandshake
- reactjs - 类似 RBAC 模式的最佳实践?
- mysql - Mysql按月获取计数并分组