首页 > 解决方案 > 如何避免在 Scrapy 中跟随下载链接?

问题描述

在进行通用 Scrapy 站点爬行时,我需要避免下载任何可下载的文件。

问题是有时这些链接并不能“告诉”它们背后的内容,您最终可能会关注下载链接。

我怎样才能避免这种情况?(检测大小、mime 类型等)

标签: pythonscrapy

解决方案


推荐阅读