scrapy - 以href为CDN端点的scrapy下载图像
问题描述
我要下载的图片格式如下:
<a href="//cdn.xyz.com/download/file.jpg" title="JPG file" target="_blank" class="btn btn-default">Small</a>
问题是手动下载时我需要单击按钮,文件将照常下载。但是,如果您复制 href 并将其粘贴到浏览器,则文件不会下载,您会被重定向到主网站。
由于scrapy不能像selenium(单击按钮等)那样工作。它无法从href中的数据下载图像。
有没有人尝试下载这种在cdn中的图像?我猜它已经阻止服务主域之外的任何请求?
解决方案
推荐阅读
- c# - 将 JSON 反序列化为“object”类型的属性
- html - 没有砌体方法的 Bootstrap 4 列
- visual-studio-code - 空手道跑步者:mvn:找不到命令终端进程以退出代码终止:127
- amazon-web-services - 需要根据 Splunk SPL 中的条件从 json 中获取值
- c - 使用以下方法查找包括两个数字之间的素数
- r - 错误:未找到合适的服务器(`serverSelectionTryOnce` 设置):[socket timeout calls ismaster on ...]
- c++ - c++ - 如何在c ++中对包含正数和负数的字符串数组进行排序?
- java - Akka Stream Java - 是否可以将未知数量的源合并为一个
- c++ - 多线程程序卡在优化模式但在-O0下正常运行
- laravel - 在 Laravel 6.x 中将公司数据传递给所有控制器