python - 如何打印刮痕深度
问题描述
所以我正在浏览一个网站,并正在寻找该网站中的特定链接。如果我从主页开始,我想看看蜘蛛在找到链接之前离原始页面有多远
linksonpage = response.css('a::attr(href)').getall()
for i in linksonpage:
link = response.urljoin(i)
if link == goallink:
print('found the goal link')
elif:
yield scrapy.Request(link)
Linkdepth 当前设置为 10 作为设置,但如果它在 10 之前找到链接,我想知道它必须走多远才能到达那里。
是否有像scrapy固有的“链接深度”变量之类的东西,我可以调用它在过程中的位置还是我必须做一个计数器?
解决方案
我很愚蠢。这只是 response.meta['depth']
所以你可以将它设置为一个变量。
推荐阅读
- javascript - 带有渲染器的 Angular 2+ CSS 自定义属性(变量)
- ethereum - 为什么我的以太坊区块编号为 0,即使同步已接近完成?
- javascript - 如何防止附加在一个用户脚本中的事件处理程序干扰另一个?
- ubuntu - 为什么在 docker 中更改 ubuntu16.04 时区无效
- javascript - HTML 表单到 Javascript 以通过 REST API 问题创建 JIRA 问题
- ruby-on-rails - 如何跨单行显示项目
- python - Python:是使用跳过测试的覆盖率
- python - 如何使用 python 和 pandas 将 Csv 文件转换为 libsvm?
- android - NotificationManager.notify 不会在一个应用程序中创建通知,尽管完全相同的编码在另一个应用程序中工作
- java - 如何使用两个不同的api取消异步spring方法