python - 如何提取zomato上的链接?
问题描述
试图从 start_url 下方仅查找餐厅页面链接(例如https://www.zomato.com/istanbul/m%C3%BCkellef-karak%C3%B6y-istanbul),但我得到的不仅是餐厅页面链接,所有的链接。
import scrapy
class ZomatoSpider(scrapy.Spider):
name = 'zomato'
allowed_domains = ["zomato.com"]
start_urls = ['https://www.zomato.com/tr/istanbul/restoranlar?page=1']
def parse(self, response):
all_css = response.css('.col-s-12')
all_product = all_css.css('a::attr(href)').extract()
print(all_product)
yield
解决方案
请阅读scrapy文档。它有一个用于学习目的的教程项目。为了回答您的问题,这将为您提供所有餐厅链接。
all_product = response.css('#orig-search-list .result-title::attr(href)').extract()
yield{
'all_product': all_product
}
推荐阅读
- python - 如何在 sendmail 函数的消息正文中插入 var 内容
- php - 在 uff8 上设置了配置的控制器上不是 uft8
- vue.js - Vuejs一旦设置就获取会话
- javascript - WMTS 和 WMTSTileGrid 导致“无法读取属性‘每个’未定义”
- git - Git 提交消息验证
- javascript - 为什么 Javascript 等于 5 == 8 为真?
- c# - 如何使用查询字符串参数在控制台应用程序中调用 Web Api
- javascript - 提交ajax表单后刷新选项卡而不刷新视图
- powershell - 字符串的长度提供了错误的信息
- php - PHP-> 变量 vars - 数组列