web-scraping - 我该如何解决这个问题,它不返回文本?
问题描述
我正在抓取 https://cadres.apec.fr/home/mes-offres/recherche-des-offres-demploi/liste-des-offres-demploi.html?motsCles=commercial&sortsType=SCORE&sortsDirection=DESCENDING&lieux=590711 这个网站,我在提取文本时遇到问题。
我尝试了各种方法但徒劳无功
import scrapy
from scrapy_splash import SplashRequest
class QuotesSpider(scrapy.Spider):
name = "hi"
start_urls = [
'https://cadres.apec.fr/home/mes-offres/recherche-des-offres-demploi/liste-des-offres-demploi.html?motsCles=commercial&sortsType=SCORE&sortsDirection=DESCENDING&lieux=590711'
]
def start_requests(self):
for url in self.start_urls:
yield SplashRequest(url=url, callback=self.parse)
def parse(self, response):
name = response.css('span.offre.intitule::text').extract()
list = {"Name":name}
yield list
任何人都可以调查并帮助我吗?
解决方案
我认为您的 css 选择器是错误的,因为您使用offre.intitule
的是bo-text
属性的值。所以也许是这样的:
response.css('[bo-text="offre.intitule"]::text').extract()
推荐阅读
- c# - 从 DateTime.Now.Date 中删除尾随零
- powershell - Sitecore Powershell 报告不返回任何结果
- javascript - 如何让角度前端等待快速 REST-Call 响应
- laravel - 在 Laravel Schedule Job 中使用配置文件
- android - osmdroid 的 mapbox 磁贴中无法识别字体
- dart - 从 Dart 中的另一个未来“值”创建一个未来
- javascript - C# 没有从 Ajax 获取数据
- ffmpeg - 无法使用 FFmpeg 修复具有动态分辨率的 WebM 视频的时间戳
- css - 禁用 align=center on @media
- c - C 在编译时检查数组内容