首页 > 解决方案 > 如何从 Scrapy 选择器中的多个标签中提取值?

问题描述

<div class="information-list__item l-column small-12 medium-6 large-4 small-valign-top">
          <dt class="information-list__item__term medium-valign-top">Supplier</dt>
          <dd class="information-list__item__definition">
            Elmar Groetsch
          </dd>
        </div>

在 Scrapy 或 BeautifulSoup 中,如何提取值“供应商”和“Elmar Groetsch”?在这种情况下,供应商是关键,Elmar Groetsch 是价值。

这不起作用:

supplier = response.css('div.information-list__item')[0]

如何在 class="" 部分使用多个标签?

标签: beautifulsoupscrapy

解决方案


这些将分别返回供应商和 Elmar Groetsch

soup = BeautifulSoup(html, "html.parser")
soup.find('div', class_='information-list__item l-column small-12 medium-6 large-4 small-valign-top').find('dt').text
soup.find('div', class_='information-list__item l-column small-12 medium-6 large-4 small-valign-top').find('dd').text

推荐阅读