首页 > 解决方案 > BeautifoulSoup4 从源代码中提取标题

问题描述

我正在寻找一种从以下源代码 中提取字符串Title Name的方法:

<div class="specs__party-group">
    <a href="Url" title="Title Name" class="specs__party"  data-no-translate="true">General
    </a>
</div>

使用的包是 BeautifoulSoup4。在源代码中,有多个

<a title = ... </a> 

结构。例如:

<div class="show-more__fade  js_show-more-button">
    <a href="#" title="showmore">
    </a>
  </div>
</div>

但是,我只想要块中的标题字符串class="specs__party-group"

以下代码(在此处找到)没有给我想要的结果:

title = soup.find_all('a', title=True, class_='specs__party-group')

或者

for link in soup.find_all('div', attrs={'class': 'specs__party-group'}): 
    title= link.get('title')

还有其他建议吗?

标签: pythonweb-scrapingbeautifulsoup

解决方案


您定位的 a 标签带有类“specs__party”,而不是“specs__party-group”。

这应该有效:

title = soup.find_all('a', class_='specs__party')

推荐阅读