python - BeautifoulSoup4 从源代码中提取标题
问题描述
我正在寻找一种从以下源代码 中提取字符串Title Name的方法:
<div class="specs__party-group">
<a href="Url" title="Title Name" class="specs__party" data-no-translate="true">General
</a>
</div>
使用的包是 BeautifoulSoup4。在源代码中,有多个
<a title = ... </a>
结构。例如:
<div class="show-more__fade js_show-more-button">
<a href="#" title="showmore">
</a>
</div>
</div>
但是,我只想要块中的标题字符串class="specs__party-group"
。
以下代码(在此处找到)没有给我想要的结果:
title = soup.find_all('a', title=True, class_='specs__party-group')
或者
for link in soup.find_all('div', attrs={'class': 'specs__party-group'}):
title= link.get('title')
还有其他建议吗?
解决方案
您定位的 a 标签带有类“specs__party”,而不是“specs__party-group”。
这应该有效:
title = soup.find_all('a', class_='specs__party')
推荐阅读
- maven - 在 pom.xml 中调用属性的层次结构
- css - CSS 媒体查询和移动设备
- vb.net - 多选或多选不能全选
- awk - 如果使用 AWK 未找到匹配项,则运行命令
- ionic-framework - Scrolling ion-content is scrolling header and tabs wrongly
- python - 在线程中重定向烧瓶请求
- python - 如何阻止 pydoc 在 f 字符串上出错?
- c++ - 为什么我们需要在引用右值函数参数上显式调用 std::move ?
- lattice-diamond - Linux 上的 Lattice Diamond v 3.11:ftdio_sio 的问题
- android - Android Q 保存的 Uris 在新手机上是否有效?