python - 如何使用 BeatifulSoup 的“find_previous_siblings”来查找标签?
问题描述
解决方案
他们不是兄弟姐妹,因为 strong 在另一个段落标签内,p
.
我想你想要find_previous
:
from bs4 import BeautifulSoup, element
import requests
url = 'http://www.mpsp.mp.br/portal/page/portal/DO_Estado/2020/DO_20-06-2020.html'
page = requests.get(url)
soup = BeautifulSoup(page.content, 'html.parser')
for i in soup.body.contents:
if isinstance(i, element.NavigableString):
continue
if isinstance(i, element.Tag):
texts = i.text
if texts == 'HELENA BONILHA DE TOLEDO LEITE':
print(i.find_previous('h1'))
print(i.find_previous('strong'))
print(i)
文档解释find_previous
和find_all_previous
:
https ://www.crummy.com/software/BeautifulSoup/bs4/doc/#find-all-previous-and-find-previous
推荐阅读
- android - 尝试在空对象引用上调用接口方法“java.lang.Object kotlin.Lazy.getValue()”
- javascript - Ajax 'error: function()' 在 Linux 服务器上不起作用
- java - JavaFX 不在 BorderPane 上打印网格
- c - 如何从字符串中提取整数?
- c++ - 为什么将字符串分配给 const char * 然后将 const char * 作为缓冲区 (void*) 传递给函数时结果不正确?
- javascript - 需要在 $data 中绑定选定的外部数据位
- aframe - 如何使用 AFRAME.TWEEN
- java - 如何使用 Firebase ML 套件识别地标?
- python - 有没有办法将函数参数用作同一函数的另一个参数?
- c++ - 处理dll问题弹出窗口