首页 > 解决方案 > 如何使用 Beautiful soup 找到其中没有兄弟姐妹的 P 标签

问题描述

有些<p></p>标签有<img>标签和<h4>标签,但我只想要那些<p>没有兄弟标签的标签只是内容。

 <p> <img src="any url"/> </p>     <p> hello world </p>

想要<p>没有<img>使用美汤的标签的标签

标签: pythonweb-scrapingbeautifulsoup

解决方案


假设 BeautifulSoup 4.7+,你应该能够做到这一点:

import bs4
html="""<p> <img src="any url"/> </p>     <p> hello world </p>"""
soup=bs4.BeautifulSoup(html,"html.parser")

kids=soup.select("p:not(:has(*))")
print(kids)

推荐阅读