python - 如何使用 Beautiful soup 找到其中没有兄弟姐妹的 P 标签
问题描述
有些<p></p>
标签有<img>
标签和<h4>
标签,但我只想要那些<p>
没有兄弟标签的标签只是内容。
<p> <img src="any url"/> </p> <p> hello world </p>
想要<p>
没有<img>
使用美汤的标签的标签
解决方案
假设 BeautifulSoup 4.7+,你应该能够做到这一点:
import bs4
html="""<p> <img src="any url"/> </p> <p> hello world </p>"""
soup=bs4.BeautifulSoup(html,"html.parser")
kids=soup.select("p:not(:has(*))")
print(kids)
推荐阅读
- ruby - 给定两个哈希数组,我们如何匹配两个数组中具有匹配键的哈希:值
- c - 尝试访问时带有结构的 C mq_receive() 会导致段错误
- javascript - PHP return to Javascript
- r - 如何添加更多的 x 轴标签使人口金字塔与 ggplot?R
- vue.js - 带有 vuetify 的 vue-cli 在代码和框中出现故障
- computer-science - SML 解释器。我的 Div func 正在工作,但我的 Minus func 有问题。当传递的错误不是数字时,我希望它给出错误
- javascript - 如何将通用代码“注入”到各种 js 函数?
- python - 需要运行以下在循环中运行的 If 语句
- javascript - 如何在 javascript 中不使用正则表达式将首字母大写
- ios - 无法使用 lazarus 将 pascal 源代码从 mac os 交叉编译到 aarch64 darwin 和 x86_64 isim