首页 > 解决方案 > 我需要从 H1 SPAN no class with Beautifulsoup 中提取文本并删除括号

问题描述

H1 是独一无二的

<h1>Anno <span>(2021)</span></h1>

我需要从 H1 SPAN no class with Beautifulsoup 中提取文本并删除括号

标签: pythonpython-3.xbeautifulsoup

解决方案


这是工作解决方案:

从 bs4 导入 BeautifulSoup

tag="""
<h1>    
 Anno   
 <span> 
  (2021)
 </span>
</h1>

"""

soup = BeautifulSoup(tag, 'html.parser')
span= soup.select_one('h1 span').text.replace('(', '').replace(')', '')
print(span)

输出

2021

推荐阅读