首页 > 解决方案 > 在python中使用Beatifulsoup获取html标签中的内部文本

问题描述

我正在尝试使用 bs4 获取 html 标记内的内部文本,但我不熟悉该库。将不胜感激你们帮助我。

html:

<span class="course-time"> Duration<i> 3:1:00 </i></span>

例如,我正在使用此代码来获取i标签内的文本:

duration = soup.findAll("span" , attrs = {"class" : {"course-time"}})[0].decode_contents()

当我使用此代码时,我得到文本但带有 i 标签。

我只想要文字。

我该怎么做?

标签: pythonhtmlbeautifulsoup

解决方案


您可以使用.text

duration = soup.findAll("span" , attrs = {"class" : {"course-time"}})[0].text

推荐阅读