python - 在python中使用Beatifulsoup获取html标签中的内部文本
问题描述
我正在尝试使用 bs4 获取 html 标记内的内部文本,但我不熟悉该库。将不胜感激你们帮助我。
html:
<span class="course-time"> Duration<i> 3:1:00 </i></span>
例如,我正在使用此代码来获取i标签内的文本:
duration = soup.findAll("span" , attrs = {"class" : {"course-time"}})[0].decode_contents()
当我使用此代码时,我得到文本但带有 i 标签。
我只想要文字。
我该怎么做?
解决方案
您可以使用.text
:
duration = soup.findAll("span" , attrs = {"class" : {"course-time"}})[0].text
推荐阅读
- sql - 如何在画面中分配@variables
- bash - 如何获取使用`find`找到的最后一个文件夹的名称
- python-3.x - 在 Linux 中 DatetimeArray 到 dtype datetime64 但在 Windows 中很好
- c# - 在 Visual Studio 中对具有不同目标平台的另一个项目的项目引用
- sql-server - 从 GROUP BY CUBE 结果中过滤掉 NULL 列
- .net-core - 剃须刀页面上基于策略的授权
- javascript - 从 chart.js 中呈现的图表中获取数据
- android - 在 Android.view.inflateexception 二进制 xml 文件处停止了应用程序
- java - Java 通过 JDBC 连接到 Postgres - SQLException
- amazon-redshift - 红移窗口函数中的条件和最大参考