python - Python - Beautiful Soup - 删除
标记前的值
问题描述
我在一个用 br 分隔的标签中有数据,我试图弄清楚如何删除 br 标签之前的所有值并且遇到困难。
这是我的数据的示例:
<td>
ValueToBeDeleted
<br>
<br/> ValueToKeep
</td>
因此,我试图保留“ValueToKeep”,并为我正在处理的数据删除 TD 标记中的先前值。此外,我的数据文件有数百个需要清理的 TD 标签,因此我也在寻找迭代解决方案。有任何想法吗?
解决方案
也许:
text = text.split('<br/>')[-1]
print(text.replace('</td>','').strip())
使用 BS4 BeautifulSoup:
from bs4 import BeautifulSoup as soup
soup_ = soup(html,'html.parser')
soup_ = soup_.find('td').text.split('\n')[-2]
推荐阅读
- python - 如何解决 TypeError:'builtin_function_or_method' 对象在 make_file 上不可迭代?
- java - java中如何在JTable中显示excel数据
- markdown - 在 Markdown 上定义和使用元数据
- react-native - React Native“未定义不是对象”
- javascript - 使用 DurationAxis 时 Amcharts 工具提示损坏
- ssl - 运行 Grails 新项目时 PKIX 路径验证失败
- flutter - 我如何在颤动中使用线性渐变颜色作为导航轨道背景
- angularjs - 排队的 GPT 命令类型错误中的异常:无法读取 null 的属性“addService”
- css - 使用 CSS 模糊和不透明度交叉淡化元素宽图像会导致 chrome 出现问题
- sql - 基于 Teradata 中的条件加入