python - 清理 html 文本,替换问题
问题描述
我有一个编辑广告:
<p><br></p> or empty `p`, and I want to rplace or remove them.
我用:
value = value.replace('<p><br></p>', '<br>').replace('<p></p>','').strip('<br>')
问题是有时会删除所有内容,在所有情况下,我总是得到第一段:p>
(删除标签中的第一个字符)。
解决方案
您的错误在于您如何使用strip方法,该方法删除了字符的任何前导或尾随序列'<br>'
。例如,因此<b>hello</b>
将被剥离hello</
为 。
如果要删除字符串<br>
开头和结尾的任何内容value
,可以这样做:
if value.startswith('<br>'):
value = value[4:]
if value.endswith('<br>'):
value = value[:-4]
推荐阅读
- akka - 在 Akka Typed Cluster Sharding 中,持久化 EntityRef 以供将来使用是否安全?
- python - 未找到隧道错误 Pyngrok streamlit collab
- python-3.x - 刮板无法突然运行并且显示驱动程序未定义
- swift - 使用大标题时的部分搜索更新框架
- java - 如何解决`遇到
在第 1 行 ...` 问题 - java - Files.probeContentType() 在 OpenJDK 11 上返回 null
- mysql - ERROR 2002 (HY000): Can't connect to local MySQL server through socket '/tmp/mysql.sock' 。安装后出错
- c# - 如何在 asp.net 核心中找到具有特殊命名空间的控制器
- angular - 带有 rxjs 计时器的 Angular 服务...需要主题吗?
- python - python中字符串终止文字的逻辑(即单引号和双引号)