首页 > 解决方案 > 清理 html 文本,替换问题

问题描述

我有一个编辑广告:

<p><br></p> or empty `p`, and I want to rplace or remove them.

我用:

  value = value.replace('<p><br></p>', '<br>').replace('<p></p>','').strip('<br>')

问题是有时会删除所有内容,在所有情况下,我总是得到第一段:p>(删除标签中的第一个字符)。

标签: pythonpython-3.x

解决方案


您的错误在于您如何使用strip方法,该方法删除了字符的任何前导或尾随序列'<br>'。例如,因此<b>hello</b>将被剥离hello</为 。

如果要删除字符串<br>开头和结尾的任何内容value,可以这样做:

if value.startswith('<br>'):
    value = value[4:]
if value.endswith('<br>'):
    value = value[:-4]

推荐阅读